Detail publikace

Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language

MACIEJEWSKI, M.; KLEMENT, D.; HUANG, R.; WIESNER, M.; KHUDANPUR, S. Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language. In Proceedings of Interspeech 2024. Proceedings of Interspeech. Kos: International Speech Communication Association, 2024. p. 2155-2160. ISSN: 1990-9772.
Název česky
Hodnocení řečových technologií na Santa Barbara korpusu: výzvy konverzační mluvené řeči
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Maciejewski Matthew
Klement Dominik, Bc. (UPGM)
HUANG, R.
Wiesner Matthew, PhD.
Khudanpur Sanjeev
URL
Klíčová slova

konverzační řeč, diarizace, rozpoznávání řeči

Abstrakt

Jak technologie řeči vyspěla, došlo k tlaku na systémy oddělení, které dokážou
zpracovat konverzační řeč, odrážet takzvaný "problém koktejlových večírků", který
zahrnuje nikoli pouze náročnější akustické podmínky, ale také nutnost uvádí
řešení nových problémů, jako je identifikace toho, kdo mluvil při zpracování více
souběžných proudů řeči. K těmto problémům se přistupuje především prostřednictvím
korpusů zahrnující obchodní jednání a večírky s výhledem široký rozsah
konverzační dynamiky a de- mografie, které spadají do kategorie multimluvčích
řečí. Za tímto účelem zavádíme použití korpusu Santa Barbara mluvené americké
angličtiny pro hodnocení řečových technologií gy - včetně přípravy korpusu
a anotací pro auto- matické zpracování, demonstrující selhání nejmodernějšího
stavu techniky systémy odolávající heterogenitě podmínek a vysoké osvětlení
situací, kde standardní metody mají potíže forma vůbec

Rok
2024
Strany
2155–2160
Časopis
Proceedings of Interspeech, roč. 2024, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2024
Konference
Interspeech Conference, Kos, GR
Vydavatel
International Speech Communication Association
Místo
Kos
DOI
EID Scopus
BibTeX
@inproceedings{BUT193741,
  author="MACIEJEWSKI, M. and KLEMENT, D. and HUANG, R. and WIESNER, M. and KHUDANPUR, S.",
  title="Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language",
  booktitle="Proceedings of Interspeech 2024",
  year="2024",
  journal="Proceedings of Interspeech",
  volume="2024",
  number="9",
  pages="2155--2160",
  publisher="International Speech Communication Association",
  address="Kos",
  doi="10.21437/Interspeech.2024-2119",
  issn="1990-9772",
  url="https://www.isca-archive.org/interspeech_2024/maciejewski24_interspeech.pdf"
}
Soubory
Nahoru