Detail publikace
Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language
konverzační řeč, diarizace, rozpoznávání řeči
Jak technologie řeči vyspěla, došlo k tlaku na systémy oddělení, které dokážou
zpracovat konverzační řeč, odrážet takzvaný "problém koktejlových večírků", který
zahrnuje nikoli pouze náročnější akustické podmínky, ale také nutnost uvádí
řešení nových problémů, jako je identifikace toho, kdo mluvil při zpracování více
souběžných proudů řeči. K těmto problémům se přistupuje především prostřednictvím
korpusů zahrnující obchodní jednání a večírky s výhledem široký rozsah
konverzační dynamiky a de- mografie, které spadají do kategorie multimluvčích
řečí. Za tímto účelem zavádíme použití korpusu Santa Barbara mluvené americké
angličtiny pro hodnocení řečových technologií gy - včetně přípravy korpusu
a anotací pro auto- matické zpracování, demonstrující selhání nejmodernějšího
stavu techniky systémy odolávající heterogenitě podmínek a vysoké osvětlení
situací, kde standardní metody mají potíže forma vůbec
@inproceedings{BUT193741,
author="MACIEJEWSKI, M. and KLEMENT, D. and HUANG, R. and WIESNER, M. and KHUDANPUR, S.",
title="Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language",
booktitle="Proceedings of Interspeech 2024",
year="2024",
journal="Proceedings of Interspeech",
volume="2024",
number="9",
pages="2155--2160",
publisher="International Speech Communication Association",
address="Kos",
doi="10.21437/Interspeech.2024-2119",
issn="1990-9772",
url="https://www.isca-archive.org/interspeech_2024/maciejewski24_interspeech.pdf"
}