Detail publikace

Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language

MACIEJEWSKI, M.; KLEMENT, D.; HUANG, R.; WIESNER, M.; KHUDANPUR, S. Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language. In Proceedings of Interspeech 2024. Proceedings of Interspeech. Kos: International Speech Communication Association, 2024. p. 2155-2160. ISSN: 1990-9772.

Název česky

Hodnocení řečových technologií na Santa Barbara korpusu: výzvy konverzační mluvené řeči

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Maciejewski Matthew
Klement Dominik, Bc. (UPGM)
HUANG, R.
Wiesner Matthew, PhD.
Khudanpur Sanjeev

URL

Klíčová slova

konverzační řeč, diarizace, rozpoznávání řeči

Abstrakt

Jak technologie řeči vyspěla, došlo k tlaku na systémy oddělení, které dokážou
zpracovat konverzační řeč, odrážet takzvaný "problém koktejlových večírků", který
zahrnuje nikoli pouze náročnější akustické podmínky, ale také nutnost uvádí
řešení nových problémů, jako je identifikace toho, kdo mluvil při zpracování více
souběžných proudů řeči. K těmto problémům se přistupuje především prostřednictvím
korpusů zahrnující obchodní jednání a večírky s výhledem široký rozsah
konverzační dynamiky a de- mografie, které spadají do kategorie multimluvčích
řečí. Za tímto účelem zavádíme použití korpusu Santa Barbara mluvené americké
angličtiny pro hodnocení řečových technologií gy - včetně přípravy korpusu
a anotací pro auto- matické zpracování, demonstrující selhání nejmodernějšího
stavu techniky systémy odolávající heterogenitě podmínek a vysoké osvětlení
situací, kde standardní metody mají potíže forma vůbec

Rok

2024

Strany

2155–2160

Časopis

Proceedings of Interspeech, roč. 2024, č. 9, ISSN 1990-9772

Sborník

Proceedings of Interspeech 2024

Konference

Interspeech Conference, Kos, GR

Vydavatel

International Speech Communication Association

Místo

Kos

DOI

10.21437/Interspeech.2024-2119

EID Scopus

2-s2.0-85214796368

BibTeX

@inproceedings{BUT193741,
  author="MACIEJEWSKI, M. and KLEMENT, D. and HUANG, R. and WIESNER, M. and KHUDANPUR, S.",
  title="Evaluating the Santa Barbara Corpus: Challenges of the Breadth of Conversational Spoken Language",
  booktitle="Proceedings of Interspeech 2024",
  year="2024",
  journal="Proceedings of Interspeech",
  volume="2024",
  number="9",
  pages="2155--2160",
  publisher="International Speech Communication Association",
  address="Kos",
  doi="10.21437/Interspeech.2024-2119",
  issn="1990-9772",
  url="https://www.isca-archive.org/interspeech_2024/maciejewski24_interspeech.pdf"
}

Soubory

pdf maciejewski_2024_interspeech.pdf 309 kB