Detail publikace
End-to-End Open Vocabulary Keyword Search
keyword search, spoken term detection
V poslední době se neurální přístupy k vyhledávání mluveného obsahu staly oblíbenými. Mají však tendenci být omezené ve své slovní zásobě nebo ve své schopnosti vypořádat se s nevyváženým nastaveními testů. Tyto restrikce omezují jejich použitelnost při vyhledávání klíčových slov, kde soubor dotazů není předem znám a kde systém by měl vrátit nejen to, zda výrok obsahuje dotaz, ale přesné umístění všech takových výskytů. V této práci navrhujeme model přímo optimalizovaný pro klíčová slova Vyhledávání. Model bere jako vstup dotaz a výrok a vrátí sekvenci pravděpodobností pro každý snímek vyslovení dotazu, ke kterému došlo v tomto rámci. Experimenty ukazují, že navrhovaný model nejenže překonává podobné end-to-end modely na úkol, kde poměr kladných a negativních zkoušek je uměle vyvážená, ale je také schopna se vypořádat s mnohem náročnějším úkolem vyhledávání klíčových slov inherentní nerovnováha. Navíc pomocí našeho systému znovu bodovat výstupy, ke kterým vede systém vyhledávání klíčových slov založený na LVCSR u posledně jmenovaných výrazná zlepšení.
@inproceedings{BUT175847,
author="YUSUF, B. and GOK, A. and GUNDOGDU, B. and SARAÇLAR, M.",
title="End-to-End Open Vocabulary Keyword Search",
booktitle="Proceedings Interspeech 2021",
year="2021",
journal="Proceedings of Interspeech",
volume="2021",
number="8",
pages="4388--4392",
publisher="International Speech Communication Association",
address="Brno",
doi="10.21437/Interspeech.2021-1399",
issn="1990-9772",
url="https://www.isca-speech.org/archive/interspeech_2021/yusuf21_interspeech.html"
}