Detail publikace
End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations
Keyword search, spoken term detection, end-to-end keyword search, asr-free keyword search, keyword spotting.
Konvenční systémy pro vyhledávání klíčových slov pracují na výstupech automatického rozpoznávání řeči (ASR), což způsobuje, že mají složité indexování a vyhledávání. To vedlo k zájmu o přístupy bez ASR za účelem zjednodušení postupu vyhledávání. Nedávno jsme navrhli neurální model vyhledávání klíčových slov bez ASR, který dosahuje konkurenceschopného výkonu při zachování efektivního a zjednodušeného potrubí, kde jsou dotazy a dokumenty kódovány dvojicí opakujících se kodérů neuronové sítě a kódování jsou kombinována s tečkovým produktem. V tomto článku tuto práci rozšiřujeme o vícejazyčné předtrénování a podrobnou analýzu modelu. Naše experimenty ukazují, že navrhované vícejazyčné školení výrazně zlepšuje výkon modelu a že navzdory tomu, že neodpovídá silnému konvenčnímu systému vyhledávání klíčových slov na bázi ASR pro krátké dotazy a dotazy obsahující slova ve slovní zásobě, navrhovaný model překonává systém založený na ASR pro dlouhé dotazy. a dotazy, které se neobjevují v trénovacích datech.
@article{BUT185202,
author="YUSUF, B. and ČERNOCKÝ, J. and SARAÇLAR, M.",
title="End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations",
journal="IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
year="2023",
volume="31",
number="08",
pages="3070--3080",
doi="10.1109/TASLP.2023.3301239",
issn="2329-9290",
url="https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10201906"
}