Detail publikace

End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations

YUSUF, B.; ČERNOCKÝ, J.; SARAÇLAR, M. End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, 2023, vol. 31, no. 08, p. 3070-3080. ISSN: 2329-9290.
Název česky
Celostní vyhledávání klíčových slov s otevřeným slovníkem a vícejazyčnými neurálními reprezentacemi
Typ
článek v časopise
Jazyk
anglicky
Autoři
Yusuf Bolaji (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
SARAÇLAR, M.
URL
Klíčová slova

Keyword search, spoken term detection, end-to-end keyword search, asr-free keyword search, keyword spotting.

Abstrakt

Konvenční systémy pro vyhledávání klíčových slov pracují na výstupech automatického rozpoznávání řeči (ASR), což způsobuje, že mají složité indexování a vyhledávání. To vedlo k zájmu o přístupy bez ASR za účelem zjednodušení postupu vyhledávání. Nedávno jsme navrhli neurální model vyhledávání klíčových slov bez ASR, který dosahuje konkurenceschopného výkonu při zachování efektivního a zjednodušeného potrubí, kde jsou dotazy a dokumenty kódovány dvojicí opakujících se kodérů neuronové sítě a kódování jsou kombinována s tečkovým produktem. V tomto článku tuto práci rozšiřujeme o vícejazyčné předtrénování a podrobnou analýzu modelu. Naše experimenty ukazují, že navrhované vícejazyčné školení výrazně zlepšuje výkon modelu a že navzdory tomu, že neodpovídá silnému konvenčnímu systému vyhledávání klíčových slov na bázi ASR pro krátké dotazy a dotazy obsahující slova ve slovní zásobě, navrhovaný model překonává systém založený na ASR pro dlouhé dotazy. a dotazy, které se neobjevují v trénovacích datech.

Rok
2023
Strany
3070–3080
Časopis
IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 31, č. 08, ISSN 2329-9290
Vydavatel
IEEE
Místo
PISCATAWAY, NJ
DOI
UT WoS
001047323400008
EID Scopus
BibTeX
@article{BUT185202,
  author="YUSUF, B. and ČERNOCKÝ, J. and SARAÇLAR, M.",
  title="End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations",
  journal="IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
  year="2023",
  volume="31",
  number="08",
  pages="3070--3080",
  doi="10.1109/TASLP.2023.3301239",
  issn="2329-9290",
  url="https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10201906"
}
Nahoru