Detail publikace
On-the-Fly Text Retrieval for end-to-end ASR Adaptation
retrieval, language model, domain adaptation, end-to-end ASR, RNN transducer, contextual biasing
End-to-end modely rozpoznávání řeči jsou vylepšeny začleněním externích textových zdrojů, obvykle fúzí s externím měřicí model. Takové jazykové modely je třeba kdykoli přeškolit zájmový korpus se mění. Kromě toho, protože ukládají celý korpus ve svých parametrech, vzácná slova mohou být náročná odvolání. V této práci navrhujeme rozšíření ASR na bázi převodníku model s jazykovým modelem vyhledávání, který přímo načítá z externí textový korpus věrohodná dokončení pro částečné ASR hy- potéza. Tato dokončení jsou pak integrována do následujících předběžných dikce adaptérem, který se trénuje jednou, takže korpus z úrok lze změnit, aniž by došlo k přetížení výpočtu vedoucí rekvalifikace. Naše experimenty ukazují, že navrhovaný model výrazně zlepšuje výkon základní linie převodníku na a dvojice datových sad na otázky. Dále překonává mělký výkon fúze na rozpoznání pojmenovaných entit asi 7 % relativních; když když se oba spojí, relativní zlepšení se zvýší na 13 %
@inproceedings{BUT185196,
author="YUSUF, B. and GOURAV, A. and GANDHE, A. and BULYKO, I.",
title="On-the-Fly Text Retrieval for end-to-end ASR Adaptation",
booktitle="Proceedings of ICASSP 2023",
year="2023",
pages="1--5",
publisher="IEEE Signal Processing Society",
address="Rhodes Island",
doi="10.1109/ICASSP49357.2023.10095857",
isbn="978-1-7281-6327-7",
url="https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10095857"
}