Detail publikace
Description and Analysis of ABC Submission to NIST LRE 2022
Silnova Anna, M.Sc., Ph.D. (UPGM)
SLAVÍČEK, J.
Mošner Ladislav, Ing. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Klčo Michal, Ing.
Peng Junyi, Master of Technology, prof. UMK (UPGM)
Stafylakis Themos
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
nguage detection, language recognition, embedding extractor, LRE, NIST
Tento článek shrnuje naše úsilí v NIST Recognition Evaluation 2022, které vyústilo v systémy poskytující konkurenční výkon. Popisujeme, jaká data jsme použili pro trénování našich modelů a sledujeme je pomocí "embedding extractors" a "backend classifiers". Po pokrytí architektury věnujeme pozornost analýze po vyhodnocení. Porovnáváme různé topologie DNN, různé back-endové klasifikátory a dopady dat použitých k jejich trénování. Uvádíme také výsledky s XLS-R předtrénované modelů. Představujeme výkon systémů v "Pevné podmínce", (požadováno použití pouze předdefinovaných datových sad) a v "Otevřené podmínce" (umožněno použití jakýchkoli dat k trénování systémů).
@inproceedings{BUT185574,
author="MATĚJKA, P. and SILNOVA, A. and SLAVÍČEK, J. and MOŠNER, L. and PLCHOT, O. and KLČO, M. and PENG, J. and STAFYLAKIS, T. and BURGET, L.",
title="Description and Analysis of ABC Submission to NIST LRE 2022",
booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
year="2023",
journal="Proceedings of Interspeech",
volume="2023",
number="08",
pages="511--515",
publisher="International Speech Communication Association",
address="Dublin",
doi="10.21437/Interspeech.2023-1529",
issn="1990-9772",
url="https://www.isca-speech.org/archive/pdfs/interspeech_2023/matejka23_interspeech.pdf"
}