Detail publikace
Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge
Boulianne Gilles
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
DAHMANE, M.
DIEZ SÁNCHEZ, M.
Glembek Ondřej, Ing., Ph.D.
LALONDE, M.
LOZANO DÍEZ, A.
Matějka Pavel, Ing., Ph.D. (UPGM)
MIZERA, P.
Mošner Ladislav, Ing. (UPGM)
NOISEUX, C.
MONTEIRO, J.
Novotný Ondřej, Ing., Ph.D.
Plchot Oldřich, Ing., Ph.D. (UPGM)
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Silnova Anna, M.Sc., Ph.D. (UPGM)
SLAVÍČEK, J.
Stafylakis Themos
ST-CHARLES, P.
Wang Shuai
Zeinali Hossein, Ph.D. (UPGM)
speaker verification, NIST SRE, CMN, VAST, system fusion.
Předkládáme ucelený popis a analýzu společného podání týmu ABC do evaluace NIST SRE 2019 ve složení VUT v Brně, CRIM, Phonexia, Omilia a UAM. Soustředíme se na výzvy, které vyvstaly během vývoje, a analyzujeme výsledky získané na hodnotících datech a na našich vývojových sadách. Podmínka konverzační telefonní řeči (CMN2) je pro současné nejmodernější systémy náročná, zejména kvůli nesouladu jazyků mezi tréninkovými a testovacími daty. Ukazujeme, že kombinace nesouladu s doménou, přizpůsobení backendu a normalizace skóre může tento nesoulad zmírnit. Ve stavu VAST prokazujeme důležitost nasazení diarizace pro vypořádání se s promluvami vícero mluvčích a zásadní vylepšení, která lze dosáhnout kombinací zvukových a vizuálních modalit.
@inproceedings{BUT164070,
author="ALAM, J. and BOULIANNE, G. and BURGET, L. and DAHMANE, M. and DIEZ SÁNCHEZ, M. and GLEMBEK, O. and LALONDE, M. and LOZANO DÍEZ, A. and MATĚJKA, P. and MIZERA, P. and MOŠNER, L. and NOISEUX, C. and MONTEIRO, J. and NOVOTNÝ, O. and PLCHOT, O. and ROHDIN, J. and SILNOVA, A. and SLAVÍČEK, J. and STAFYLAKIS, T. and ST-CHARLES, P. and WANG, S. and ZEINALI, H.",
title="Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge",
booktitle="Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop",
year="2020",
journal="Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland",
volume="2020",
number="11",
pages="289--295",
publisher="International Speech Communication Association",
address="Tokyo",
doi="10.21437/Odyssey.2020-41",
issn="2312-2846",
url="https://www.isca-speech.org/archive/Odyssey_2020/abstracts/73.html"
}