Detail publikace

Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge

ALAM, J.; BOULIANNE, G.; BURGET, L.; DAHMANE, M.; DIEZ SÁNCHEZ, M.; GLEMBEK, O.; LALONDE, M.; LOZANO DÍEZ, A.; MATĚJKA, P.; MIZERA, P.; MOŠNER, L.; NOISEUX, C.; MONTEIRO, J.; NOVOTNÝ, O.; PLCHOT, O.; ROHDIN, J.; SILNOVA, A.; SLAVÍČEK, J.; STAFYLAKIS, T.; ST-CHARLES, P.; WANG, S.; ZEINALI, H. Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge. In Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop. Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland. Tokyo: International Speech Communication Association, 2020. p. 289-295. ISSN: 2312-2846.
Název česky
Analýza systému ABC pro evaluaci NIST SRE 2019 v kategoriích CMN a VAST
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Alam Jahangir
Boulianne Gilles
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
DAHMANE, M.
DIEZ SÁNCHEZ, M.
Glembek Ondřej, Ing., Ph.D.
LALONDE, M.
LOZANO DÍEZ, A.
Matějka Pavel, Ing., Ph.D. (UPGM)
MIZERA, P.
Mošner Ladislav, Ing. (UPGM)
NOISEUX, C.
MONTEIRO, J.
Novotný Ondřej, Ing., Ph.D.
Plchot Oldřich, Ing., Ph.D. (UPGM)
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Silnova Anna, M.Sc., Ph.D. (UPGM)
SLAVÍČEK, J.
Stafylakis Themos
ST-CHARLES, P.
Wang Shuai
Zeinali Hossein, Ph.D. (UPGM)
URL
Klíčová slova

speaker verification, NIST SRE, CMN, VAST, system fusion.

Abstrakt

Předkládáme ucelený popis a analýzu společného podání týmu ABC do evaluace NIST SRE 2019 ve složení VUT v Brně, CRIM, Phonexia, Omilia a UAM. Soustředíme se na výzvy, které vyvstaly během vývoje, a analyzujeme výsledky získané na hodnotících datech a na našich vývojových sadách. Podmínka konverzační telefonní řeči (CMN2) je pro současné nejmodernější systémy náročná, zejména kvůli nesouladu jazyků mezi tréninkovými a testovacími daty. Ukazujeme, že kombinace nesouladu s doménou, přizpůsobení backendu a normalizace skóre může tento nesoulad zmírnit. Ve stavu VAST prokazujeme důležitost nasazení diarizace pro vypořádání se s promluvami vícero mluvčích a zásadní vylepšení, která lze dosáhnout kombinací zvukových a vizuálních modalit.

Rok
2020
Strany
289–295
Časopis
Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland, roč. 2020, č. 11, ISSN 2312-2846
Sborník
Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop
Vydavatel
International Speech Communication Association
Místo
Tokyo
DOI
BibTeX
@inproceedings{BUT164070,
  author="ALAM, J. and BOULIANNE, G. and BURGET, L. and DAHMANE, M. and DIEZ SÁNCHEZ, M. and GLEMBEK, O. and LALONDE, M. and LOZANO DÍEZ, A. and MATĚJKA, P. and MIZERA, P. and MOŠNER, L. and NOISEUX, C. and MONTEIRO, J. and NOVOTNÝ, O. and PLCHOT, O. and ROHDIN, J. and SILNOVA, A. and SLAVÍČEK, J. and STAFYLAKIS, T. and ST-CHARLES, P. and WANG, S. and ZEINALI, H.",
  title="Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge",
  booktitle="Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop",
  year="2020",
  journal="Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland",
  volume="2020",
  number="11",
  pages="289--295",
  publisher="International Speech Communication Association",
  address="Tokyo",
  doi="10.21437/Odyssey.2020-41",
  issn="2312-2846",
  url="https://www.isca-speech.org/archive/Odyssey_2020/abstracts/73.html"
}
Nahoru