Detail výsledku

Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge

ALAM, J.; BOULIANNE, G.; BURGET, L.; DAHMANE, M.; DIEZ SÁNCHEZ, M.; GLEMBEK, O.; LALONDE, M.; LOZANO DÍEZ, A.; MATĚJKA, P.; MIZERA, P.; MOŠNER, L.; NOISEUX, C.; MONTEIRO, J.; NOVOTNÝ, O.; PLCHOT, O.; ROHDIN, J.; SILNOVA, A.; SLAVÍČEK, J.; STAFYLAKIS, T.; ST-CHARLES, P.; WANG, S.; ZEINALI, H. Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge. Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop. Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland. Tokyo: International Speech Communication Association, 2020. no. 11, p. 289-295. ISSN: 2312-2846.
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Alam Jahangir
Boulianne Gilles
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
DAHMANE, M.
DIEZ SÁNCHEZ, M.
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
LALONDE, M.
LOZANO DÍEZ, A.
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
MIZERA, P.
Mošner Ladislav, Ing., Ph.D., UPGM (FIT)
NOISEUX, C.
MONTEIRO, J.
Novotný Ondřej, Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Rohdin Johan Andréas, M.Sc., Ph.D., FIT (FIT), UPGM (FIT)
Silnova Anna, M.Sc., Ph.D., UPGM (FIT)
SLAVÍČEK, J.
Stafylakis Themos
ST-CHARLES, P.
Wang Shuai
Zeinali Hossein, Ph.D.
Abstrakt

We present a condensed description and analysis of the jointsubmission of ABC team for NIST SRE 2019, by BUT, CRIM,Phonexia, Omilia and UAM. We concentrate on challenges thatarose during development and we analyze the results obtainedon the evaluation data and on our development sets. The conversationaltelephone speech (CMN2) condition is challengingfor current state-of-the-art systems, mainly due to the languagemismatch between training and test data. We show that a combinationof adversarial domain adaptation, backend adaptationand score normalization can mitigate this mismatch. On theVAST condition, we demonstrate the importance of deployingdiarization when dealing with multi-speaker utterances and thedrastic improvements that can be obtained by combining audioand visual modalities.

Klíčová slova

speaker verification, NIST SRE, CMN, VAST, system fusion.

URL
Rok
2020
Strany
289–295
Časopis
Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland, roč. 2020, č. 11, ISSN 2312-2846
Sborník
Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop
Konference
Odyssey 2020: The Speaker and Language Recognition Workshop
Vydavatel
International Speech Communication Association
Místo
Tokyo
DOI
BibTeX
@inproceedings{BUT164070,
  author="ALAM, J. and BOULIANNE, G. and BURGET, L. and DAHMANE, M. and DIEZ SÁNCHEZ, M. and GLEMBEK, O. and LALONDE, M. and LOZANO DÍEZ, A. and MATĚJKA, P. and MIZERA, P. and MOŠNER, L. and NOISEUX, C. and MONTEIRO, J. and NOVOTNÝ, O. and PLCHOT, O. and ROHDIN, J. and SILNOVA, A. and SLAVÍČEK, J. and STAFYLAKIS, T. and ST-CHARLES, P. and WANG, S. and ZEINALI, H.",
  title="Analysis of ABC Submission to NIST SRE 2019 CMN and VAST Challenge",
  booktitle="Proceedings of Odyssey 2020 The Speaker and Language Recognition Workshop",
  year="2020",
  journal="Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland",
  volume="2020",
  number="11",
  pages="289--295",
  publisher="International Speech Communication Association",
  address="Tokyo",
  doi="10.21437/Odyssey.2020-41",
  issn="2312-2846",
  url="https://www.isca-speech.org/archive/Odyssey_2020/abstracts/73.html"
}
Soubory
Projekty
Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony, MV, Bezpečnostní výzkum České republiky 2015-2020, VI20152020025, zahájení: 2015-10-01, ukončení: 2020-09-30, ukončen
IT4Innovations excellence in science, MŠMT, Národní program udržitelnosti II, LQ1602, zahájení: 2016-01-01, ukončení: 2020-12-31, ukončen
Moderní metody zpracování, analýzy a zobrazování multimediálních a 3D dat, VUT, Vnitřní projekty VUT, FIT-S-20-6460, zahájení: 2020-03-01, ukončení: 2023-02-28, ukončen
Neuronové reprezentace v multimodálním a mnohojazyčném modelování, GAČR, Grantové projekty exelence v základním výzkumu EXPRO - 2019, GX19-26934X, zahájení: 2019-01-01, ukončení: 2023-12-31, ukončen
Robustní rozpoznávání SPEAKER na základě modelů hlubokého učení a pozornosti, EU, Horizon 2020, zahájení: 2019-06-01, ukončení: 2021-01-31, ukončen
Síťová, textová analýza a analýza řeči v reálném čase pro boj s organizovaným zločinem, EU, Horizon 2020, zahájení: 2019-09-01, ukončení: 2022-12-31, ukončen
Zapojení umělé inteligence do příjmu tísňového volání, MV, Program bezpečnostního výzkumu ČR v letech 2015-2022 (BV III/1-VS), VI20192022169, zahájení: 2019-07-04, ukončení: 2022-05-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru