Detail publikace
The Zero Resource Speech Challenge 2020: Discovering discrete subword and word units
KARADAYI, J.
BERNARD, M.
CAO, X.
ALGAYRES, R.
ONDEL YANG, L.
BESACIER, L.
SAKTI, S.
Dupoux Emmanuel (FIT)
zero resource speech technology, speech synthesis, acoustic unit discovery, spoken term discovery, unsupervised learning
Představujeme Zero Resource Speech Challenge 2020, který si klade za cíl naučit se reprezentace řeči ze surových zvukových signálů bez jakýchkoli štítků. Kombinuje datové sady a metriky z dvě předchozí měřítka (2017 a 2019) a dvě funkce úkoly, které pronikají do dvou úrovní reprezentace řeči. Prvním úkolem je objevit reprezentace podslovů s nízkou bitovou rychlostí, které optimalizují kvalitu syntézy řeči; druhým úkolem je objevit slovní jednotky z nesegmentované syrové řeči. Představujeme výsledky dvaceti předložených modelů a rozebíráme implikace hlavních zjištění pro unsupervised speech learning.
@inproceedings{BUT168147,
author="DUNBAR, E. and KARADAYI, J. and BERNARD, M. and CAO, X. and ALGAYRES, R. and ONDEL YANG, L. and BESACIER, L. and SAKTI, S. and DUPOUX, E.",
title="The Zero Resource Speech Challenge 2020: Discovering discrete subword and word units",
booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
year="2020",
journal="Proceedings of Interspeech",
volume="2020",
number="10",
pages="4831--4835",
publisher="International Speech Communication Association",
address="Shanghai",
doi="10.21437/Interspeech.2020-2743",
issn="1990-9772",
url="https://www.isca-speech.org/archive/Interspeech_2020/pdfs/2743.pdf"
}