Detail publikace
Unsupervised Word Segmentation from Speech with Attention
Boito Marcely Z. (INRIA)
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Berard Alexandre (INRIA)
Yvon Francois (LIMSI)
Villavicencio Aline (UESSEX)
Besacier Laurent (UGA)
dokumentace počítačového jazyka, kódovací-dekódovací modely, pozornostní modely, segmentace slova bez supervize
Článek pojednává o segmentaci řeči na slova bez supervize s pozornostním modelem.
Představujeme první pokus provést segmentaci slov s pozornost přímo z řečového signálu, přičemž konečným cílem je automatická identifikace lexikálních jednotek v nepsaném nepsaném jazyce (UL). Naše metodika předpokládá párování mezi nahrávkami v UL s překlady v dobře vybaveném jazyce. Používá Acoustic Unit Discovery (AUD) k převodu řeči na sekvenci pseudo-telefonů, která je rozdělena na segmenty pomocí neuronových měkkých zarovnání vytvořených modelem nervového strojového překladu. Hodnocení používá skutečné Bantu UL, Mboshi; srovnání s monolingválními a dvojjazyčnými základními liniemi ilustruje potenciál segmentace slov s pozorností pro jazykovou dokumentaci.
@INPROCEEDINGS{FITPUB12242, author = "Pierre Godard and Z. Marcely Boito and Francois Antoine Lucas Yang Ondel and Alexandre Berard and Francois Yvon and Aline Villavicencio and Laurent Besacier", title = "Unsupervised Word Segmentation from Speech with Attention", pages = "2678--2682", booktitle = "Proceeding of Interspeech 2018", journal = "Proceedings of Interspeech - on-line", volume = 2018, number = 9, year = 2018, location = "Hyderabad, IN", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2018-1308", language = "english", url = "https://www.fit.vut.cz/research/publication/12242" }