Detail publikace
Unsupervised Word Segmentation from Speech with Attention
BOITO, M.
ONDEL YANG, L.
BERARD, A.
YVON, F.
VILLAVICENCIO, A.
BESACIER, L.
dokumentace počítačového jazyka, kódovací-dekódovací modely, pozornostní modely, segmentace slova bez supervize
Článek pojednává o segmentaci řeči na slova bez supervize s pozornostním modelem. Představujeme první pokus provést segmentaci slov s pozornost přímo z řečového signálu, přičemž konečným cílem je automatická identifikace lexikálních jednotek v nepsaném nepsaném jazyce (UL). Naše metodika předpokládá párování mezi nahrávkami v UL s překlady v dobře vybaveném jazyce. Používá Acoustic Unit Discovery (AUD) k převodu řeči na sekvenci pseudo-telefonů, která je rozdělena na segmenty pomocí neuronových měkkých zarovnání vytvořených modelem nervového strojového překladu. Hodnocení používá skutečné Bantu UL, Mboshi; srovnání s monolingválními a dvojjazyčnými základními liniemi ilustruje potenciál segmentace slov s pozorností pro jazykovou dokumentaci.
@inproceedings{BUT163406,
author="GODARD, P. and BOITO, M. and ONDEL YANG, L. and BERARD, A. and YVON, F. and VILLAVICENCIO, A. and BESACIER, L.",
title="Unsupervised Word Segmentation from Speech with Attention",
booktitle="Proceeding of Interspeech 2018",
year="2018",
journal="Proceedings of Interspeech",
volume="2018",
number="9",
pages="2678--2682",
publisher="International Speech Communication Association",
address="Hyderabad",
doi="10.21437/Interspeech.2018-1308",
issn="1990-9772",
url="https://www.isca-speech.org/archive/Interspeech_2018/pdfs/1308.pdf"
}