Detail publikace

Unsupervised Word Segmentation from Speech with Attention

GODARD, P.; BOITO, M.; ONDEL YANG, L.; BERARD, A.; YVON, F.; VILLAVICENCIO, A.; BESACIER, L. Unsupervised Word Segmentation from Speech with Attention. In Proceeding of Interspeech 2018. Proceedings of Interspeech. Hyderabad: International Speech Communication Association, 2018. p. 2678-2682. ISSN: 1990-9772.
Název česky
Segmentace řeči na slova bez supervize s pozornostním modelem
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
GODARD, P.
BOITO, M.
ONDEL YANG, L.
BERARD, A.
YVON, F.
VILLAVICENCIO, A.
BESACIER, L.
URL
Klíčová slova

dokumentace počítačového jazyka, kódovací-dekódovací modely, pozornostní modely, segmentace slova bez supervize

Abstrakt

Článek pojednává o segmentaci řeči na slova bez supervize s pozornostním modelem. Představujeme první pokus provést segmentaci slov s pozornost přímo z řečového signálu, přičemž konečným cílem je automatická identifikace lexikálních jednotek v nepsaném nepsaném jazyce (UL). Naše metodika předpokládá párování mezi nahrávkami v UL s překlady v dobře vybaveném jazyce. Používá Acoustic Unit Discovery (AUD) k převodu řeči na sekvenci pseudo-telefonů, která je rozdělena na segmenty pomocí neuronových měkkých zarovnání vytvořených modelem nervového strojového překladu. Hodnocení používá skutečné Bantu UL, Mboshi; srovnání s monolingválními a dvojjazyčnými základními liniemi ilustruje potenciál segmentace slov s pozorností pro jazykovou dokumentaci.

Rok
2018
Strany
2678–2682
Časopis
Proceedings of Interspeech, roč. 2018, č. 9, ISSN 1990-9772
Sborník
Proceeding of Interspeech 2018
Vydavatel
International Speech Communication Association
Místo
Hyderabad
DOI
UT WoS
000465363900561
EID Scopus
BibTeX
@inproceedings{BUT163406,
  author="GODARD, P. and BOITO, M. and ONDEL YANG, L. and BERARD, A. and YVON, F. and VILLAVICENCIO, A. and BESACIER, L.",
  title="Unsupervised Word Segmentation from Speech with Attention",
  booktitle="Proceeding of Interspeech 2018",
  year="2018",
  journal="Proceedings of Interspeech",
  volume="2018",
  number="9",
  pages="2678--2682",
  publisher="International Speech Communication Association",
  address="Hyderabad",
  doi="10.21437/Interspeech.2018-1308",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/Interspeech_2018/pdfs/1308.pdf"
}
Nahoru