Detail publikace

The IWSLT 2021 BUT Speech Translation Systems

VYDANA, H.; KARAFIÁT, M.; BURGET, L.; ČERNOCKÝ, J. The IWSLT 2021 BUT Speech Translation Systems. In Proceedings of 18th International Conference on Spoken Language Translation (IWSLT). Bangkok, on-line: Association for Computational Linguistics, 2021. p. 75-83. ISBN: 978-1-7138-3378-9.
Název česky
BUT systém pro strojový překlad z řeči pro IWSLT 2021
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

speech, translation

Abstrakt

Příspěvek popisuje offline systémy překladu řeči z angličtiny do němčiny vyvinuté na VUT v Brně pro IWSLT2021. Jsou založeny na společně trénovaném automatickém rozpoznávání řeči - na modelech strojového překladu. Jejich výkon je hodnocen na testu MustC-Common soubor. V této práci studujeme jejich účinnost z pohledu velkého množství samostatných tréninkových dat ASR a trénování MT dat a z pohledu menšího množství překladů řeči trénovaných dat. Velké množství trénovacích dat ASR a MT se využívá pro předtrénování modelů ASR a MT. Speechtranslation data se používají ke společné optimalizaci Modelů ASR-MT definováním end-to-end diferencovatelné cesty od řeči k překladům. K tomuto účelu používáme vnitřní průběžnou reprezentaci z dekodéru ASR a vstup do modulu MT. Ukážemem že překlad řeči lze dále zlepšit školením dekodéru ASR společně s modulem MT pomocí velkého množství pouze textového trénování MT dat. Ukazujeme také výrazná zlepšení trénováním modulu ASR schopného generovat přerušovaný text, než aby interpunkční úloha byla ponechána na MT modulu.

Rok
2021
Strany
75–83
Sborník
Proceedings of 18th International Conference on Spoken Language Translation (IWSLT)
ISBN
978-1-7138-3378-9
Vydavatel
Association for Computational Linguistics
Místo
Bangkok, on-line
DOI
UT WoS
000694723100007
EID Scopus
BibTeX
@inproceedings{BUT177246,
  author="Hari Krishna {Vydana} and Martin {Karafiát} and Lukáš {Burget} and Jan {Černocký}",
  title="The IWSLT 2021 BUT Speech Translation Systems",
  booktitle="Proceedings of 18th International Conference on Spoken Language Translation (IWSLT)",
  year="2021",
  pages="75--83",
  publisher="Association for Computational Linguistics",
  address="Bangkok, on-line",
  doi="10.18653/v1/2021.iwslt-1.7",
  isbn="978-1-7138-3378-9",
  url="https://aclanthology.org/2021.iwslt-1.7.pdf"
}
Nahoru