Detail výsledku

Using machine learning for automatic dialect detection. New methods in Czech dialectology.

ŠIMEČKOVÁ, M.; KARAFIÁT, M.; PLCHOT, O. Using machine learning for automatic dialect detection. New methods in Czech dialectology. In Slovanské dialek ty v době dig itál ních technologií. Nářeční prameny a jejich současné zpracování. Praha: Slovanský ústav AV ČR, 2025. p. 297-307. ISBN: 978-80-86420-99-8.
Typ
kapitola, resp. kapitoly v odborné knize
Jazyk
angličtina
Autoři
Šimečková Marta
Karafiát Martin, Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Abstrakt

This chapter explores machine learning applications in Czech dialectology, focusing specifically in the automatic detection of Czech language dialects. The detector is being developed in the project ‘Language Memory of the Regions of the Czech Republic’ through collaboration amongst dialectology, machine learning, and geoinformatics experts. This software utilizes machine learning methods to identify dialects from audio recordings, drawing from the Archive of Dialect Audio Recordings. The chapter details the archive’s history, cataloging, and recorded language diversity, showcasing the software’s effectiveness in dialect recognition. Results demonstrate substantial improvements over conventional i-vector systems, indicating the promising role of machine learning in Czech dialectology and applied linguistics.

Klíčová slova

applied dialectology ; Czech dialects ; archive of dialect audio recordings ; automatic dialect detector ; automatic speech recognition

URL
Rok
2025
Strany
11
Kniha
Slovanské dialek­ty v době dig­itál­ních technologií. Nářeční prameny a jejich současné zpracování.
ISBN
978-80-86420-99-8
Vydavatel
Slovanský ústav AV ČR
Místo
Praha
BibTeX
@inbook{BUT201320,
  author="{} and Martin {Karafiát} and Oldřich {Plchot}",
  title="Using machine learning for automatic dialect detection. New methods in Czech dialectology.",
  booktitle="Slovanské dialek­ty v době dig­itál­ních technologií. Nářeční prameny a jejich současné zpracování.",
  year="2025",
  publisher="Slovanský ústav AV ČR",
  address="Praha",
  pages="11",
  isbn="978-80-86420-99-8",
  url="https://www.slu.cas.cz/cs/publikace/slovanske-dialekty-v-dobe-digitalnich-technologii"
}
Projekty
Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka, MK, NAKI III – program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030, DH23P03OVV010, zahájení: 2023-03-01, ukončení: 2027-12-31, řešení
Výzkumné skupiny
Pracoviště
Nahoru