Detail produktu

Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Vznik: 2025

Název anglicky
Methodology for Transferring Structured Knowledge from Dialectology into Machine Learning
Typ
metodika certifikovaná uplatněná
Licence
Využití výsledku jiným subjektem je v některých případech možné bez nabytí licence
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje v některých případech licenční poplatek
Autoři
Šimečková Marta
Stupňánek Bronislav
Karafiát Martin, Ing., Ph.D. (UPGM)
Voženílek Vít, Prof. RNDr., CSc.
Vondráková Alena, RNDr., Ph.D.
Nétek Rostislav, RNDr., Ph.D.
Klíčová slova

dialektologie, lingvistika, nářečí českého jazyka, dokumentace dialektů, nářeční
výzkum, metoda rozhovoru, zvukový archiv, katalogizace nahrávek, archivace
nahrávek, audiální data, textová data, dialektologická transkripce, folklorní
transkripce, normalizace textů, digitalizace, automatické rozpoznávání řeči,
strojové učení, tematická kartografie, zvuková mapa, interdisciplinární přístup

Popis

Metodika zpracovává problematiku přípravy a využití nářečních dat v dialektologii
prostřednictvím moderních technologií strojového učení. Zaměřuje se na procesy
konsolidace, standardizace a strukturování audiálních a textových materiálů,
které tvoří základ pro vývoj automatických nástrojů pro transkripci řeči.
Středobodem je představení postupů uplatnitelných při digitalizaci a normalizaci
textových dat, obsahuje rovněž podrobný popis audiální dokumentace nářečí
v terénu se zaměřením na různé explorační metody, a to včetně digitální archivace
a katalogizace nahrávek. Metodika propojuje teoretické poznatky o sběru
a zpracování nářečního materiálu s praktickými postupy, které zahrnují nasazení
strojového učení. Důraz je kladen na interdisciplinární přístup, který kombinuje
lingvistické znalosti s technologickými nástroji pro automatizaci práce. Součástí
metodiky jsou také postupy vizualizace dialektologických dat pomocí tematické
kartografie, vedoucí k tvorbě interaktivních zvukových map či webových atlasů.
Dokument slouží nejen jako praktický průvodce pro přípravu specifického
jazykového materiálu, ale i jako inspirace pro další výzkumné týmy, a to jak
v oblasti dialektologie, tak v rámci širšího zapojení strojového učení do
humanitních věd.

Umístění

Národní úložiště šedé literatury

Soubory
Projekty
Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka, MK, NAKI III – program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030, DH23P03OVV010, zahájení: 2023-03-01, ukončení: 2027-12-31, řešení
Výzkumné skupiny
Pracoviště
Nahoru