Detail publikace

Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals

PEŠÁN, J.; JUŘÍK, V.; RŮŽIČKOVÁ, A.; SVOBODA, V.; JANOUŠEK, O.; NĚMCOVÁ, A.; BOJANOVSKÁ, H.; ALDABAGHOVÁ, J.; KYSLÍK, F.; VODIČKOVÁ, K.; SODOMOVÁ, A.; BARTYS, P.; CHUDÝ, P.; ČERNOCKÝ, J. Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals. Scientific data, 2024, vol. 11, no. 1, p. 1-9. ISSN: 2052-4463.
Název česky
Tvorba řeči ve stresu pro strojové učení: multimodální dataset 79 mluvčích a 8 signálů
Typ
článek v časopise
Jazyk
anglicky
Autoři
Pešán Jan, Ing. (UPGM)
JUŘÍK, V.
RŮŽIČKOVÁ, A.
SVOBODA, V.
Janoušek Oto, Ing., Ph.D. (UBMI)
NĚMCOVÁ, A.
BOJANOVSKÁ, H.
ALDABAGHOVÁ, J.
KYSLÍK, F.
VODIČKOVÁ, K.
SODOMOVÁ, A.
BARTYS, P.
Chudý Peter, doc. Ing., Ph.D., MBA (VZ AeroWorks)
Černocký Jan, prof. Dr. Ing. (UPGM)
URL
Klíčová slova

speech, stress, machine learning

Abstrakt

Včasná identifikace kognitivního nebo fyzického přetížení je zásadní v oblastech,
kde záleží na lidském rozhodování při předcházení ohrožení bezpečnosti a majetku.
Piloti, řidiči, chirurgové a operátoři jaderných elektráren patří mezi ty, kteří
jsou touto výzvou zasaženi, protože akutní stres může zhoršit jejich poznávání.
V této souvislosti vzrůstá význam paralingvistického automatického zpracování
řeči pro včasnou detekci stresu. Intenzita, intonace a kadence výpovědi jsou
příklady paralingvistických rysů, které určují význam věty a často se ztrácejí
v doslovném přepisu. K vyřešení tohoto problému se vyvíjejí nástroje, které
umožňují efektivní rozpoznání paralingvistických rysů. Datové úzké hrdlo však
stále existuje při trénování paralingvistických řečových znaků a přetrvává
nedostatek kvalitních referenčních dat pro trénování umělých systémů. S ohledem
na to uvádíme původní empirický soubor dat shromážděný pomocí experimentálního
protokolu BESST pro zachycení řečových signálů při indukovaném stresu. S těmito
údaji je naším cílem podporovat rozvoj systémů preemptivní intervence založených
na odhadu stresu z řeči.

Rok
2024
Strany
1–9
Časopis
Scientific data, roč. 11, č. 1, ISSN 2052-4463
DOI
UT WoS
001353330000007
EID Scopus
BibTeX
@article{BUT193434,
  author="PEŠÁN, J. and JUŘÍK, V. and RŮŽIČKOVÁ, A. and SVOBODA, V. and JANOUŠEK, O. and NĚMCOVÁ, A. and BOJANOVSKÁ, H. and ALDABAGHOVÁ, J. and KYSLÍK, F. and VODIČKOVÁ, K. and SODOMOVÁ, A. and BARTYS, P. and CHUDÝ, P. and ČERNOCKÝ, J.",
  title="Speech production under stress for machine learning: multimodal dataset of 79 cases and 8 signals",
  journal="Scientific data",
  year="2024",
  volume="11",
  number="1",
  pages="1--9",
  doi="10.1038/s41597-024-03991-w",
  issn="2052-4463",
  url="https://www.nature.com/articles/s41597-024-03991-w"
}
Soubory
Nahoru