Detail práce

Voice Dialog System in Web Browser for Demonstration Purposes

Diplomová práce Student: Vlček Pavol Akademický rok: 2020/2021 Vedoucí: Schwarz Petr, Ing., Ph.D.
Název česky
Hlasový dialogový systém ve webovém prohlížeči pro demonstrační účely
Jazyk práce
anglický
Abstrakt

Cieľom práce je navrhnúť a vytvoriť hlasom ovládaného asistenta(voicebota), ktorý bude ľahko nasaditeľný na webovú stránku. Používateľom tak bude poskytnutý moderný spôsob, ako prirodzene komunikovať cez internetový prehliadač. Hlavný dôraz je kladený na synchronizáciu medzi hlasovým asistentom a obsahom na webovej stránke. Synchronizácia je dosiahnutá obojsmerným prenosom hlasu a textových príkazov medzi klientom a serverom. Na to je použitá technológia WebRTC v kombinácií so signalizačným protokolom SIP. Práca sa zaoberá oblasťami ako VoIP telefonovanie, počítačové siete a strojové učenie(proprietárne rečové technológie od Phonexie). Benefitom nasadenia hlasového asistenta je zníženie nákladov na odchádzajúce hovory pre klientov, odľahčenie agentov na call centrách pri odpovedaní na často kladené otázky a zvýšenie záujmu zákazníkov vďaka použitiu nových technológií.

Klíčová slova

voicebot, WebRTC, SIP, RTP, SDP, Asterisk, hlasový dialógový systém, prechod NAT, Phonexia, rozpoznávanie reči, internetový prehliadač, IBM Watson, WebSocket, Phonexia Speech Engine

Ústav
Studijní program
Informační technologie a umělá inteligence, specializace Počítačové sítě
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
26. srpna 2021
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře.

Otázky u obhajoby

Do dialogového systému se jako vstup bere "1-best" výstupní řetězec z modulu rozpoznávání řeči, tedy sekvence slov. Dal by se využít graf hypotéz, případně N-best výstup rozpoznávače?

Komise
Hruška Tomáš, prof. Ing., CSc. (UIFS FIT VUT), předseda
Kolář Dušan, doc. Dr. Ing. (UIFS FIT VUT), člen
Lengál Ondřej, Ing., Ph.D. (UITS FIT VUT), člen
Očenášek Pavel, Mgr. Ing., Ph.D. (UIFS FIT VUT), člen
Polčák Libor, Ing., Ph.D. (UIFS FIT VUT), člen
Veselý Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Citace
VLČEK, Pavol. Voice Dialog System in Web Browser for Demonstration Purposes. Brno, 2021. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2021-08-26. Vedoucí práce Schwarz Petr. Dostupné z: https://www-dev.fit.vutbr.cz/study/thesis/23460/
BibTeX
@mastersthesis{FITMT23460,
    author = "Pavol Vl\v{c}ek",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Voice Dialog System in Web Browser for Demonstration Purposes",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2021,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/23460/"
}
Nahoru