Detail produktu
Tensorflow implementation of speaker recognition with x-vector topology
Vznik: 2019
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Stafylakis Themos
Černocký Jan, prof. Dr. Ing. (UPGM)
rozpoznávání mluvčího, DNN, x-vector, trénování, přetrénování
Software je implementace rozpoznávače mluvčího (x-vector topologie), který pro předzpracování dat používá rozšířený Kaldi toolkit. Pomocí systému je možné natrénovat model nebo přetrénovat již existující pomocí Tensorflow k cílové doméně zákaznických dat. Dále je možné změnit topologii systému, trénovací schéma nebo přetrénovat systém s jinou objektivní funkcí. Vše toto může umožnit zlepšení výsledku rozpoznávání mluvčího pro cílovou doménu dat. Software je výsledkem projektu Ministerstva vnitra ČR "Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony - DRAPÁK", č. VI20152020025 (https://www.fit.vut.cz/research/project/1009/)