Detail publikace
Toroidal Probabilistic Spherical Discriminant Analysis
Brummer Johan Nikolaas Langenhoven, Dr.
Swart Albert du Preez
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
speaker recognition, PSDA, Von Mises-Fishe
V rozpoznávání mluvčího, kde jsou namapovány segmenty řeči vložení na jednotkovou hypersféru, dva bodovací back-endy běžně používané, jmenovitě cosinus scoring a PLDA. My máme nedávno navržené PSDA, analog k PLDA, který používá Von Mises-Fisher distribuce místo Gaussianů. V tomto papíru představujeme toroidní PSDA (T-PSDA). Rozšiřuje PSDA o schopnost modelovat variabilitu uvnitř a mezi mluvčími v toroidních subvarietách hypersféry. Jako PLDA a PSDA, model umožňuje skórování v uzavřené formě a uzavřené formě EM aktualizace pro trénink. Na VoxCeleb najdeme T-PSDA accu- energický na stejné úrovni jako kosinové bodování, zatímco přesnost PLDA je nedostatečná rior. Na NIST SRE'21 jsme zjistili, že T-PSDA poskytuje velké přírůstky rasy ve srovnání s kosinovým hodnocením a PLDA.
@inproceedings{BUT185199,
author="Anna {Silnova} and Johan Nikolaas Langenhoven {Brummer} and Albert du Preez {Swart} and Lukáš {Burget}",
title="Toroidal Probabilistic Spherical Discriminant Analysis",
booktitle="Proceedings of ICASSP 2023",
year="2023",
pages="1--5",
publisher="IEEE Signal Processing Society",
address="Rhodes Island",
doi="10.1109/ICASSP49357.2023.10095580",
isbn="978-1-7281-6327-7",
url="https://ieeexplore.ieee.org/document/10095580"
}