Detail publikace

Probability-Aware Word-Confusion-Network-to-Text Alignment Approach for Intent Classification

VILLATORO-TELLO, E.; MADIKERI, S.; SHARMA, B.; KHALIL, D.; KUMAR, S.; NIGMATULINA, I.; MOTLÍČEK, P.; GANAPATHIRAJU, A. Probability-Aware Word-Confusion-Network-to-Text Alignment Approach for Intent Classification. ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Seoul: IEEE Signal Processing Society, 2024. p. 12617-12621. ISBN: 979-8-3503-4485-1.
Název česky
Pravděpodobnostní přístup k zarovnání slov a sítí k textu pro klasifikaci záměrů
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
VILLATORO-TELLO, E.
Madikeri Srikanth
SHARMA, B.
KHALIL, D.
KUMAR, S.
NIGMATULINA, I.
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
GANAPATHIRAJU, A.
URL
Klíčová slova

Word-Confusion-Networks, Cross-modal Alignment, Knowledge Distillation, Intent
Classification

Abstrakt

Technologie pro porozumění mluvené řeči (SLU) mají výrazně zlepšily díky
efektivnímu předtrénování řeči. reprezentace. Běžným požadavkem průmyslových je
přenositelnost pro nasazení modelů SLU v hlasových systémech. asistentů.
Destilace znalostí z rozsáhlých textových na základě jazykových modelů se stalo
atraktivním řešením pro dosažení dobrého výkonu a zaručení přenositelnosti. Na
adrese v tomto článku představujeme novou architekturu, která využívá křížový
přístup k datům. modální mechanismus pozornosti k extrakci kontextových informací
na úrovni binů. z kódování slovně-konfúzní sítě (WNC). tak, aby je bylo možné
přímo porovnávat a srovnávat se slovy s tradičními textovými kontextovými
vložkami. Toto zarovnání je dosaženo pomocí nedávno navrženého tokenwise
konstrastivního ztrátové funkce. Ověřujeme účinnost naší architektury vyladěním
našeho předem natrénovaného modelu založeného na WCN, aby mohl provádět záměry.
klasifikaci (IC) na známé datové sadě SLURP. Ob- vané přesnosti v úloze IC (81
%), zobrazuje 9,4 % relativní přesnost v úloze IC. v porovnání
s nedávnou/ekvivalentní metodou E2E. Translated with DeepL.com (free version)

Rok
2024
Strany
12617–12621
Sborník
ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
Konference
Mezinárodní konference o akustice řeči..., Seoul, KR
ISBN
979-8-3503-4485-1
Vydavatel
IEEE Signal Processing Society
Místo
Seoul
DOI
BibTeX
@inproceedings{BUT196786,
  author="VILLATORO-TELLO, E. and MADIKERI, S. and SHARMA, B. and KHALIL, D. and KUMAR, S. and NIGMATULINA, I. and MOTLÍČEK, P. and GANAPATHIRAJU, A.",
  title="Probability-Aware Word-Confusion-Network-to-Text Alignment Approach for Intent Classification",
  booktitle="ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)",
  year="2024",
  pages="12617--12621",
  publisher="IEEE Signal Processing Society",
  address="Seoul",
  doi="10.1109/ICASSP48485.2024.10445934",
  isbn="979-8-3503-4485-1",
  url="https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10445934"
}
Soubory
Nahoru