Detail publikace

Speech and Language Recognition with Low-rank Adaptation of Pretrained Models

PRASAD, A.; MADIKERI, S.; KHALIL, D.; MOTLÍČEK, P.; SCHUEPBACH, C. Speech and Language Recognition with Low-rank Adaptation of Pretrained Models. In Proceedings of Interspeech. Proceedings of Interspeech. Kos Island: International Speech Communication Association, 2024. p. 2825-2829. ISSN: 1990-9772.
Název česky
Rozpoznávání řeči a jazyka s Low-rank adaptací předtrénovaných modelů
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Prasad Amrutha (UPGM)
Madikeri Srikanth
KHALIL, D.
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
SCHUEPBACH, C.
URL
Klíčová slova

parameter reduction, language identification, speech recognition, wav2vec2.0

Abstrakt

Doladění velkých předtrénovaných modelů vyžaduje značné výpočetní zdroje
a představuje praktická omezení. Většinu z celkového počtu parametrů v těchto
modelech využívají plně propojené vrstvy. V této práci zvažujeme použití
semi-ortogonálního omezení, po kterém následuje úplné doladění plně propojených
vrstev, což výrazně snižuje parametry modelu bez obětování účinnosti v následných
úlohách. Konkrétně uvažujeme modely wav2vec2.0 XLS-R a Whisper pro automatické
rozpoznávání řeči a rozpoznávání jazyka. Naše výsledky ukazují, že můžeme zmenšit
velikost modelu přibližně o 24 % jak během tréninku, tak během doby inference
s absolutním poklesem výkonu o 0,7 % pro XLS-R a bez poklesu výkonu pro Whisper
pro ASR. V kombinaci s výkonnostně efektivním tréninkem s adaptéry nízké úrovně
lze požadavky na zdroje pro trénink dále snížit až o 90 %

Rok
2024
Strany
2825–2829
Časopis
Proceedings of Interspeech, roč. 2024, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech
Konference
Interspeech Conference, Kos, GR
Vydavatel
International Speech Communication Association
Místo
Kos Island
DOI
EID Scopus
BibTeX
@inproceedings{BUT193370,
  author="PRASAD, A. and MADIKERI, S. and KHALIL, D. and MOTLÍČEK, P. and SCHUEPBACH, C.",
  title="Speech and Language Recognition with Low-rank Adaptation of Pretrained Models",
  booktitle="Proceedings of Interspeech",
  year="2024",
  journal="Proceedings of Interspeech",
  volume="2024",
  number="9",
  pages="2825--2829",
  publisher="International Speech Communication Association",
  address="Kos Island",
  doi="10.21437/Interspeech.2024-2187",
  issn="1990-9772",
  url="https://www.isca-archive.org/interspeech_2024/prasad24_interspeech.html"
}
Soubory
Nahoru