Detail publikace
Source Separation for Sound Event Detection in domestic environments using jointly trained models
Detekce zvukové události, oddělení zdroje, DCASE, DESED
Detekce zvukových událostí a separace zdrojů jsou úzce související úkoly: zatímco první si klade za cíl najít časové hranice akustických událostí uvnitř nahrávky, cílem druhého je izolovat každý z akustických zdrojů na různé signály. Tento článek představuje systém detekce zvukových událostí tvořený dvěma nezávisle předem připravenými bloky pro separaci zdrojů a detekci zvukových událostí. Navrhujeme schéma společného tréninku, kde se trénují oba bloky současně, a dvoustupňový trénink, kdy každý blok trénuje, zatímco druhý je zmrazený. Kromě toho porovnáváme použití předtréninku pod dohledem a bez dozoru pro blok Separation a dvě strategie výběru modelu pro detekci zvukových událostí. Naše experimenty ukazují, že navrhované metody jsou schopny překonat základní systémy výzvy DCASE 2021 Challenge Task 4.
@inproceedings{BUT179869,
author="Diego {de Benito Gorron} and Kateřina {Žmolíková} and Doroteo {Torre Toledano}",
title="Source Separation for Sound Event Detection in domestic environments using jointly trained models",
booktitle="Proceedings of The 17th International Workshop on Acoustic Signal Enhancement (IWAENC 2022)",
year="2022",
pages="1--5",
publisher="IEEE Signal Processing Society",
address="Bamberg",
doi="10.1109/IWAENC53105.2022.9914755",
isbn="978-1-6654-6867-1",
url="https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9914755"
}