Téma disertační práce
Strojové učenie zohľadňujúce doménovo špecifické vedecké poznatky
Ak. rok 2024/2025
Školitel: Rozinajová Věra, Doc., Ph.D.
Ústav: Ústav informačních systémů
Programy:
Informační technologie (DIT) - kombinované studium
Po desaťročia bolo správanie systémov vo fyzickom svete modelované numerickými modelmi založenými na rozsiahlych vedeckých poznatkoch o základných prírodných zákonoch. Rastúce schopnosti algoritmov strojového učenia však začínajú tieto zaužívané postupy meniť. Pri použití dostatočne veľkých datasetov sú tieto algoritmy schopné objaviť opakujúce sa vzory v dátach.
Modely strojového učenia majú však zvyčajne slabú interpretovateľnosť a potrebujú veľké datasety na trénovanie, čo môže byť v mnohých oblastiach problém. Tieto nevýhody sa snaží odstrániť “strojové učenie zohľadňujúce doménovo špecifické vedecké poznatky” (Scientific Machine Learning - SciML) – rozvíjajúca sa disciplína v rámci komunity dátových vedcov. Ide o snahu zahrnúť vedecké poznatky z danej oblasti do procesu učenia. Cieľom SciML je vyvinúť nové metódy pre škálovateľné, robustné, interpretovateľné a spoľahlivé učenie.
Neurónové siete zohľadňujúce fyzikálne poznatky sú súčasťou SciML učenia, kde do modelu zahŕňame fyzikálne obmedzenia prostredníctvom vhodných účelových funkcií alebo úprav architektúry modelu. Prostredníctvom tohto prístupu môžeme vytvárať modely neurónových sietí, ktoré sú fyzikálne konzistentné, efektívne a dôveryhodné.
Cieľom výskumu je preskúmať, ako začleniť vedecké poznatky do modelov strojového učenia vytváraním hybridných modelov založených na SciML princípoch, ktoré obsahujú komponenty založené na dátach aj na znalostiach z domény. Výskum je možné orientovať aj na kombináciu SciML a transfer learning (ktoré opätovne využíva vopred natrénovaný model na riešenie nového podobného problému) - cieľom takejto kombinácie je využiť výhody oboch prístupov.
SciML je možné aplikovať v mnohých doménach – zameriavame sa najmä na energetiku (napr. podporu širšieho zavedenia obnoviteľných zdrojov) alebo geovedy (s dôrazom na pozitívny vplyv na životné prostredie, zlepšujúci odolnosť voči zmene klímy), ale výsledky výskumu je možné aplikovať v ľubovoľnej inej oblasti.
Súvisiace publikácie:
- Kloska, M., Rozinajova, V., Grmanova, G. Expert Enhanced Dynamic Time Warping Based Anomaly Detection. Expert Systems with Applications (2023) https://arxiv.org/pdf/2310.02280.pdf
- Pavlik, P., Rozinajova, V., Bou Ezzeddine, A. Radar-Based Volumetric Precipitation Nowcasting: A 3D Convolutional Neural Network with UNet Architecture. Workshop on Complex Data Challenges in Earth Observation 2022 at CAI-ECAI (2022) https://ceur-ws.org/Vol-3207/paper10.pdf
Výskum bude doktorand vykonávať v rámci Kempelenovho inštitútu inteligentných technológií (KInIT, https://kinit.sk) v Bratislave pod vedením výskumníkov zo svetovo uznávaných výskumných skupín. Predpokladá sa kombinovaná (externá) forma štúdia a pracovný pomer na plný úväzok v KInIT.