Detail publikace

Are we meeting a deadline? classification goal achievement in time in the presence of imbalanced data

HLOSTA, M.; ZDRÁHAL, Z.; ZENDULKA, J. Are we meeting a deadline? classification goal achievement in time in the presence of imbalanced data. KNOWLEDGE-BASED SYSTEMS, 2018, vol. 2018, no. 160, p. 278-295. ISSN: 0950-7051.
Název česky
Splníme termín? klasifikace dosažení cíle v čase při nevyvážených datech
Typ
článek v časopise
Jazyk
anglicky
Autoři
Hlosta Martin, Ing., Ph.D.
Zdráhal Zdeněk
Zendulka Jaroslav, doc. Ing., CSc. (UIFS)
URL
Klíčová slova

Classification, imbalanced data, learning analytics, educational data mining

Abstrakt

Článek se zabývá problémem konečného souboru entit, u kterých je požadováno dosažení cíle v předem stanoveném termínu. Například skupina studentů má předložit úlohu do specifikovaného data. Chceme predikovat, které entity v termínu cíl splní. Prediktivní modely jsou vytvořeny pouze na základě údajů z této populace. Predikce jsou prováděny v různých okamžicích s přihlédnutím k aktualizovaným údajům o entitách. Prvním příspěvkem článku je formální popis problému. Důležitou vlastnosyí navrhované metody tvorby modelu je využití vlastností entit, které již cíle dosáhly. Takový přístup nazýváme "Self-Learning". Vzhledem k tomu, že obvykle jen několik entit dosáhlo cíle na začátku a jejich počet postupně narůstá, problém z podstaty nevyvážený. Abychom zmírnili dopad nevyváženosti, zlepšili jsme metodu Self-Learning řešením ztráty informace a několika technikami vzorkování. Původní metoda Self-Learning a její modifikace byly vyhodnoceny v případové studii pro predikci odevzdání prvních úloh ve vysokoškolských kurzech distančního vzdělávání. Výsledky ukazují, že navrhovaná vylepšení překonávají dva specifikované bázové modely a původní metodu Self-Learning a také to, že nejlepších výsledků při řešení problému nevyváženosti bylo dosaženo použitím technik vycházejících z dané aplikační domény. Použitím Wilcoxonova testu jsme také prokázali, že tato zlepšení jsou statisticky významná.

Rok
2018
Strany
278–295
Časopis
KNOWLEDGE-BASED SYSTEMS, roč. 2018, č. 160, ISSN 0950-7051
DOI
UT WoS
000446283900022
EID Scopus
BibTeX
@article{BUT155093,
  author="Martin {Hlosta} and Zdeněk {Zdráhal} and Jaroslav {Zendulka}",
  title="Are we meeting a deadline? classification goal achievement in time in the presence of imbalanced data",
  journal="KNOWLEDGE-BASED SYSTEMS",
  year="2018",
  volume="2018",
  number="160",
  pages="278--295",
  doi="10.1016/j.knosys.2018.07.021",
  issn="0950-7051",
  url="https://www.sciencedirect.com/science/article/pii/S0950705118303496"
}
Nahoru