Detail publikace

Orbis Pictus: Zpřístupnění netextových dat z digitálních knihoven

LEHEČKA, D.; JEBAVÝ, F.; KERSCH, F.; PAVČÍK, F.; JANA, H.; FREMROVÁ, K.; KIŠŠ, M.; LHOTÁK, M.; DVOŘÁKOVÁ, M.; BEŽOVÁ, M.; HRADIŠ, M.; ŽABIČKA, P.; JIROUŠEK, V. Orbis Pictus: Zpřístupnění netextových dat z digitálních knihoven. ITlib, 2024, roč. 2024, č. 2, s. 22-31. ISSN: 1336-0779.
Název anglicky
Orbis Pictus. Enhancing access to non-textual data in digital libraries
Typ
článek v časopise
Jazyk
česky
Autoři
Lehečka Dalibor
Jebavý Filip, Mgr.
Kersch Filip, Mgr.
Pavčík Filip, Mgr., Ph.D.
Jana Hrzinová, Mgr.
Fremrová Květa
Kišš Martin, Ing. (UPGM)
Lhoták Martin, Ing.
Dvořáková Martina
Bežová Michaela, Mgr. et Bc.
Hradiš Michal, Ing., Ph.D. (UPGM)
Žabička Petr, Ing.
Jiroušek Václav
URL
Abstrakt

Účel - Projekt "Orbis Pictus - oživení knihy pro kulturní a kreativní odvětví" si klade za cíl zpřístupnit netextový obsah českých digitálních knihoven, který je ve srovnání s textovými daty obtížně dosažitelný a neprohledatelný. Tento článek přináší přehled plánovaných výstupů projektu s důrazem na klíčové výsledky dosažené v prvních dvou letech. Metody - Zpřístupnění netextových objektů v digitalizovaných dokumentech lze rozdělit na tři úlohy: detekci, popis a vyhledání. Identifikaci, lokalizaci a kategorizaci objektů zajistí nástroj AnnoPage, který umožní extrakci popisů objektů a jejich uložení ve standardizovaném formátu. V dalších fázích projektu naváže na AnnoPage nástroj PeopleGator, který identifikuje osoby na fotografiích či kresbách a umožní propojení dokumentů s vyobrazením stejné osoby a vytvoření databáze identifikovaných osob. Projekt bude zakončen softwarovým řešením integrujícím všechny vyvinuté nástroje. Výsledky - V prvních dvou letech projektu byla vytvořena metodika pro zpracování obrazových dokumentů. Ta popisuje způsob detekce netextových objektů, jejich rozdělení do 25 kategorií a zápis informací pomocí mezinárodních standardů, čímž pokládá základ pro nástroj AnnoPage. K detekci objektů je využíván detektor trénovaný na vlastní datové sadě. Detekované objekty jsou popsány pomocí vektorových reprezentací a textových popisů. Originalita/hodnota - Výstupy projektu budou integrovány do České digitální knihovny, což umožní využívání vyvinutých nástrojů širokému spektru knihoven, které platforma agreguje. Orbis Pictus je unikátní projekt v oblasti digital humanities díky rozsáhlému shromáždění netextových dat. Výsledky najdou uplatnění nejen v identifikaci objektů a metadat, ale i ve výzkumu a kulturním a kreativním průmyslu, kde mohou zpřístupněné objekty sloužit jako inspirace pro marketing, vzdělávání, gamifikaci nebo umělou inteligenci.

Rok
2024
Strany
22–31
Časopis
ITlib, roč. 2024, č. 2, ISSN 1336-0779
Vydavatel
Slovak Centre of Scientific and Technical Information
DOI
BibTeX
@article{BUT197967,
  author="Dalibor {Lehečka} and Filip {Jebavý} and Filip {Kersch} and Filip {Pavčík} and Hrzinová {Jana} and Květa {Fremrová} and Martin {Kišš} and Martin {Lhoták} and Martina {Dvořáková} and Michaela {Bežová} and Michal {Hradiš} and Petr {Žabička} and Václav {Jiroušek}",
  title="Orbis Pictus: Zpřístupnění netextových dat z digitálních knihoven",
  journal="ITlib",
  year="2024",
  volume="2024",
  number="2",
  pages="22--31",
  doi="10.52036/1335793X.2024.2.22-31",
  issn="1336-0779",
  url="https://doi.org/10.52036/1335793X.2024.2.22-31"
}
Soubory
Nahoru