Pregled bibliografske jedinice broj: 786918
Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva
Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva // Zaštita arhivskoga gradiva u nastajanju / Babić, Silvija (ur.).
Zagreb: Hrvatsko arhivističko društvo, 2015. str. 195-211 (predavanje, domaća recenzija, cjeloviti rad (in extenso), znanstveni)
CROSBI ID: 786918 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva
(The concept of the automatic classification of the registry and archival records)
Autori
Dunđer, Ivan ; Seljan, Sanja ; Stančić, Hrvoje
Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni
Izvornik
Zaštita arhivskoga gradiva u nastajanju
/ Babić, Silvija - Zagreb : Hrvatsko arhivističko društvo, 2015, 195-211
ISBN
978-953-58736-0-0
Skup
48. savjetovanje hrvatskih arhivista Zaštita arhivskoga gradiva u nastajanju
Mjesto i datum
Topusko, Hrvatska, 21.10.2015. - 23.10.2015
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Domaća recenzija
Ključne riječi
automatska klasifikacija ; računalna obrada prirodnoga jezika ; statističke metode ; digitalizacija ; arhivsko gradivo
(automatic classification ; natural language processing ; statistical methods ; digitisation ; archival records)
Sažetak
Sustavi za upravljanje dokumentima i zapisima (EDRMS) koji su najčešće dijelovi sveobuhvatnijeg sustava za upravljanje korporacijskim sadržajima (ECMS) zahvaćaju dokumente i zapise koji izvorno nastaju u digitalnom obliku kao i one koji su digitalizirani. Dok je izvorno digitalne zapise relativno jednostavno opisati tijekom njihovoga nastanka te im pridodati sve potrebne metapodatke, do problema dolazi kod onih koji u sustav ulaze prolazeći postupak digitalizacije. Ukoliko je riječ o velikoj količini gradiva, pri čemu su dokumenti raznorodni i nemaju neka jedinstvena ili ponavljajuća obilježja, tada nije jednostavno odrediti o kojem je dokumentu riječ, ispravno ga klasificirati i pridodati mu metapodatke. Autori analiziraju i prikazuju mogućnosti rješenja koja pripadaju području statistički utemeljenih jezičnih tehnologija i istražuju njihovu moguću primjenu u području (polu)automatske klasifikacije registraturnoga i arhivskoga gradiva. U radu su objašnjena osnovna polazišta pojedinih metoda, mogućnosti automatske ekstrakcije teksta, metode statističke obrade te postavljanje osnove za (polu)automatsku klasifikaciju. Autori prikazuju rezultate testiranja primijenjenih metoda na konkretnome arhivskom gradivu i zaključuju o mogućim budućim pravcima istraživanja.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti
POVEZANOST RADA
Ustanove:
Filozofski fakultet, Zagreb