Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva

Dunđer, Ivan; Seljan, Sanja; Stančić, Hrvoje

Pregled bibliografske jedinice broj: 786918

Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva

Dunđer, Ivan; Seljan, Sanja; Stančić, Hrvoje

Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva // Zaštita arhivskoga gradiva u nastajanju / Babić, Silvija (ur.).
Zagreb: Hrvatsko arhivističko društvo, 2015. str. 195-211 (predavanje, domaća recenzija, cjeloviti rad (in extenso), znanstveni)

CROSBI ID: 786918 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva
(The concept of the automatic classification of the registry and archival records)

Autori
Dunđer, Ivan ; Seljan, Sanja ; Stančić, Hrvoje

Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni

Izvornik
Zaštita arhivskoga gradiva u nastajanju / Babić, Silvija - Zagreb : Hrvatsko arhivističko društvo, 2015, 195-211

ISBN
978-953-58736-0-0

Skup
48. savjetovanje hrvatskih arhivista Zaštita arhivskoga gradiva u nastajanju

Mjesto i datum
Topusko, Hrvatska, 21.10.2015. - 23.10.2015

Vrsta sudjelovanja
Predavanje

Vrsta recenzije
Domaća recenzija

Ključne riječi
automatska klasifikacija ; računalna obrada prirodnoga jezika ; statističke metode ; digitalizacija ; arhivsko gradivo
(automatic classification ; natural language processing ; statistical methods ; digitisation ; archival records)

Sažetak
Sustavi za upravljanje dokumentima i zapisima (EDRMS) koji su najčešće dijelovi sveobuhvatnijeg sustava za upravljanje korporacijskim sadržajima (ECMS) zahvaćaju dokumente i zapise koji izvorno nastaju u digitalnom obliku kao i one koji su digitalizirani. Dok je izvorno digitalne zapise relativno jednostavno opisati tijekom njihovoga nastanka te im pridodati sve potrebne metapodatke, do problema dolazi kod onih koji u sustav ulaze prolazeći postupak digitalizacije. Ukoliko je riječ o velikoj količini gradiva, pri čemu su dokumenti raznorodni i nemaju neka jedinstvena ili ponavljajuća obilježja, tada nije jednostavno odrediti o kojem je dokumentu riječ, ispravno ga klasificirati i pridodati mu metapodatke. Autori analiziraju i prikazuju mogućnosti rješenja koja pripadaju području statistički utemeljenih jezičnih tehnologija i istražuju njihovu moguću primjenu u području (polu)automatske klasifikacije registraturnoga i arhivskoga gradiva. U radu su objašnjena osnovna polazišta pojedinih metoda, mogućnosti automatske ekstrakcije teksta, metode statističke obrade te postavljanje osnove za (polu)automatsku klasifikaciju. Autori prikazuju rezultate testiranja primijenjenih metoda na konkretnome arhivskom gradivu i zaključuju o mogućim budućim pravcima istraživanja.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti

POVEZANOST RADA

Ustanove:
Filozofski fakultet, Zagreb

Profili:

Hrvoje Stančić (autor)