Napredna pretraga

Pregled bibliografske jedinice broj: 786918

Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva


Dunđer, Ivan; Seljan, Sanja; Stančić, Hrvoje
Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva // Zaštita arhivskoga gradiva u nastajanju / Babić, Silvija (ur.).
Zagreb: Hrvatsko arhivističko društvo, 2015. str. 195-211 (predavanje, domaća recenzija, cjeloviti rad (in extenso), znanstveni)


Naslov
Koncept automatske klasifikacije registraturnoga i arhivskoga gradiva
(The concept of the automatic classification of the registry and archival records)

Autori
Dunđer, Ivan ; Seljan, Sanja ; Stančić, Hrvoje

Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni

Izvornik
Zaštita arhivskoga gradiva u nastajanju / Babić, Silvija - Zagreb : Hrvatsko arhivističko društvo, 2015, 195-211

ISBN
978-953-58736-0-0

Skup
48. savjetovanje hrvatskih arhivista Zaštita arhivskoga gradiva u nastajanju

Mjesto i datum
Topusko, Hrvatska, 21-23.10.2015.

Vrsta sudjelovanja
Predavanje

Vrsta recenzije
Domaća recenzija

Ključne riječi
Automatska klasifikacija ; računalna obrada prirodnoga jezika ; statističke metode ; digitalizacija ; arhivsko gradivo
(Automatic classification ; natural language processing ; statistical methods ; digitisation ; archival records)

Sažetak
Sustavi za upravljanje dokumentima i zapisima (EDRMS) koji su najčešće dijelovi sveobuhvatnijeg sustava za upravljanje korporacijskim sadržajima (ECMS) zahvaćaju dokumente i zapise koji izvorno nastaju u digitalnom obliku kao i one koji su digitalizirani. Dok je izvorno digitalne zapise relativno jednostavno opisati tijekom njihovoga nastanka te im pridodati sve potrebne metapodatke, do problema dolazi kod onih koji u sustav ulaze prolazeći postupak digitalizacije. Ukoliko je riječ o velikoj količini gradiva, pri čemu su dokumenti raznorodni i nemaju neka jedinstvena ili ponavljajuća obilježja, tada nije jednostavno odrediti o kojem je dokumentu riječ, ispravno ga klasificirati i pridodati mu metapodatke. Autori analiziraju i prikazuju mogućnosti rješenja koja pripadaju području statistički utemeljenih jezičnih tehnologija i istražuju njihovu moguću primjenu u području (polu)automatske klasifikacije registraturnoga i arhivskoga gradiva. U radu su objašnjena osnovna polazišta pojedinih metoda, mogućnosti automatske ekstrakcije teksta, metode statističke obrade te postavljanje osnove za (polu)automatsku klasifikaciju. Autori prikazuju rezultate testiranja primijenjenih metoda na konkretnome arhivskom gradivu i zaključuju o mogućim budućim pravcima istraživanja.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Ustanove
Filozofski fakultet, Zagreb