Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima (CROSBI ID 455210)

Ocjenski rad | doktorska disertacija

Trbušić, Željko Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima / Stančić, Hrvoje (mentor); Zagreb, Filozofski fakultet u Zagrebu, . 2022. doi: 10.17234/diss.2022.8895

Podaci o odgovornosti

Trbušić, Željko

Stančić, Hrvoje

hrvatski

Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima

Doktorska disertacija naslovljena Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima izrađena je s ciljem istraživanja tehnologije optičkog prepoznavanja znakova (OCR) i njene primjene u okviru izgradnje i unapređenja arhivskih informacijskih sustava. Ova tehnologija pripada u šira područja proučavanja tehnologije računalnog vida, umjetne inteligencije i prepoznavanja uzoraka koja omogućuju računalima, strojevima i robotima da percipiraju analogne informacije iz okoline te ih koriste u vlastitom radu. S obzirom na veliku količinu tekstualnih informacija koje arhivi pohranjuju, potrebno je osmisliti model upravljanja, implementacije i evaluacije optičkog prepoznavanja znakova kojim će se ostvariti korištenje ove tehnologije na vjerodostojan, dugoročno održiv i optimalan način. Izgradnja takvog metodološkog procesa započinje proučavanjem radnog okruženja i vanjskih utjecaja čije zakonitosti određuju mogućnost i način implementacije. Obrađen je povijesni razvoj ove tehnologije koji prikazuje razvoj od samih početaka pa sve do suvremenih sustava koji koriste usluge u oblaku i mehanizme potpomognute umjetnom inteligencijom. Također je pružen pregled svih tehnoloških aspekata koji utječu na proces optičkog prepoznavanja znakova, od analize specifičnosti arhivskoga gradiva koje se prepoznaje, tipografskih elemenata slovnih oznaka, uređaja kojima se obavlja digitalizacija i povezanih formata prijenosa slikovnih datoteka do formata prijenosa računalno kodiranog teksta i načina kodiranja znakova. Obrađen je OAIS referentni model na temelju kojeg su prikazane mogućnosti implementacije optičkog prepoznavanja znakova na konceptualnoj razini, a predstavljena su i dva funkcionalna arhivska informacijska sustava koja koriste OCR u svakodnevnom poslovanju. Sustav zaklade Hathi definira proces prepoznavanja na razini komunikacije sa stvarateljima dok informacijski sustav Nacionalne medicinske knjižnice SAD-a obavlja postupak prepoznavanja izgradnjom unutrašnjih tehnoloških rješenja. Identificirani su elementi faza procesa optičkog prepoznavanja znakova koji omogućuju provođenje evaluacijskih metoda te unapređenje sustava u svim njegovim segmentima. U sklopu procesa evaluacije, ključnog za provođenje svrsishodnih i sistematički značajnih istraživanja prikazanih u ovom radu, definirani su koraci testiranja, mjerne jedinice te su detaljno predstavljeni ISRI analitički alati za evaluaciju OCR-a. iv Posljednji dio rada predstavlja rezultate i analizu evaluacije provedene na arhivskom gradivu na hrvatskom i engleskom jeziku. Testiranja su organizirana u tri radne okoline koje obuhvaćaju širok spektar arhivskoga gradiva i kojima se donose zaključci koji omogućuju optimizaciju procesa optičkog prepoznavanja znakova u svih njegovim fazama. Promatraju se postignute financijske i vremenske uštede, ali također i vjerodostojnost evaluiranog procesa te informacijska vrijednost produkta prepoznavanja. Testiranja, obavljena ISRI sustavom, obuhvatila su i temeljne statističke analize koje se mogu upošljavati ne samo kao dio evaluacije procesa optičkog prepoznavanja, već i za evaluaciju cjelokupnog sustava u svim njegovim segmentima. Ovaj rad polazi iz perspektive koja ne traga za savršenim sustavom niti besprijekorno implementiranim procesom, već se, pomalo paradoksalno za kvantitativnu analizu koja je temelj provedenih eksperimenata, dokazuje kako se i nesavršena tehnologija kao što je OCR može upotrijebiti u području upravljanja arhivskim gradivom na sustavan i optimalan način koji doprinosi povećanju iskoristivosti pohranjenog gradiva i podiže povjerenje koje korisnici imaju u arhive i arhivsku zajednicu.

optičko prepoznavanje znakova (OCR), arhivski informacijski sustavi, digitalizacija, evaluacija procesa, kvantitativna analiza, optimizacija

nije evidentirano

engleski

Methods for analysis and process optimisation of optical character recognition in archival information systems

nije evidentirano

optical character recognition (OCR), archival information systems, digitization, evaluation, quantitative analysis, optimization

nije evidentirano

Podaci o izdanju

281

15.07.2022.

obranjeno

10.17234/diss.2022.8895

Podaci o ustanovi koja je dodijelila akademski stupanj

Filozofski fakultet u Zagrebu

Zagreb

Povezanost rada

Informacijske i komunikacijske znanosti

Poveznice