Pregled bibliografske jedinice broj: 1235585
Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima
Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima, 2022., doktorska disertacija, Filozofski fakultet, Zagreb doi:10.17234/diss.2022.8895
CROSBI ID: 1235585 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Metode analize i optimizacije procesa optičkog
prepoznavanja znakova u arhivskim informacijskim
sustavima
(Methods for analysis and process optimisation of
optical character recognition in archival
information systems)
Autori
Trbušić, Željko
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija
Fakultet
Filozofski fakultet
Mjesto
Zagreb
Datum
15.07
Godina
2022
Stranica
281
Mentor
Stančić, Hrvoje
Ključne riječi
optičko prepoznavanje znakova (OCR), arhivski informacijski sustavi, digitalizacija, evaluacija procesa, kvantitativna analiza, optimizacija
(optical character recognition (OCR), archival information systems, digitization, evaluation, quantitative analysis, optimization)
Sažetak
Doktorska disertacija naslovljena Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima izrađena je s ciljem istraživanja tehnologije optičkog prepoznavanja znakova (OCR) i njene primjene u okviru izgradnje i unapređenja arhivskih informacijskih sustava. Ova tehnologija pripada u šira područja proučavanja tehnologije računalnog vida, umjetne inteligencije i prepoznavanja uzoraka koja omogućuju računalima, strojevima i robotima da percipiraju analogne informacije iz okoline te ih koriste u vlastitom radu. S obzirom na veliku količinu tekstualnih informacija koje arhivi pohranjuju, potrebno je osmisliti model upravljanja, implementacije i evaluacije optičkog prepoznavanja znakova kojim će se ostvariti korištenje ove tehnologije na vjerodostojan, dugoročno održiv i optimalan način. Izgradnja takvog metodološkog procesa započinje proučavanjem radnog okruženja i vanjskih utjecaja čije zakonitosti određuju mogućnost i način implementacije. Obrađen je povijesni razvoj ove tehnologije koji prikazuje razvoj od samih početaka pa sve do suvremenih sustava koji koriste usluge u oblaku i mehanizme potpomognute umjetnom inteligencijom. Također je pružen pregled svih tehnoloških aspekata koji utječu na proces optičkog prepoznavanja znakova, od analize specifičnosti arhivskoga gradiva koje se prepoznaje, tipografskih elemenata slovnih oznaka, uređaja kojima se obavlja digitalizacija i povezanih formata prijenosa slikovnih datoteka do formata prijenosa računalno kodiranog teksta i načina kodiranja znakova. Obrađen je OAIS referentni model na temelju kojeg su prikazane mogućnosti implementacije optičkog prepoznavanja znakova na konceptualnoj razini, a predstavljena su i dva funkcionalna arhivska informacijska sustava koja koriste OCR u svakodnevnom poslovanju. Sustav zaklade Hathi definira proces prepoznavanja na razini komunikacije sa stvarateljima dok informacijski sustav Nacionalne medicinske knjižnice SAD-a obavlja postupak prepoznavanja izgradnjom unutrašnjih tehnoloških rješenja. Identificirani su elementi faza procesa optičkog prepoznavanja znakova koji omogućuju provođenje evaluacijskih metoda te unapređenje sustava u svim njegovim segmentima. U sklopu procesa evaluacije, ključnog za provođenje svrsishodnih i sistematički značajnih istraživanja prikazanih u ovom radu, definirani su koraci testiranja, mjerne jedinice te su detaljno predstavljeni ISRI analitički alati za evaluaciju OCR-a. iv Posljednji dio rada predstavlja rezultate i analizu evaluacije provedene na arhivskom gradivu na hrvatskom i engleskom jeziku. Testiranja su organizirana u tri radne okoline koje obuhvaćaju širok spektar arhivskoga gradiva i kojima se donose zaključci koji omogućuju optimizaciju procesa optičkog prepoznavanja znakova u svih njegovim fazama. Promatraju se postignute financijske i vremenske uštede, ali također i vjerodostojnost evaluiranog procesa te informacijska vrijednost produkta prepoznavanja. Testiranja, obavljena ISRI sustavom, obuhvatila su i temeljne statističke analize koje se mogu upošljavati ne samo kao dio evaluacije procesa optičkog prepoznavanja, već i za evaluaciju cjelokupnog sustava u svim njegovim segmentima. Ovaj rad polazi iz perspektive koja ne traga za savršenim sustavom niti besprijekorno implementiranim procesom, već se, pomalo paradoksalno za kvantitativnu analizu koja je temelj provedenih eksperimenata, dokazuje kako se i nesavršena tehnologija kao što je OCR može upotrijebiti u području upravljanja arhivskim gradivom na sustavan i optimalan način koji doprinosi povećanju iskoristivosti pohranjenog gradiva i podiže povjerenje koje korisnici imaju u arhive i arhivsku zajednicu.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti
POVEZANOST RADA
Ustanove:
Filozofski fakultet, Zagreb