Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 1235585

Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima


Trbušić, Željko
Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima, 2022., doktorska disertacija, Filozofski fakultet, Zagreb doi:10.17234/diss.2022.8895


CROSBI ID: 1235585 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima
(Methods for analysis and process optimisation of optical character recognition in archival information systems)

Autori
Trbušić, Željko

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija

Fakultet
Filozofski fakultet

Mjesto
Zagreb

Datum
15.07

Godina
2022

Stranica
281

Mentor
Stančić, Hrvoje

Ključne riječi
optičko prepoznavanje znakova (OCR), arhivski informacijski sustavi, digitalizacija, evaluacija procesa, kvantitativna analiza, optimizacija
(optical character recognition (OCR), archival information systems, digitization, evaluation, quantitative analysis, optimization)

Sažetak
Doktorska disertacija naslovljena Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima izrađena je s ciljem istraživanja tehnologije optičkog prepoznavanja znakova (OCR) i njene primjene u okviru izgradnje i unapređenja arhivskih informacijskih sustava. Ova tehnologija pripada u šira područja proučavanja tehnologije računalnog vida, umjetne inteligencije i prepoznavanja uzoraka koja omogućuju računalima, strojevima i robotima da percipiraju analogne informacije iz okoline te ih koriste u vlastitom radu. S obzirom na veliku količinu tekstualnih informacija koje arhivi pohranjuju, potrebno je osmisliti model upravljanja, implementacije i evaluacije optičkog prepoznavanja znakova kojim će se ostvariti korištenje ove tehnologije na vjerodostojan, dugoročno održiv i optimalan način. Izgradnja takvog metodološkog procesa započinje proučavanjem radnog okruženja i vanjskih utjecaja čije zakonitosti određuju mogućnost i način implementacije. Obrađen je povijesni razvoj ove tehnologije koji prikazuje razvoj od samih početaka pa sve do suvremenih sustava koji koriste usluge u oblaku i mehanizme potpomognute umjetnom inteligencijom. Također je pružen pregled svih tehnoloških aspekata koji utječu na proces optičkog prepoznavanja znakova, od analize specifičnosti arhivskoga gradiva koje se prepoznaje, tipografskih elemenata slovnih oznaka, uređaja kojima se obavlja digitalizacija i povezanih formata prijenosa slikovnih datoteka do formata prijenosa računalno kodiranog teksta i načina kodiranja znakova. Obrađen je OAIS referentni model na temelju kojeg su prikazane mogućnosti implementacije optičkog prepoznavanja znakova na konceptualnoj razini, a predstavljena su i dva funkcionalna arhivska informacijska sustava koja koriste OCR u svakodnevnom poslovanju. Sustav zaklade Hathi definira proces prepoznavanja na razini komunikacije sa stvarateljima dok informacijski sustav Nacionalne medicinske knjižnice SAD-a obavlja postupak prepoznavanja izgradnjom unutrašnjih tehnoloških rješenja. Identificirani su elementi faza procesa optičkog prepoznavanja znakova koji omogućuju provođenje evaluacijskih metoda te unapređenje sustava u svim njegovim segmentima. U sklopu procesa evaluacije, ključnog za provođenje svrsishodnih i sistematički značajnih istraživanja prikazanih u ovom radu, definirani su koraci testiranja, mjerne jedinice te su detaljno predstavljeni ISRI analitički alati za evaluaciju OCR-a. iv Posljednji dio rada predstavlja rezultate i analizu evaluacije provedene na arhivskom gradivu na hrvatskom i engleskom jeziku. Testiranja su organizirana u tri radne okoline koje obuhvaćaju širok spektar arhivskoga gradiva i kojima se donose zaključci koji omogućuju optimizaciju procesa optičkog prepoznavanja znakova u svih njegovim fazama. Promatraju se postignute financijske i vremenske uštede, ali također i vjerodostojnost evaluiranog procesa te informacijska vrijednost produkta prepoznavanja. Testiranja, obavljena ISRI sustavom, obuhvatila su i temeljne statističke analize koje se mogu upošljavati ne samo kao dio evaluacije procesa optičkog prepoznavanja, već i za evaluaciju cjelokupnog sustava u svim njegovim segmentima. Ovaj rad polazi iz perspektive koja ne traga za savršenim sustavom niti besprijekorno implementiranim procesom, već se, pomalo paradoksalno za kvantitativnu analizu koja je temelj provedenih eksperimenata, dokazuje kako se i nesavršena tehnologija kao što je OCR može upotrijebiti u području upravljanja arhivskim gradivom na sustavan i optimalan način koji doprinosi povećanju iskoristivosti pohranjenog gradiva i podiže povjerenje koje korisnici imaju u arhive i arhivsku zajednicu.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Ustanove:
Filozofski fakultet, Zagreb

Profili:

Avatar Url Hrvoje Stančić (mentor)

Avatar Url Željko Trbušić (autor)

Poveznice na cjeloviti tekst rada:

doi

Citiraj ovu publikaciju:

Trbušić, Željko
Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima, 2022., doktorska disertacija, Filozofski fakultet, Zagreb doi:10.17234/diss.2022.8895
Trbušić, Ž. (2022) 'Metode analize i optimizacije procesa optičkog prepoznavanja znakova u arhivskim informacijskim sustavima', doktorska disertacija, Filozofski fakultet, Zagreb doi:10.17234/diss.2022.8895.
@phdthesis{phdthesis, author = {Trbu\v{s}i\'{c}, \v{Z}eljko}, year = {2022}, pages = {281}, DOI = {10.17234/diss.2022.8895}, keywords = {opti\v{c}ko prepoznavanje znakova (OCR), arhivski informacijski sustavi, digitalizacija, evaluacija procesa, kvantitativna analiza, optimizacija}, doi = {10.17234/diss.2022.8895}, title = {Metode analize i optimizacije procesa opti\v{c}kog prepoznavanja znakova u arhivskim informacijskim sustavima}, keyword = {opti\v{c}ko prepoznavanje znakova (OCR), arhivski informacijski sustavi, digitalizacija, evaluacija procesa, kvantitativna analiza, optimizacija}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Trbu\v{s}i\'{c}, \v{Z}eljko}, year = {2022}, pages = {281}, DOI = {10.17234/diss.2022.8895}, keywords = {optical character recognition (OCR), archival information systems, digitization, evaluation, quantitative analysis, optimization}, doi = {10.17234/diss.2022.8895}, title = {Methods for analysis and process optimisation of optical character recognition in archival information systems}, keyword = {optical character recognition (OCR), archival information systems, digitization, evaluation, quantitative analysis, optimization}, publisherplace = {Zagreb} }

Citati:





    Contrast
    Increase Font
    Decrease Font
    Dyslexic Font