Ispravljanje pogrešaka u tekstovima dobivenima postupkom optičkog raspoznavanja znakova (CROSBI ID 360060)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Marović, Mladen
Dalbelo Bašić, Bojana
Šnajder, Jan
hrvatski
Ispravljanje pogrešaka u tekstovima dobivenima postupkom optičkog raspoznavanja znakova
U tekstovima dobivenim postupkom optičkog raspoznavanja znakova učestale su pogreške uzrokovane netočnim raspoznavanjem pojedinačnih znakova ili slijeda znakova. Ručno ispravljanje takvih pogrešaka izuzetno je naporan i vremenski zahtjevan zadatak. U ovom radu proučeni su postupci za automatsko ispravljanje pogrešaka nastalih netočnim raspoznavanjem znakova te je razrađen sustav prikladan za tekstove na hrvatskom jeziku. Uz opis modela sustava razvijena je programska implementacija postupka te je provedeno eksperimentalno vrednovanje točnosti na odgovarajućem tekstnom uzorku.
optičko raspoznavanje znakova; OCR; ispravljanje pogrešaka; supstitucijska pravila; znakovni n-grami; jezični model
nije evidentirano
engleski
OCR Error Correction
nije evidentirano
optical character recognition; OCR; error correction; character confusions; letter n-grams; language model
nije evidentirano
Podaci o izdanju
35
07.07.2010.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb