Pregled bibliografske jedinice broj: 476336
Ispravljanje pogrešaka u tekstovima dobivenima postupkom optičkog raspoznavanja znakova
Ispravljanje pogrešaka u tekstovima dobivenima postupkom optičkog raspoznavanja znakova, 2010., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 476336 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Ispravljanje pogrešaka u tekstovima dobivenima postupkom optičkog raspoznavanja znakova
(OCR Error Correction)
Autori
Marović, Mladen
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
07.07
Godina
2010
Stranica
35
Mentor
Dalbelo Bašić, Bojana
Neposredni voditelj
Šnajder, Jan
Ključne riječi
optičko raspoznavanje znakova; OCR; ispravljanje pogrešaka; supstitucijska pravila; znakovni n-grami; jezični model
(optical character recognition; OCR; error correction; character confusions; letter n-grams; language model)
Sažetak
U tekstovima dobivenim postupkom optičkog raspoznavanja znakova učestale su pogreške uzrokovane netočnim raspoznavanjem pojedinačnih znakova ili slijeda znakova. Ručno ispravljanje takvih pogrešaka izuzetno je naporan i vremenski zahtjevan zadatak. U ovom radu proučeni su postupci za automatsko ispravljanje pogrešaka nastalih netočnim raspoznavanjem znakova te je razrađen sustav prikladan za tekstove na hrvatskom jeziku. Uz opis modela sustava razvijena je programska implementacija postupka te je provedeno eksperimentalno vrednovanje točnosti na odgovarajućem tekstnom uzorku.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb