Ispravljanje upita tražilice na temelju Levenshteinove mjere udaljenosti (CROSBI ID 353684)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Šolta, Ivan
Dalbelo Bašić, Bojana
hrvatski
Ispravljanje upita tražilice na temelju Levenshteinove mjere udaljenosti
Pravopisne pogreške svakodnevna su pojava. U domeni računala izazivaju probleme kao što je smanjen odziv tražilice. Postupak pronalaska ispravne riječi se uglavnom sastoji od dvije faze. Prva je faza generiranje kandidata, od kojih se u drugoj fazi bira najbolji. Opisane metode generiranja kandidata se temelje na pretraživanju rječnika ili na teoriji automata. Odabir najboljeg kandidata moguće je izvršiti na temelju vjerojatnosti pogreške. U okviru rada razvijen je sustav za ispravljanje jednostruke pogreške nastale unosom pojma putem tipkovnice. Generiranje kandidata temelji se na upotrebi Levenshteinovog automata. Odabir ispravne riječi ne uzima u obzir kontekst i vrši se na temelju vjerojatnosti pogreške koje su prethodno izračunate prema udaljenosti znakova i pohranjene u tablice. Time je postignuta otvorenost za promjene i nadogradnje.
pravopisne pogreške; Levenshteinova udaljenost; pretraživanje informacija
nije evidentirano
engleski
Query correction based on Levenshtein distance
nije evidentirano
spelling correction; Levenshtein-distance; typographical error; information retrieval
nije evidentirano
Podaci o izdanju
47
08.07.2008.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb