Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 476483

Algoritam korjenovanja riječi temeljen na grupiranju znakovnih nizova


Hot, Zlatan
Algoritam korjenovanja riječi temeljen na grupiranju znakovnih nizova, 2010., diplomski rad, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 476483 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Algoritam korjenovanja riječi temeljen na grupiranju znakovnih nizova
(A Stemming Algorithm Based on String Clustering)

Autori
Hot, Zlatan

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
09.07

Godina
2010

Stranica
39

Mentor
Dalbelo Bašić, Bojana

Neposredni voditelj
Šnajder, Jan

Ključne riječi
korjenovanje; pretraživanje informacija; morfološka normalizacija; Newmanov algoritam za detekciju zajednica u grafu; sličnost znakovnih nizova; Ratclif-Obershelp mjera sličnosti
(stemming; information retrieval; morphological normalization; Newman's graph algorithm; string similarity; Ratclif-Obershelp similarity measure)

Sažetak
Performanse računalnih sustava za pretraživanje informacija i klasifikaciju teksta moguće je značajno poboljšati provođenjem postupka morfološke normalizacije. Jedan od načina jest korjenovanje riječi, koje uključuje svođenje morfološki sličnih riječi na zajedničku normu. Tema ovog rada je izrada programa za nenadzirano strojno učenje koji (bez predznanja o jeziku) kroz tri koraka izvodi potencijalna pravila za korjenovanje. Koraci su: povezivanje ortografski sličnih riječi, grupiranje riječi u derivacijske grupe korištenjem Newmanovog algoritma za otkrivanje zajednica u grafu te izvođenje pravila iz rezultirajućih grupa. Rezultat se vrednuje u smislu kakvoće normalizacije na flektivno-derivacijskoj razini. Istražuje se utjecaj izbora metode za određivanje udaljenosti, praga sličnosti i skupa ulaznih podataka.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Jan Šnajder (mentor)

Avatar Url Bojana Dalbelo Bašić (mentor)


Citiraj ovu publikaciju:

Hot, Zlatan
Algoritam korjenovanja riječi temeljen na grupiranju znakovnih nizova, 2010., diplomski rad, Fakultet elektrotehnike i računarstva, Zagreb
Hot, Z. (2010) 'Algoritam korjenovanja riječi temeljen na grupiranju znakovnih nizova', diplomski rad, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, author = {Hot, Zlatan}, year = {2010}, pages = {39}, keywords = {korjenovanje, pretra\v{z}ivanje informacija, morfolo\v{s}ka normalizacija, Newmanov algoritam za detekciju zajednica u grafu, sli\v{c}nost znakovnih nizova, Ratclif-Obershelp mjera sli\v{c}nosti}, title = {Algoritam korjenovanja rije\v{c}i temeljen na grupiranju znakovnih nizova}, keyword = {korjenovanje, pretra\v{z}ivanje informacija, morfolo\v{s}ka normalizacija, Newmanov algoritam za detekciju zajednica u grafu, sli\v{c}nost znakovnih nizova, Ratclif-Obershelp mjera sli\v{c}nosti}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Hot, Zlatan}, year = {2010}, pages = {39}, keywords = {stemming, information retrieval, morphological normalization, Newman's graph algorithm, string similarity, Ratclif-Obershelp similarity measure}, title = {A Stemming Algorithm Based on String Clustering}, keyword = {stemming, information retrieval, morphological normalization, Newman's graph algorithm, string similarity, Ratclif-Obershelp similarity measure}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font