Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi

Leksička flektivna baza podataka hrvatskih imena i prezimena (CROSBI ID 28595)

Prilog u knjizi | izvorni znanstveni rad

Boras, Damir ; Mikelić, Nives ; Lauc, Davor Leksička flektivna baza podataka hrvatskih imena i prezimena // Modeli znanja i obrada prirodnoga jezika / Tuđman, Miroslav (ur.). Zagreb: Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu, 2003. str. 219-237

Podaci o odgovornosti

Boras, Damir ; Mikelić, Nives ; Lauc, Davor

hrvatski

Leksička flektivna baza podataka hrvatskih imena i prezimena

U radu je opisan paradigmatski model, struktura i izrada flektivne baze podataka hrvatskih imena i prezimena (za pisani jezik) te njezina moguća upotreba u sustavima za pretraživanje podataka, sustavima za segmentaciju teksta, korektorima pogrešaka, te sustavima za gramatičku analizu teksta. Bazu podataka čine sva postojeća osobna imena i prezimena u Republici Hrvatskoj prikupljena iz dostupnih javnih izvora. Iz baze je moguće dobiti sve oblike za određeno ime u skladu s pravilima koja postoje za hrvatski jezik i koja su radi cjelovitosti rada također izložena. Budući da infleksijska baza sadrži i čestotu pojavljivanja određenog imena na području RH, moguće su i različite statističke analize, te upotreba baze kao modula za prepoznavanje osobnih imena u sustavima za pretraživanje punog teksta koji se koriste i vjerojatnosnim modelom prepoznavanja. Stoga su izložena i pravila slaganja osobnih imena s prezimenima. Osim što je u informatičkom smislu to prva takva baza imena i prezimena u nas, a od ostalih se infleksijskih baza riječi hrvatskoga jezika razlikuje i jednostavnijom paradigmatskom strukturom, ona i u lingvističkom smislu predstavlja novost jer donosi niz razrješenja za imena i prezimena kojima pripadajuću nastavačku paradigmu nije bilo moguće odrediti samo na temelju gramatičkih pravila, nego je bilo potrebno ući i u semantiku i etimologiju pojedinih imena i prezimena.

flektivna baza, osobna imena i prezimena, pretraživanje obavijesti

nije evidentirano

engleski

Lexical Inflectional Database of Croatian First and Last Names

nije evidentirano

inflectional database, first and last names, information retrieval

nije evidentirano

Podaci o prilogu

219-237.

objavljeno

Podaci o knjizi

Modeli znanja i obrada prirodnoga jezika

Tuđman, Miroslav

Zagreb: Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu

2003.

953-175-181-1

Povezanost rada

Informacijske i komunikacijske znanosti