Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 132098

Leksička flektivna baza podataka hrvatskih imena i prezimena


Boras, Damir; Mikelić, Nives; Lauc, Davor
Leksička flektivna baza podataka hrvatskih imena i prezimena // Modeli znanja i obrada prirodnoga jezika / Tuđman, Miroslav (ur.).
Zagreb: Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu, 2003. str. 219-237


CROSBI ID: 132098 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Leksička flektivna baza podataka hrvatskih imena i prezimena
(Lexical Inflectional Database of Croatian First and Last Names)

Autori
Boras, Damir ; Mikelić, Nives ; Lauc, Davor

Vrsta, podvrsta i kategorija rada
Poglavlja u knjigama, znanstveni

Knjiga
Modeli znanja i obrada prirodnoga jezika

Urednik/ci
Tuđman, Miroslav

Izdavač
Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu

Grad
Zagreb

Godina
2003

Raspon stranica
219-237

ISBN
953-175-181-1

Ključne riječi
flektivna baza, osobna imena i prezimena, pretraživanje obavijesti
(inflectional database, first and last names, information retrieval)

Sažetak
U radu je opisan paradigmatski model, struktura i izrada flektivne baze podataka hrvatskih imena i prezimena (za pisani jezik) te njezina moguća upotreba u sustavima za pretraživanje podataka, sustavima za segmentaciju teksta, korektorima pogrešaka, te sustavima za gramatičku analizu teksta. Bazu podataka čine sva postojeća osobna imena i prezimena u Republici Hrvatskoj prikupljena iz dostupnih javnih izvora. Iz baze je moguće dobiti sve oblike za određeno ime u skladu s pravilima koja postoje za hrvatski jezik i koja su radi cjelovitosti rada također izložena. Budući da infleksijska baza sadrži i čestotu pojavljivanja određenog imena na području RH, moguće su i različite statističke analize, te upotreba baze kao modula za prepoznavanje osobnih imena u sustavima za pretraživanje punog teksta koji se koriste i vjerojatnosnim modelom prepoznavanja. Stoga su izložena i pravila slaganja osobnih imena s prezimenima. Osim što je u informatičkom smislu to prva takva baza imena i prezimena u nas, a od ostalih se infleksijskih baza riječi hrvatskoga jezika razlikuje i jednostavnijom paradigmatskom strukturom, ona i u lingvističkom smislu predstavlja novost jer donosi niz razrješenja za imena i prezimena kojima pripadajuću nastavačku paradigmu nije bilo moguće odrediti samo na temelju gramatičkih pravila, nego je bilo potrebno ući i u semantiku i etimologiju pojedinih imena i prezimena.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Projekti:
0130464
0130423

Ustanove:
Filozofski fakultet, Zagreb

Profili:

Avatar Url Davor Lauc (autor)

Avatar Url Nives Mikelić Preradović (autor)

Avatar Url Damir Boras (autor)


Citiraj ovu publikaciju:

Boras, Damir; Mikelić, Nives; Lauc, Davor
Leksička flektivna baza podataka hrvatskih imena i prezimena // Modeli znanja i obrada prirodnoga jezika / Tuđman, Miroslav (ur.).
Zagreb: Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu, 2003. str. 219-237
Boras, D., Mikelić, N. & Lauc, D. (2003) Leksička flektivna baza podataka hrvatskih imena i prezimena. U: Tuđman, M. (ur.) Modeli znanja i obrada prirodnoga jezika. Zagreb, Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu, str. 219-237.
@inbook{inbook, author = {Boras, Damir and Mikeli\'{c}, Nives and Lauc, Davor}, editor = {Tu\djman, M.}, year = {2003}, pages = {219-237}, keywords = {flektivna baza, osobna imena i prezimena, pretra\v{z}ivanje obavijesti}, isbn = {953-175-181-1}, title = {Leksi\v{c}ka flektivna baza podataka hrvatskih imena i prezimena}, keyword = {flektivna baza, osobna imena i prezimena, pretra\v{z}ivanje obavijesti}, publisher = {Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveu\v{c}ili\v{s}ta u Zagrebu}, publisherplace = {Zagreb} }
@inbook{inbook, author = {Boras, Damir and Mikeli\'{c}, Nives and Lauc, Davor}, editor = {Tu\djman, M.}, year = {2003}, pages = {219-237}, keywords = {inflectional database, first and last names, information retrieval}, isbn = {953-175-181-1}, title = {Lexical Inflectional Database of Croatian First and Last Names}, keyword = {inflectional database, first and last names, information retrieval}, publisher = {Zavod za informacijske studije Odsjeka za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveu\v{c}ili\v{s}ta u Zagrebu}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font