Pregled bibliografske jedinice broj: 69325
Neki problemi obrade prirodnoga jezika u sustavima za pretraživanje obavijesti putem pretraživanja punoga teksta na hrvatskome književnom jeziku
Neki problemi obrade prirodnoga jezika u sustavima za pretraživanje obavijesti putem pretraživanja punoga teksta na hrvatskome književnom jeziku, 2001., doktorska disertacija, Filozofski fakultet, Zagreb
CROSBI ID: 69325 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Neki problemi obrade prirodnoga jezika u sustavima za pretraživanje obavijesti putem pretraživanja punoga teksta na hrvatskome književnom jeziku
(Problems of natural language processing in systems of information retrieval using full text searching in the Standard Croatian language)
Autori
Lauc (rođ. Žubrinić), Tomislava
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija
Fakultet
Filozofski fakultet
Mjesto
Zagreb
Datum
15.03
Godina
2001
Stranica
254
Mentor
Tuđman, Miroslav
Ključne riječi
obrada prirodnoga jezika; pretraživanje obavijest; hrvatski književni jezik
(NLP; information retrieval; standard Croatian language)
Sažetak
Tehnike za obradu prirodnoga jezika radi pronalaženja relevantnih dokumenata zasnivaju se na podudarnosti semantičkog sadržaja upita sa semantičkim sadržajem dokumenta. Pri tome je važno naglasiti da su značajnija poboljšanja kad je riječ o automatskoj semantičkoj analizi, zbog njenesloženosti još uvijek nedovoljna. S obzirom na suvremena dostignuća u području izrade sustava za pretraživanje obavijesti, sustav za pretraživanje korpusa tekstova hrvatskoga jezika treba obuhvaćati pretraživanje osnovnoga oblika i oznake za oblik i vrstu riječu u danome tekstu, segmentaciju teksta na podcjeline do razine rečenice, automatsku sintaktičku analizu određenih rečeničnih dijelova u cilju indeksiranja složenih termina te razmatranje teorijskih postavki za moguće semantičke analize tekstova hrvatskoga jezika. Važno je uočiti, da se, kad je riječ o hrvatskome jeziku, izrada dosadašnjih sustava za pretraživanje obavijesti temelji na statističkom pristupu i tradicionalnim metodama koje ne uključuju tehnike obrade prirodnoga jezika. U tom smislu znanstveni doprinos predstavlja uporaba sintaktičkih, za razliku od ne-sintaktičkih metoda u svrhu automatskoga indeksiranja složenih pojmova, pri čemu je polazna odrednica da se usporedbom sintaktičkih i ne-sintaktičkih metoda može ukazati na prednosti pristupa koji se temelji na obradi prirodnoga jezika.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti
POVEZANOST RADA