Pregled bibliografske jedinice broj: 69512
Obrada i pretraživanje tekstova pisanih na hrvatskom jeziku. The second International Conference: Journalism and Information Technology Dubrovnik, 26-29.05.1997 (pozvano predavanje)
Obrada i pretraživanje tekstova pisanih na hrvatskom jeziku. The second International Conference: Journalism and Information Technology Dubrovnik, 26-29.05.1997 (pozvano predavanje) // The second International Conference: Journalism and Information Technology
Dubrovnik, Hrvatska, 1997. (pozvano predavanje, nije recenziran, sažetak, ostalo)
CROSBI ID: 69512 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Obrada i pretraživanje tekstova pisanih na hrvatskom jeziku. The second International Conference: Journalism and Information Technology Dubrovnik, 26-29.05.1997 (pozvano predavanje)
(Processing and retrieval of texts written in Croatian language. The second International Conference: Journalism and Information Technology, Dubrovnik, 26-29.05.1997)
Autori
Boras, Damir
Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, sažetak, ostalo
Skup
The second International Conference: Journalism and Information Technology
Mjesto i datum
Dubrovnik, Hrvatska, 26.05.1997. - 29.05.1997
Vrsta sudjelovanja
Pozvano predavanje
Vrsta recenzije
Nije recenziran
Ključne riječi
obrada prirodnoga jezika; pretraživanje teksta; hrvatski jezika
(NLP; text retrieval; Croatian language)
Sažetak
U radu se prvo analiziraju karakteristike germanskih (anglosaksonskih) i romanskih jezika kao analitičkih jezika u kojima promjenjljive riječi nemaju mnogo tvorbenih oblika, pri čemu se osnovna riječ ne mijenja ili joj se dodaju brojem vrlo ograničeni nastavci, pri čemu je takva jezična tvorba vrlo povoljna za programsku obradu te zatim uspoređuju sa značajkama hrvatskog jezika kao sintetičnog (flektivnog, infleksijskog) jezika u kojem postoji velik broj morfoloških inačica iste riječi, pri čemu je kao posljedica toga i redoslijed riječi u rečenici slobodniji nego u analitičkim jezicima pa je takva jezična tvorba složena i teža za programsku obradu. Zatim se opisuju razlike između govorenoga i pisanoga jezika, naročito u pogledu zapisivanja naglasaka te definira pojam obrade teksta u širem smislu, koja se proteže i na obradu jezika. Na temelju poredbene analize tih različitih jezičnih sustava teoretski se postavljaju zahtjevi na karakteristike alata za obradu tekstova pisanih na hrvatskom (i drugim flektivnim jezicima), izrada odgovarajućih rječničkih baza te njihova upotreba u pretraživanju teksta.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti