Napredna pretraga

Pregled bibliografske jedinice broj: 69512

Obrada i pretraživanje tekstova pisanih na hrvatskom jeziku. The second International Conference: Journalism and Information Technology Dubrovnik, 26-29.05.1997 (pozvano predavanje)


Boras, Damir
Obrada i pretraživanje tekstova pisanih na hrvatskom jeziku. The second International Conference: Journalism and Information Technology Dubrovnik, 26-29.05.1997 (pozvano predavanje) // The second International Conference: Journalism and Information Technology
Dubrovnik, Hrvatska, 1997. (pozvano predavanje, nije recenziran, sažetak, ostalo)


Naslov
Obrada i pretraživanje tekstova pisanih na hrvatskom jeziku. The second International Conference: Journalism and Information Technology Dubrovnik, 26-29.05.1997 (pozvano predavanje)
(Processing and retrieval of texts written in Croatian language. The second International Conference: Journalism and Information Technology, Dubrovnik, 26-29.05.1997)

Autori
Boras, Damir

Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, sažetak, ostalo

Skup
The second International Conference: Journalism and Information Technology

Mjesto i datum
Dubrovnik, Hrvatska, 26-29.05.1997

Vrsta sudjelovanja
Pozvano predavanje

Vrsta recenzije
Nije recenziran

Ključne riječi
Obrada prirodnoga jezika; pretraživanje teksta; hrvatski jezika
(NLP; text retrieval; Croatian language)

Sažetak
U radu se prvo analiziraju karakteristike germanskih (anglosaksonskih) i romanskih jezika kao analitičkih jezika u kojima promjenjljive riječi nemaju mnogo tvorbenih oblika, pri čemu se osnovna riječ ne mijenja ili joj se dodaju brojem vrlo ograničeni nastavci, pri čemu je takva jezična tvorba vrlo povoljna za programsku obradu te zatim uspoređuju sa značajkama hrvatskog jezika kao sintetičnog (flektivnog, infleksijskog) jezika u kojem postoji velik broj morfoloških inačica iste riječi, pri čemu je kao posljedica toga i redoslijed riječi u rečenici slobodniji nego u analitičkim jezicima pa je takva jezična tvorba složena i teža za programsku obradu. Zatim se opisuju razlike između govorenoga i pisanoga jezika, naročito u pogledu zapisivanja naglasaka te definira pojam obrade teksta u širem smislu, koja se proteže i na obradu jezika. Na temelju poredbene analize tih različitih jezičnih sustava teoretski se postavljaju zahtjevi na karakteristike alata za obradu tekstova pisanih na hrvatskom (i drugim flektivnim jezicima), izrada odgovarajućih rječničkih baza te njihova upotreba u pretraživanju teksta.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Projekt / tema
130743

Ustanove
Filozofski fakultet, Zagreb

Autor s matičnim brojem:
Damir Boras, (4513)