Pregled bibliografske jedinice broj: 102036
Primjena računalnojezikoslovnih alata na hrvatske korpuse
Primjena računalnojezikoslovnih alata na hrvatske korpuse, 2001., magistarski rad, Filozofski fakultet, Zagreb
CROSBI ID: 102036 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Primjena računalnojezikoslovnih alata na hrvatske korpuse
(The Application of Computational-linguistic Tools on Croatian Corpora)
Autori
Bekavac, Božo
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad
Fakultet
Filozofski fakultet
Mjesto
Zagreb
Datum
19.09
Godina
2001
Stranica
137
Mentor
Tadić, Marko
Ključne riječi
jezične tehnologije; hrvatski jezik; računalna lingvistika; računalnolingvistički alati; korpus
(human language technologies; Croatian language; computational linguistics; computational-linguistic tools; corpus)
Sažetak
U radu se osvjetljava problematika računalnih korpusa i računalnojezikoslovnih alata primijenjenih u njihovu sastavljanju i obradi. U prva tri poglavlja određuje se položaj korpusne lingvistike unutar lingvistike same, ali i unutar područja jezičnih tehnologija. U istom se dijelu objašnjavaju i definiraju osnovni termini tog područja, te nude njihovi prijevodi na hrvatski jezik. Logičnim se slijedom nastavljaju poglavlja o kodiranju tekstova/korpusa (najzahtjevniji postupak pri sastavljanju korpusa) i međunarodnim standardima za njihovo kodiranje (TEI, CES, XCES). Slijedi poglavlje o (meta)jezicima za obilježavanje (SGML i osobito XML). Alati kojima se danas služe jezikoslovci pri proučavanju jezika opisani su i potkrijepljeni brojnim primjerima i slikovnim prikazima (IV poglavlje). Slijedi opis alata primjenjivanih na hrvatske tekstove/korpuse, te prikaz samih hrvatskih korpusa. U žarištu su rada alati primjenjivani u izradi najvećeg korpusa hrvatskih tekstova do sada &#8212 ; HNK (Hrvatskog Nacionalnog Korpusa). Rad na jednome mjestu usustavljeno donosi pregled dosadašnjih aktivnosti u sastavljanju hrvatskih korpusa i primjeni računalnojezikoslovnih alata. Osobita je zasluga razrada, objašnjene te terminološko uređivanje na hrvatskome jeziku područja jezika za obilježavanje i kodiranja korpusa (osobito XML). Alati uporabljeni za postavljanje i uporabu Hrvatskoga nacionalnoga korpusa također su detaljno opisani, a dijelom predstavljaju i autorov osobni doprinos radu u okviru sastavljanja HNK.
Izvorni jezik
Hrvatski
Znanstvena područja
Filologija
POVEZANOST RADA