Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive

Tadić, Marko

izvor podataka: crosbi !

Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive (CROSBI ID 92650)

Prilog u časopisu | stručni rad

Tadić, Marko Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive // Suvremena lingvistika, 23 (1997), 43-44; 387-394-x

Podaci o odgovornosti

Autori

Tadić, Marko

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

hrvatski

Naslov

Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive

Sažetak

Članak daje pregled obradbe hrvatskih korpusa. Navode se najznačajniji korpusni projekti od prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski nacionalni korpus koji je središnji projekt na području korpusne lingvistike u Hrvatskoj danas. Hrvatski nacionalni korpus (Tadić 1996) čine dvije sastavnice: 1) reprezentativni 30-milijunski korpus suvremenoga hrvatskoga jezika (30M) i 2) Hrvatski elektronski tekstovni arhiv (HETA). U prvoj fazi sastavljanja Hrvatskoga nacionalnoga korpusa naglasak je na zaokruživanju 30-milijunskoga korpusa dok će se u drugoj fazi sav napor preusmjeriti na širenje obuhvata Hrvatskoga elektronskog tekstovnoga arhiva. U sadašnjem stanju rad na 30-milijunski korpusu, koji bi trebao biti završen 2000, u fazi je uznapredovala planiranja i javnoga testiranja probne inačice korpusa (7, 68 milijuna pojavnica) putem WWW-a.

Ključne riječi

korpusna lingvistika; korpus; hrvatski jezik

Napomena

nije evidentirano

Jezik

engleski

Naslov

Croatian Corpus Processing: History, State of the Art and Perspectives

Sažetak

nije evidentirano

Ključne riječi

corpus linguistics; corpus; Croatian language

Napomena

nije evidentirano

Podaci o izdanju

Časopis

Suvremena lingvistika

Volumen (broj)

23 (43-44)

Godina

1997.

Stranice rada

387-394-x

Status objave rada

objavljeno

ISSN

0586-0296

Povezanost rada

Povezane osobe

Marko Tadić (autor/i)

Povezane ustanove

Filozofski fakultet u Zagrebu (130) (autorova ustanova)

Područje

Filologija