Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu

Tadić, Marko; Šojat, Krešimir

Pregled bibliografske jedinice broj: 125765

Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu

Tadić, Marko; Šojat, Krešimir

Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu // Filologija, 38-39 (2002), 38-39; 247-262 (podatak o recenziji nije dostupan, članak, znanstveni)

CROSBI ID: 125765 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu
(Identification of translational equivalents in Croatian-English Parallel Corpus)

Autori
Tadić, Marko ; Šojat, Krešimir

Izvornik
Filologija (0449-363X) 38-39 (2002), 38-39; 247-262

Vrsta, podvrsta i kategorija rada
Radovi u časopisima, članak, znanstveni

Ključne riječi
Hrvatsko-engleski paralelni korpus; višerječne jedinice; prijevodni ekvivalenti; sravnjivanje riječi; uzajamna obavijesnost
(Croatian-English parallel corpus; multi-word units; translational equivalents; word alignment; mutual information)

Sažetak
U radu se ispituju mogućnosti identificiranja prijevodnih ekvivalenta u Hrvatsko-engleskom paralelnom korpusu sravnjenom (aligned) na razini rečenica koji je sastavljen u Zavodu za lingvistiku Filozofskog fakulteta u Zagrebu. Pozornost je u početku usmjerena na identifikaciju prijevodnih ekvivalenata od po jedne riječi u svakom jeziku. To je postignuto generiranjem svih mogućih prijevodnih parova riječi unutar svake rečenice sravnjene u odnosu 1:1. Na tako generirane parove primijenjen je izračun statističke mjere uzajamne obavijesnosti (mutual information) koja daje podatak od statistički relevantnim supojavljivanjima riječi u takvu paru. Parovi s visokom vrijednošću uzajamne obavijesnosti predstavljaju dobre kandidate za prijevodne ekvivalente. U nastavku se rada provodi identifikacija jedinica sastavljenih od više riječi (multi-word units) u izvornim (hrvatskim) tekstovima i to primjenom iste statističke mjere. Identičan se postupak rabi za ustanovljavanje relevantnog supojavljivanja parova riječi i u jeziku prijevoda (engleski). Kako bi se ustanovili potencijalni kandidati za prijevodne ekvivalente tako dobivenih parova riječi u pojedinom jeziku, u nastavku se izračunavaju i statistički značajna supojavljivanja izvornih i prijevodnih parova riječi. Tako su dobiveni karakteristični prijevodni uzorci jer se pokazalo da postoje parovi riječi u izvornom jeziku koji se redovito prevode istim parom riječi u ciljnome jeziku premda je u svakom od jezika pojedinačno, vrijednost njihove uzajamne obavijesnosti izrazito niska. Radom se želi prikazati kako se korištenjem statističkih postupaka u paralelnim korpusima olakšava pronalaženje kolokacija (mogućih višerječnih termina) i njihovih prijevoda. Istodobno se omogućuje uvid u odgovarajuće ko-tekstualne primjere uporabe riječi u izvornom jeziku i u jeziku prijevoda. Tako priređena građa od nesumnjive je koristi kako dvojezičnim leksikografima kao autorima rječnika, tako i prevoditeljima kao najznatnijoj skupini rječničkih korisnika.

Izvorni jezik
Engleski

Znanstvena područja
Filologija

POVEZANOST RADA

Projekti:
0130418

Ustanove:
Filozofski fakultet, Zagreb

Profili:

Marko Tadić (autor)

Krešimir Šojat (autor)

Citiraj ovu publikaciju:

Uključenost u ostale bibliografske baze podataka::

LLBA: Linguistics and Language Behavior Abstracts
MLA - Modern Language Abstracts

Pregled bibliografske jedinice broj: 125765

Identifikacija prijevodnih ekvivalenata u hrvatsko-engleskom paralelnom korpusu

Citiraj ovu publikaciju:

Uključenost u ostale bibliografske baze podataka::

Podijeli: