Pregled bibliografske jedinice broj: 1265586
Izazovi rada s digitalnim alatima i resursima u kontekstu istraživanja strojnog prevođenja
Izazovi rada s digitalnim alatima i resursima u kontekstu istraživanja strojnog prevođenja // 4. simpozij SCIMETH - Digitalni alati i resursi u jezikoslovlju
Rijeka, Hrvatska, 2019. (predavanje, podatak o recenziji nije dostupan, pp prezentacija, znanstveni)
CROSBI ID: 1265586 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Izazovi rada s digitalnim alatima i resursima u
kontekstu istraživanja strojnog prevođenja
(Challenges of working with digital tools and
resources in the context of MT-research)
Autori
Ljubas, Sandra
Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, pp prezentacija, znanstveni
Skup
4. simpozij SCIMETH - Digitalni alati i resursi u jezikoslovlju
Mjesto i datum
Rijeka, Hrvatska, 15.05.2019
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Podatak o recenziji nije dostupan
Ključne riječi
strojno prevođenje ; digitalni alati
(machine translation ; digital tools)
Sažetak
Digitalni alati i resursi osim instrumenta, mogu biti i glavni fokus jezikoslovnih istraživanja. Prvi se izazov istraživanja kvalitete strojnih prijevoda krije u tome što su rezultati uvijek specifični za određen jezični par, karakteristike tih jezika i dostupne digitalne resurse, pa tako katkad radimo s gotovo neupotrebljivim izlaznim podacima, a katkad s prilično dobrima. Drugi je izazov brzo zastarijevanje podataka: zbog čestih ažuriranja strojnoprevoditeljskih sustava (primjerice Google Prevoditelja) rezultati istraživanja do trenutka objavljivanja već mogu prestati vrijediti, a to sa sobom povlači nereplikabilnost istraživanja. Nadalje, za svako je istraživanje vrednovanja strojnih prijevoda prvenstveno važno odabrati dobar paralelan korpus. Repozitoriji poput CLARIN-a uvelike olakšavaju i ubrzavaju proces pripreme istraživanja u usporedbi sa situacijama kada se ručno prikupljaju tekstovi i slažu korpusi samo za potrebe istraživanja. Ipak, valja zapamtiti da se i gotovi, preuzeti paralelni tekstovi smiju i trebaju prilagoditi potrebama pojedinog istraživanja. U preliminarnom istraživanju utjecaja višejezičnosti na ljudsku procjenu kvalitete strojnih prijevoda pokazalo se da odabrani referentni prijevod nije u potpunosti adekvatan i da su odabrani dijelovi teksta pisani prestručnim jezikom, pa je tekst prvo morao biti preuređen i lektoriran. Zaključno se može reći da u Hrvatskoj još uvijek vlada određeno nepovjerenje prema razvijanju jezičnih tehnologija, a tom se problemu može doskočiti samo daljnjim naporima na usavršavanju digitalnih resursa i ohrabrivanju i ostalih aktera, poput prevoditelja, da se i njih uključe.
Izvorni jezik
Hrvatski