BLEU Evaluation of Machine-Translated English- Croatian Legislation

Seljan, Sanja; Vičić, Tomislav; Brkić, Marija

izvor podataka: crosbi !

BLEU Evaluation of Machine-Translated English- Croatian Legislation (CROSBI ID 587076)

Prilog sa skupa u zborniku | izvorni znanstveni rad | međunarodna recenzija

Seljan, Sanja ; Vičić, Tomislav ; Brkić, Marija BLEU Evaluation of Machine-Translated English- Croatian Legislation // Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12) / Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Mehmet Uğur Doğan, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis (ur.). Istanbul: European Language Resources Association (ELRA), 2012

Podaci o odgovornosti

Autori

Seljan, Sanja ; Vičić, Tomislav ; Brkić, Marija

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

engleski

Naslov

BLEU Evaluation of Machine-Translated English- Croatian Legislation

Sažetak

This paper presents work on the evaluation of online available machine translation (MT) service, i.e. Google Translate, for English- Croatian language pair in the domain of legislation. The total set of 200 sentences, for which three reference translations are provided, is divided into short and long sentences. Human evaluation is performed by native speakers, using the criteria of adequacy and fluency. For measuring the reliability of agreement among raters, Fleiss' kappa metric is used. Human evaluation is enriched by error analysis, in order to examine the influence of error types on fluency and adequacy, and to use it in further research. Translation errors are divided into several categories: non- translated words, word omissions, unnecessarily translated words, morphological errors, lexical errors, syntactic errors and incorrect punctuation. The automatic evaluation metric BLEU is calculated with regard to a single and multiple reference translations. System level Pearson’s correlation between BLEU scores based on a single and multiple reference translations is given, as well as correlation between short and long sentences BLEU scores, and correlation between the criteria of fluency and adequacy and each error category.

Ključne riječi

BLEU metric; English-Croatian legislation; human evaluation

Napomena

nije evidentirano

Jezik

nije evidentirano

Naslov

nije evidentirano

Sažetak

nije evidentirano

Ključne riječi

nije evidentirano

Napomena

nije evidentirano

Podaci o prilogu

Godina izdavanja

2012.

Status objave rada

objavljeno

Podaci o matičnoj publikaciji

Naslov

Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)

Urednici

Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Mehmet Uğur Doğan, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis

Izdavač

Istanbul: European Language Resources Association (ELRA)

ISBN

978-2-9517408-7-7

Podaci o skupu

Skup

Language Resources and Evaluation (LREC'12)

Vrsta sudjelovanja

poster

Datum održavanja skupa

23.05.2012-25.05.2012

Mjesto održavanja skupa

Istanbul, Turska

Povezanost rada

Povezane osobe

Marija Brkić Bakarić (autor/i)

Sanja Seljan (autor/i)

Tomislav Vičić (autor/i)

Povezane ustanove

Filozofski fakultet u Zagrebu (130) (autorova ustanova)

Sveučilište u Rijeci, Fakultet informatike i digitalnih tehnologija (318) (autorova ustanova)

Povezani projekti

Informacijska tehnologija u prevođenju hrvatskoga i e-učenju jezika (rezultat rada na projektu)

Govorne tehnologije (rezultat rada na projektu)

Područje

Informacijske i komunikacijske znanosti

Poveznice

lrec-conf.org