Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 719183

Pseudo-lemmatization in Croatian-English SMT


Brkić, Marija; Matetić, Maja; Seljan, Sanja
Pseudo-lemmatization in Croatian-English SMT // Proceedings of the Central European Conference on Information and Intelligent Systems / Hunjak, T. ; Lovrenčić, S. ; Tomičić, I. (ur.).
Varaždin: Fakultet organizacije i informatike Sveučilišta u Zagrebu, 2014. str. 242-249 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)


CROSBI ID: 719183 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Pseudo-lemmatization in Croatian-English SMT

Autori
Brkić, Marija ; Matetić, Maja ; Seljan, Sanja

Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni

Izvornik
Proceedings of the Central European Conference on Information and Intelligent Systems / Hunjak, T. ; Lovrenčić, S. ; Tomičić, I. - Varaždin : Fakultet organizacije i informatike Sveučilišta u Zagrebu, 2014, 242-249

Skup
Central European Conference on Information and Intelligent Systems

Mjesto i datum
Varaždin, Hrvatska, 17.09.2014. - 19.09.2014

Vrsta sudjelovanja
Predavanje

Vrsta recenzije
Međunarodna recenzija

Ključne riječi
phrase-based statistical machine translation; pseudolemmatization; Croatian-English

Sažetak
One of the first difficulties in conducting a thorough analysis of statistical machine translation involving Croatian as a morphologically rich and resource poor language is the lack of quality language resources. This paper presents results of two standard fourteen feature Croatian-English phrase-based statistical machine translation systems. Prior to building the second system a partial pseudo- lemmatization of the Croatian parts of training and test sets is made in an attempt to simplify the translation process. Besides automatic evaluation, a manual evaluation is conducted in order to gain insight into the nature of the translation differences achieved between the two systems.

Izvorni jezik
Engleski

Znanstvena područja
Računarstvo, Informacijske i komunikacijske znanosti



POVEZANOST RADA


Projekti:
13.13.1.3.03
130-1300646-0909 - Informacijska tehnologija u prevođenju hrvatskoga i e-učenju jezika (Seljan, Sanja, MZOS ) ( CroRIS)

Ustanove:
Filozofski fakultet, Zagreb,
Fakultet informatike i digitalnih tehnologija, Rijeka

Profili:

Avatar Url Sanja Seljan (autor)

Avatar Url Maja Matetić (autor)

Avatar Url Marija Brkić Bakarić (autor)

Citiraj ovu publikaciju:

Brkić, Marija; Matetić, Maja; Seljan, Sanja
Pseudo-lemmatization in Croatian-English SMT // Proceedings of the Central European Conference on Information and Intelligent Systems / Hunjak, T. ; Lovrenčić, S. ; Tomičić, I. (ur.).
Varaždin: Fakultet organizacije i informatike Sveučilišta u Zagrebu, 2014. str. 242-249 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)
Brkić, M., Matetić, M. & Seljan, S. (2014) Pseudo-lemmatization in Croatian-English SMT. U: Hunjak, T., Lovrenčić, S. & Tomičić, I. (ur.)Proceedings of the Central European Conference on Information and Intelligent Systems.
@article{article, author = {Brki\'{c}, Marija and Mateti\'{c}, Maja and Seljan, Sanja}, year = {2014}, pages = {242-249}, keywords = {phrase-based statistical machine translation, pseudolemmatization, Croatian-English}, title = {Pseudo-lemmatization in Croatian-English SMT}, keyword = {phrase-based statistical machine translation, pseudolemmatization, Croatian-English}, publisher = {Fakultet organizacije i informatike Sveu\v{c}ili\v{s}ta u Zagrebu}, publisherplace = {Vara\v{z}din, Hrvatska} }
@article{article, author = {Brki\'{c}, Marija and Mateti\'{c}, Maja and Seljan, Sanja}, year = {2014}, pages = {242-249}, keywords = {phrase-based statistical machine translation, pseudolemmatization, Croatian-English}, title = {Pseudo-lemmatization in Croatian-English SMT}, keyword = {phrase-based statistical machine translation, pseudolemmatization, Croatian-English}, publisher = {Fakultet organizacije i informatike Sveu\v{c}ili\v{s}ta u Zagrebu}, publisherplace = {Vara\v{z}din, Hrvatska} }




Contrast
Increase Font
Decrease Font
Dyslexic Font