Named Entity Recognition in Croatian Tweets

Baksa, Krešimir; Dolović, Dino; Glavaš, Goran; Šnajder, Jan

izvor podataka: crosbi !

Named Entity Recognition in Croatian Tweets (CROSBI ID 619157)

Prilog sa skupa u zborniku | izvorni znanstveni rad | međunarodna recenzija

Baksa, Krešimir ; Dolović, Dino ; Glavaš, Goran ; Šnajder, Jan Named Entity Recognition in Croatian Tweets // Proceedings of the Ninth Language Technologies Conference, Information Society (IS-JT 2014). Ljubljana, 2014. str. 85-89

Podaci o odgovornosti

Autori

Baksa, Krešimir ; Dolović, Dino ; Glavaš, Goran ; Šnajder, Jan

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

engleski

Naslov

Named Entity Recognition in Croatian Tweets

Sažetak

Existing named entity extraction tools, typically designed for formal texts written in standard language (e.g., news stories, essays, or legal texts), do not perform well on user-generated content (e.g., tweets). In this paper we present a supervised approach for named entity recognition and classification for Croatian tweets. Comparison of three different sequence labeling models (HMM, CRF, and SVM) revealed that CRF is the best model for the task, achieving a micro-averaged F1-score of over 87%. We also demonstrate that the state-of-the-art NER model designed for Croatian standard language texts performs much worse than our Twitter-specific NER models.

Ključne riječi

Named entity recognition; information extraction; twitter data; Croatian language

Napomena

nije evidentirano

Jezik

nije evidentirano

Naslov

nije evidentirano

Sažetak

nije evidentirano

Ključne riječi

nije evidentirano

Napomena

nije evidentirano

Podaci o prilogu

Stranice rada

85-89.

Godina izdavanja

2014.

Status objave rada

objavljeno

Podaci o matičnoj publikaciji

Naslov

Proceedings of the Ninth Language Technologies Conference, Information Society (IS-JT 2014)

Izdavač

Ljubljana:

Podaci o skupu

Skup

Ninth Language Technologies Conference, Information Society (IS-JT 2014)

Vrsta sudjelovanja

predavanje

Datum održavanja skupa

09.10.2014-10.10.2014

Mjesto održavanja skupa

Ljubljana, Slovenija

Povezanost rada

Povezane osobe

Goran Glavaš (autor/i)

Jan Šnajder (autor/i)

Povezane ustanove

Fakultet elektrotehnike i računarstva (036) (autorova ustanova)

Područje

Računarstvo

Poveznice

nl.ijs.si