Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 200075

Mining textual data in Croatian


Dalbelo Bašić, Bojana; Bereček, Boris; Cvitaš, Ana
Mining textual data in Croatian // Proceedings of the XXVIII International Conference MIPRO 2005, Business Intelligence Systems / Baranović, Mirta ; Sandri, Roberto ; Čišić, Dragan ; Hutinski, Željko (ur.).
Opatija: Hrvatska udruga za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku - MIPRO, 2005. str. 61-66 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)


CROSBI ID: 200075 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Mining textual data in Croatian

Autori
Dalbelo Bašić, Bojana ; Bereček, Boris ; Cvitaš, Ana

Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni

Izvornik
Proceedings of the XXVIII International Conference MIPRO 2005, Business Intelligence Systems / Baranović, Mirta ; Sandri, Roberto ; Čišić, Dragan ; Hutinski, Željko - Opatija : Hrvatska udruga za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku - MIPRO, 2005, 61-66

Skup
Business Intelligence Systems - MIPRO 2005

Mjesto i datum
Opatija, Hrvatska, 30.05.2005. - 03.06.2005

Vrsta sudjelovanja
Predavanje

Vrsta recenzije
Međunarodna recenzija

Ključne riječi
text mining; text classification; clustering; morphological normalisation

Sažetak
Business intelligence systems find textual data a very useful source of information. Text processing algorithms and systems in English and other world languages are well developed, which is not the case with Croatian language. This paper explores the applicability of existing systems and examines optimal parameters for Croatian. The quality of input data strongly influences clustering and classification results. Experiments are significantly better run after reducing noise. The impact of input learning set size and dimensionality are also considered. Special preprocessing for Croatian language consists of morphological normalisation, a useful step towards better results. Non-croatian specialised text mining tools are also applicable.

Izvorni jezik
Engleski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Bojana Dalbelo Bašić (autor)

Poveznice na cjeloviti tekst rada:

Pristup cjelovitom tekstu rada

Citiraj ovu publikaciju:

Dalbelo Bašić, Bojana; Bereček, Boris; Cvitaš, Ana
Mining textual data in Croatian // Proceedings of the XXVIII International Conference MIPRO 2005, Business Intelligence Systems / Baranović, Mirta ; Sandri, Roberto ; Čišić, Dragan ; Hutinski, Željko (ur.).
Opatija: Hrvatska udruga za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku - MIPRO, 2005. str. 61-66 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)
Dalbelo Bašić, B., Bereček, B. & Cvitaš, A. (2005) Mining textual data in Croatian. U: Baranović, M., Sandri, R., Čišić, D. & Hutinski, Ž. (ur.)Proceedings of the XXVIII International Conference MIPRO 2005, Business Intelligence Systems.
@article{article, author = {Dalbelo Ba\v{s}i\'{c}, Bojana and Bere\v{c}ek, Boris and Cvita\v{s}, Ana}, year = {2005}, pages = {61-66}, keywords = {text mining, text classification, clustering, morphological normalisation}, title = {Mining textual data in Croatian}, keyword = {text mining, text classification, clustering, morphological normalisation}, publisher = {Hrvatska udruga za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku - MIPRO}, publisherplace = {Opatija, Hrvatska} }
@article{article, author = {Dalbelo Ba\v{s}i\'{c}, Bojana and Bere\v{c}ek, Boris and Cvita\v{s}, Ana}, year = {2005}, pages = {61-66}, keywords = {text mining, text classification, clustering, morphological normalisation}, title = {Mining textual data in Croatian}, keyword = {text mining, text classification, clustering, morphological normalisation}, publisher = {Hrvatska udruga za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku - MIPRO}, publisherplace = {Opatija, Hrvatska} }




Contrast
Increase Font
Decrease Font
Dyslexic Font