Pregled bibliografske jedinice broj: 293020
Flexible Length Phrases in Document Classification
Flexible Length Phrases in Document Classification // Proceedings of 29th International Conference of Information Technology Interfaces, ITI 2007 / Dobrić Vesna (ur.).
Zagreb: Universtity Computing Centre - SRCE, 2006. str. 457-462 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)
CROSBI ID: 293020 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Flexible Length Phrases in Document Classification
Autori
Radošević, Danijel ; Dobša, Jasminka ; Mladenić, Dunja
Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni
Izvornik
Proceedings of 29th International Conference of Information Technology Interfaces, ITI 2007
/ Dobrić Vesna - Zagreb : Universtity Computing Centre - SRCE, 2006, 457-462
ISBN
953-7138-05-4
Skup
ITI 2006, Cavtat/Dubrovnik, June 19-22, 2006, Sveučilište u Zagrebu i Sveučilišni računalni centar (SRCE), 2006.
Mjesto i datum
Cavtat, Hrvatska; Dubrovnik, Hrvatska, 19.06.2006. - 22.06.2006
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Međunarodna recenzija
Ključne riječi
documents classification; bag of words representation; flexible length phrases
Sažetak
In this paper we investigate possibility of using phrases of flexible length in classification of textual documents as an extension to classic bag of words document representation where documents are represented using single words as index terms. The investigation is conducted on collection of articles from Večernji list. It is shown that usage of flexible length phrases improves precision of automatic document classification and there are indications that such approach could be used for genre classification.
Izvorni jezik
Engleski
Znanstvena područja
Informacijske i komunikacijske znanosti
POVEZANOST RADA
Ustanove:
Fakultet organizacije i informatike, Varaždin