Pregled bibliografske jedinice broj: 228659
Automatic Categorisation of Croatian Web Sites
Automatic Categorisation of Croatian Web Sites // Proceedings of 25th International Convention MIPRO 2005 / Budin, Leo ; Ribarić, Slobodan (ur.).
Rijeka: Hrvatska udruga za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku - MIPRO, 2005. str. 144-149 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)
CROSBI ID: 228659 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Automatic Categorisation of Croatian Web Sites
Autori
Dobša, Jasminka ; Radošević, Danijel ; Stapić, Zlatko ; Zubac, Marinko
Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni
Izvornik
Proceedings of 25th International Convention MIPRO 2005
/ Budin, Leo ; Ribarić, Slobodan - Rijeka : Hrvatska udruga za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku - MIPRO, 2005, 144-149
Skup
25th International Convention MIPRO 2005
Mjesto i datum
Opatija, Hrvatska, 30.05.2005. - 03.06.2005
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Međunarodna recenzija
Ključne riječi
automatic classification; Croatian Web sites; text mining; bag of words representation; support vector machines
Sažetak
On the Web site www.hr we can find the catalogue of Croatian Web sites organized hierarchically in more then 600 categories. So far new Web sites have been added into the hierarchy manually. The aim of our work was to research the possibilities of automatic categorisation of Croatian Web sites in the hierarcy of catalogue. For the representation of documents (Web sites) we have used text mining technique of bag of words representation, while for purpose of categorisation we have used the technique of support vector machines. The experiments are conducted for categorisation of Web sites in 14 categories on the highes hierarchical level.
Izvorni jezik
Engleski
Znanstvena područja
Računarstvo