Pregled bibliografske jedinice broj: 348724
A Generic Method for Multi Word Extraction from Wikipedia
A Generic Method for Multi Word Extraction from Wikipedia // Proceedings of the 30th International Conference on Information Technology Interfaces / Lužar-Stiffler, Vesna ; Hljuz Dobrić, Vesna ; Bekić, Zoran (ur.).
Zagreb: Sveučilišni računski centar Sveučilišta u Zagrebu (Srce), 2008. str. 663-667 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)
CROSBI ID: 348724 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
A Generic Method for Multi Word Extraction from Wikipedia
Autori
Bekavac, Božo ; Tadić, Marko
Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni
Izvornik
Proceedings of the 30th International Conference on Information Technology Interfaces
/ Lužar-Stiffler, Vesna ; Hljuz Dobrić, Vesna ; Bekić, Zoran - Zagreb : Sveučilišni računski centar Sveučilišta u Zagrebu (Srce), 2008, 663-667
ISBN
978-953-7138-12-7
Skup
30th International Conference on Information Technology Interfaces (ITI 2008)
Mjesto i datum
Dubrovnik, Hrvatska; Cavtat, Hrvatska, 23.06.2008. - 26.06.2008
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Međunarodna recenzija
Ključne riječi
multi word expressions; multi word extraction; Croatian; Wikipedia
Sažetak
This paper presents the generic method for multiword expression extraction from Wikipedia. The method is using the propreties of this specific encyclopedic genre in its HTML format and it relies on the intention of the autors of articles to link to other articles. The relevant links were processed by applying local regular grammars within the NooJ development envi-ronment. We tested the method on a Croatian version of Wikipedia and we present the results obtained.
Izvorni jezik
Engleski
Znanstvena područja
Informacijske i komunikacijske znanosti, Filologija
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
130-1300646-0645 - Hrvatski jezični resursi i njihovo obilježavanje (Tadić, Marko, MZOS ) ( CroRIS)
130-1300646-1002 - Leksička semantika u izradi Hrvatskog WordNeta (Raffaelli, Ida, MZOS ) ( CroRIS)
Ustanove:
Filozofski fakultet, Zagreb