Node Selectivity as a Measure for Graph-Based Keyword Extraction in Croatian News

Beliga, Slobodan; Martinčić-Ipšić, Sanda

izvor podataka: crosbi !

Node Selectivity as a Measure for Graph-Based Keyword Extraction in Croatian News (CROSBI ID 617186)

Neobjavljeno sudjelovanje sa skupa | neobjavljeni prilog sa skupa | međunarodna recenzija

Beliga, Slobodan ; Martinčić-Ipšić, Sanda Node Selectivity as a Measure for Graph-Based Keyword Extraction in Croatian News // 6th International Conference on Information Technologies and Information Society (ITIS2014) Šmarješke toplice, Slovenija, 05.11.2014-07.11.2014

Podaci o odgovornosti

Autori

Beliga, Slobodan ; Martinčić-Ipšić, Sanda

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

engleski

Naslov

Node Selectivity as a Measure for Graph-Based Keyword Extraction in Croatian News

Sažetak

In this paper, we introduce selectivity-based keyword extraction as a new unsupervised method for graph-based keyword extraction. Node selectivity measure is defined as the average weight distribution on the links of a single node and used in procedure of keyword candidate extraction. In particular, we propose extracting three word long keyword sequence and proving that the obtained results compare favourably with previously published results. Experiments were conducted on Croatian news articles dataset with keywords annotated by human experts. The selectivity-based keyword extraction method achieved the average F2 score of 25.32% on isolated documents and F2 score of 42.07% on a document collection. Proposed method is derived solely from statistical and structural information, which are reflected in the topological properties of text network. Furthermore, comparative results indicate that our simple graph-based method provides results that are comparable with more complex supervised and unsupervised methods, as well as with human annotators.

Ključne riječi

keyword extraction; keyword candidate; keyword ranking; keyword expansion; node selectivity; Croatian news; complex network

Napomena

nije evidentirano

Jezik

nije evidentirano

Naslov

nije evidentirano

Sažetak

nije evidentirano

Ključne riječi

nije evidentirano

Napomena

nije evidentirano

Podaci o prilogu

Volumen (broj)

nije evidentirano

Status objave rada

nije evidentirano

Podaci o skupu

Skup

6th International Conference on Information Technologies and Information Society (ITIS2014)

Vrsta sudjelovanja

predavanje

Datum održavanja skupa

05.11.2014-07.11.2014

Mjesto održavanja skupa

Šmarješke toplice, Slovenija

Povezanost rada

Povezane osobe

Slobodan Beliga (autor/i)

Sanda Martinčić-Ipšić (autor/i)

Povezane ustanove

Sveučilište u Rijeci, Fakultet informatike i digitalnih tehnologija (318) (autorova ustanova)

Područje

Računarstvo, Informacijske i komunikacijske znanosti