Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata (CROSBI ID 355212)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Saratlija, Josip
Dalbelo Bašić, Bojana
Šnajder, Jan
hrvatski
Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata
Učinkovito dohvaćanje informacija često zahtjeva prethodno označavanje dokumenata ključnim riječima koje najbolje opisuju njihov sadržaj. Pošto je taj postupak, ako ga radi čovjek, vrlo skup i dugotrajan, teži se izgradnji sustava koji bi to mogao raditi automatski. U ovom radu opisan je jedan takav sustav koji koristi nenadzirano učenje, a temelji se na grupiranju semantički povezanih riječi postupkom k-srednjih vrijednosti. Riječi se modeliraju vektorima na temelju njihove učestalosti u dokumentima. Dokumentima se potom dodjeljuju one grupe riječi s kojima su semantički najpovezaniji. Iz presjeka riječi dokumenta i njemu dodijeljene grupe zatim se ekstrahiraju ključne riječi. Postupak je evaluiran na zbirci novinskih tekstova koji su već označeni ključnim riječima.
automatsko pridjeljivanje ključnih riječi; grupiranje dokumenata; algoritam k-srednih vrijednosti
nije evidentirano
engleski
Keyword Extraction Based on Document Clustering
nije evidentirano
automatic keyword assignment; document clustering; k-means algorithm
nije evidentirano
Podaci o izdanju
37
15.07.2009.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb