Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata

Saratlija, Josip

izvor podataka: crosbi !

Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata (CROSBI ID 355212)

Ocjenski rad | sveučilišni preddiplomski završni rad

Saratlija, Josip Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata / Dalbelo Bašić, Bojana (mentor); Šnajder, Jan (neposredni voditelj). Zagreb, Fakultet elektrotehnike i računarstva, . 2009

Podaci o odgovornosti

Autori

Saratlija, Josip

Mentori

Dalbelo Bašić, Bojana

Neposredni voditelji

Šnajder, Jan

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

hrvatski

Naslov

Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata

Sažetak

Učinkovito dohvaćanje informacija često zahtjeva prethodno označavanje dokumenata ključnim riječima koje najbolje opisuju njihov sadržaj. Pošto je taj postupak, ako ga radi čovjek, vrlo skup i dugotrajan, teži se izgradnji sustava koji bi to mogao raditi automatski. U ovom radu opisan je jedan takav sustav koji koristi nenadzirano učenje, a temelji se na grupiranju semantički povezanih riječi postupkom k-srednjih vrijednosti. Riječi se modeliraju vektorima na temelju njihove učestalosti u dokumentima. Dokumentima se potom dodjeljuju one grupe riječi s kojima su semantički najpovezaniji. Iz presjeka riječi dokumenta i njemu dodijeljene grupe zatim se ekstrahiraju ključne riječi. Postupak je evaluiran na zbirci novinskih tekstova koji su već označeni ključnim riječima.

Ključne riječi

automatsko pridjeljivanje ključnih riječi; grupiranje dokumenata; algoritam k-srednih vrijednosti

Napomena

nije evidentirano

Jezik

engleski

Naslov

Keyword Extraction Based on Document Clustering

Sažetak

nije evidentirano

Ključne riječi

automatic keyword assignment; document clustering; k-means algorithm

Napomena

nije evidentirano

Podaci o izdanju

Broj stranica

Datum obrane

15.07.2009.

Status objave rada

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Ustanova / Organizacija

Fakultet elektrotehnike i računarstva

Mjesto

Zagreb

Povezanost rada

Povezane osobe

Jan Šnajder (mentor/i)

Bojana Dalbelo Bašić (mentor/i)

Povezane ustanove

Fakultet elektrotehnike i računarstva (036) (autorova ustanova)

Povezani projekti

Otkrivanje znanja u tekstnim podacima (rezultat rada na projektu)

Područje

Računarstvo