Pregled bibliografske jedinice broj: 425110
Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata
Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata, 2009., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 425110 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata
(Keyword Extraction Based on Document Clustering)
Autori
Saratlija, Josip
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
15.07
Godina
2009
Stranica
37
Mentor
Dalbelo Bašić, Bojana
Neposredni voditelj
Šnajder, Jan
Ključne riječi
automatsko pridjeljivanje ključnih riječi; grupiranje dokumenata; algoritam k-srednih vrijednosti
(automatic keyword assignment; document clustering; k-means algorithm)
Sažetak
Učinkovito dohvaćanje informacija često zahtjeva prethodno označavanje dokumenata ključnim riječima koje najbolje opisuju njihov sadržaj. Pošto je taj postupak, ako ga radi čovjek, vrlo skup i dugotrajan, teži se izgradnji sustava koji bi to mogao raditi automatski. U ovom radu opisan je jedan takav sustav koji koristi nenadzirano učenje, a temelji se na grupiranju semantički povezanih riječi postupkom k-srednjih vrijednosti. Riječi se modeliraju vektorima na temelju njihove učestalosti u dokumentima. Dokumentima se potom dodjeljuju one grupe riječi s kojima su semantički najpovezaniji. Iz presjeka riječi dokumenta i njemu dodijeljene grupe zatim se ekstrahiraju ključne riječi. Postupak je evaluiran na zbirci novinskih tekstova koji su već označeni ključnim riječima.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb