Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 425110

Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata


Saratlija, Josip
Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata, 2009., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 425110 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata
(Keyword Extraction Based on Document Clustering)

Autori
Saratlija, Josip

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
15.07

Godina
2009

Stranica
37

Mentor
Dalbelo Bašić, Bojana

Neposredni voditelj
Šnajder, Jan

Ključne riječi
automatsko pridjeljivanje ključnih riječi; grupiranje dokumenata; algoritam k-srednih vrijednosti
(automatic keyword assignment; document clustering; k-means algorithm)

Sažetak
Učinkovito dohvaćanje informacija često zahtjeva prethodno označavanje dokumenata ključnim riječima koje najbolje opisuju njihov sadržaj. Pošto je taj postupak, ako ga radi čovjek, vrlo skup i dugotrajan, teži se izgradnji sustava koji bi to mogao raditi automatski. U ovom radu opisan je jedan takav sustav koji koristi nenadzirano učenje, a temelji se na grupiranju semantički povezanih riječi postupkom k-srednjih vrijednosti. Riječi se modeliraju vektorima na temelju njihove učestalosti u dokumentima. Dokumentima se potom dodjeljuju one grupe riječi s kojima su semantički najpovezaniji. Iz presjeka riječi dokumenta i njemu dodijeljene grupe zatim se ekstrahiraju ključne riječi. Postupak je evaluiran na zbirci novinskih tekstova koji su već označeni ključnim riječima.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Projekti:
036-1300646-1986 - Otkrivanje znanja u tekstnim podacima (Dalbelo-Bašić, Bojana, MZO ) ( CroRIS)

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Jan Šnajder (mentor)

Avatar Url Bojana Dalbelo Bašić (mentor)


Citiraj ovu publikaciju:

Saratlija, Josip
Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata, 2009., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
Saratlija, J. (2009) 'Ekstrakcija ključnih riječi iz teksta na temelju grupiranja dokumenata', diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, author = {Saratlija, Josip}, year = {2009}, pages = {37}, keywords = {automatsko pridjeljivanje klju\v{c}nih rije\v{c}i, grupiranje dokumenata, algoritam k-srednih vrijednosti}, title = {Ekstrakcija klju\v{c}nih rije\v{c}i iz teksta na temelju grupiranja dokumenata}, keyword = {automatsko pridjeljivanje klju\v{c}nih rije\v{c}i, grupiranje dokumenata, algoritam k-srednih vrijednosti}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Saratlija, Josip}, year = {2009}, pages = {37}, keywords = {automatic keyword assignment, document clustering, k-means algorithm}, title = {Keyword Extraction Based on Document Clustering}, keyword = {automatic keyword assignment, document clustering, k-means algorithm}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font