Pregled bibliografske jedinice broj: 1262118
Obrada teksta temeljem modela vreća riječi
Obrada teksta temeljem modela vreća riječi, 2023., diplomski rad, preddiplomski, Fakultet strojarstva i brodogradnje, Zagreb
CROSBI ID: 1262118 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Obrada teksta temeljem modela vreća riječi
(Text processing based on the bag of words model)
Autori
Valjavec, Tena
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet strojarstva i brodogradnje
Mjesto
Zagreb
Datum
02.03
Godina
2023
Stranica
38
Mentor
Stipančić, Tomislav
Ključne riječi
NLP ; umjetna inteligencija ; Python ; vreća riječi
(NLP ; artificial intelligence ; Python ; Bag of Words)
Sažetak
Tema ovog rada je proučiti jedan od jednostavnijih modela za obradu prirodnog jezika (engl. Natural Language Proccesing - NLP), a to je model „vreća riječi“ (engl. Bag of Words, skraćeno BoW). Model i njegova implementacija razvija se u programskom jeziku Python, a za izvedbu koda koristi se biblioteka NLTK. U prvom dijelu rada objašnjena je teorijska osnova za razumijevanje programa te su dane na uvid neke od najčešće korištenih NLP tehnika, a u drugom dijelu je razvijen kod te je analiziran odabran tekst korištenjem modela „vreća riječi“. Naposljetku je opisana funkcija „Tf-idf“ te je prikazana usporedba navedene funkcije i modela „vreća riječi“.
Izvorni jezik
Hrvatski
Znanstvena područja
Strojarstvo
POVEZANOST RADA
Ustanove:
Fakultet strojarstva i brodogradnje, Zagreb
Profili:
Tomislav Stipančić
(mentor)