Obrada teksta temeljem modela vreća riječi (CROSBI ID 459502)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Valjavec, Tena
Stipančić, Tomislav
hrvatski
Obrada teksta temeljem modela vreća riječi
Tema ovog rada je proučiti jedan od jednostavnijih modela za obradu prirodnog jezika (engl. Natural Language Proccesing - NLP), a to je model „vreća riječi“ (engl. Bag of Words, skraćeno BoW). Model i njegova implementacija razvija se u programskom jeziku Python, a za izvedbu koda koristi se biblioteka NLTK. U prvom dijelu rada objašnjena je teorijska osnova za razumijevanje programa te su dane na uvid neke od najčešće korištenih NLP tehnika, a u drugom dijelu je razvijen kod te je analiziran odabran tekst korištenjem modela „vreća riječi“. Naposljetku je opisana funkcija „Tf-idf“ te je prikazana usporedba navedene funkcije i modela „vreća riječi“.
NLP ; umjetna inteligencija ; Python ; vreća riječi
nije evidentirano
engleski
Text processing based on the bag of words model
nije evidentirano
NLP ; artificial intelligence ; Python ; Bag of Words
nije evidentirano
Podaci o izdanju
38
02.03.2023.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet strojarstva i brodogradnje
Zagreb