Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 1262118

Obrada teksta temeljem modela vreća riječi


Valjavec, Tena
Obrada teksta temeljem modela vreća riječi, 2023., diplomski rad, preddiplomski, Fakultet strojarstva i brodogradnje, Zagreb


CROSBI ID: 1262118 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Obrada teksta temeljem modela vreća riječi
(Text processing based on the bag of words model)

Autori
Valjavec, Tena

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski

Fakultet
Fakultet strojarstva i brodogradnje

Mjesto
Zagreb

Datum
02.03

Godina
2023

Stranica
38

Mentor
Stipančić, Tomislav

Ključne riječi
NLP ; umjetna inteligencija ; Python ; vreća riječi
(NLP ; artificial intelligence ; Python ; Bag of Words)

Sažetak
Tema ovog rada je proučiti jedan od jednostavnijih modela za obradu prirodnog jezika (engl. Natural Language Proccesing - NLP), a to je model „vreća riječi“ (engl. Bag of Words, skraćeno BoW). Model i njegova implementacija razvija se u programskom jeziku Python, a za izvedbu koda koristi se biblioteka NLTK. U prvom dijelu rada objašnjena je teorijska osnova za razumijevanje programa te su dane na uvid neke od najčešće korištenih NLP tehnika, a u drugom dijelu je razvijen kod te je analiziran odabran tekst korištenjem modela „vreća riječi“. Naposljetku je opisana funkcija „Tf-idf“ te je prikazana usporedba navedene funkcije i modela „vreća riječi“.

Izvorni jezik
Hrvatski

Znanstvena područja
Strojarstvo



POVEZANOST RADA


Ustanove:
Fakultet strojarstva i brodogradnje, Zagreb

Profili:

Avatar Url Tomislav Stipančić (mentor)

Citiraj ovu publikaciju:

Valjavec, Tena
Obrada teksta temeljem modela vreća riječi, 2023., diplomski rad, preddiplomski, Fakultet strojarstva i brodogradnje, Zagreb
Valjavec, T. (2023) 'Obrada teksta temeljem modela vreća riječi', diplomski rad, preddiplomski, Fakultet strojarstva i brodogradnje, Zagreb.
@phdthesis{phdthesis, author = {Valjavec, Tena}, year = {2023}, pages = {38}, keywords = {NLP, umjetna inteligencija, Python, vre\'{c}a rije\v{c}i}, title = {Obrada teksta temeljem modela vre\'{c}a rije\v{c}i}, keyword = {NLP, umjetna inteligencija, Python, vre\'{c}a rije\v{c}i}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Valjavec, Tena}, year = {2023}, pages = {38}, keywords = {NLP, artificial intelligence, Python, Bag of Words}, title = {Text processing based on the bag of words model}, keyword = {NLP, artificial intelligence, Python, Bag of Words}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font