Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Prepoznavanje imenovanih entiteta adresa (CROSBI ID 448953)

Ocjenski rad | diplomski rad

Čeović, Helena Prepoznavanje imenovanih entiteta adresa / Delač, Goran (mentor); Zagreb, Fakultet elektrotehnike i računarstva, . 2021

Podaci o odgovornosti

Čeović, Helena

Delač, Goran

hrvatski

Prepoznavanje imenovanih entiteta adresa

Cilj ovog diplomskog rada je razvoj modela visoke točnosti za prepoznavanje imenovanih entiteta adresa. Izazovi uključuju raznolikost, dvosmislenost i kompleksnost entiteta adrese. Različite arhitekture modela korištene za treniranje klasifikatora su jednostavniji modeli logističke regresije i algoritam slučajnih šuma te složeniji model temeljen na dvosmjernoj povratnoj neuronskoj mreži s dodatnim slojem koji sadrži uvjetovana slučajna polja (BiLSTM-CRF) i implementiran je pomoću Flair knjižnice. Sva testiranja provedena su na dva skupa podataka koji se razlikuju po načinu označavanja temeljenom na granularnosti imenavanog entiteta: adresa kao cjelina i adresa sastavljena od podelemenata. Za oba skupa podataka najbolje rezultate postiže model temeljen na BiLSTM-CRF arhitekturi s jednim RNN slojem te treniran ili samo na BERT-u ili na kombinaciji BERT i GloVe embedding-a.

prepoznavanje imenovanih entiteta ; obrada prirodnog jezika ; entitet adrese ; IOB označavanje ; ekstrakcija značajki ; logistička regresija ; algoritam slučajnih šuma ; Flair ; GloVe ; BERT ; povratne neuronske mreže ; LSTM ; uvjetovana slučajna polja ; BiLSTM-CRF arhitektura

nije evidentirano

engleski

Named Entity Recognition for Addresses

nije evidentirano

named entity recognition ; natural language processing ; address entity ; IOB tagging ; feature extraction ; logistic regression ; random forest ; Flair ; embeddings ; GloVe ; BERT ; recurrent neural network ; LSTM ; conditional random fields ; BiLSTM-CRF architecture

nije evidentirano

Podaci o izdanju

44

06.07.2021.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Fakultet elektrotehnike i računarstva

Zagreb

Povezanost rada

Računarstvo