Prepoznavanje imenovanih entiteta adresa (CROSBI ID 448953)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Čeović, Helena
Delač, Goran
hrvatski
Prepoznavanje imenovanih entiteta adresa
Cilj ovog diplomskog rada je razvoj modela visoke točnosti za prepoznavanje imenovanih entiteta adresa. Izazovi uključuju raznolikost, dvosmislenost i kompleksnost entiteta adrese. Različite arhitekture modela korištene za treniranje klasifikatora su jednostavniji modeli logističke regresije i algoritam slučajnih šuma te složeniji model temeljen na dvosmjernoj povratnoj neuronskoj mreži s dodatnim slojem koji sadrži uvjetovana slučajna polja (BiLSTM-CRF) i implementiran je pomoću Flair knjižnice. Sva testiranja provedena su na dva skupa podataka koji se razlikuju po načinu označavanja temeljenom na granularnosti imenavanog entiteta: adresa kao cjelina i adresa sastavljena od podelemenata. Za oba skupa podataka najbolje rezultate postiže model temeljen na BiLSTM-CRF arhitekturi s jednim RNN slojem te treniran ili samo na BERT-u ili na kombinaciji BERT i GloVe embedding-a.
prepoznavanje imenovanih entiteta ; obrada prirodnog jezika ; entitet adrese ; IOB označavanje ; ekstrakcija značajki ; logistička regresija ; algoritam slučajnih šuma ; Flair ; GloVe ; BERT ; povratne neuronske mreže ; LSTM ; uvjetovana slučajna polja ; BiLSTM-CRF arhitektura
nije evidentirano
engleski
Named Entity Recognition for Addresses
nije evidentirano
named entity recognition ; natural language processing ; address entity ; IOB tagging ; feature extraction ; logistic regression ; random forest ; Flair ; embeddings ; GloVe ; BERT ; recurrent neural network ; LSTM ; conditional random fields ; BiLSTM-CRF architecture
nije evidentirano
Podaci o izdanju
44
06.07.2021.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb