Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 1218222

Ekstrakcija i korištenje znanja prikazanog semantičkim hipergrafom iz teksta na hrvatskom jeziku


Vasić, Daniel
Ekstrakcija i korištenje znanja prikazanog semantičkim hipergrafom iz teksta na hrvatskom jeziku, 2021., doktorska disertacija, Fakultet elektrotehnihe, strojarstva i brodogradnje, Split


CROSBI ID: 1218222 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Ekstrakcija i korištenje znanja prikazanog semantičkim hipergrafom iz teksta na hrvatskom jeziku
(Croatian Text-Based Knowledge Extraction, Usage and Semantic Hypergraph Representation)

Autori
Vasić, Daniel

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija

Fakultet
Fakultet elektrotehnihe, strojarstva i brodogradnje

Mjesto
Split

Datum
30.09

Godina
2021

Stranica
243

Mentor
Žitko, Branko

Ključne riječi
obrada teksta na prirodnom jeziku ; automatska obrada teksta primjenom dubinskog učenja ; morfološki bogat jezici ; prikaz znanja ; automatsko zaključivanje ; semantički hipergraf ; automatsko označivanje semantičkih uloga
(natural language processing ; deep learning techniques ; morphologically rich language ; knowledge representation ; automatic reasoning ; semantic hypergraph ; automatic semantic role labeling)

Sažetak
Ogromna količina ljudskog znanja zapisana je u nestrukturiranom obliku, a pretvaranje znanja u strukturirani oblik, proces poznat kao ekstrakcija znanja, često je složen, skup i vremenski zahtjevan. Cilj ove doktorske disertacije je razvoj modela za ekstrakciju znanja iz teksta na hrvatskom jeziku te korištenju znanja prikazanog u obliku semantičkog hipergrafa. Predloženi model objedinjuje razvoj preciznijih modela za automatsko označivanje vrsta riječi, automatsko ovisnosno parsanje teksta te automatsko označivanje semantičkih uloga koje se temelje na arhitekturi duboke neuronske mreže i učenja prenošenjem. Za učenje prenošenjem, u zadatku automatskog označivanja vrsta riječi, korišten je BERT model čija se arhitektura temelji na mehanizmu pažnje. Za korištenje ekstrahiranog znanja razvijen je mehanizam za zaključivanje koji se temelji na upotrebi rječnika predikata i ulančavanju pravila unaprijed. Mehanizam koristi metode za pretraživanje znanja koje se temelje na semantičkim ulogama i vektorskim reprezentacijama. Istraživanje je provedeno na hr500k korpusu i posebno razvijenom SemCro korpusu koji je korišten za vrednovanje semantičkog hipergrafa i kvalitete ekstrahiranog znanja. Metrika korištena za usporedbu strukture hipergrafa temelji se na sličnosti matrica susjedstva. Predloženi BERT model je ostvario bolje rezultate u odnosu na referentne modele. Predloženi model prikaza znanja nalazi svoju primjenu u inteligentnim sustavima koji se temelje na znanju i u drugim zadacima obrade prirodnog jezika kao što su sažimanje teksta, razrješavanje koreferencija, odgovaranje na pitanja i slično. Razvoj, vrednovanje te implementacija prototipa inteligentnog sustava za ekstrakciju i korištenje znanja prikazanog semantičkim hipergrafom dodatni je znanstveni doprinos ovog rada. Osnovno ograničenje ovog istraživanja je veličina SemCro korpusa za treniranje i vrednovanje.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Ustanove:
Fakultet elektrotehnike, strojarstva i brodogradnje, Split

Profili:

Avatar Url Branko Žitko (mentor)

Avatar Url Daniel Vasić (autor)

Citiraj ovu publikaciju:

Vasić, Daniel
Ekstrakcija i korištenje znanja prikazanog semantičkim hipergrafom iz teksta na hrvatskom jeziku, 2021., doktorska disertacija, Fakultet elektrotehnihe, strojarstva i brodogradnje, Split
Vasić, D. (2021) 'Ekstrakcija i korištenje znanja prikazanog semantičkim hipergrafom iz teksta na hrvatskom jeziku', doktorska disertacija, Fakultet elektrotehnihe, strojarstva i brodogradnje, Split.
@phdthesis{phdthesis, author = {Vasi\'{c}, Daniel}, year = {2021}, pages = {243}, keywords = {obrada teksta na prirodnom jeziku, automatska obrada teksta primjenom dubinskog u\v{c}enja, morfolo\v{s}ki bogat jezici, prikaz znanja, automatsko zaklju\v{c}ivanje, semanti\v{c}ki hipergraf, automatsko ozna\v{c}ivanje semanti\v{c}kih uloga}, title = {Ekstrakcija i kori\v{s}tenje znanja prikazanog semanti\v{c}kim hipergrafom iz teksta na hrvatskom jeziku}, keyword = {obrada teksta na prirodnom jeziku, automatska obrada teksta primjenom dubinskog u\v{c}enja, morfolo\v{s}ki bogat jezici, prikaz znanja, automatsko zaklju\v{c}ivanje, semanti\v{c}ki hipergraf, automatsko ozna\v{c}ivanje semanti\v{c}kih uloga}, publisherplace = {Split} }
@phdthesis{phdthesis, author = {Vasi\'{c}, Daniel}, year = {2021}, pages = {243}, keywords = {natural language processing, deep learning techniques, morphologically rich language, knowledge representation, automatic reasoning, semantic hypergraph, automatic semantic role labeling}, title = {Croatian Text-Based Knowledge Extraction, Usage and Semantic Hypergraph Representation}, keyword = {natural language processing, deep learning techniques, morphologically rich language, knowledge representation, automatic reasoning, semantic hypergraph, automatic semantic role labeling}, publisherplace = {Split} }




Contrast
Increase Font
Decrease Font
Dyslexic Font