Pregled bibliografske jedinice broj: 1239227
Antroponimi i toponimi iz latinskih srednjovjekovnih oporuka u alatu NooJ
Antroponimi i toponimi iz latinskih srednjovjekovnih oporuka u alatu NooJ // Natales grate numeras? : Book of Abstracts.
Zadar, Hrvatska, 2022. str. 42-43 (predavanje, međunarodna recenzija, sažetak, znanstveni)
CROSBI ID: 1239227 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Antroponimi i toponimi iz latinskih
srednjovjekovnih oporuka u alatu NooJ
(Anthroponyms and Toponyms from Latin Medieval Last
Wills and Testaments in Nooj)
Autori
Bartulović, Anita ; Mijić, Linda
Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, sažetak, znanstveni
Izvornik
Natales grate numeras? : Book of Abstracts.
/ - , 2022, 42-43
Skup
Natales grate numeras?
Mjesto i datum
Zadar, Hrvatska, 27.-28. 05. 2022
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Međunarodna recenzija
Ključne riječi
srednjovjekovni latinski jezik, oporuke, Zadar, NooJ, računalna obrada prirodnog jezika
(medieval Latin language, last will and testament, Zadar, NooJ, NLP)
Sažetak
Računalna obrada prirodnog jezika (Natural language processing) istražuje načine uporabe računala za obradu ili razumijevanje ljudskih (prirodnih) jezika. NooJ je jezično razvojno okruženje i korpusni procesor koji obrađuje tekst i skupove tekstualnih datoteka na ortografskoj, leksičkoj, morfološkoj, sintaktičkoj i semantičkoj razini (Silberztein, 2016). Da bi se ova platforma mogla koristiti u istraživanju određenog jezika potrebno je računalno opisati jezik te izraditi gramatičke modele i algoritme za prepoznavanje i označavanje leksičkih jedinica u nestrukturiranim tekstualnim zapisima. Do sada je tako u NooJ-u obrađeno tridesetak prirodnih jezika različitih jezičnih skupina. Dosadašnji rad na semantičkom označavanju srednjovjekovnog latinskog jezika u fokusu je imao problem prepoznavanja riječi s obzirom na ortografske osobitosti i neujednačene upotrebe egdotičkih pravila kod objavljenih arhivskih dokumenata (posebno korištenje različitih vrsta zagrada) te izradu rječnika i morfoloških gramatika za opće imenice (Mijić i Bartulović, 2021.). U radu se proširuje postojeći rječnik antroponimima i toponimima izdvojenim iz korpusa od 385 srednjovjekovnih oporuka sastavljenih od 1209. do 1409. godine u Zadarskoj komuni (dijelom objavljenih dijelom neobjavljenih) te se predlažu morfološke gramatike za njihovo prepoznavanje.
Izvorni jezik
Hrvatski
Znanstvena područja
Filologija