Napredna pretraga

Pregled bibliografske jedinice broj: 685467

Model ekspertnog sustava za obradu strojno čitljive diplomatičke građe (za hrvatsku latinističku građu)


Mijić, Ivan
Model ekspertnog sustava za obradu strojno čitljive diplomatičke građe (za hrvatsku latinističku građu) 2007., magistarski rad, Filozofski fakultet, Zagreb


Naslov
Model ekspertnog sustava za obradu strojno čitljive diplomatičke građe (za hrvatsku latinističku građu)
(Model of expert system for processing machine readable diplomatic texts (for Croatian Latinist texts))

Autori
Mijić, Ivan

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad

Fakultet
Filozofski fakultet

Mjesto
Zagreb

Datum
11.12

Godina
2007

Stranica
123

Mentor
Boras, Damir ; Matijević Sokol, Mirjana

Ključne riječi
Ekspertni sustav; latinski tekstovi; diplomatički tekstovi; strojno čitljivi tekstovi
(Expert system; latin texts; diplomatic texts; machine readable texts)

Sažetak
Digitalizacija objekata povijesnog arhivskog gradiva doista predstavlja više od običnog prijenosa građe s jednog medija na drugi. Cilj koji arhivi nastoje ostvariti poslovima digitalizacije zajedno s drugim ustanovama kulture usmjeren je prema izgradnji društva znanja. Prikladna računalna infrastruktura, odnosno mreža široke propusnosti koja omogućuje iznimnu brzinu i pouzdanost prijenosa podataka dodatni je uvjet za istodoban pristup građi većem broju korisnika kroz mrežu, razmjenu i kreativno korištenje digitalnih reprodukcija arhivske građe. Od četrnaest arhiva, prema stanju u svibnju 2007. godine, šest njih nema internetsku stranicu. Također, samo šest arhiva daje opis arhivskoga gradiva, a nijedan ne prikazuje i samo gradivo. Glavni problem je na koji način doći do željenog podatka pohranjenog u gradivu. U hrvatskim arhivima je to nemoguće bez posrednika, odnosno arhivista. Međutim kako se teži automatizaciji rada, trebalo bi doći do načina prikazivanja i prezentiranja gradiva putem Interneta, čime bi se došlo do traženih podataka i to bez posrednika i na daljinu. Na taj bi način većina korisnika svoje potrebe zadovoljila slikom dokumenta i došla do traženih podataka. U svijetu je situacija, što se tiče pristupa arhivskoj građi na daljinu, puno bolja. U radu je navedeno i opisano nekoliko uspješnih programa digitalizacije stare građe. Svi primjeri omogućuju pristup gradivu on-line, sve slike mogu se preuzeti, uvećati, ispisati za osobne potrebe i to bez novčane naknade. Hrvatski državni arhiv je u međuvremenu pokrenuo izradu arhivskog informacijsko-evidencijskog sustava nazvanog ArhiNet koji se planira otvoriti javnosti sredinom listopada 2007. godine. Osmišljen je kao mrežno programsko rješenje koje obuhvaća sljedeće funkcije arhiva: čuvanje, zaštitu, obradu i korištenje arhivskoga gradiva. Međutim, potrebno je uočiti da ArhiNet prvenstveno omogućuje pristup podatcima o arhivskim fondovima te djelomično i samim izvornim digitaliziranim podacima, dok se za sam pristup sadržaju koji se nalazi u pohranjenim dokumentima u načelu korisnik ArhiNeta, odnosno ustanova koja svoju podatke stavlja na ArhiNet, mora pobrinuti sam. To se posebno odnosi na analitički pristup dokumentima koji zahtijeva da se digitalizirani dokumenti pretvore u strojno čitljivi tekst, koji se zatim ekspertno analizira, označi prema različitim kategorijama sadržaja, te zatim putem prikladnog sustava, korisnicima omogući pretraživanje i pregledavanje tako digitaliziranih tekstova na više različitih načina. Mogućnosti pronalaženja pojedinih dokumenata u skupu svih dokumenata ograničene su na elemente koji postoje u vanjskom opisu dokumenta, a pronalaženje prema podacima u dokumentu za sada još nije moguće. Zbog svega toga, prepoznajući potrebu boljeg, sveobuhvatnijeg, strukturiranijeg i bržeg pretraživanja tekstova dokumenata, u drugom je dijelu ovog magistarskog rada teoretski razrađen i praktično izveden model takvog sustava s naslovom „Model za obradu strojno čitljive diplomatičke građe“. U modelu je razrađen sustav označavanja pojedinih dijelova teksta koji sadrže imena osoba, mjesta, nazive rijeka, jezera, mora, datume i slično te je ostvarena mogućnost pretraživanja po svim tim označenim elementima, a također je omogućen i pretraživanje po svim pojavnicama u bilo kojem tekstu (riječima kakve se pojavljuju u tekstu). Mogu se, ipak, uočiti poteškoće pri izradi pri izvedbi baze podataka, pri čemu je najveći problem dugotrajnost procesa označavanja, te bi u budućnosti trebalo nastaviti istraživanja i izraditi sustav koji bi omogućio automatsko ili djelomično automatsko (uz ljudsku pomoć) označavanje digitaliziranog i u tekst preobličenog korpusa tekstova. Prednosti su izvedenog model što omogućuje ne samo arhivističku obradu, nego omogućuje i jezične analize, te da ga je moguće povezati s drugim sustavima koji sadrže sličnu tekstualnu građu na Internetu. Na kraju, može se zaključiti, da se sustav, iako je primijenjen za latinske tekstove, može uz male izmjene primijeniti i na tekstove pisane bilo kojim jezikom, a zapisane latinicom, ćirilicom, glagoljicom ili grčkim pismom.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Ustanove
Filozofski fakultet, Zagreb