Pregled bibliografske jedinice broj: 826982
O pretvorbi kartičnoga mjesnoga kataloga Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik
O pretvorbi kartičnoga mjesnoga kataloga Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik // Crkvenoslavenska i hrvatska povijesna leksikografija. Međunarodni znanstveno-stručni skup, Zagreb 29. lipnja - 1. srpnja 2016. Knjižica sažetakaStaroslavenski institut, 2016. / Kovačević, Ana ; Vukoja, Vida (ur.).
Zagreb: Staroslavenski institut, 2016. str. 70-71 (predavanje, nije recenziran, sažetak, stručni)
CROSBI ID: 826982 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
O pretvorbi kartičnoga mjesnoga kataloga Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik
(On the conversion of the Source-card catalog of the Dictionary of the Croatian Redaction of Church Slavonic into a Machine-Readable Form)
Autori
Turkalj, Lucija
Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, sažetak, stručni
Izvornik
Crkvenoslavenska i hrvatska povijesna leksikografija. Međunarodni znanstveno-stručni skup, Zagreb 29. lipnja - 1. srpnja 2016. Knjižica sažetakaStaroslavenski institut, 2016.
/ Kovačević, Ana ; Vukoja, Vida - Zagreb : Staroslavenski institut, 2016, 70-71
ISBN
978-953-6080-22-9
Skup
Crkvenoslavenska i hrvatska povijesna leksikografija
Mjesto i datum
Zagreb, Hrvatska, 29.06.2016. - 01.07.2016
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Nije recenziran
Ključne riječi
hrvatski crkvenoslavenski jezik; korpus Rječnika crkvenoslavenskoga jezika hrvatske redakcije; mjesni katalog; dohvaćanje podataka; prepoznavanje rukom pisanoga teksta
(Croatian Church Slavonic language; corpus of the Dictionary of The Croatian Redaction of Church Slavonic; source-card catalog; data capture; ICR recognition)
Sažetak
U izlaganju se opisuje pretvorba skeniranih slika mjesnoga kataloga korpusa Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik. Prepoznavanje rukom pisanoga teksta (ICR) provedeno je računalnim programom za automatsku obradu rukom pisanih stukturiranih obrazaca. Grafički poboljšane, slike su uvezene, povezane u manje jedinice vezane kontekstom i položajem u izvoru te podudarene s pripadajućim dokumentnim definicijama koje defi niraju principe identifi kacije i procesiranja dokumenata i pružaju mogućnosti poput odabira skupova znakova i dodavanja rječničkih popisa. U prepoznavanju teks tova dokumenata posebna pozornost posvećena je: glavnim oblicima crkvenoslavenskoga teksta i crkvenoslavenskim pojavnicama, u tekstovnom i lematiziranom obliku, pisanima ćiriličnim pismom, s pripadajućim gramatičkim oznakama i podatcima o tekstovnom mjestu, pisanima latinicom. Tekstovi grčkih i latinskih paralela i njihovi oblici riječi te podatci o njihovom mjestu, teže strojno čitljivi zbog spojenoga kurzivnoga pisanja dodani su ručno, u obliku potvrđenom u pouzdanim tiskanim ili elektronskim izdanjima. Prepoznat i provjeren strojno čitljiv tekst mjesnoga kataloga izvezen je u XML formatu, s očuvanim informacijama vezanim za strukturu i opis podataka.
Izvorni jezik
Hrvatski
POVEZANOST RADA
Projekti:
HRZZ-UIP-2013-11-2462 - Teoretsko i primjenjeno jezikoslovno istraživanje korpusa hrvatskih crkvenoslavenskih tekstova s izradom Rječnika crkvenoslavenskoga jezika hrvatske redakcije (TALRCCCSTDCRCSC) (Vukoja, Vida, HRZZ - 2013-11) ( CroRIS)
Profili:
Lucija Turkalj Čulinović
(autor)