Napredna pretraga

Pregled bibliografske jedinice broj: 826982

O pretvorbi kartičnoga mjesnoga kataloga Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik


Turkalj, Lucija
O pretvorbi kartičnoga mjesnoga kataloga Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik // Crkvenoslavenska i hrvatska povijesna leksikografija. Međunarodni znanstveno-stručni skup, Zagreb 29. lipnja - 1. srpnja 2016. Knjižica sažetakaStaroslavenski institut, 2016. / Kovačević, Ana ; Vukoja, Vida (ur.).
Zagreb: Staroslavenski institut, 2016. str. 70-71 (predavanje, nije recenziran, sažetak, stručni)


Naslov
O pretvorbi kartičnoga mjesnoga kataloga Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik
(On the conversion of the Source-card catalog of the Dictionary of the Croatian Redaction of Church Slavonic into a Machine-Readable Form)

Autori
Turkalj, Lucija

Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, sažetak, stručni

Izvornik
Crkvenoslavenska i hrvatska povijesna leksikografija. Međunarodni znanstveno-stručni skup, Zagreb 29. lipnja - 1. srpnja 2016. Knjižica sažetakaStaroslavenski institut, 2016. / Kovačević, Ana ; Vukoja, Vida - Zagreb : Staroslavenski institut, 2016, 70-71

ISBN
978-953-6080-22-9

Skup
Crkvenoslavenska i hrvatska povijesna leksikografija

Mjesto i datum
Zagreb, Hrvatska, 29.06.-01.07. 2016

Vrsta sudjelovanja
Predavanje

Vrsta recenzije
Nije recenziran

Ključne riječi
Hrvatski crkvenoslavenski jezik; korpus Rječnika crkvenoslavenskoga jezika hrvatske redakcije; mjesni katalog; dohvaćanje podataka; prepoznavanje rukom pisanoga teksta
(Croatian Church Slavonic language; corpus of the Dictionary of The Croatian Redaction of Church Slavonic; source-card catalog; data capture; ICR recognition)

Sažetak
U izlaganju se opisuje pretvorba skeniranih slika mjesnoga kataloga korpusa Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik. Prepoznavanje rukom pisanoga teksta (ICR) provedeno je računalnim programom za automatsku obradu rukom pisanih stukturiranih obrazaca. Grafički poboljšane, slike su uvezene, povezane u manje jedinice vezane kontekstom i položajem u izvoru te podudarene s pripadajućim dokumentnim definicijama koje defi niraju principe identifi kacije i procesiranja dokumenata i pružaju mogućnosti poput odabira skupova znakova i dodavanja rječničkih popisa. U prepoznavanju teks tova dokumenata posebna pozornost posvećena je: glavnim oblicima crkvenoslavenskoga teksta i crkvenoslavenskim pojavnicama, u tekstovnom i lematiziranom obliku, pisanima ćiriličnim pismom, s pripadajućim gramatičkim oznakama i podatcima o tekstovnom mjestu, pisanima latinicom. Tekstovi grčkih i latinskih paralela i njihovi oblici riječi te podatci o njihovom mjestu, teže strojno čitljivi zbog spojenoga kurzivnoga pisanja dodani su ručno, u obliku potvrđenom u pouzdanim tiskanim ili elektronskim izdanjima. Prepoznat i provjeren strojno čitljiv tekst mjesnoga kataloga izvezen je u XML formatu, s očuvanim informacijama vezanim za strukturu i opis podataka.

Izvorni jezik
Hrvatski



POVEZANOST RADA


Projekt / tema
HRZZ-UIP-2013-11-2462 - Teoretsko i primjenjeno jezikoslovno istraživanje korpusa hrvatskih crkvenoslavenskih tekstova s izradom Rječnika crkvenoslavenskoga jezika hrvatske r (Vida Vukoja, )

Autor s matičnim brojem:
Lucija Turkalj Čulinović, (272583)