Računalno oblikovanje korpusa starohrvatskoga jezika

Barbarić, Vuk-Tadija; Kapetanović, Amir

Pregled bibliografske jedinice broj: 548512

Računalno oblikovanje korpusa starohrvatskoga jezika

Barbarić, Vuk-Tadija; Kapetanović, Amir

Računalno oblikovanje korpusa starohrvatskoga jezika // Filologija : časopis Razreda za filološke znanosti Hrvatske akademije znanosti i umjetnosti, 59 (2012), 1-13 (međunarodna recenzija, pregledni rad, znanstveni)

CROSBI ID: 548512 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Računalno oblikovanje korpusa starohrvatskoga jezika
(Computer Designed Corpus of the Old-Croatian Language)

Autori
Barbarić, Vuk-Tadija ; Kapetanović, Amir

Izvornik
Filologija : časopis Razreda za filološke znanosti Hrvatske akademije znanosti i umjetnosti (0449-363X) 59 (2012); 1-13

Vrsta, podvrsta i kategorija rada
Radovi u časopisima, pregledni rad, znanstveni

Ključne riječi
starohrvatski jezik; korpus; standard TEI
(Old-Croatian language; corpus; TEI standard)

Sažetak
Rad na projektu Starohrvatski rječnikobuhvaća tri glavne faze: tekstološku, računalnu i leksikografsku. Autori se u ovom prilogu bave računalnim oblikovanjem korpusa starohrvatskoga jezika, i to pronalaženjem što učinkovitijega načina kodiranja primarnih podataka i metapodataka za korisnike, ali u okviru realnih mogućnosti projekta.

Izvorni jezik
Hrvatski

Znanstvena područja
Filologija

Napomena
Research for the Old-Croatian Dictionary in the Department of Croatian Language History and Historical Lexicography at the Institute of Croatian Language and Linguistics consists of three main stages: textological, computational and lexicographic. The first stage (textological) is thoroughly explained in Kapetanović's article Digitization of Old Croatian Texts and Textual Criticism. This paper explains the second stage – computational corpus design for the mentioned dictionary. Therefore, the analysis is focused on anticipating problems in designing a computationally readable corpus of texts written in the Old Croatian language, and on providing possible solutions. The computational processing of the texts for the corpus is described, as are problems which arise from the selection of TEI and Philologic server application. Priorities in corpus design are determined in order to overcome the mentioned problems and other potential difficulties. One possible solution to the separation of the apparatus criticus from the Old Croatian texts is proposed. All proposals are aimed at a more efficient encoding of primary data and metadata with respect to users, while remaining within the capabilities of the project. The paper also deals with the third, lexicographic stage by giving an overview of the chosen lexicographic tool TshwaneLex.

POVEZANOST RADA

Projekti:
212-2120920-0895 - Starohrvatski rječnik (Kapetanović, Damir, MZOS ) ( CroRIS)

Ustanove:
Institut za hrvatski jezik i jezikoslovlje, Zagreb

Profili:

Vuk-Tadija Barbarić (autor)

Amir Kapetanović (autor)

Poveznice na cjeloviti tekst rada:

Hrčak

Citiraj ovu publikaciju:

Časopis indeksira:

Scopus

Uključenost u ostale bibliografske baze podataka::

Linguistics Abstracts
LLBA: Linguistics and Language Behavior Abstracts

Pregled bibliografske jedinice broj: 548512

Računalno oblikovanje korpusa starohrvatskoga jezika

Poveznice na cjeloviti tekst rada:

Citiraj ovu publikaciju:

Časopis indeksira:

Uključenost u ostale bibliografske baze podataka::

Podijeli: