Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 1106015

Označavanje pogrešaka u CroLTeC-u (računalnom učeničkom korpusu hrvatskog kao stranog jezika)


Mikelić Preradović, Nives
Označavanje pogrešaka u CroLTeC-u (računalnom učeničkom korpusu hrvatskog kao stranog jezika) // Rasprave Instituta za hrvatski jezik i jezikoslovlje, 46 (2020), 2; 899-920 doi:10.31724/rihjj.46.2.24 (međunarodna recenzija, članak, znanstveni)


CROSBI ID: 1106015 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Označavanje pogrešaka u CroLTeC-u (računalnom učeničkom korpusu hrvatskog kao stranog jezika)
(Error-tagging of CroLTeC (electronic learner corpus of Croatian as a foreign language))

Autori
Mikelić Preradović, Nives

Izvornik
Rasprave Instituta za hrvatski jezik i jezikoslovlje (1331-6745) 46 (2020), 2; 899-920

Vrsta, podvrsta i kategorija rada
Radovi u časopisima, članak, znanstveni

Ključne riječi
učenički korpus ; CroLTeC ; označavanje pogrešaka ; obilježavanje pogrešaka ; normalizacija
(learner corpora ; CroLTeC ; error annotation ; error-tagging ; normalization)

Sažetak
U radu je opisana shema za označavanje pogrešaka u CroLTeC-u (http://nlp.ffzg.hr/resources/corpora/croltec/) - prvom računalnom učeničkom korpusu hrvatskog kao stranog jezika. Korpus sadrži eseje 755 učenika s 36 različitih materinskih jezika među kojima su najzastupljeniji španjolski, engleski, njemački, poljski, kineski, francuski i arapski. Sastoji se od 6, 213 eseja od čega je 1, 217 eseja u izvornom digitalnom obliku, a 4, 996 ih je skenirano, transkribirano i pretvoreno u XML format. Korpus ima ukupno 1.054, 287 pojavnica, a eseji su prikupljali na svih šest razina učenja hrvatskog jezika u Croaticumu – Centru za hrvatski kao drugi i strani jezik na Filozofskom fakultetu u Zagrebu. Svi eseji obogaćeni su metapodatcima o naslovu, broju i vrsti eseja te okolnostima pod kojima su nastali (domaća zadaća, dio ispita ili terenske nastave i sl.). Svi eseji su lematizirani i provedeno je morfosintaktičko označavanje riječi pomoću RELDI označivača (Ljubesic et al., 2016). Također, korpus je moguće pretraživati prema dobi, spolu, razini znanja hrvatskog jezika te materinskim jezicima polaznika. Shema označavanja pogrešaka djelomično se temelji na shemi Šolara (razvojnog korpusa slovenskog jezika) i shemi Cambridge Learner korpusa i prilagođena je hrvatskom jeziku. Shema označavanja pogrešaka u korpusu razvijena je kako bi se izgradio potkoprus koji će poslužiti kao spremište autentičnih podataka o međujeziku učenika te omogućiti znanstvenicima i lektorima hrvatskog kao stranog jezika da otkriju aspekte gramatike koje je najteže svladati i prilagode nastavne materijale različitim skupinama učenika (ne samo s obzirom na njihovo poznavanje hrvatskog jezika, nego i s obzirom na materinski jezik). Konačno, potkorpus s označenim pogreškama bi mogao biti temelj za dizajn računalnih alata za pomoć u ispravljanju leksičkih pogrešaka, kod pogrešne uporabe glagolskih vremena, idioma i kolokacija.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Ustanove:
Filozofski fakultet, Zagreb

Profili:

Avatar Url Nives Mikelić Preradović (autor)

Poveznice na cjeloviti tekst rada:

doi hrcak.srce.hr

Citiraj ovu publikaciju:

Mikelić Preradović, Nives
Označavanje pogrešaka u CroLTeC-u (računalnom učeničkom korpusu hrvatskog kao stranog jezika) // Rasprave Instituta za hrvatski jezik i jezikoslovlje, 46 (2020), 2; 899-920 doi:10.31724/rihjj.46.2.24 (međunarodna recenzija, članak, znanstveni)
Mikelić Preradović, N. (2020) Označavanje pogrešaka u CroLTeC-u (računalnom učeničkom korpusu hrvatskog kao stranog jezika). Rasprave Instituta za hrvatski jezik i jezikoslovlje, 46 (2), 899-920 doi:10.31724/rihjj.46.2.24.
@article{article, author = {Mikeli\'{c} Preradovi\'{c}, Nives}, year = {2020}, pages = {899-920}, DOI = {10.31724/rihjj.46.2.24}, keywords = {u\v{c}eni\v{c}ki korpus, CroLTeC, ozna\v{c}avanje pogre\v{s}aka, obilje\v{z}avanje pogre\v{s}aka, normalizacija}, journal = {Rasprave Instituta za hrvatski jezik i jezikoslovlje}, doi = {10.31724/rihjj.46.2.24}, volume = {46}, number = {2}, issn = {1331-6745}, title = {Ozna\v{c}avanje pogre\v{s}aka u CroLTeC-u (ra\v{c}unalnom u\v{c}eni\v{c}kom korpusu hrvatskog kao stranog jezika)}, keyword = {u\v{c}eni\v{c}ki korpus, CroLTeC, ozna\v{c}avanje pogre\v{s}aka, obilje\v{z}avanje pogre\v{s}aka, normalizacija} }
@article{article, author = {Mikeli\'{c} Preradovi\'{c}, Nives}, year = {2020}, pages = {899-920}, DOI = {10.31724/rihjj.46.2.24}, keywords = {learner corpora, CroLTeC, error annotation, error-tagging, normalization}, journal = {Rasprave Instituta za hrvatski jezik i jezikoslovlje}, doi = {10.31724/rihjj.46.2.24}, volume = {46}, number = {2}, issn = {1331-6745}, title = {Error-tagging of CroLTeC (electronic learner corpus of Croatian as a foreign language)}, keyword = {learner corpora, CroLTeC, error annotation, error-tagging, normalization} }

Časopis indeksira:


  • Web of Science Core Collection (WoSCC)
    • Emerging Sources Citation Index (ESCI)
  • Scopus


Citati:





    Contrast
    Increase Font
    Decrease Font
    Dyslexic Font