Pregled bibliografske jedinice broj: 953722
Etički izazovi pri prikupljanju Hrvatskog korpusa govornog jezika (HrAL)
Etički izazovi pri prikupljanju Hrvatskog korpusa govornog jezika (HrAL) // 3. simpozij SCIMETH: Etička pitanja u suvremenim lingvističkim istraživanjima
Rijeka, Hrvatska, 2018. (predavanje, domaća recenzija, neobjavljeni rad, znanstveni)
CROSBI ID: 953722 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Etički izazovi pri prikupljanju Hrvatskog korpusa govornog jezika (HrAL)
(Ethical Challenges in collecting Croatian Adult Spoken Language Corpus (HrAL))
Autori
Olujić, Marina ; Kuvač Kraljević, Jelena ; Hržica, Gordana
Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, neobjavljeni rad, znanstveni
Skup
3. simpozij SCIMETH: Etička pitanja u suvremenim lingvističkim istraživanjima
Mjesto i datum
Rijeka, Hrvatska, 02.05.2018
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Domaća recenzija
Ključne riječi
etički izazovi ; Hrvatski korpus govornog jezika odraslih (HrAL) ; jezično uzorkovanje ; korpus spontanoga govora
(ethical challenges ; Croatian Adult Spoken Language Corpus (HrAL) ; language sampling ; spontaneous speech corpora)
Sažetak
Korpusi govornog jezika odnose se na kolekcije jezičnih i komunikacijskih podataka koji su prikupljani u svrhu istraživanjima prirode ljudskog jezika i komunikacije (Wichmann, 2008). Jezični korpusi spontanog govora predstavljaju sveobuhvatan izvor jezičnih informacija neprofesionalnih govornika te sadrže spontane, nepripremljene govore i razgovore u stvarnom vremenu, različitih stilova, registara i dijalekata (Kuvač Kraljević i Hržica, 2016). Hrvatski korpus govornog jezika (HrAL) javno je dostupan korpus u sklopu TalkBank baze koja prikuplja korpuse različitih jezika (https://talkbank.org). Sadrži uzorke spontanog razgovora između 617 govornika iz svih hrvatskih županija. Uzorke sačinjava više od 250 000 pojavnica i više od 100 000 natuknica, a uz većinu uzoraka vezan je i pripadajući zvučni zapis. HrAL može pružiti informacije o obilježjima jezične proizvodnje uključujući govorni leksikon i gramatiku, diskursne vještine i pogreške (Kuvač Kraljević i Hržica, 2016). Podatke za HrAL su prikupljali trenirani prikupljači. Većinu prikupljača činili su studenti logopedije Edukacijsko- rehabilitacijskog fakulteta, a ciljni ispitanici su bili njihove obitelji, rodbina i prijatelji. Prikupljači su prukupljali audio zapise neformalnih razgovora tijekom svakodnevnih aktivnost (npr. večera s obitelji, razgovor uz kavu, ...) u grupi od 3 do 8 ciljnih govornika. Audio zapisi naknadno su transkribirani, kodirani i segmentirani na komunikacijske jedinice. Izrada korpusa spontanog govora metodološki je vrlo zahtjevna, a tomu pridonose i različiti etički izazovi s kojima se autori korpusa susreću. Bit će predstavljeni neki od njih. Prvi izazov predstavlja osiguravanje spontanosti govora u prikupljenim uzorcima. Naime, ukoliko ciljni govornici znaju da se njihov govor snima, narušit će se spontanost. Je li u ovom slučaju opravdana obmana ispitanika? Drugo, da bi se omogućila reprezentativnost uzorka koja uključuje što veći uzorak ciljnih govornika kao i županijsku raznolikost, vrlo je prigodno regrutirati i obučiti studente kao prikupljače. Je li opravdano studente regrutirati u ove svrhe? Treće, što kada prikupljeni uzorci sadrže delikatne podatke iz privatnog života ciljnih ispitanika? Prilikom izrade HrAL-a poštovani su propisi Helsinške deklaracije (World Medical Association), ASHA-e (American Speech-Language- Hearing Association), APA-e (American Psychological Association) i Etičkog kodeksa Sveučilišta u Zagrebu, a potvrdu o zadovoljenju etičkih uvjeta izdalo je povjerenstvo Edukacijsko - rehabilitacijskog fakulteta i Hrvatske zaklade za znanost (HRZZ). Korpus je prikupljen u sklopu projekta Adult language processing (HRZZ, 2421).
Izvorni jezik
Hrvatski
Znanstvena područja
Logopedija
POVEZANOST RADA
Ustanove:
Edukacijsko-rehabilitacijski fakultet, Zagreb