Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava

Perak, Benedikt

izvor podataka: crosbi ✓

Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava (CROSBI ID 699361)

Prilog sa skupa u zborniku | sažetak izlaganja sa skupa | međunarodna recenzija

Perak, Benedikt Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava // XXXIV. međunarodni znanstveni skup JEZIČNO I IZVANJEZIČNO U MEĐUDJELOVANJU. 2020. str. ---

Podaci o odgovornosti

Autori

Perak, Benedikt

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

hrvatski

Naslov

Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava

Sažetak

Korpus saborskih rasprava tvori važan i jedinstven korpus javnog diskursa s a) izvanjezičnim obilježjima identiteta govornika, njihovog političkog angažmana, svjetonazorskih uvjerenja i društveno-političkog umreženja te b) unutarjezičnim načinima komunikacije ideja, profiliranja značenja i oblikovanja svjetonazora konvencionalizacijom figura mišljenja. Saborske rasprave mogu se pronaći u transkribiranoj inačici na mrežnim stranicama http://edoc.sabor.hr/. Međutim, njihov podatkovni format na tom izvoru nije baš lako dostupan za standardiziranu jezičnu obradu i daljnju jezikoslovnu analizu iz perspektive jednog korpusnog lingvista. Izlaganje će ponuditi opis računalnih metoda stvaranja morfo-sintaktički obilježenog, socio- lingvističkog korpusa saborskih rasprava (Perak i Rodik 2018), pohranjivanja u graf bazu (https://neo4j.com/) i obogaćivanja podataka o govornicima iz različitih institucionalnih i neinstitucionalnih informacijskih izvora te kognitivno- sociolingvističku leksičku analizu koja se temelji na čestotnoj (koji govornik najviše koristi pojam x), proporcijskoj (koji govornik najviše koristi pojam x u proporciji s ostalim iskazanim pojmovnima), i relacijskoj analizi (koji su zastupnici/zastupnički klubovi slični temeljem iskazanih pojmova) leksema. Navedeni se rezultati mogu koristiti za različite analize kritičke analize diskursa i računalno potpomognutu stilistiku diskursa. Također, prikazat će se rezultati metode conGraCnet (https://github.com/bperak/ConGraCNet) za analizu semantičkih odnosa na temelju sintaktičkih konstrukcija dobivenih računalnim morfosintaktičkim parsiranjem (http://ufal.mff.cuni.cz/udpipe). ConGraCNet metoda omogućuje produbljenje sociolingvističkih analiza na korpusu saborskih rasprava dohvaćanjem semantički označenih sintaktičkih konstrukcija (https://universaldependencies.org/) čime se za bilo koji leksem unutar korpusa mogu dobiti uvidi o sinonimiji, analogiji i potencijalno drugim semantičkim odnosima u odnosu na skupinu govornika. To je istovremeno i prilika za kulturološke usporedbe s drugim korpusima poput hrWac (Ljubešić i Erjavec 2011) i analizu njihove specifičnosti. Navedeni alati i metode razvijaju se unutar projekta EmocNet (http://emocnet.uniri.hr/) s ciljem implementacije alata za jezikoslovnu analizu diskurza u kulturi.

Ključne riječi

Saborske rasprave, računalna lingvistika, socio-lingvistička analiza

Napomena

nije evidentirano

Jezik

engleski

Naslov

Enrichment of data on speakers and cognitive- socio-linguistic analysis of the corpus of parliamentary debates

Sažetak

nije evidentirano

Ključne riječi

Metadata enrichment and cognitive-socio-linguistic analysis, parliamentary debates, corpus

Napomena

nije evidentirano

Podaci o prilogu

Stranice rada

---.

Godina izdavanja

2020.

Status objave rada

objavljeno

Podaci o matičnoj publikaciji

Naslov

XXXIV. međunarodni znanstveni skup JEZIČNO I IZVANJEZIČNO U MEĐUDJELOVANJU

Podaci o skupu

Skup

XXXIV. međunarodni znanstveni skup JEZIČNO I IZVANJEZIČNO U MEĐUDJELOVANJU

Vrsta sudjelovanja

predavanje

Datum održavanja skupa

24.09.2020-26.09.2020

Mjesto održavanja skupa

Split, Hrvatska

Povezanost rada

Povezane osobe

Benedikt Perak (autor/i)

Povezane ustanove

Filozofski fakultet u Rijeci (009) (autorova ustanova)

Povezani projekti

Jezično izražavanje emocija: Razvoj računalnih metoda identifikacije i ontološkog modeliranja komunikacije psiholoških stanja u hrvatskom jeziku (EmoCNet) (rezultat rada na projektu)

Područje

Filologija, Informacijske i komunikacijske znanosti, Interdisciplinarne humanističke znanosti, Sociologija