Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava

Perak, Benedikt

Pregled bibliografske jedinice broj: 1108182

Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava

Perak, Benedikt

Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava // XXXIV. međunarodni znanstveni skup JEZIČNO I IZVANJEZIČNO U MEĐUDJELOVANJU
Split, Hrvatska, 2020. str. - (predavanje, međunarodna recenzija, sažetak, ostalo)

CROSBI ID: 1108182 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava
(Enrichment of data on speakers and cognitive- socio-linguistic analysis of the corpus of parliamentary debates)

Autori
Perak, Benedikt

Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, sažetak, ostalo

Izvornik
XXXIV. međunarodni znanstveni skup JEZIČNO I IZVANJEZIČNO U MEĐUDJELOVANJU / - , 2020

Skup
XXXIV. međunarodni znanstveni skup JEZIČNO I IZVANJEZIČNO U MEĐUDJELOVANJU

Mjesto i datum
Split, Hrvatska, 24.09.2020. - 26.09.2020

Vrsta sudjelovanja
Predavanje

Vrsta recenzije
Međunarodna recenzija

Ključne riječi
Saborske rasprave, računalna lingvistika, socio-lingvistička analiza
(Metadata enrichment and cognitive-socio-linguistic analysis, parliamentary debates, corpus)

Sažetak
Korpus saborskih rasprava tvori važan i jedinstven korpus javnog diskursa s a) izvanjezičnim obilježjima identiteta govornika, njihovog političkog angažmana, svjetonazorskih uvjerenja i društveno-političkog umreženja te b) unutarjezičnim načinima komunikacije ideja, profiliranja značenja i oblikovanja svjetonazora konvencionalizacijom figura mišljenja. Saborske rasprave mogu se pronaći u transkribiranoj inačici na mrežnim stranicama http://edoc.sabor.hr/. Međutim, njihov podatkovni format na tom izvoru nije baš lako dostupan za standardiziranu jezičnu obradu i daljnju jezikoslovnu analizu iz perspektive jednog korpusnog lingvista. Izlaganje će ponuditi opis računalnih metoda stvaranja morfo-sintaktički obilježenog, socio- lingvističkog korpusa saborskih rasprava (Perak i Rodik 2018), pohranjivanja u graf bazu (https://neo4j.com/) i obogaćivanja podataka o govornicima iz različitih institucionalnih i neinstitucionalnih informacijskih izvora te kognitivno- sociolingvističku leksičku analizu koja se temelji na čestotnoj (koji govornik najviše koristi pojam x), proporcijskoj (koji govornik najviše koristi pojam x u proporciji s ostalim iskazanim pojmovnima), i relacijskoj analizi (koji su zastupnici/zastupnički klubovi slični temeljem iskazanih pojmova) leksema. Navedeni se rezultati mogu koristiti za različite analize kritičke analize diskursa i računalno potpomognutu stilistiku diskursa. Također, prikazat će se rezultati metode conGraCnet (https://github.com/bperak/ConGraCNet) za analizu semantičkih odnosa na temelju sintaktičkih konstrukcija dobivenih računalnim morfosintaktičkim parsiranjem (http://ufal.mff.cuni.cz/udpipe). ConGraCNet metoda omogućuje produbljenje sociolingvističkih analiza na korpusu saborskih rasprava dohvaćanjem semantički označenih sintaktičkih konstrukcija (https://universaldependencies.org/) čime se za bilo koji leksem unutar korpusa mogu dobiti uvidi o sinonimiji, analogiji i potencijalno drugim semantičkim odnosima u odnosu na skupinu govornika. To je istovremeno i prilika za kulturološke usporedbe s drugim korpusima poput hrWac (Ljubešić i Erjavec 2011) i analizu njihove specifičnosti. Navedeni alati i metode razvijaju se unutar projekta EmocNet (http://emocnet.uniri.hr/) s ciljem implementacije alata za jezikoslovnu analizu diskurza u kulturi.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti, Sociologija, Filologija, Interdisciplinarne humanističke znanosti

POVEZANOST RADA

Projekti:
NadSve-Sveučilište u Rijeci-uniri-human-18-243 - Jezično izražavanje emocija: Razvoj računalnih metoda identifikacije i ontološkog modeliranja komunikacije psiholoških stanja u hrvatskom jeziku (EmoCNet) (EmoCNet) (Perak, Benedikt, NadSve - UNIRI Sredstva potpore znanstvenim istraživanjima) ( CroRIS)

Ustanove:
Filozofski fakultet, Rijeka

Profili:

Benedikt Perak (autor)

CROSBI Hrvatska znanstvena bibliografija

Pregled bibliografske jedinice broj: 1108182

Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava

Citiraj ovu publikaciju:

Pregled bibliografske jedinice broj: 1108182

Obogaćivanje podataka o govornicima i kognitivno-socio-lingvistička analiza korpusa saborskih rasprava

Citiraj ovu publikaciju:

Podijeli: