Pregled bibliografske jedinice broj: 632801
Sadašnjost ili budućnost: Mogu li računala govoriti hrvatski?
Sadašnjost ili budućnost: Mogu li računala govoriti hrvatski?, 2013. (popularni rad).
CROSBI ID: 632801 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Sadašnjost ili budućnost: Mogu li računala govoriti hrvatski?
(Present or future? Are computers capable of speaking Croatian?)
Autori
Martinčić-Ipšić, Sanda
Izvornik
Festival znanosti, Rijeka
Vrsta, podvrsta
Ostale vrste radova, popularni rad
Godina
2013
Ključne riječi
sinteza govora; govor
(speech synthesis; speech)
Sažetak
Danas su poznati postupci sinteze govora, koji računalima omogućavaju da govore na svakom jeziku, pa i hrvatskome. Preciznije u slučaju kad računala govore bolje je govoriti da sintetiziraju govor, odnosno da iz ulaznoga teksta generiraju govor. Naravno, sama sinteza govora nije jednostavna te uz poznavanje računalnih postupaka podrazumijeva i analizu i obradu govornih signala (izgovorenoga govora zapisanog u obliku signala) ; jezičnih pravila (prvenstveno pravila izgovaranja i naglašavanja riječi) ; funkcioniranja govornih organa itd. Računalni postupci sinteze govora povijesno su proizašli: iz artikulacijskog modela – koji opisuje funkcioniranje govornih organa ; iz rezonantnog modela – koji analizira glavna rezonantna obilježja govornog signala (formante) i iz konkatenacijskog pristupa – pri kojem je model zamijenjen dijelovima govora, odnosno segmentima govora. Posljednjih se godina konkatenacijski pristup najintenzivnije razvija. Istražuje se utjecaj različitih vrsta segmenata (glasove, slogove, riječi) te različitih načina povezivanja segmenata u cjelinu (algoritme lijepljenja i glađenja signala). Posebno je značajno povezivanje sinteze govora s korpusno-statističkim pristupima. Korpus (zbirka ili baza snimljenih segmenata) omogućava odabir najboljeg segmenta za povezivanje u potrebnu riječ/rečenicu, čime se značajno pridonosi prirodnosti sinteze ; dok statistički pristup iz korpusa gradi model (stohastički) iz kojeg se govor sintetizira. Posljednji koristi skrivene Markovljeve modele kao generativni model za sintetiziranje. Bez obzira na odabran pristup ili tehnologiju generiranja samog signala, prethodno je potrebno analizirati ulazni tekst (popraviti ga ili dopuniti). U te se postupke ubraja normalizacija teksta gdje se svaka ulazna riječ (kratica, akronim, broj, datum itd.) mora ispisati slovima, zatim odrediti kako će se pojedino slovo pretvoriti u glas (pretvaranje grafema u foneme), odrediti mjesta naglasaka u riječima i rečenici (prozodijski model) te intonacijski model koji pridonosi da nam sintetiziran govor zvuči prirodnije.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo, Informacijske i komunikacijske znanosti
Napomena
Popularno predavanje, Festival znanosti, Rijeka, 24.04.2013.
POVEZANOST RADA
Projekti:
318-0361935-0852 - Govorne tehnologije (Ipšić, Ivo, MZOS ) ( CroRIS)
Ustanove:
Fakultet informatike i digitalnih tehnologija, Rijeka
Profili:
Sanda Martinčić - Ipšić
(autor)