Pregled bibliografske jedinice broj: 1164390
Metoda automatske detekcije naglašenih riječi u zvučnom zapisu
Metoda automatske detekcije naglašenih riječi u zvučnom zapisu, 2019., doktorska disertacija, Filozofski fakultet / Informacijske i komunikacijske znanosti, Zagreb
CROSBI ID: 1164390 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Metoda automatske detekcije naglašenih riječi u
zvučnom zapisu
(A method for automatic detection of emphasized words
in recorded speech)
Autori
Stojanović, Aleksandar
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija
Fakultet
Filozofski fakultet / Informacijske i komunikacijske znanosti
Mjesto
Zagreb
Datum
27.06
Godina
2019
Stranica
229
Mentor
Lazić, Nikolaj
Ključne riječi
prozodija ; prepoznavanje govora ; naglašavanje riječi ; podnatpis ; intenzitet ; frekvencija ; ton
(neural network ; phoneme ; LTAS ; spectrum ; recognition ; alignment ; emphasized word ; frequency ; pitch ; intensity)
Sažetak
Prozodija je važan aspekt govora jer poboljšava informativnost izgovorenog. Jedan segment prozodije uključuje naglašavanje riječi kojim se ističe važnost jedne riječi u kontekstu sadržaja onoga što je izgovoreno, čime se može utjecati i na semantiku tog sadržaja. U tekstu, međutim, taj je aspekt izgubljen, pa je time izgubljena i ta dodatna informativnost napisanog sadržaja. Cilj ovog rada bio je istražiti mogućnosti automatskog vraćanja informacija o naglašenim riječima u tekst koji je spremljen kao podnatpis ili transkript. To se željelo postići bez upotrebe potpuno automatskog sustava za prepoznavanje govora. Naglašenost riječi analizira se kroz tri dimenzije: pojačani intenzitet, povišeni ton, produljeni (usporeni) izgovor. Vraćanje ovih informacija u tekst obogaćuje njegovu informativnost, dok istovremeno, s tehničke strane, takav tekst zahtijeva puno manje memorijskog kapaciteta od zvuka, pa u tom obliku može biti pogodan tamo gdje postoji potreba za spremanjem velikih količina podataka, kao što je arhiviranje ili računalno pretraživanje. Isto tako, ovako obogaćeni tekst može biti koristan za osobe s oštećenim sluhom ili gluhonijeme osobe jer bi se njima na ovaj način olakšalo razumijevanje sadržaja time što bi im se približio izvorni oblik onoga što je i kako je bilo izgovoreno.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti
POVEZANOST RADA
Ustanove:
Filozofski fakultet, Zagreb