Pregled bibliografske jedinice broj: 1162676
Metoda automatske analize brzine govora
Metoda automatske analize brzine govora // Polytechnic and design, 9 (2021), 2; 74-81 doi:10.19279/TVZ.PD.2021-9-2-01 (međunarodna recenzija, članak, znanstveni)
CROSBI ID: 1162676 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Metoda automatske analize brzine govora
(A method for automatic analysis of speech tempo)
Autori
Stojanović, Aleksandar
Izvornik
Polytechnic and design (1849-1995) 9
(2021), 2;
74-81
Vrsta, podvrsta i kategorija rada
Radovi u časopisima, članak, znanstveni
Ključne riječi
prepoznavanje govora, poravnavanje, tempo, neuronska mreža
(speech recognition, alignment, tempo, neural network)
Sažetak
U ovom radu opisana je metoda analize brzine govora ili tempa na osnovu uzoraka govora dobivenih s televizijskih kanala koji sadrže tekst izgovorenog u obliku titlova. Za prepoznavanje govora korištena je nepovratna neuronska mreža (engl. feed-forward neural network) trenirana s oko 160 sekundi govora. Da bi se odredile granice pojedinačnih riječi napravljena je komponenta za poravnavanje govora s tekstom koja pronalazi prihvatljivo podudaranje slova teksta s fonemima koje je klasificirala neuronska mreža. Komponenta za poravnavanje uzima u obzir kategorije fonema za koje neuronska mreža ima veću preciznost klasifikacije. Preliminarni rezultati pokazuju prosječne promašaje poravnavanja od jednog do tri fonema, zavisno od govornika, sadržaja izgovorenog i kvalitete snimke.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo, Informacijske i komunikacijske znanosti