Perceptual Significance of Cepstral Distortion Measures in Digital Speech Processing (CROSBI ID 355532)
Ocjenski rad | magistarski rad (mr. sc. i mr. art.)
Podaci o odgovornosti
Vasilijević, Antonio
Petrinović, Davor
engleski
Perceptual Significance of Cepstral Distortion Measures in Digital Speech Processing
Tema ovog rada je ispitati usklađenost MFCC mjere sa stvarnim percepcijskim razlikama za različite vrijednosti parametara analize. Analizom parametara mel filtarskog sloga utvrdili smo da filtar sa 24 pojasa, širine 220 mel-a i faktorom preklapanja filtra većim ili jednakim jedan, daje optimalne SD mjere koje se najbolje slažu s percepcijom. Za takav mel filtartski slog granica čujnosti razlike između glasova je 0.4-0.5 dB, mjereno SD RMS razlikom potpunih mel kepstralnih vektora. Također, pokazat ćemo da je korištenje mel kepstralnog vektora odrezanog na konačunu dužinu (12 koeficijenata) opravdano za prepoznavanje govora, ali da bi moglo biti upitno u primjenama prepoznavanja govornika. Analizirali smo i utjecaj aliasing-a u kepstralnoj domeni na mjere udaljenosti glasova. Postoje rijetke iznimke kod kojih je utjecaj aliasing-a prisutan, te su one posebno analizirane.
digital speech processing ; speech recognition ; MFCC ; mel cepstrum ; aliasing ; SD measure ; homomorfic analysis ; LSF parameters ; LPC parameters
nije evidentirano
nije evidentirano
nije evidentirano
nije evidentirano
nije evidentirano
nije evidentirano
Podaci o izdanju
79
10.12.2008.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb