Pregled bibliografske jedinice broj: 428235
Percepcijska utemeljenost kepstralnih mjera udaljenosti za primjene u obradi govora
Percepcijska utemeljenost kepstralnih mjera udaljenosti za primjene u obradi govora, 2008., magistarski rad, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 428235 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Percepcijska utemeljenost kepstralnih mjera udaljenosti za primjene u obradi govora
(Perceptual Significance of Cepstral Distortion Measures in Digital Speech Processing)
Autori
Vasilijević, Antonio
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
10.12
Godina
2008
Stranica
79
Mentor
Petrinović, Davor
Ključne riječi
obrada govora ; prepoznavanje govora ; MFCC ; mel kepstar ; aliasing ; SD mjera ; homomorfna analiza ; LSF parametri ; LPC parametri
(digital speech processing ; speech recognition ; MFCC ; mel cepstrum ; aliasing ; SD measure ; homomorfic analysis ; LSF parameters ; LPC parameters)
Sažetak
Tema ovog rada je ispitati usklađenost MFCC mjere sa stvarnim percepcijskim razlikama za različite vrijednosti parametara analize. Analizom parametara mel filtarskog sloga utvrdili smo da filtar sa 24 pojasa, širine 220 mel-a i faktorom preklapanja filtra većim ili jednakim jedan, daje optimalne SD mjere koje se najbolje slažu s percepcijom. Za takav mel filtartski slog granica čujnosti razlike između glasova je 0.4-0.5 dB, mjereno SD RMS razlikom potpunih mel kepstralnih vektora. Također, pokazat ćemo da je korištenje mel kepstralnog vektora odrezanog na konačunu dužinu (12 koeficijenata) opravdano za prepoznavanje govora, ali da bi moglo biti upitno u primjenama prepoznavanja govornika. Analizirali smo i utjecaj aliasing-a u kepstralnoj domeni na mjere udaljenosti glasova. Postoje rijetke iznimke kod kojih je utjecaj aliasing-a prisutan, te su one posebno analizirane.
Izvorni jezik
Engleski
Znanstvena područja
Elektrotehnika