Pregled bibliografske jedinice broj: 864699
PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA
PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA, 2016., diplomski rad, diplomski, Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek, Osijek
CROSBI ID: 864699 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA
(The voice recognition in real time using FPGA)
Autori
Labak, Matija
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski
Fakultet
Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek
Mjesto
Osijek
Datum
29.09
Godina
2016
Stranica
80
Mentor
Hocenski, Željko
Neposredni voditelj
Matić, Tomislav
Ključne riječi
automatsko prepoznavanje govora, Altium NanoBoard, FPGA, značajke signala govora, linerano preditkivna analiza, glasovi hrvatskog jezika
(automatic speech recognition, Altium NanoBoard, FPGA, voice signal features, linear predictive analysis, Croatian phones)
Sažetak
U ovom radu je dan pregled povijesti razvitka sustava za prepoznavanje govora. Opisani su osnovni algoritmi koje sustavi za prepoznavanje govora koriste. Objašnjeno je što su to značajke govornog signala te kako se stvaraju. Sustavi za prepoznavanje govora koriste algoritme odabira jezičnih jedinica. Dinamičko savijanje vremena je algoritam u kojem se govorni signal uspoređuje s drugim govornim signalom dinamičkim savijanjem značajki signala po vremenskoj osi. Umjetne neuronske mreže su alat koji se primjenjuje na problem pretraživanja uzoraka, pa tako i na problem prepoznavanja govora. Skriveni Markovljevi modeli uspješno modeliraju razne jezične jedinice te su jedan od najčešćih algoritama koje se koriste u sustavima za prepoznavanje govora. Dubinske neuronske mreže se koriste u sustavima s velikim zahtjevima. Za implementaciju je korišten Altium NanoBoard 3000 sustav koji je razvijan u programu Altium Designer. Razvijen je ugrađeni računalni sustav koji se temelji na TSK3000A procesoru, a uključuje audio jedinicu koja služi za unos zvuka s audio ulaza ploče. Sustav koji je implementiran se temelji na linearno prediktivnoj analizi. Linearno preditkivnom analizom nastaju LPC koeficijenti koji u konačnici služe za usporedbu s usrednjenim značajkama u sustavu za prepoznavanju glasova hrvatskog jezika. Provedeno je testiranje napravljenog sustava za prepoznavanje glasova hrvatskog jezika. Točnost sustava za cjelokupno proveden eksperiment iznosi 44%. Za snimke po kojima su napravljene referente usrednjene značajke sustava točnost iznosi 93%. Mjerenje vremena proračuna značajki je potvrdilo da sustav u trenutnom stanju ne može ispuniti vremenski zahtjev sustava za proračunom u stvarnom vremenu
Izvorni jezik
Hrvatski
Znanstvena područja
Elektrotehnika
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek