PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA

Labak, Matija

Pregled bibliografske jedinice broj: 864699

PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA

Labak, Matija

PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA, 2016., diplomski rad, diplomski, Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek, Osijek

CROSBI ID: 864699 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA
(The voice recognition in real time using FPGA)

Autori
Labak, Matija

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski

Fakultet
Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek

Mjesto
Osijek

Datum
29.09

Godina
2016

Stranica
80

Mentor
Hocenski, Željko

Neposredni voditelj
Matić, Tomislav

Ključne riječi
automatsko prepoznavanje govora, Altium NanoBoard, FPGA, značajke signala govora, linerano preditkivna analiza, glasovi hrvatskog jezika
(automatic speech recognition, Altium NanoBoard, FPGA, voice signal features, linear predictive analysis, Croatian phones)

Sažetak
U ovom radu je dan pregled povijesti razvitka sustava za prepoznavanje govora. Opisani su osnovni algoritmi koje sustavi za prepoznavanje govora koriste. Objašnjeno je što su to značajke govornog signala te kako se stvaraju. Sustavi za prepoznavanje govora koriste algoritme odabira jezičnih jedinica. Dinamičko savijanje vremena je algoritam u kojem se govorni signal uspoređuje s drugim govornim signalom dinamičkim savijanjem značajki signala po vremenskoj osi. Umjetne neuronske mreže su alat koji se primjenjuje na problem pretraživanja uzoraka, pa tako i na problem prepoznavanja govora. Skriveni Markovljevi modeli uspješno modeliraju razne jezične jedinice te su jedan od najčešćih algoritama koje se koriste u sustavima za prepoznavanje govora. Dubinske neuronske mreže se koriste u sustavima s velikim zahtjevima. Za implementaciju je korišten Altium NanoBoard 3000 sustav koji je razvijan u programu Altium Designer. Razvijen je ugrađeni računalni sustav koji se temelji na TSK3000A procesoru, a uključuje audio jedinicu koja služi za unos zvuka s audio ulaza ploče. Sustav koji je implementiran se temelji na linearno prediktivnoj analizi. Linearno preditkivnom analizom nastaju LPC koeficijenti koji u konačnici služe za usporedbu s usrednjenim značajkama u sustavu za prepoznavanju glasova hrvatskog jezika. Provedeno je testiranje napravljenog sustava za prepoznavanje glasova hrvatskog jezika. Točnost sustava za cjelokupno proveden eksperiment iznosi 44%. Za snimke po kojima su napravljene referente usrednjene značajke sustava točnost iznosi 93%. Mjerenje vremena proračuna značajki je potvrdilo da sustav u trenutnom stanju ne može ispuniti vremenski zahtjev sustava za proračunom u stvarnom vremenu

Izvorni jezik
Hrvatski

Znanstvena područja
Elektrotehnika

POVEZANOST RADA

Ustanove:
Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek

Profili:

Tomislav Matić (mentor)

Željko Hocenski (mentor)

CROSBI Hrvatska znanstvena bibliografija

Pregled bibliografske jedinice broj: 864699

PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA

Citiraj ovu publikaciju:

Pregled bibliografske jedinice broj: 864699

PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA

Citiraj ovu publikaciju:

Podijeli: