Pregled bibliografske jedinice broj: 451355
Izgradnja i korištenje statističkog modela jezika za automatsko prepoznavanje govora
Izgradnja i korištenje statističkog modela jezika za automatsko prepoznavanje govora, 2009., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 451355 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Izgradnja i korištenje statističkog modela jezika za automatsko prepoznavanje govora
(Design and application of statistical language model for automatic speech recognition)
Autori
Okorn, Boris
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
13.02
Godina
2009
Stranica
40
Mentor
Petrinović, Davor
Neposredni voditelj
Petrinović, Davor
Ključne riječi
automatsko prepoznavanje govora; statistički model jezika; gradnja modela jezika; ograničena domena
(Automatic speech recognition; Statistical language model; Language model training; Limited domain)
Sažetak
U okviru završnog rada potrebno je obraditi problem modeliranja statističkih svojstava jezika i korištenje takvih modela u sustavima za automatsko prepoznavanje prirodnog vezanog govora za hrvatski jezik. Istražiti tipove modela koji se koriste za tu namjenu i automatizirane postupke određivanja parametara, tj. treniranje tih modela temeljene na učenju. Potrebno je istražiti koliko se ugradnjom takvih modela u sustav za automatsko prepoznavanje govora povećava točnost prepoznavanja u odnosu na čiste akustičke modele jezika bez eksplicitne gramatike ili modela jezika. Sve je potrebno demonstrirati na primjeru zadatka uske domene (npr. vremenska prognoza ili stanje na cestama), s rječnikom koji sadrži do par tisuća riječi. U tu svrhu potrebno je pripremiti odgovarajuće tekstualne i akustičke baze koje se odnose na odabranu domenu, bilo prikupljanjem javno raspoloživih podataka, bilo snimanjem. Sve praktične zadatke potrebno je realizirani u okviru programskog alata HTK. Diskutirati i problem brzine rada, i utjecaj parametara sustava prepoznavanja na složenost algoritma sa stanovišta opterećenja procesora.
Izvorni jezik
Hrvatski
Znanstvena područja
Elektrotehnika, Računarstvo