Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 779609

Metode razlikovanja govora i glazbe u digitalnim zvučnim zapisima


Križanić, Ivan
Metode razlikovanja govora i glazbe u digitalnim zvučnim zapisima, 2015., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb


CROSBI ID: 779609 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Metode razlikovanja govora i glazbe u digitalnim zvučnim zapisima
(Methods for speech and music discrimination in digital soundtracks)

Autori
Križanić, Ivan

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, diplomski

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
10.07

Godina
2015

Stranica
71

Mentor
Petrinović, Davor

Ključne riječi
digitalna obrada zvuka; razlikovanje govora i glazbe; broj prolaza kroz ništicu; spektralni tok; spektralni centroid; MFCC koeficijenti; MAP estimator; Gaussove mješavine; k-d stabla; k-NN algoritam
(digital sound processing; speech/music discrimination; zero-crossing rate; spectral flux; spectral centroid; MFCC coefficients; the MAP estimator; Gaussian mixtures; k-d trees; k-NN algorithm)

Sažetak
U sklopu ovog diplomskog rada obrađen je povijesni pregled na metode razlikovanja govora i glazba te je napravljen pregled različitih čimbenika koji utječu na uspješnost klasifikacije. To su prije svega parametri zvuka, u vremenskoj domeni postotak okvira niske energije i broj prolaza kroz ništicu, u frekvencijskoj domeni spektralni centroid, spektralni tok, frekvencija većinske spektralne snage te u kepstralnoj domeni modulacijska energija na 4 Hz i modul razlike spektra i rekonstruiranog spektra iz kepstra. Rad se zatim fokusira na različite klasifikatore koje je moguće koristiti u sklopu razlikovanja govora i glazbe te obrađuje četiri različita klasifikatora. Na kraju se diskutiraju dvije različite gotove metode koje se mogu koristiti za klasificiranje govora i glazbe.

Izvorni jezik
Hrvatski

Znanstvena područja
Elektrotehnika, Računarstvo



POVEZANOST RADA


Projekti:
0036054

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Davor Petrinović (mentor)

Poveznice na cjeloviti tekst rada:

Pristup cjelovitom tekstu rada

Citiraj ovu publikaciju:

Križanić, Ivan
Metode razlikovanja govora i glazbe u digitalnim zvučnim zapisima, 2015., diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb
Križanić, I. (2015) 'Metode razlikovanja govora i glazbe u digitalnim zvučnim zapisima', diplomski rad, diplomski, Fakultet elektrotehnike i računarstva, Zagreb.
@phdthesis{phdthesis, author = {Kri\v{z}ani\'{c}, Ivan}, year = {2015}, pages = {71}, keywords = {digitalna obrada zvuka, razlikovanje govora i glazbe, broj prolaza kroz ni\v{s}ticu, spektralni tok, spektralni centroid, MFCC koeficijenti, MAP estimator, Gaussove mje\v{s}avine, k-d stabla, k-NN algoritam}, title = {Metode razlikovanja govora i glazbe u digitalnim zvu\v{c}nim zapisima}, keyword = {digitalna obrada zvuka, razlikovanje govora i glazbe, broj prolaza kroz ni\v{s}ticu, spektralni tok, spektralni centroid, MFCC koeficijenti, MAP estimator, Gaussove mje\v{s}avine, k-d stabla, k-NN algoritam}, publisherplace = {Zagreb} }
@phdthesis{phdthesis, author = {Kri\v{z}ani\'{c}, Ivan}, year = {2015}, pages = {71}, keywords = {digital sound processing, speech/music discrimination, zero-crossing rate, spectral flux, spectral centroid, MFCC coefficients, the MAP estimator, Gaussian mixtures, k-d trees, k-NN algorithm}, title = {Methods for speech and music discrimination in digital soundtracks}, keyword = {digital sound processing, speech/music discrimination, zero-crossing rate, spectral flux, spectral centroid, MFCC coefficients, the MAP estimator, Gaussian mixtures, k-d trees, k-NN algorithm}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font