Pregled bibliografske jedinice broj: 1231291
Određivanje kompleksnosti glazbenog žanra pomoću generativnih modela neuronskih mreža
Određivanje kompleksnosti glazbenog žanra pomoću generativnih modela neuronskih mreža // 2022 45th Jubilee International Convention on Information, Communication and Electronic Technology (MIPRO)
Opatija: Institute of Electrical and Electronics Engineers (IEEE), 2022. str. 1762-1767 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), stručni)
CROSBI ID: 1231291 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Određivanje kompleksnosti glazbenog žanra
pomoću generativnih modela neuronskih mreža
(Determining the complexity of a musical genre
using generative neural network models)
Autori
Sladić, Dimitar ; Kramberger, Tin ; Kramberger, Renata ; Nožica, Bojan
Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), stručni
Izvornik
2022 45th Jubilee International Convention on Information, Communication and Electronic Technology (MIPRO)
/ - Opatija : Institute of Electrical and Electronics Engineers (IEEE), 2022, 1762-1767
ISBN
978-953-233-103-5
Skup
45th International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO 2022)
Mjesto i datum
Opatija, Hrvatska, 23.05.2022. - 27.05.2022
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Međunarodna recenzija
Ključne riječi
Neuronske mreže, glazba, LSTM, GRU, Transformer
(Neural networks, music, LSTM, GRU, Transformer)
Sažetak
Trenutno postoji velik broj različitih žanrova i pod žanrova glazbe. Svaki od žanrova uvelike se razlikuje po kompleksnosti reprodukcije i skladanja. Ovaj rad bavi se generiranjem različitih žanrova glazbe pomoću umjetnih neuronskih mreža s ciljem mjerenja točnosti predviđanja idućeg glazbenog zapisa kako bi se odredila kompleksnost žanra. Koriste se MIDI setovi podataka koji su podijeljeni u različite žanrove glazbe nad kojima se potom vrši treniranje neuronskih mreža. Kako bi se izbjegla mogućnost pristranosti neuronske mreže, koriste se tri različite arhitekture: LSTM, GRU i Transformer. Nad neuronskim mrežama se mjeri točnost svakih 10 epoha treniranja nad testnim setom podataka. Na posljetku se uzima najveća točnost koja pokazuje rezultat predviđanja idućeg tonskog zapisa MIDI datoteke za svaku neuronsku mrežu zasebno. Rezultati mjerenja točnosti predviđanja idućeg zapisa neuronske mreže potvrđuju inicijalnu hipotezu. Žanrovi glazbe uvelike se razlikuju svojom kompleksnošću u vidu predviđanja sljedećeg muzičkog zapisa na temelju prethodnih od strane neuronske mreže. Na taj način moguće je zaključiti da postoji spona između kompleksnosti predviđanja glazbe neuronskom mrežom i žanra glazbe nad kojim je ista trenirana. Pomoću ove tehnike moguće je obraditi bilo koji žanr glazbe i pomoću točnosti dobivene neuronskom mrežom odrediti kompleksnost žanra.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Ustanove:
Tehničko veleučilište u Zagrebu