Metode višeagentskog podržanog učenja u igri distribucije piva (CROSBI ID 450387)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Mutić, Domagoj
Mario Brčić
hrvatski
Metode višeagentskog podržanog učenja u igri distribucije piva
Upravljanje lancima opskrbe je izuzetno odgovorna zadaća jer na njenoj efikasnosti počiva ekonomski sustav. Lanci opskrbe su povrh svega kompleksni sustav koje odlikuju nelinearnosti, složena vremenska dinamika, problemi dijeljenja informacija, te već poznati efekt biča kojim dolazi do velikih oscilacija u sustavu čak i u uvjetima jednostavno i blago promjenjive potražnje na izlazu. Igra distribucije piva jest jednostavni lanac opskrbe koji se sastoji od jednostavnog lanca četiri subjekta: proizvođač, distributer, dobavljač i prodavač. U ovom radu su uspoređeni postojeći radovi iz literature iz područja višeagentskog podržanog učenja u upravljanju lancem opskrbe u igri distribucije piva. Usporedba zahtijeva svođenje različitih rješenja na identične uvjete i scenarije. Također, isprobane su i uspoređene različite metode višeagentskog podržanog učenja u pogledu konfiguracija i topologije učenja koje doprinose ubrzanju učenja i/ili postizanju boljeg rezultata.
podržano učenje, višeagentsko podržano učenje, PPO, SRDQN
nije evidentirano
engleski
Methods of multiagent reinforcement learning in beer distribution game
nije evidentirano
reinforcement learning, multiagent supported learning, PPO, SRDQN
nije evidentirano
Podaci o izdanju
34
04.07.2022.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb