Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata (CROSBI ID 367599)
Ocjenski rad | doktorska disertacija
Podaci o odgovornosti
Job, Josip
Jović, Franjo
hrvatski
Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata
U radu je opisana standardna metoda Q-učenja pojačavanjem. Predložena je nova metoda učenja zasnovana na odlučivanju prema nagradi u n-tom budućem koraku i dogovoru između k-agenata. Za obje metode napravljeno je simulacijsko okruženje u programskom paketu Matlab. Osmišljeni su i izvedeni testovi učenja u različitim scenarijima koji se sastoje od okoline s konačnim brojem stanja te agenata koji se kreću u okolini. Promatran je broj epizoda potrebnih za učenje pronalaženja odredišta te uspješnost izbjegavanja sudara agenata. Dobiveni rezultati obaju metoda grafički su prikazani te uspoređeni. Analizirana je robusnost postupka učenja na utjecaj smetnji zbog nepotpunih i netočnih podataka o stanju i kretanju agenata. Iznesene su prednosti i nedostaci primjene ove metode u praksi.
agent; pojačano učenje; q-učenje; učenje iz nagrade i kazne
nije evidentirano
engleski
A Q-learning by n-th step state and multi-agent negotiation
nije evidentirano
agent; reinforcement learning; q-learning; learning from reward and punishment
nije evidentirano
Podaci o izdanju
90
03.11.2010.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Osijek