Pregled bibliografske jedinice broj: 539955
Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata
Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata, 2010., doktorska disertacija, Elektrotehnički fakultet, Osijek
CROSBI ID: 539955 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata
(A Q-learning by n-th step state and multi-agent negotiation)
Autori
Job, Josip
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija
Fakultet
Elektrotehnički fakultet
Mjesto
Osijek
Datum
03.11
Godina
2010
Stranica
90
Mentor
Jović, Franjo
Ključne riječi
agent; pojačano učenje; q-učenje; učenje iz nagrade i kazne
(agent; reinforcement learning; q-learning; learning from reward and punishment)
Sažetak
U radu je opisana standardna metoda Q-učenja pojačavanjem. Predložena je nova metoda učenja zasnovana na odlučivanju prema nagradi u n-tom budućem koraku i dogovoru između k-agenata. Za obje metode napravljeno je simulacijsko okruženje u programskom paketu Matlab. Osmišljeni su i izvedeni testovi učenja u različitim scenarijima koji se sastoje od okoline s konačnim brojem stanja te agenata koji se kreću u okolini. Promatran je broj epizoda potrebnih za učenje pronalaženja odredišta te uspješnost izbjegavanja sudara agenata. Dobiveni rezultati obaju metoda grafički su prikazani te uspoređeni. Analizirana je robusnost postupka učenja na utjecaj smetnji zbog nepotpunih i netočnih podataka o stanju i kretanju agenata. Iznesene su prednosti i nedostaci primjene ove metode u praksi.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
165-1652017-2016 - Holografski logički analizator (Slavek, Ninoslav, MZO ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek