Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi

Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata (CROSBI ID 367599)

Ocjenski rad | doktorska disertacija

Job, Josip Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata / Jović, Franjo (mentor); Osijek, . 2010

Podaci o odgovornosti

Job, Josip

Jović, Franjo

hrvatski

Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata

U radu je opisana standardna metoda Q-učenja pojačavanjem. Predložena je nova metoda učenja zasnovana na odlučivanju prema nagradi u n-tom budućem koraku i dogovoru između k-agenata. Za obje metode napravljeno je simulacijsko okruženje u programskom paketu Matlab. Osmišljeni su i izvedeni testovi učenja u različitim scenarijima koji se sastoje od okoline s konačnim brojem stanja te agenata koji se kreću u okolini. Promatran je broj epizoda potrebnih za učenje pronalaženja odredišta te uspješnost izbjegavanja sudara agenata. Dobiveni rezultati obaju metoda grafički su prikazani te uspoređeni. Analizirana je robusnost postupka učenja na utjecaj smetnji zbog nepotpunih i netočnih podataka o stanju i kretanju agenata. Iznesene su prednosti i nedostaci primjene ove metode u praksi.

agent; pojačano učenje; q-učenje; učenje iz nagrade i kazne

nije evidentirano

engleski

A Q-learning by n-th step state and multi-agent negotiation

nije evidentirano

agent; reinforcement learning; q-learning; learning from reward and punishment

nije evidentirano

Podaci o izdanju

90

03.11.2010.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Osijek

Povezanost rada

Računarstvo