Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 539955

Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata


Job, Josip
Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata, 2010., doktorska disertacija, Elektrotehnički fakultet, Osijek


CROSBI ID: 539955 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata
(A Q-learning by n-th step state and multi-agent negotiation)

Autori
Job, Josip

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija

Fakultet
Elektrotehnički fakultet

Mjesto
Osijek

Datum
03.11

Godina
2010

Stranica
90

Mentor
Jović, Franjo

Ključne riječi
agent; pojačano učenje; q-učenje; učenje iz nagrade i kazne
(agent; reinforcement learning; q-learning; learning from reward and punishment)

Sažetak
U radu je opisana standardna metoda Q-učenja pojačavanjem. Predložena je nova metoda učenja zasnovana na odlučivanju prema nagradi u n-tom budućem koraku i dogovoru između k-agenata. Za obje metode napravljeno je simulacijsko okruženje u programskom paketu Matlab. Osmišljeni su i izvedeni testovi učenja u različitim scenarijima koji se sastoje od okoline s konačnim brojem stanja te agenata koji se kreću u okolini. Promatran je broj epizoda potrebnih za učenje pronalaženja odredišta te uspješnost izbjegavanja sudara agenata. Dobiveni rezultati obaju metoda grafički su prikazani te uspoređeni. Analizirana je robusnost postupka učenja na utjecaj smetnji zbog nepotpunih i netočnih podataka o stanju i kretanju agenata. Iznesene su prednosti i nedostaci primjene ove metode u praksi.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo



POVEZANOST RADA


Projekti:
165-1652017-2016 - Holografski logički analizator (Slavek, Ninoslav, MZO ) ( CroRIS)

Ustanove:
Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek

Profili:

Avatar Url Josip Job (autor)

Avatar Url Franjo Jović (mentor)


Citiraj ovu publikaciju:

Job, Josip
Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata, 2010., doktorska disertacija, Elektrotehnički fakultet, Osijek
Job, J. (2010) 'Q-učenje prema stanju n-tog koraka i dogovaranjem više agenata', doktorska disertacija, Elektrotehnički fakultet, Osijek.
@phdthesis{phdthesis, author = {Job, Josip}, year = {2010}, pages = {90}, keywords = {agent, poja\v{c}ano u\v{c}enje, q-u\v{c}enje, u\v{c}enje iz nagrade i kazne}, title = {Q-u\v{c}enje prema stanju n-tog koraka i dogovaranjem vi\v{s}e agenata}, keyword = {agent, poja\v{c}ano u\v{c}enje, q-u\v{c}enje, u\v{c}enje iz nagrade i kazne}, publisherplace = {Osijek} }
@phdthesis{phdthesis, author = {Job, Josip}, year = {2010}, pages = {90}, keywords = {agent, reinforcement learning, q-learning, learning from reward and punishment}, title = {A Q-learning by n-th step state and multi-agent negotiation}, keyword = {agent, reinforcement learning, q-learning, learning from reward and punishment}, publisherplace = {Osijek} }




Contrast
Increase Font
Decrease Font
Dyslexic Font