Razvoj agenta korištenjem potpomognutog učenja u parcijalno primjetljivom okruženju

Torić, Laura

izvor podataka: crosbi !

Razvoj agenta korištenjem potpomognutog učenja u parcijalno primjetljivom okruženju (CROSBI ID 439617)

Ocjenski rad | sveučilišni preddiplomski završni rad

Torić, Laura Razvoj agenta korištenjem potpomognutog učenja u parcijalno primjetljivom okruženju / Jakobović, Domagoj (mentor); Zagreb, Fakultet elektrotehnike i računarstva, . 2020

Podaci o odgovornosti

Autori

Torić, Laura

Mentori

Jakobović, Domagoj

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

hrvatski

Naslov

Razvoj agenta korištenjem potpomognutog učenja u parcijalno primjetljivom okruženju

Sažetak

Svrha ovog projekta bila je riješiti problem učenja u složenom djelomično promatranom okruženju pomoću potpomognutog učenja. Igra za više igrača pod nazivom DotA 2 izabrana je kao okolina jer je i izazovna i vizualno ugodna. Agent je komunicirao s igrom putem dobivenog poslužitelja i dodatka za igru (engl. Steam Add-on) (zvanog Breezy), koji je na kraju i sam bio izazov. Krajnji rezultati pokazali su se razocaravajuće lošima. Prvotna ideja je bila spajanje Duboke Q-Mreže (engl. Deep Q-Network) s genetskim algoritmom, ali kasnijim je istraživanjem je odabrana metoda Hijerarhijske Duboke Q-Mreže (engl. Hierarchical Deep Q-Network) kao strategija koja obećava. Nažalost, zbog nedostatka resursa (dostupno samo jedno računalo), nedosljedne mrežne veze i velikog trajanja epizoda, izvelo se samo 250 epizoda za hDQN, što nije bilo dovoljno za postizanje željene konvergencije performansi. Unatoč nedostatku prihvatljivih rezultata, ovaj je projekt pokazao stvarnu važnost modeliranja ispravnih stanja i nagrade, kao i razlike između različitih strategija Q-učenja.

Ključne riječi

Potpomognuto učenje ; Duboke Q-Mreže ; Hijerarhijske Duboke Q-Mreže ; DotA 2

Napomena

nije evidentirano

Jezik

engleski

Naslov

An attempt of reinforcement learning in a partially observable environment

Sažetak

nije evidentirano

Ključne riječi

Reinforcement Learning ; Deep Q-Network (DQN) ; Hierarchical Deep QNetwork (h-DQN) ; DotA 2

Napomena

nije evidentirano

Podaci o izdanju

Broj stranica

Datum obrane

01.07.2020.

Status objave rada

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Ustanova / Organizacija

Fakultet elektrotehnike i računarstva

Mjesto

Zagreb

Povezanost rada

Povezane osobe

Domagoj Jakobović (mentor/i)

Povezane ustanove

Fakultet elektrotehnike i računarstva (036) (autorova ustanova)

Područje

Računarstvo