Pregled bibliografske jedinice broj: 1262112
Problem višerukog razbojnika kod razvoja modela podržanog učenja
Problem višerukog razbojnika kod razvoja modela podržanog učenja, 2023., diplomski rad, preddiplomski, Fakultet strojarstva i brodogradnje, Zagreb
CROSBI ID: 1262112 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Problem višerukog razbojnika kod razvoja modela podržanog učenja
(Multi-armed bandit problem in the development of reinforcement
learning)
Autori
Čaprić, Dolores
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet strojarstva i brodogradnje
Mjesto
Zagreb
Datum
02.03
Godina
2023
Stranica
41
Mentor
Stipančić, Tomislav
Ključne riječi
višeruki razbojnik ; Python ; Jupyter Notebook ; istraživanje ; iskorištavanje
(multi-armed bandit ; Python ; Jupyter Notebook ; exploitation ; exploration)
Sažetak
Tema ovog rada je razvoj algoritama koji pomoću metode istraživanja i iskorištavanja rješavaju problem višerukog razbojnika. To je problem u okviru strojnog učenja u kojem agent odabire radnje kako bi maksimalno povećao dobivenu nagradu. Ideja algoritama je implementirana u programski jezik Python, dok su rezultati prikazani u web aplikaciji Jupyter Notebook. Prikaz rezultata sadrži numerički i grafički dio. U prvom dijelu rada razrađena je teorijska i matematička osnova koja omogućava razumijevanje i primjenu algoritama. U drugom dijelu je za svaki algoritam detaljno objašnjen princip te implementacija u Python-u. Također su dani dobiveni rezultati koji prikazuju razinu uspješnost svakog algoritma
Izvorni jezik
Hrvatski
Znanstvena područja
Strojarstvo
POVEZANOST RADA
Ustanove:
Fakultet strojarstva i brodogradnje, Zagreb
Profili:
Tomislav Stipančić
(mentor)