Problem višerukog razbojnika kod razvoja modela podržanog učenja (CROSBI ID 459499)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Čaprić, Dolores
Stipančić, Tomislav
hrvatski
Problem višerukog razbojnika kod razvoja modela podržanog učenja
Tema ovog rada je razvoj algoritama koji pomoću metode istraživanja i iskorištavanja rješavaju problem višerukog razbojnika. To je problem u okviru strojnog učenja u kojem agent odabire radnje kako bi maksimalno povećao dobivenu nagradu. Ideja algoritama je implementirana u programski jezik Python, dok su rezultati prikazani u web aplikaciji Jupyter Notebook. Prikaz rezultata sadrži numerički i grafički dio. U prvom dijelu rada razrađena je teorijska i matematička osnova koja omogućava razumijevanje i primjenu algoritama. U drugom dijelu je za svaki algoritam detaljno objašnjen princip te implementacija u Python-u. Također su dani dobiveni rezultati koji prikazuju razinu uspješnost svakog algoritma
višeruki razbojnik ; Python ; Jupyter Notebook ; istraživanje ; iskorištavanje
nije evidentirano
engleski
Multi-armed bandit problem in the development of reinforcement learning
nije evidentirano
multi-armed bandit ; Python ; Jupyter Notebook ; exploitation ; exploration
nije evidentirano
Podaci o izdanju
41
02.03.2023.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet strojarstva i brodogradnje
Zagreb