Pregled bibliografske jedinice broj: 904185
Lokalizacija objekata odozdo prema gore primjenom Fisherovih vektora
Lokalizacija objekata odozdo prema gore primjenom Fisherovih vektora, 2017., doktorska disertacija, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 904185 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Lokalizacija objekata odozdo prema gore primjenom Fisherovih vektora
(Bottom-up object localization with Fisher vectors)
Autori
Zadrija, Valentina
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
13.07
Godina
2017
Stranica
134
Mentor
Šegvić, Siniša
Ključne riječi
lokalizacija objekata ; Fisherovi vektori ; slabo nadzirano učenje, rijetki modeli, model prostornog rasporeda ; računalni vid ; strojno učenje
(object localization ; Fisher vectors ; weakly supervised learning ; sparse localization models ; spatial layout representations ; computer vision ; machine learning)
Sažetak
U okviru ove disertacije razmatraju se problemi klasifikacije slika i lokalizacije objekata u složenim scenama. Posebna je pažnja usmjerena učenju lokalizacijskih modela uz slabi nadzor budući da se na taj način zaobilazi vremenski zahtjevan proces označavanja lokacija objekata u slikama za učenje. U fazi učenja, dostupne su isključivo oznake prisutnosti objekta u slici, dok se u fazi testiranja zahtjeva predikcija lokacija objekata u vidu opisanih poligona kao i u slučaju učenja pod strogim nadzorom. Predstavljen je pristup za lokalizaciju objekata temeljen na reprezentaciji Fisherovim vektorima i slabo nadziranom učenju rijetkih lokalizacijskih modela. Predstavljanje slike i slikovnih okana Fisherovim vektorima omogućava primjenu lokalizacijskog modela učenog nad opisnicima cjelokupnih slika za proračun odziva slikovnih okana. Pomoću lokalizacijskih modela rijetkih po komponentama umanjuje se utjecaj prenaučenosti i omogućava učinkovit proračun odziva slikovnog okna. Za poboljšanje lokalizacijske točnosti predložena je primjena metričke normalizacije po komponentama Fisherovog vektora slike. Kako bi se omogućila vremenski efikasna primjena normalizacija u fazi lokalizacije, doprinosa slikovnog okna odzivu normalizirane slike određuje se aproksimacijom prvog reda. Naposljetku, budući da Fisherovi vektori ne uzimaju u obzir prostorne odnose okana u slici, predložene su reprezentacije lokalnog prostornog rasporeda slikovnih riječi u vidu prostornih Fisherovih vektora i prostornih histograma. Razvijeni su algoritmi kojima se na temelju slikovnih okana pozitivnog odziva generiraju predikcije lokacija objekata u vidu opisanih poligona. Provedeno je iscrpno eksperimentalno vrednovanje opisanog pristupa na problemima lokalizacije prometnih znakova i pješačkih prijelaza u složenim prometnim scenama. Pokazano je da se opisani pristup lokalizaciji može primijeniti za potrebe automatizacije digitalnog kartiranja. Za lokalizaciju pješačkih prijelaza, predstavljen je nov skup podataka dobiven polu-automatski na temelju dobrovoljno prikupljenih geopodataka iz OpenStreetMap karte i georeferenciranog videa. Eksperimentalni rezultati pokazuju da predloženi lokalizacijski i reprezentacijski modeli postižu iznimno dobre rezultate unatoč različitim obilježjima traženih objekata i učenju uz slabi nadzor.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo