Pregled bibliografske jedinice broj: 1237801
Združeno prognoziranje značajki i njihova pomaka za predviđanje semantičke budućnosti u videu
Združeno prognoziranje značajki i njihova pomaka za predviđanje semantičke budućnosti u videu, 2022., doktorska disertacija, Zagreb
CROSBI ID: 1237801 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Združeno prognoziranje značajki i njihova pomaka za predviđanje semantičke budućnosti u videu
(Joint Forecasting of Features and Feature Motion for Semantic Future Prediction in Video)
Autori
Josip Šarić
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, doktorska disertacija
Mjesto
Zagreb
Datum
14.07
Godina
2022
Stranica
86
Mentor
Siniša Šegvić
Ključne riječi
računalni vid, duboko učenje, gusto semantičko prognoziranje, predvid̄anje budućnosti
(computer vision, deep learning, dense semantic forecasting, future prediction)
Sažetak
Gusto semantičko prognoziranje anticipira događaje u videu predviđanjem semantike na razini piksela u budućem neopaženom slikovnom okviru. Ova disertacija posebnu pažnju posvećuje metodama gustog prognoziranja na razini apstraktnih značajki dubokog modela. Predložena prognostička metoda može se primijeniti na različite oblike gustog raspoznavanja u jednoj slici. Metoda prognozira značajke uz pomoć dva komplementarna modula. Modul F2M (eng. features-to-motion}; prognozira gusto polje pomaka koji pomiču značajke iz prošlosti prema njihovim budućim položajima. Modul F2F (eng. features-to-features) izravno regresira buduće značajke i zbog toga ima mogućnost zamišljanja novootkrivenih dijelova scene. Združeni model F2MF kombinira prognoze dvaju modula u skladu s predviđenim poljem težina. Posljedično, model ima mogućnost prepoznavanja novootkrivenih dijelova scene jer u njima težine preferiraju izravno prognoziranje modulom F2F. Prognoziranje defomiranjem dominantno je u dijelovima scene gdje se lako može uspostaviti korespondencija. Predložena metoda je učinkovita jer prognozira najsažetiju i najapstraktniju moguću reprezentaciju modela za gusto raspoznavanje. Prognostičku točnost modela poboljšavaju izvedbeni detalji kao što su deformabilne konvolucije i reprezentacija obogaćena prostorno-vremenskim korelacijskim koeficijentima. Eksperimentalno vrednovanje razmatra prognoziranje semantičke segmentacije, segmentacije instanci i panoptičke segmentacije. Rezultati su pokazali da predložena metoda ostvaruje kompetitivnu točnost na podatkovnom skupu Cityscapes.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
--IP-2020-02-5851 - Napredna gusta predikcija za računalni vid (ADEPT) (Šegvić, Siniša) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb