Išmanių ir klimatui neutralių kompetencijų centras
Išmanių ir klimatui neutralių kompetencijų centro naujienos
Nauja daktaro disertacija
2023-06-12
Nauja daktaro disertacija
VILNIUS TECH didžiuojasi savo doktorantų disertacijomis, todėl VILNIUS TECH Biblioteka kviečia sekti skelbiamas naujas apgintas disertacijas. Šiandien pristatoma disertacija anglų kalba, tema „Improving image captioning methods using machine learning approaches“, kurią parengė VILNIUS TECH doktorantas Viktar Atliha. Disertacija rengta 2018–2023 metais, vadovas – prof. dr. Dmitrij Šešok.
Disertacijos tema lietuvių kalba: „Vaizdų antraščių generavimo metodų tobulinimas mašininio mokymosi metodais“.
Disertacija ginama viešame Informatikos inžinerijos mokslo krypties disertacijos gynimo tarybos posėdyje 2023 m. birželio 12 d. 14 val. Vilniaus Gedimino technikos universiteto senato posedžių salėje.
Pastaruoju metu kompiuterinio regėjimo ir natūralios kalbos apdorojimo sritys sulaukia vis daugiau mokslininkų ir pramones dėmesio. Pirmos srities metodų grupė leidžia išspręsti daugybę užduočių, susijusių su vaizdų apdorojimu, pavyzdžiui, vaizdų klasifikavimą, vaizdų aptikimą ir kt., antros srities metodai apdoroja tekstą, įskaitant teksto klasifikavimo ar vertimo užduotis. Tačiau yra ir uždavinių, esančių šių dviejų sričių sankirtoje. Vienas iš tokių uždavinių yra vaizdų antraščių generavimas. Vaizdų antraščių generavimo sistemos tikslas automatiškai sugeneruoti panašų žmogaus sudarytą tekstinį pateikto vaizdo aprašymą. Tokios sistemos galėtų būti naudojamos sklandesnei žmogaus ir kompiuterio sąveikai, informacijos paieškai arba, kas dar svarbiau, padėti silpnaregiams. Kad šiose sistemose naudojami algoritmai būtų sėkmingi, jie turi sunaudoti mažai išteklių (ypač, turėti mažai atminties) ir būti kokybiški. Kadangi vaizdų antraščių generavimo užduotis yra kelių sričių sankirtoje, o moderniausi modeliai, skirti tiek kompiuterinio regėjimo, tiek natūralios kalbos apdorojimo užduotims, naudoja giliojo mokymosi modelius, tokius metodus reikia naudoti ir vaizdų antraštėms generuoti. Tačiau dauguma gerai žinomų vaizdų antraščių generavimo modelių tobulinimo būdų yra labiau orientuoti į kokybės gerinimą, ˙neatsižvelgiant į jokius papildomus reikalingus išteklius. Taigi geriausi modeliai šiuo metu yra labai dideli ir netinkami naudoti mobiliuosiuose ir kituose ribotos atminties įrenginiuose, kur galėtų duoti didžiausią praktinę naudą.
Mokslo darbą galite rasti VILNIUS TECH Virtualiojoje bibliotekoje.
Disertacijos tema lietuvių kalba: „Vaizdų antraščių generavimo metodų tobulinimas mašininio mokymosi metodais“.
Disertacija ginama viešame Informatikos inžinerijos mokslo krypties disertacijos gynimo tarybos posėdyje 2023 m. birželio 12 d. 14 val. Vilniaus Gedimino technikos universiteto senato posedžių salėje.
Pastaruoju metu kompiuterinio regėjimo ir natūralios kalbos apdorojimo sritys sulaukia vis daugiau mokslininkų ir pramones dėmesio. Pirmos srities metodų grupė leidžia išspręsti daugybę užduočių, susijusių su vaizdų apdorojimu, pavyzdžiui, vaizdų klasifikavimą, vaizdų aptikimą ir kt., antros srities metodai apdoroja tekstą, įskaitant teksto klasifikavimo ar vertimo užduotis. Tačiau yra ir uždavinių, esančių šių dviejų sričių sankirtoje. Vienas iš tokių uždavinių yra vaizdų antraščių generavimas. Vaizdų antraščių generavimo sistemos tikslas automatiškai sugeneruoti panašų žmogaus sudarytą tekstinį pateikto vaizdo aprašymą. Tokios sistemos galėtų būti naudojamos sklandesnei žmogaus ir kompiuterio sąveikai, informacijos paieškai arba, kas dar svarbiau, padėti silpnaregiams. Kad šiose sistemose naudojami algoritmai būtų sėkmingi, jie turi sunaudoti mažai išteklių (ypač, turėti mažai atminties) ir būti kokybiški. Kadangi vaizdų antraščių generavimo užduotis yra kelių sričių sankirtoje, o moderniausi modeliai, skirti tiek kompiuterinio regėjimo, tiek natūralios kalbos apdorojimo užduotims, naudoja giliojo mokymosi modelius, tokius metodus reikia naudoti ir vaizdų antraštėms generuoti. Tačiau dauguma gerai žinomų vaizdų antraščių generavimo modelių tobulinimo būdų yra labiau orientuoti į kokybės gerinimą, ˙neatsižvelgiant į jokius papildomus reikalingus išteklius. Taigi geriausi modeliai šiuo metu yra labai dideli ir netinkami naudoti mobiliuosiuose ir kituose ribotos atminties įrenginiuose, kur galėtų duoti didžiausią praktinę naudą.
Mokslo darbą galite rasti VILNIUS TECH Virtualiojoje bibliotekoje.