Išmanių ir klimatui neutralių kompetencijų centras
Išmanių ir klimatui neutralių kompetencijų centro naujienos
Nauja daktaro disertacija
.png)
2024-06-12
Nauja daktaro disertacija
VILNIUS TECH didžiuojasi savo doktorantų disertacijomis, todėl VILNIUS TECH Biblioteka kviečia sekti skelbiamas naujas apgintas disertacijas. Šiandien pristatoma disertacija anglų kalba, tema „Internet Web Page Content Block Dataset and Solutions for its Data Labelling Simplification“, kurią parengė doktorantas Kiril Griazev. Disertacija rengta 2017–2024 metais Vilniaus Gedimino technikos universitete, vadovė – prof. dr. Simona Ramanauskaitė.
Disertacijos tema lietuvių kalba: „Interneto tinklalapių turinio blokų duomenų rinkinys ir jo duomenų žymėjimą supaprastinantys sprendimai“.
Disertacija ginama viešame Informatikos inžinerijos mokslo krypties disertacijos gynimo tarybos posėdyje 2024 m. birželio 12 d. 14 val. Vilniaus Gedimino technikos universiteto SRA-I posėdžių salėje.
Disertacijoje nagrinėjami interneto svetainių turinio blokų identifikavimo, išgavimo ir dokumentavimo iššūkiai. Internetinių tinklalapių turinio blokai, jų išskyrimo, susiejimo ir dokumentavimo duomenų rinkinyje metodai. Pagrindinis tikslas yra atlikti išsamų duomenų rinkinių, kuriuose yra svetainių turinio blokai, analizę, siekiant padidinti jų detalumą ir sumažinti blokų, kuriems reikalingas rankinis žymėjimas, kiekį. Disertacijoje nagrinėjama keletas svarbių užduočių: 1) sisteminė naujausių tyrimų interneto svetainių duomenų išgavimo srityje analizė; 2) struktūrizuoto svetainėms skirto duomenų rinkinio, kuriam būdingos įvairios turinio blokų savybės ir suderinimas su įvairiais duomenų išgavimo metodais, sukūrimas; 3) iš dalies automatizuoto turinio blokų žymėjimo svetainėse sprendimo, kuris nustato ryšius tarp turinio blokų ir juos grupuoja, taip mažindamas rankinio peržiūrėjimo poreikį, sukūrimas; 4) sukurto duomenų rinkinio ir žymėjimo sprendimo efektyvumo vertinimas, identifikuojant, grupuojant ir nustatant ryšius tarp svetainės turinio blokų. Disertacija susideda iš keturių dalių: įvado, keturių skyrių, išvadų, šaltinių ir priedų. Įvade pristatoma tyrimo problema, jo svarba, tikslai, metodika, naujumas, praktinė nauda, ginamos tezės, autoriaus konferencijų pranešimai ir apžvelgiama disertacijos struktūra. Pirmajame skyriuje nagrinėjamas interneto duomenų gavybos (angl. Web Mining) klausimas, išryškinami duomenų išgavimo ir klasifikavimo technikų iššūkiai bei evoliucija. Antrajame skyriuje tyrinėjami HTML blokų panašumo nustatymo metodai, atsižvelgiant į duomenis ir struktūrą. Trečiajame skyriuje išsamiai aprašomas duomenų rinkinio sukūrimas, pritaikytas duomenų išgavimui, išryškinant įvairių blokų tipų, savybių ir struktūrų informacijos įvairovę. Ketvirtajame skyriuje pristatomi pažangūs metodai HTML turinio blokams identifikuoti ir turinio išgavimo tikslumui bei efektyvumui didinti. Publikuoti straipsniai disertacijos tema: du pagrindinio Clarivate Analytics Web of Science sąrašo leidiniuose ir du mokslinių konferencijų leidiniuose. Tyrimo rezultatai buvo pristatyti trijose tarptautinėse konferencijose: 6th workshop on Advances in Information, Electronic and Electrical Engineering (AIEEE), 2018 m., Vilnius, Lietuva; Open Conference of Electrical, Electronic and Information Sciences (eStream), 2018 m., Vilnius, Lietuva; International Conference on Science & Technology, STRA, 2023 m., Praha, Čekija.
Mokslo darbą galite rasti VILNIUS TECH Virtualiojoje bibliotekoje.
Disertacijos tema lietuvių kalba: „Interneto tinklalapių turinio blokų duomenų rinkinys ir jo duomenų žymėjimą supaprastinantys sprendimai“.
Disertacija ginama viešame Informatikos inžinerijos mokslo krypties disertacijos gynimo tarybos posėdyje 2024 m. birželio 12 d. 14 val. Vilniaus Gedimino technikos universiteto SRA-I posėdžių salėje.
Disertacijoje nagrinėjami interneto svetainių turinio blokų identifikavimo, išgavimo ir dokumentavimo iššūkiai. Internetinių tinklalapių turinio blokai, jų išskyrimo, susiejimo ir dokumentavimo duomenų rinkinyje metodai. Pagrindinis tikslas yra atlikti išsamų duomenų rinkinių, kuriuose yra svetainių turinio blokai, analizę, siekiant padidinti jų detalumą ir sumažinti blokų, kuriems reikalingas rankinis žymėjimas, kiekį. Disertacijoje nagrinėjama keletas svarbių užduočių: 1) sisteminė naujausių tyrimų interneto svetainių duomenų išgavimo srityje analizė; 2) struktūrizuoto svetainėms skirto duomenų rinkinio, kuriam būdingos įvairios turinio blokų savybės ir suderinimas su įvairiais duomenų išgavimo metodais, sukūrimas; 3) iš dalies automatizuoto turinio blokų žymėjimo svetainėse sprendimo, kuris nustato ryšius tarp turinio blokų ir juos grupuoja, taip mažindamas rankinio peržiūrėjimo poreikį, sukūrimas; 4) sukurto duomenų rinkinio ir žymėjimo sprendimo efektyvumo vertinimas, identifikuojant, grupuojant ir nustatant ryšius tarp svetainės turinio blokų. Disertacija susideda iš keturių dalių: įvado, keturių skyrių, išvadų, šaltinių ir priedų. Įvade pristatoma tyrimo problema, jo svarba, tikslai, metodika, naujumas, praktinė nauda, ginamos tezės, autoriaus konferencijų pranešimai ir apžvelgiama disertacijos struktūra. Pirmajame skyriuje nagrinėjamas interneto duomenų gavybos (angl. Web Mining) klausimas, išryškinami duomenų išgavimo ir klasifikavimo technikų iššūkiai bei evoliucija. Antrajame skyriuje tyrinėjami HTML blokų panašumo nustatymo metodai, atsižvelgiant į duomenis ir struktūrą. Trečiajame skyriuje išsamiai aprašomas duomenų rinkinio sukūrimas, pritaikytas duomenų išgavimui, išryškinant įvairių blokų tipų, savybių ir struktūrų informacijos įvairovę. Ketvirtajame skyriuje pristatomi pažangūs metodai HTML turinio blokams identifikuoti ir turinio išgavimo tikslumui bei efektyvumui didinti. Publikuoti straipsniai disertacijos tema: du pagrindinio Clarivate Analytics Web of Science sąrašo leidiniuose ir du mokslinių konferencijų leidiniuose. Tyrimo rezultatai buvo pristatyti trijose tarptautinėse konferencijose: 6th workshop on Advances in Information, Electronic and Electrical Engineering (AIEEE), 2018 m., Vilnius, Lietuva; Open Conference of Electrical, Electronic and Information Sciences (eStream), 2018 m., Vilnius, Lietuva; International Conference on Science & Technology, STRA, 2023 m., Praha, Čekija.
Mokslo darbą galite rasti VILNIUS TECH Virtualiojoje bibliotekoje.