- Faculty of Fundamental Sciences
- Faculty Departments
- Department of Mathematical Statistics
Department of Mathematical Statistics
The Department prepares Bachelor’s and Master’s specialists in data analysis, data science, and statistics who are able to apply statistical methods in various fields of research and practice. It conducts theoretical research on limit theorems in probability theory, as well as applied statistical research ranging from technological processes to economics and genetics.
About the Department
Partners
Department of Mathematical Statistics maintains active cooperation with social and business partners.
Show more
Department Staff
The staff of the Department of Mathematical Statistics are highly qualified specialists in mathematics, statistics, and data analysis. They conduct research and deliver study courses to students.
Administration
- Administration
- Research Staff
-
Assoc Prof. Dr. Rūta SimanavičienėHead
-
Edita DombrovskienėAdministrator
Show more
Thesis abstracts
Years
Qualification
Clear selections
Dominyka Gruodytė
— Assoc Prof Dr Nomeda Bratčikovienė
Health data research
The aim of this bachelor's thesis is to develop and compare convolutional neural networks and decision tree models for classifying images of skin diseases. The study analyzes data...
Health data research
Student:
Dominyka Gruodytė
Supervisor:
Assoc Prof Dr Nomeda Bratčikovienė
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Baigiamojo bakalauro darbo tikslas – sukurti ir palyginti konvoliucinį neuroninį tinklą bei sprendimų medžio modelius, skirtus odos ligų vaizdų klasifikavimui. Darbe analizuojami duomenys, gauti iš ISIC duomenų rinkinio, apimančio 2357 įvairių odos darinių nuotraukas. Modeliams kurti naudoti konvoliuciniai neuroniniai tinklai (CNN), taikant EfficientNetB0 architektūrą, bei sprendimų medžio metodai. Modelių efektyvumas įvertintas pagal klasifikavimo tikslumą ir klaidų matricas. Eksperimento metu taip pat buvo naudota klasės svorio kompensacija bei taikytas „early stopping“. Rezultatai parodė, kad CNN modelis pasiekė aukštesnį tikslumą nei sprendimų medis, ypač dirbant su sudėtingesniais atvejais. Pabaigoje pateiktos rekomendacijos modelių tobulinimui bei jų taikymo galimybės praktikoje.
Darbą sudaro šios dalys: įvadas, literatūros apžvalga, teorinė-metodinė dalis, praktinė dalis, išvados, literatūros sąrašas, priedai.
Darbo apimtis: 34 p. be priedų, 11 iliustracijų, 2 lentelės, 20 šaltinių.
Thesis abstract (EN)
The aim of this bachelor's thesis is to develop and compare convolutional neural networks and decision tree models for classifying images of skin diseases. The study analyzes data obtained from a dataset containing 2,357 images of various skin lesions. To build the models, convolutional neural networks (CNN) with the EfficientNetB0 architecture and decision tree methods were used. The performance of the models was evaluated based on classification accuracy and confusion matrices. During the experiment, class weight balancing and early stopping techniques were also applied. The results showed that the CNN model achieved higher accuracy than the decision tree, especially in more complex cases. Finally, recommendations for model improvement and practical application possibilities are presented.
The thesis consists of the following parts: introduction, literature review, theoretical-methodological part, practical part, conclusions, list of references, and appendices.
Thesis length: 34 pages without appendices, 11 figures, 2 tables, 20 sources.
Elena Strelčiūnaitė
— Dr Vilma Nekrašaitė-Liegė
Anglų kalba: The Impact of Nonresponse on Population Parameter Estimation in Asymmetric Data: A Comparison of Methods
The final bachelor’s thesis examines the impact of missing data on the estimation of population parameters in asymmetric data and compares different nonresponse evaluation methods. Based on the...
Anglų kalba: The Impact of Nonresponse on Population Parameter Estimation in Asymmetric Data: A Comparison of Methods
Student:
Elena Strelčiūnaitė
Supervisor:
Dr Vilma Nekrašaitė-Liegė
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Baigiamajame bakalauro darbe nagrinėjama trūkstamų duomenų įtaka populiacijos parametrų vertinimui asimetriniuose duomenyse ir lyginami neatsakymų vertinimo metodai. Remiantis teorine dalimi ir taikant simuliacijas, nagrinėti skirtingi neatsakymų tipai – klausimo ir elemento. Elemento neatsakymų vertinimui generuoti skirtingi trūkstamų duomenų lygiai ir taikyti persvėrimo metodai, tokie kaip visiškai atsitiktinio neatsakymo tikimybės, lygių neatsakymo tikimybių grupėse vertinimas bei atsitiktinių miškų metodas. Klausimo neatsakymai vertinti turint vieną neatsakymo lygį, tačiau du skirtingus neatsakymo generavimo mechanizmus ir pritaikyti duomenų įrašymo metodai, tokie kaip šiltųjų duomenų, artimiausių kaimynų ir tiesinės bei logistinės regresijos metodai. Geriausi metodai renkami atsižvelgiant į tikslumo matus, tokius kaip santykinis poslinkis, variacijos koeficientas ir santykinė vidutinė kvadratinė paklaida. Atlikus analizę, nustatyta, kad norint pasirinkti tinkamą neatsakymų vertinimo metodą, reikia teisingai nustatyti neatsakymų atsiradimo priežastį.
Darbą sudaro įvadas, mokslinių darbų apžvalga, teorinė – metodinė bei praktinė dalys, išvados ir literatūros sąrašas.
Darbo apimtis – 42 p. teksto be priedų, 15 iliustr., 11 lent., 12 bibliografinių šaltinių. Atskirai pridedami darbo priedai.
Thesis abstract (EN)
The final bachelor’s thesis examines the impact of missing data on the estimation of population parameters in asymmetric data and compares different nonresponse evaluation methods. Based on the theoretical part and using simulations, different types of nonresponse are analyzed -— item and unit. For unit nonresponse evaluation, various levels of missing data are generated and reweighting methods are applied, such as the probability of completely random nonresponse, evaluation of equal nonresponse probabilities within groups, and the random forest method. Item nonresponse is assessed at a single level of nonresponse, but using two different nonresponse generation mechanisms, and imputation methods such as hot deck, k-nearest neighbors, and linear and logistic regression are applied. The best-performing methods are selected based on accuracy metrics such as relative bias, coefficient of variation, and relative root mean square error. The analysis shows that in order to select an appropriate method for nonresponse evaluation, it is crucial to correctly identify the cause of nonresponse.
The thesis consists of an introduction, a review of scientific literature, theoretical–methodological and practical parts, conclusions, and a list of references.
The volume of the thesis is 42 pages of text excluding appendices, 15 figures, 11 tables, and 12 bibliographic sources. The appendices are provided separately.
Ema Atkočaitytė
— Assoc Prof Dr Nomeda Bratčikovienė
Modeling of Real Estate indicators
The master's thesis aimed to assess the determinants of real estate prices and to classify real estate properties. Such analysis is essential to improve decision-making by the participants...
Modeling of Real Estate indicators
Student:
Ema Atkočaitytė
Supervisor:
Assoc Prof Dr Nomeda Bratčikovienė
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Baigiamajame magistro darbe buvo siekiama įvertinti nekilnojamojo turto kainas lemiančius rodiklius bei suklasifikuoti rinkos objektus. Norint pagerinti viešojo, privataus bei individualaus sektorių dalyvių sprendimų priėmimus, tokia analizė yra ypač svarbi bei aktuali. Magistro darbas pradedamas literatūros apžvalga, kurioje nagrinėjamos panašios problemos įvairiose užsienio šalyse bei miestuose. Įvertinus literatūros apžvalgoje pristatytų mašininio mokymosi metodų rezultatus, šiame darbe nuspręsta tirti daugialypės tiesinės regresijos, atsitiktinių miškų bei „XGBoost“ metodų veikimą. Atlikus reikalingos metodologijos apžvalgą, palyginami skirtingais metodais gauti rezultatai. Modelių veikimą siekiama pagerinti naudojant atsitiktinę bei gardelės paiešką su k-perlenkimų kryžmine patikra geriausiems bei optimaliausiems hiperparametrams rasti. Įvertinus reikšmingiausiai nekilnojamojo turto kainas lemiančių rodiklių svarbą, atliekama duomenų rinkinio klasterizacija bei geriausio modelio veikimo patikra rastuose klasteriuose. Remiantis klasterizacijos metu gauta informacija, atliekamas nekilnojamojo turto objektų klasifikavimas atsitiktinių miškų metodu. Išnagrinėjus teorinius bei praktinius nekilnojamojo turto rodiklių modeliavimo aspektus, pateikiamos išvados bei rekomendacijos tolesniems tyrimams.
Darbą sudaro 7 dalys: įvadas, literatūros apžvalga, teorinė dalis, tiriamoji dalis, išvados, literatūros sąrašas bei priedai.
Darbo apimtis - 71 p. teksto be priedų, 26 iliustr., 25 lent., 36 bibliografiniai šaltiniai.
Thesis abstract (EN)
The master's thesis aimed to assess the determinants of real estate prices and to classify real estate properties. Such analysis is essential to improve decision-making by the participants of public and private sectors along with individual actors. The master's thesis starts with a literature review in which similar problems of foreign countries and cities are analyzed. After evaluating the results of the machine learning methods presented in the literature review, it was decided to investigate the performance of multiple linear regression, random forests and „XGBoost“. After reviewing the methodology, the results obtained using different methods are compared. An improvement in model performance is sought through random and grid search combined with k-fold cross-validation to identify optimal hyperparameters. After assessing the importance of the most significant indicators of property prices, the dataset is clustered and the performance of the best model is tested in the clusters found. Based on the information obtained from the clustering process, a random forest clasification of real estate objects is performed. After examining the theoretical and practical aspects of real estate indicator modeling, conclusions and recommendations for future research are provided.
The work consits of 7 parts: introduction, review of literature, theoretical part, review part, conclusions, bibliography and appendix.
Scope of work - 71 p. of text without appendices, 26 illustrations, 25 tables, 36 bibliographic sources.
Evelina Kačarovskaja
— Assoc Prof Dr Tomas Rekašius
Engine Emissions Prediction Using Regression Models
The transport sector is a major source of air pollution, with emissions from internal combustion engines—such as CO, CO₂, NOₓ, and particulate matter—posing significant risks to the environment...
Engine Emissions Prediction Using Regression Models
Student:
Evelina Kačarovskaja
Supervisor:
Assoc Prof Dr Tomas Rekašius
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Transporto sektorius yra reikšmingas oro taršos šaltinis, o vidaus degimo variklių išmetami teršalai daro didelį poveikį aplinkai ir žmonių sveikatai. Šiame darbe nagrinėjamas vibracijos ir slėgio signalų taikymas emisijų prognozavimui, sudarant regresinius modelius, paremtus statistinėmis transformacijomis, pagrindinių komponenčių analize (PCA) ir LASSO regresija. Analizuojant eksperimentinius duomenis, suformuoti modeliai azoto oksidų (NOₓ), anglies monoksido (CO) ir anglies dioksido (CO₂) emisijų prognozavimui. Tyrimo rezultatai parodė, kad skirtingoms emisijų rūšims geriausią prognozavimo tikslumą pasiekė skirtingi metodai: PCA pagrindu sudaryti modeliai buvo efektyviausi prognozuojant NOₓ emisijas, o LASSO regresija geriausiai pasiteisino prognozuojant CO₂ emisijas bei padėjo atrinkti reikšmingus kintamuosius. CO emisijų prognozavimo tikslumas išliko ribotas. Tyrimas patvirtino, kad vibracijos duomenys gali būti naudingi emisijų prognozėse.
Thesis abstract (EN)
The transport sector is a major source of air pollution, with emissions from internal combustion engines—such as CO, CO₂, NOₓ, and particulate matter—posing significant risks to the environment and public health. This study investigates the use of vibration and pressure signal data for emission prediction by developing regression models based on statistical transformations, Principal Component Analysis (PCA), and LASSO regression. Experimental data were used to construct models for predicting nitrogen oxides (NOₓ), carbon monoxide (CO), and carbon dioxide (CO₂) emissions. The results showed that different methods yielded the best accuracy for different pollutants: PCA-based models were most effective in predicting NOₓ emissions, while LASSO regression performed best for CO₂ prediction and facilitated significant variable selection. The accuracy of CO emission prediction remained limited. The study confirms that vibration data can be effectively used for emission forecasting.
Mantas Švenčiūnas
— Assoc Prof Dr Rūta Simanavičienė
Effectiveness of preventive programs for early diagnosis and treatment of oncological diseases
This bachelor’s thesis examines the effectiveness of oncological disease prevention programs implemented in Lithuania (breast, cervical, colorectal, and prostate cancer) in order to evaluate their impact on early...
Effectiveness of preventive programs for early diagnosis and treatment of oncological diseases
Student:
Mantas Švenčiūnas
Supervisor:
Assoc Prof Dr Rūta Simanavičienė
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Šiame baigiamajame darbe nagrinėjamas Lietuvoje vykdomų onkologinių ligų prevencinių programų (krūties, gimdos kaklelio, storosios žarnos ir prostatos vėžio) efektyvumas, siekiant įvertinti jų įtaką ankstyvos diagnostikos ir mirtingumo rodikliams 2013–2023 metų laikotarpiu. Tyrimo objektu pasirinktos keturios pagrindinės valstybės finansuojamos prevencinės programos, analizuoti jų aprėpties, paslaugų teikimo, ankstyvos diagnostikos bei mirtingumo pokyčių duomenys. Darbe taikyti aprašomosios statistikos, statistinių hipotezių tikrinimo (χ² ir Mann–Whitney testai) bei tiesinės regresijos metodai.
Tyrimo rezultatai parodė, kad visose programose atrankinės patikros (PRA) grupėje ankstyvų stadijų vėžys diagnozuojamas žymiai dažniau nei kitose grupėse, tačiau bendras programų aprėpties lygis Lietuvoje vis dar yra žemas ir nepasiekia Europos Komisijos rekomenduojamų rodiklių. Trendo analizė parodė, kad daugumos pagrindinių rodiklių pokyčiai per pastarąjį dešimtmetį buvo nereikšmingi, išskyrus pavienius atvejus.
Darbe pabrėžiama būtinybė didinti gyventojų įsitraukimą į prevencines programas, tobulinti informavimo kampanijas ir gerinti duomenų kokybę. Rezultatai rodo, kad siekiant efektyviai mažinti mirtingumą nuo onkologinių ligų Lietuvoje, būtinos nuoseklios, duomenimis pagrįstos sveikatos politikos priemonės bei platesnė gyventojų motyvacija dalyvauti patikros programose.
Darbo apimtis – 45 puslapiai, 14 lentelių, 10 paveikslėlių, 2 priedai.
Thesis abstract (EN)
This bachelor’s thesis examines the effectiveness of oncological disease prevention programs implemented in Lithuania (breast, cervical, colorectal, and prostate cancer) in order to evaluate their impact on early diagnosis and mortality indicators during the period 2013–2023. The object of the research is four main state-funded prevention programs. The study analyzes data on their coverage, service provision, early diagnosis, and changes in mortality rates. Descriptive statistics, statistical hypothesis testing (χ² and Mann–Whitney tests), and linear regression methods were applied in the analysis.
The results showed that, in all programs, early-stage cancer is diagnosed significantly more often in the screening (PRA) group than in other groups. However, the overall coverage level of prevention programs in Lithuania remains low and does not reach the targets recommended by the European Commission. Trend analysis revealed that changes in most key indicators over the past decade were insignificant, with only a few exceptions.
The thesis emphasizes the need to increase public participation in prevention programs, improve information campaigns, and enhance data quality. The results indicate that, in order to effectively reduce cancer mortality in Lithuania, consistent, data-driven health policy measures and broader motivation for population participation in screening programs are required.
Scope of the thesis: 45 pages, 14 tables, 10 figures, 2 appendices.
Rimgailė Balionytė
— Assoc Prof Dr Viktoras Chadyšas
Analysis of world university rankings
This bachelor's thesis analyzes global university rankings using data from the QS World University Rankings and applies statistical analysis alongside machine learning methods. The research aimed to predict...
Analysis of world university rankings
Student:
Rimgailė Balionytė
Supervisor:
Assoc Prof Dr Viktoras Chadyšas
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Šiame baigiamajame bakalauro darbe nagrinėjami pasaulio universitetų reitingai, remiantis
„QS World University Rankings“ duomenimis, pasitelkiant statistinės analizės ir mašininio
mokymosi metodus. Tyrimo metu siekta prognozuoti universitetų reitingo grupes pagal
pagrindinius veiklos rodiklius, pasitelkiant keturis skirtingus klasifikavimo modelius:
logistinę regresiją, sprendimų medžių bei atsitiktinių miškų metodą ir XGBoost algoritmą.
Taip pat, taikant K-vidurkių klasterizacijos metodą, universitetai buvo suskirstyti į grupes
pagal jų veiklos rodiklių profilius. Atlikus analizę paaiškėjo, kad didžiausią įtaką reitingų
pozicijai daro tokie veiksniai kaip akademinis vertinimas, darbdavių nuomonė bei mokslo
publikacijų cituojamumas. Darbe pateiktos rekomendacijos aukštosioms mokykloms bei
siūlomos galimos QS reitingų vertinimo sistemos tobulinimo kryptys, siūlant įtraukti
objektyvesnius kokybės ir socialinės įtraukties vertinimo kriterijus.
Darbą sudaro įvadas, literatūros analizė, teorinė-metodinė dalis, praktinė dalis, išvados,
rekomendacijos ir literatūros sąrašas.
Darbo apimtis – 28 p. teksto be priedų, 8 iliustr., 5 lent., 12 bibliografinių šaltinių. Atskirai
pridedami darbo priedai.
Thesis abstract (EN)
This bachelor's thesis analyzes global university rankings using data from the QS World
University Rankings and applies statistical analysis alongside machine learning methods.
The research aimed to predict universities' ranking groups based on key performance
indicators by employing four different classification models: logistic regression, decision
tree, random forest, and the XGBoost algorithm. Additionally, the K-means clustering
method was used to group universities according to their performance profiles. The
analysis revealed that the most influential factors affecting ranking positions are academic
reputation, employer assessment, and citation rates of scientific publications. The thesis
provides recommendations for higher education institutions and proposes possible
improvements to the QS ranking methodology, suggesting the inclusion of more objective
quality and social inclusion assessment criteria.
The thesis consists of an introduction, literature review, theoretical-methodological part,
practical analysis, conclusions, recommendations, and a bibliography.
Scope of the thesis – 28 pages of text excluding appendices, 8 figures, 5 tables, and 12
bibliographic sources. Appendices are provided separately.
Šarūnas Vanagas
— Assoc Prof Dr Jolita Norkūnienė
Intangible assets and their impact on the economic growth of the Baltic Sea region countries
This master's thesis examines the impact of intangible assets on economic growth in the countries of the Baltic Sea region. The relevance of this research stems from the...
Intangible assets and their impact on the economic growth of the Baltic Sea region countries
Student:
Šarūnas Vanagas
Supervisor:
Assoc Prof Dr Jolita Norkūnienė
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Magistro baigiamajame darbe nagrinėjama nematerialaus turto įtaka ekonomikos augimui Baltijos jūros regiono šalyse. Tyrimo aktualumą lemia augantis dėmesys nematomam, tačiau vertę kuriančiam turtui – nematerialiajam kapitalui, kuris tampa vis reikšmingesnis žinių ekonomikoje. Darbe siekiama įvertinti nematerialių investicijų, neįtraukiamų į šalių nacionalines sąskaitas, indėlį į ekonominę plėtrą. Jos apima organizacinį kapitalą, pramoninį dizainą, prekės ženklus ir finansinių produktų kūrimą. Nematerialaus turto komponentų sąveika su BVP augimo dinamika vertinama remiantis aštuonių regiono šalių 2010–2023 m. ketvirtiniais duomenimis, taikant paprastąją, daugialypę ir Ridge regresijos metodus. Duomenų klasterizacijai pasitelkiamas K-vidurkių metodas kartu su pagrindinių komponenčių analize. Tyrimo rezultatai atskleidžia reikšmingus skirtumus tarp šalių pagal nematerialaus turto investicijų poveikį ekonomikos augimui. Ridge regresijos metodo pritaikymas leido suvaldyti daugiakolinearumo problemą tarp kintamųjų, o klasterizacija – vizualizuoti šalis pagal jų nematerialių investicijų profilių panašumą. Darbo pabaigoje pateikiamos išvados ir rekomendacijos.
Darbą sudaro 6 dalys: įvadas, literatūros apžvalga, teorinė-metodinė dalis, praktinė dalis, išvados, literatūros sąrašas.
Darbo apimtis – 64 p. teksto be priedų, 13 iliustracijų, 15 lentelių, 59 literatūros šaltinių.
Atskirai pridedami darbo priedai.
Thesis abstract (EN)
This master's thesis examines the impact of intangible assets on economic growth in the countries of the Baltic Sea region. The relevance of this research stems from the heightened focus on intangible capital, a non-physical but value-generating resource that is gaining significance in the modern knowledge economy. The study aims to assess the contribution of intangible investments not included in national accounts to economic development. These include organizational capital, industrial design, brand equity, and the development of financial products. The interaction between components of intangible assets and GDP growth dynamics is evaluated using quarterly data from eight countries in the region for the period 2010–2023, applying simple, multiple, and Ridge regression methods. For data clustering, the K-means method is applied in combination with principal component analysis. The results reveal significant differences between countries in terms of the impact of intangible investments on economic growth. Ridge regression was applied to control for multicollinearity between variables, while clustering allowed for the visualization of countries based on the similarity of their intangible investment profiles. The thesis concludes with key findings and policy recommendations.
The thesis consists of six parts: introduction, literature review, theoretical-methodological section, empirical section, conclusions, and references.
The total length of the thesis is 64 pages of text excluding appendices and includes 13 figures, 15 tables, 59 references.
The appendices are provided separately.
Valdemaras Šileika
— Dr Aurelija Kasparavičiūtė
Research on Vehicle Flow Forecasting Methods
This master’s thesis investigates traffic flow forecasting methods. The literature review outlines the concept of traffic flow forecasting, distinguishes forecasting strategies and classifications, and presents an overview of...
Research on Vehicle Flow Forecasting Methods
Student:
Valdemaras Šileika
Supervisor:
Dr Aurelija Kasparavičiūtė
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Baigiamajame magistro darbe nagrinėjami eismo srautų prognozavimo metodai. Literatūros analizėje apibūdintas eismo srautų prognozavimas, išskirtos prognozavimo strategijos ir klasifikacijos, apžvelgti parametriniai ARIMA, SARIMA ir SARIMAX modeliai bei neparametrinis LSTM modelis. Apžvelgti modelių palyginamieji darbai. Metodologijoje apibrėžti SARIMA, SARIMAX bei LSTM modeliai, jų struktūros bei reikalavimai. Pristatyti išimčių pašalinimo metodai ir paklaidų vertinimo metrikos. Tiriamojoje dalyje nagrinėtas parametrinių bei neparametrinių modelių taikymas prognozuojant ilgalaikį eismo intensyvumą. Įvertinti duomenų reikalavimai, sudarytos eismo intensyvumo prognozės ir palygintos su realiais duomenimis. Įvertintas sudarytų modelių tikslumas.
Darbą sudaro 6 dalys: įvadas, literatūros apžvalga, metodologija, tiriamoji dalis, išvados, literatūros sąrašas.
Darbo apimtis – 61 p. teksto be priedų, 28 pav., 9 lent., 46 bibliografiniai šaltiniai.
Thesis abstract (EN)
This master’s thesis investigates traffic flow forecasting methods. The literature review outlines the concept of traffic flow forecasting, distinguishes forecasting strategies and classifications, and presents an overview of parametric models such as ARIMA, SARIMA, and SARIMAX, as well as the non-parametric LSTM model. Comparative studies of the models are also reviewed. The methodology section defines SARIMA, SARIMAX, and LSTM models, their structures, and data requirements. Methods for outlier removal and error evaluation metrics are also introduced. The research part focuses on applying both parametric and non-parametric models for long-term traffic flow forecasting. The requirements for data are evaluated, traffic flow forecasts are generated and compared to real traffic data, and the accuracy of the developed models is assessed.
The thesis consists of 6 sections: introduction, literature review, methodology, research part, conclusions, and references.
Thesis consists of: 61 pages (excluding appendices), 28 illustrations, 9 tables, 46 bibliographical entries.
Beata Borisova
— Dr Vilma Nekrašaitė-Liegė
Price Index Calculation using scanned Data
The Master's thesis is devoted to price index calculations using scanned data. Two parts of this study can be distinguished: classification of food products and non-alcoholic beverages into...
Price Index Calculation using scanned Data
Student:
Beata Borisova
Supervisor:
Dr Vilma Nekrašaitė-Liegė
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Magistro baigiamasis darbas skirtas kainų indeksų skaičiavimams naudojant skenuotus duomenis atlikti. Galima išskirti dvi šio tyrimo dalis: maisto prekių bei nealkoholinių gėrimų klasifikavimas į 61 ECOICOP kategoriją bei kainų indeksų skaičiavimas. Klasifikavimas atliekamas naudojant sprendimų medžių klasifikatorių bei dirbtinius neuroninius tinklus. Klasifikuojami tekstiniai duomenys, todėl iš pradžių jie skaitmenizuojami, o tik tada pritaikomi klasifikatoriai. Skaičiavimams atlikti pasirenkami neuroninių tinklų suklasifikuoti duomenys. 01.1.8.1 (cukrus), 01.1.5.5 (kiti valgomieji gyvuliniai riebalai), 01.1.6.2 (užšaldyti vaisiai) ECOICOP kategorijoms pritaikomos tiek tradicinės, tiek tos indeksų skaičiavimo formulės, kurios gali būti naudojamos tik skenuotiems duomenims. Rezultatai tarpusavyje palyginami.
Darbą sudaro 6 dalys: įvadas, literatūros apžvalga, teorinė dalis, praktinė dalis, išvados, literatūros sąrašas. Darbo apimtis: 35 p. teksto be priedų, 16 iliustracijų, 8 lentelės, 20 šaltiniai.
Thesis abstract (EN)
The Master's thesis is devoted to price index calculations using scanned data. Two parts of this study can be distinguished: classification of food products and non-alcoholic beverages into 61 ECOICOP categories and calculation of price indices. Classification is performed using a decision tree classifier and artificial neural networks. Textual data is classified, so it is first digitized and only then classifiers are applied. Data classified by neural networks are selected for the calculations. 01.1.8.1 (sugar), 01.1.5.5 (other edible animal fats), 01.1.6.2 (frozen fruit) ECOICOP categories are subject to both traditional and index calculation formulas that can only be used for scanned data. The results are mutually comparable.
The work consists of 6 parts: introduction, literature overview, theoretical part, practical part, conclusions, reference list. Paper size: 35 p. text without appendices, 16 illustrations, 8 tables, 20 references.
Brigita Borodičaitė
— Assoc Prof Dr Jolita Norkūnienė
Time series models of crude oil prices
This bachelor's thesis investigates the prices of Brent and West Texas Intermediate crude oil from January 1988 to January 2024. Time series models are developed to describe the...
Time series models of crude oil prices
Student:
Brigita Borodičaitė
Supervisor:
Assoc Prof Dr Jolita Norkūnienė
Department:
Department of Mathematical Statistics
Thesis abstract (LT)
Baigiamajame bakalauro darbe tiriamos „Brent“ ir „West Texas Intermediate“ grynosios naftos kainos 1988 m. sausio mėn. - 2024 m. sausio mėn. laikotarpiu. Sukuriami laiko eilučių modeliai, aprašantys šių kainų elgesį, ir atliekama jų tinkamumo duomenims vertinimo analizė. Modelių adekvatumas tikrinamas atliekant liekanų analizę, kurioje naudojamos tiek grafinės, tiek skaitinės analizės priemonės, siekiant nustatyti, ar liekanos tenkina prielaidas. Analizės rezultatai parodė, kad geriausiai duomenis aprašo ARIMA modeliai, kurie toliau naudojami trumpalaikiam grynosios naftos kainų prognozavimui.
Darbą sudaro 6 dalys: įvadas, literatūros apžvalga, teorinė dalis, praktinė dalis, išvados, literatūros sąrašas.
Darbo apimtis - 43 p. teksto be priedų, 31 iliustr., 34 lent., 17 bibliografiniai šaltiniai.
Atskirai pridedami darbo priedai.
Thesis abstract (EN)
This bachelor's thesis investigates the prices of Brent and West Texas Intermediate crude oil from January 1988 to January 2024. Time series models are developed to describe the behavior of these prices, and an evaluation of the models' suitability for the data is conducted. The adequacy of the models is assessed through residual analysis, utilizing both graphical and numerical diagnostic tools to determine if the residuals meet the assumptions of the model. The analysis results indicate that ARIMA models best describe the data, which are subsequently used for short-term forecasting of crude oil prices.
Structure: introduction, literature review, theoretical part, experimental part, conclusions, references.
Thesis consist of: 43 p. text without appendixes, 31 pictures, 34 tables, 17 bibliographical entries.
Appendixes included.