Išmanių ir klimatui neutralių kompetencijų centras
Išmanių ir klimatui neutralių kompetencijų centro naujienos
Moksliniai duomenys: duomenų tipai ir aprašymas
2021-02-22
Moksliniai duomenys: duomenų tipai ir aprašymas
Kas yra moksliniai duomenys? Iš pažiūros, tai atrodo labai paprasta sąvoka, tačiau duomenys gali būti labai įvairių tipų, yra stipriai priklausomi nuo tyrimų disciplinos ir konteksto.
Yra pateikta keletas mokslinių duomenų sąvokos apibrėžimų:
Tačiau bendrai yra pabrėžiami šie mokslinių duomenų bruožai: patikimumas, heterogeniškumas, priklausomybė nuo konteksto ir jų sklaidos būtinybė.
Priklausomai nuo tyrimų disciplinos ir konteksto, duomenys gali būti įvairių tipų.
NSF išskiriami duomenų tipai:
NEH duomenims priskiria:
Kad publikuoti duomenis galėtų būti surandami, juos reikia tinkamai aprašyti, suteikiant duomenų rinkiniui metaduomenis. Metaduomenys – tai „duomenys apie duomenis“: struktūruota informacija, kuri aprašo, paaiškina, ir/arba nurodo aprašomo objekto (duomenų rinkinio) lokalizaciją.
Kiekvieno duomenų rinkinio metaduomenyse turi būti nurodyta:
Tačiau vien atrasti duomenis nepakanka. Tam, kad duomenis būtų galima suprasti, teisingai interpretuoti ir panaudoti antrinei analizei, reikalingi papildomi duomenys (angl. background data). Tai gali būti kodų aprašai, klausimynai, metodologijų aprašymai, ataskaitos, stendiniai konferencijų pranešimai, straipsniai, informacija interneto tinklapiuose, bloguose ir pan. Be šių papildomų duomenų, duomenų rinkiniai tampa bereikšmiai ir nepanaudotini.
Plačiau su mokslinių duomenų tipais ir jų aprašymu susipažinti galite VILNIUS TECH Bibliotekos tinklapyje, Mokslinės komunikacijos skiltyje Moksliniai duomenys.
Yra pateikta keletas mokslinių duomenų sąvokos apibrėžimų:
- Nacionaliniai sveikatos institutai (angl. National Institutes of Health (NIH)) apibūdina mokslinius duomenis, kaip „įrašyta faktinė medžiaga mokslinėje visuomenėje laikoma kaip būtina tyrimų rezultatų dokumentavimui ir pagrindimui“ (išversta iš „Recorded factual material commonly accepted in the scientific community as necessary to document and support research findings“ (National Institutes of Health)).
- Nacionalinis Mokslo Fondas (angl. National Science Foundation (NSF)) apibrėžia duomenis kaip tai, ką išskiria „suinteresuotos bendruomenės nariai recenzavimo ir projektų valdymo procesų eigoje“ (išversta iš „determined by the community of interest through the process of peer review and program management” (National Science Foundation)).
- Nacionalinis Humanitarinių Mokslų Fondas (angl. National Endowment for the Humanities (NEH)) apibūdina duomenis kaip „medžiagą, sukurtą ar surinktą tyrimo vykdymo eigoje“ (išversta iš „materials generated or collected during the course of conducting research” (National Endowment for the Humanities)).
Tačiau bendrai yra pabrėžiami šie mokslinių duomenų bruožai: patikimumas, heterogeniškumas, priklausomybė nuo konteksto ir jų sklaidos būtinybė.
Priklausomai nuo tyrimų disciplinos ir konteksto, duomenys gali būti įvairių tipų.
NSF išskiriami duomenų tipai:
- Duomenys (skaitiniai ar kokybiniai)
- Publikacijos
- Mėginiai (pvz., kraujo, dirvožemio ir kt.)
- Fizinės kolekcijos (pvz., herbariumai, archeologiniai radiniai ir kt.)
- Programinė įranga
- Tyrimų modeliai
NEH duomenims priskiria:
- Citatas
- Programinės įrangos kodus
- Algoritmus
- Skaitmeninius įrankius
- Duomenų bazes
- Geoerdvines koordinates
- Dokumentaciją
- Ataskaitas
- Straipsnius
Kad publikuoti duomenis galėtų būti surandami, juos reikia tinkamai aprašyti, suteikiant duomenų rinkiniui metaduomenis. Metaduomenys – tai „duomenys apie duomenis“: struktūruota informacija, kuri aprašo, paaiškina, ir/arba nurodo aprašomo objekto (duomenų rinkinio) lokalizaciją.
Kiekvieno duomenų rinkinio metaduomenyse turi būti nurodyta:
- Kas sukūrė duomenis?
- Kada duomenys buvo sukurti ir/arba publikuoti?
- Duomenų rinkinio antraštė, kuri naudojama duomenims referuoti
- Unikalus ir nekintantis identifikatorius (pvz., DOI)
Tačiau vien atrasti duomenis nepakanka. Tam, kad duomenis būtų galima suprasti, teisingai interpretuoti ir panaudoti antrinei analizei, reikalingi papildomi duomenys (angl. background data). Tai gali būti kodų aprašai, klausimynai, metodologijų aprašymai, ataskaitos, stendiniai konferencijų pranešimai, straipsniai, informacija interneto tinklapiuose, bloguose ir pan. Be šių papildomų duomenų, duomenų rinkiniai tampa bereikšmiai ir nepanaudotini.
Plačiau su mokslinių duomenų tipais ir jų aprašymu susipažinti galite VILNIUS TECH Bibliotekos tinklapyje, Mokslinės komunikacijos skiltyje Moksliniai duomenys.