Išmanių ir klimatui neutralių kompetencijų centras
Išmanių ir klimatui neutralių kompetencijų centro naujienos
Mokslinių duomenų valdymas: kas tai ir kam to reikia?
2021-03-08
Mokslinių duomenų valdymas: kas tai ir kam to reikia?
Mokslinių duomenų valdymas (toliau – MDV) apima veiklas ir procesus, susijusius su duomenų rinkimu, apdorojimu, ilgalaikiu išsaugojimu, prieiga ir pakartotiniu panaudojimu. Šie procesai gali būti suskirstyti į keletą etapų, apibūdinančių duomenų gyvavimo ciklą.
Efektyvus MDV turi būti vykdomas visose ciklo stadijose.
Planavimo etape:
Duomenų rinkimo etape:
Duomenų apdorojimo ir analizės etapas:
Tam, kad sukauptus pirminius duomenis būtų galima analizuoti, juos gali reikėti išvalyti, standartizuoti ar kitais būdais apdoroti. Šiame etape ypatingai svarbu, kad visi duomenų pakeitimai būtų dokumentuojami. Taip pat, svarbu aprašyti visas analizės procedūras, kaip atliktas papildomas manipuliacijas, naudotą analizės modelį bei techninės ir programinės įrangos specifikacijas.
Duomenų saugojimo etape:
Atsižvelgiant į pasirinktos duomenų talpyklos ir/arba finansuotojo reikalavimus, numatomas viešinamų duomenų formatas, vykdomas tolimesnis duomenų valymas (pvz., nuasmeninimas) ir dokumentavimas. Šiame etape turi būti peržiūrėta visa duomenis aprašanti dokumentacija, užtikrinant, kad ji būtų pakankamai išsami ir įgalintų paskelbtus duomenis aptikti ir pakartotinai panaudoti.
Publikavimo ir sklaidos etape:
Apdoroti ir aprašyti duomenys publikuojami moksliniuose straipsniuose, duomenų žurnaluose, ataskaitose, ir kartu su papildoma informacija talpinami duomenų talpyklose ar archyvuose.
Kodėl svarbu valdyti duomenis?
MDV padeda mokslininkams geriau atlikti tyrimus:
Mokslininkai ir tyrėjai – duomenų kūrėjai ir naudotojai. Jie planuoja tyrimus, numato, kokie duomenys bus renkami, juos kaupia ir apdoroja, bei nustato, kaip duomenys bus analizuojami ir kokios galimos tokių analizių išvados.
Universitetai ir tyrimų institutai – nustato vidines MDV politikas. Taip pat, gali suteikti MDV reikalingus resursus, tokius kaip MDV mokymus, paramą rengiant MDV planus, techninę bei programinę įrangą bei konsultavimą susijusiais klausimais (IT padaliniai), ir duomenų archyvavimo paslaugas (institucinės talpyklos).
Duomenų talpyklos – kuruoja duomenis, užtikrina jų ilgalaikį išsaugojimą ir suteikia prie jų prieigą. Duomenų talpyklos bendradarbiauja su duomenų kūrėjais, kad užtikrintų duomenų naudingumą ilgalaikėje perspektyvoje, bei nustato reikalingus prieigos apribojimus (pvz., embargo periodai ar kiti prieigos apribojimai, nulemti institucijos ar finansuotojo reikalavimų), užtikrina duomenų saugumą ir nuosavybės teisių laikymąsi.
Vartotojai – įvairių sričių atstovai, pakartotinai naudojantys publikuotus duomenis. Pakartotiniai duomenų vartotojai gali būti: patys duomenų kūrėjai bei kiti mokslininkai, nagrinėjantys duomenis kitais aspektais, nei originalaus tyrimo metu, lygindami su vėlesniuose etapuose gautais analogiškais duomenimis, ar siekiantys patikrinti tyrimo metu gautų rezultatų patikimumą; dėstytojai, naudojantys duomenis mokymo tikslams; studentai, rengiantys baigiamuosius darbus; verslo, politikos ar privačių sektorių atstovai, žurnalistai; ir suinteresuoti plačiosios visuomenės nariai.
Finansuotojai – suteikia tyrimui vykdyti reikalingus resursus. Šiandien vis daugiau finansuojančių institucijų reikalauja MDV, siekiant didesnio vykdomų projektų skaidrumo. Skatindami užtikrinti projekto metu sukauptų duomenų pakartotinio panaudojimo galimybę, finansuotojai taip pat siekia padidinti jų investicijų grąžą.
Leidėjai ir žurnalai – viešina tyrimų rezultatus ir jais paremtus mokslinius atradimus. Leidėjai ir žurnalų redkolegijos vis intensyviau skatina autorius cituoti duomenis (jų pačių sukurtus ar kitus, kurie buvo naudoti tyrime), o kai kurių žurnalų, pvz. PLOS (Public Library of Sciences), reikalavimuose nurodoma, kad tyrimui naudoti duomenys būtų publikuoti duomenų talpyklose.
Dėl didelės MDV procesuose dalyvaujančių šalių įvairovės, efektyvus MDV reikalauja glaudaus bendradarbiavimo tarp šių grupių.
Plačiau susipažinti su moksliniais duomenimis ir jų valdymu galite VILNIUS TECH Bibliotekos tinklapyje, Mokslinės komunikacijos skiltyje Moksliniai duomenys.
Efektyvus MDV turi būti vykdomas visose ciklo stadijose.
Planavimo etape:
- Numatoma, ar tyrime bus generuojami nauji duomenys, ar panaudojami jau egzistuojantys duomenys
- Pasirenkama tinkama duomenų talpykla
- Pasirenkami duomenų formatai ir metaduomenų standartai duomenims aprašyti
- Įvertinami konfidencialumo, privatumo ir kiti etiniai klausimai
- Nustatomi potencialūs duomenų vartotojai
- Įvertinamos MDV išlaidos ir reikalingi resursai
Duomenų rinkimo etape:
- Numatomos procedūros duomenų organizavimui, atsarginių versijų kūrimui ir saugojimui
- Sudaromi duomenų kokybės užtikrinimo protokolai
- Nustatomi prieigos apribojimai ir saugumo užtikrinimo priemonės
Duomenų apdorojimo ir analizės etapas:
Tam, kad sukauptus pirminius duomenis būtų galima analizuoti, juos gali reikėti išvalyti, standartizuoti ar kitais būdais apdoroti. Šiame etape ypatingai svarbu, kad visi duomenų pakeitimai būtų dokumentuojami. Taip pat, svarbu aprašyti visas analizės procedūras, kaip atliktas papildomas manipuliacijas, naudotą analizės modelį bei techninės ir programinės įrangos specifikacijas.
Duomenų saugojimo etape:
Atsižvelgiant į pasirinktos duomenų talpyklos ir/arba finansuotojo reikalavimus, numatomas viešinamų duomenų formatas, vykdomas tolimesnis duomenų valymas (pvz., nuasmeninimas) ir dokumentavimas. Šiame etape turi būti peržiūrėta visa duomenis aprašanti dokumentacija, užtikrinant, kad ji būtų pakankamai išsami ir įgalintų paskelbtus duomenis aptikti ir pakartotinai panaudoti.
Publikavimo ir sklaidos etape:
Apdoroti ir aprašyti duomenys publikuojami moksliniuose straipsniuose, duomenų žurnaluose, ataskaitose, ir kartu su papildoma informacija talpinami duomenų talpyklose ar archyvuose.
Kodėl svarbu valdyti duomenis?
MDV padeda mokslininkams geriau atlikti tyrimus:
- didelio, kompleksinio projekto atveju, kurio metu generuojami įvairių tipų duomenys, net patys tyrėjai gali pasimesti turimų duomenų gausoje. Todėl MDV padeda jiems optimizuoti duomenų panaudojimą aktyvioje tyrimo stadijoje.
- dažnai duomenų rinkimo, tvarkymo, o neretai – ir analizavimo, užduotys yra paskiriamos baigiamųjų pakopų studentams ar kitiems personalo nariams. Todėl MDV palengvina bendradarbiavimą su kitais tyrimo dalyviais, bei žinių perdavimą vykstant personalo kaitai.
- Pasibaigus tyrimui ar projektui, duomenys gali būti panaudoti atsakyti į papildomus klausimus, kurie nebuvo nagrinėti pirminio tyrimo metu.
- Taip pat, jei bus norima ateityje atlikti analogišką tyrimą, sukauptus pirminio tyrimo duomenis bus galima lengvai panaudoti gautų rezultatų palyginimui laike, kas būtų praktiškai neįmanoma, jei duomenys nebūtų tvarkomi sistemingai.
- MDV taip pat padidina tyrimo skaidrumą ir duomenų patikimumą, nes tinkamai parengti duomenys leidžia juos panaudoti tyrimo rezultatų validavimui.
- Tinkamai surinkti ir aprašyti duomenys gali būti atrandami ir panaudoti trečiųjų šalių (vartotojų), tokiu būdu ne tik užtikrinant didesnę investicijų į projektus grąžą dėl pakartotinio duomenų naudojimo inovacijų kūrimui ir pažangai, bet ir suteikiant plačiosios visuomenės nariams geresnes sąlygas piliečių mokslo vystymui ir galimybę panaudoti duomenis studijų ir mokymo tikslais.
Mokslininkai ir tyrėjai – duomenų kūrėjai ir naudotojai. Jie planuoja tyrimus, numato, kokie duomenys bus renkami, juos kaupia ir apdoroja, bei nustato, kaip duomenys bus analizuojami ir kokios galimos tokių analizių išvados.
Universitetai ir tyrimų institutai – nustato vidines MDV politikas. Taip pat, gali suteikti MDV reikalingus resursus, tokius kaip MDV mokymus, paramą rengiant MDV planus, techninę bei programinę įrangą bei konsultavimą susijusiais klausimais (IT padaliniai), ir duomenų archyvavimo paslaugas (institucinės talpyklos).
Duomenų talpyklos – kuruoja duomenis, užtikrina jų ilgalaikį išsaugojimą ir suteikia prie jų prieigą. Duomenų talpyklos bendradarbiauja su duomenų kūrėjais, kad užtikrintų duomenų naudingumą ilgalaikėje perspektyvoje, bei nustato reikalingus prieigos apribojimus (pvz., embargo periodai ar kiti prieigos apribojimai, nulemti institucijos ar finansuotojo reikalavimų), užtikrina duomenų saugumą ir nuosavybės teisių laikymąsi.
Vartotojai – įvairių sričių atstovai, pakartotinai naudojantys publikuotus duomenis. Pakartotiniai duomenų vartotojai gali būti: patys duomenų kūrėjai bei kiti mokslininkai, nagrinėjantys duomenis kitais aspektais, nei originalaus tyrimo metu, lygindami su vėlesniuose etapuose gautais analogiškais duomenimis, ar siekiantys patikrinti tyrimo metu gautų rezultatų patikimumą; dėstytojai, naudojantys duomenis mokymo tikslams; studentai, rengiantys baigiamuosius darbus; verslo, politikos ar privačių sektorių atstovai, žurnalistai; ir suinteresuoti plačiosios visuomenės nariai.
Finansuotojai – suteikia tyrimui vykdyti reikalingus resursus. Šiandien vis daugiau finansuojančių institucijų reikalauja MDV, siekiant didesnio vykdomų projektų skaidrumo. Skatindami užtikrinti projekto metu sukauptų duomenų pakartotinio panaudojimo galimybę, finansuotojai taip pat siekia padidinti jų investicijų grąžą.
Leidėjai ir žurnalai – viešina tyrimų rezultatus ir jais paremtus mokslinius atradimus. Leidėjai ir žurnalų redkolegijos vis intensyviau skatina autorius cituoti duomenis (jų pačių sukurtus ar kitus, kurie buvo naudoti tyrime), o kai kurių žurnalų, pvz. PLOS (Public Library of Sciences), reikalavimuose nurodoma, kad tyrimui naudoti duomenys būtų publikuoti duomenų talpyklose.
Dėl didelės MDV procesuose dalyvaujančių šalių įvairovės, efektyvus MDV reikalauja glaudaus bendradarbiavimo tarp šių grupių.
Plačiau susipažinti su moksliniais duomenimis ir jų valdymu galite VILNIUS TECH Bibliotekos tinklapyje, Mokslinės komunikacijos skiltyje Moksliniai duomenys.