Arvien lielāks izdevēju un finansēšanas aģentūru skaits pieprasa zinātniekiem publiskot savus datus. Četri pamatprincipi - meklējamība, pieejamība, savietojamība un atkārtojamība (FAIR) - atbalsta datu ražotājus un lietotājus, palielinot pievienoto vērtību, ko iegūst mūsdienu formālā, akadēmiski digitālā publicēšana. Datu lietotprasme un pārvaldība kļūst par zinātnieku pamatprasmēm.

Semināra mērķis ir diskutēt par to, kā pētniecība un izglītība, ko abus finansē no valsts līdzekļiem, var paātrināt to potenciālu, būdami atvērti (atvērta pieeja), caurspīdīgi un lielākoties apstrādāti publiskajā telpā (atvērtā zinātne). Praktiski piemēri, piemēram, “reproducējamības krīze” un atsauktie dokumenti, kas virza sabiedrisko domu; Tiks sniegtas patentētās datu analīzes programmatūras kļūdas, kas kompromitē rezultātus, kā arī pārskats par pašreizējiem praktiskajiem risinājumiem zinātniskās prakses uzlabošanai (piemēram, Project DEAL, FAIR datu pārvaldība, GOSH ceļvedis). Līdz ar to atklātā prakse padara zinātniskos rezultātus un publikācijas ticamākas un reproducējamākas.

Dalībnieki sadarbosies patstāvīgos projektos, apgūstot ne-digitālās un digitālās zināšanas, kas vajadzīgas, lai izpildītu jaunos standartus datu pārvaldības un analīzes ziņojumos. Seminārs ir īpaši piemērots grupām, kuru mērķis ir veicināt sadarbību starp dalībniekiem; dalībnieki darba ietvaros izskaidros kolēģiem savu darbplūsmu un datus.

Mēs secināsim par to, kā atvērtās zinātnes prakses ieviešana ne tikai sniedz labumu zinātniskajai kopienai un sabiedrībai kopumā, bet arī atvieglo un optimizē individuālo darba plūsmu.

Pētniecības datu pārvaldība

Atvērtie dati kļūst par standartu, ko pieprasa finansētāji, izdevēji un universitātes, un Pētniecības datu pārvaldība (RDM) ir atzīta par pētnieku pamatkompetencēm. Es esmu izstrādājis seminārus, lai mācītu RDM ar praktisku fokusu, jo esmu bijušais zinātnieks ar lielu pieredzi RDM un atvērto datu jomā; un es labprāt apspriestu iespēju piedāvāt seminārus caur jūsu absolventu skolu. Es ierosinu konstruktīvistu pieeju (īsi teorētiski ievadi, piemēri, kas aplūkoti visā grupā, un praktisks darbs nelielās grupās par personisko pētījumu datu pārvaldību). Studenti strādās kā datu speciālisti savam projektam, kā arī par nepiederošajiem pārējiem projektiem. Papildus tam, lai uzzinātu par RDM (datu formāts, sakoptas izklājlapas, metadati, datu organizēšana, dublēšana un glabāšana, datu apmaiņa, datu citēšana), viņiem būs arī jāpadara savi dati un projekti saprotami pārējiem savas grupas dalībniekiem, palīdzot viņiem izjust datu dokumentācijas un metadatu nozīmi. Seminārs ir paredzēts pētniekiem, kuri strādā ar gariem astes datiem, neatkarīgi no viņu pētniecības uzmanības.

Tā kā labs RDM ir laika ietaupītājs ilgtermiņā, visefektīvāk būtu pētniekiem sekot šādam semināram jau savas karjeras sākumā, un es ceru, ka mēs varētu palīdzēt nākamajai pētnieku paaudzei radīt labākas, koplietojamas datu kopas.

Kursa saturs

Datu pārvaldība reproducējamā pētniecības darbplūsmā (RRW)

  • No eksperimentāla dizaina līdz publikācijai
  • Izklājlapas māksla: csv xlsx, sakārtoti dati, savietojamība, mašīnu un cilvēku lasāmība
  • Metadati: eksperimenta un parauga platums, saturs, laiks
  • Datu inventārs, mapju organizēšana, failu nosaukumi, dublēšana
  • Atvērtie un FAIR dati: krātuves, licences, FAIR principi

Atveidojamība un datu analīze

  • Versijas kontrole un palīgu rīki (git, Rstudio, Github)
  • Kā apvienot datus no dažādiem avotiem
  • Datu modifikācija, analīzes dokumentācija ar Excel un R un Rstudio
  • Padariet savu analīzi lasāmu - koda komentēšana: konvencijas un piemēri, dplyr pakotne

Metodoloģija

Mūsu kursi ir vērsti uz pieaugušo izglītību un izmanto līdzdalības pieejas. Pasniedzējs mudina dalībniekus pievienot savu pieredzi un zināšanas kursa saturam. Apskatītās tēmas ir reāli piemēri, un tās attiecas uz dalībnieku pētījumu lauku.

Pirms kursa dalībnieki pa e-pastu var iesniegt konkrētus jautājumus un savus prezentācijas piemērus. Kursa saturs tiks pielāgots dalībnieku īpašajām vajadzībām un prasībām.

Dalībniekiem tiek izsniegti lasāmmateriāli, kas jāapspriež kursa laikā, kā arī kursa kopsavilkums ar viņu sasniegumiem.

Kursa ilgums: 2 dienas pēc kārtas (plkst. 9–5)
Dalībnieku skaits: 8-12

Lasīšanas ieteikumu un resursu lasīšana

Gregorijs K, Khalsa SJ, Mišners WK, Psomopoulos FE, de Waard A, Wu M (2018) Vienpadsmit ātri padomi pētījumu datu atrašanai. PLoS Comput Biol 14 (4): e1006038. doi.org/10.1371/journal.pcbi.1006038

Vilkinsons, MD. et al., (2016. gada decembris), FAIR zinātnisko datu pārvaldības un pārvaldības pamatprincipi. daba.com/zinātniskie dati

Dati FAIRport iniciatīva ir atvērta kustība, kas aizsākusies kā praktiska rīcība pēc Lorenca darbnīca Leidenā, Nīderlandē, 2014. gada janvārī, nosaukts: Datu FAIRporta kopīga izstrāde. Viņu vīzija ir pievienoties un atbalstīt esošās kopienas, kas cenšas realizēt un dot iespēju situācijai, kurā vērtīgi zinātniskie dati ir “PATIESI” tādā nozīmē, ka tie ir atrodami, pieejami, sadarbspējīgi un atkārtoti izmantojami. | datafairport.org

DMPonline palīdz jums izveidot, pārskatīt un koplietot datu pārvaldības plānus, kas atbilst institucionālajām un finansētāja prasībām. To nodrošina Digitālais kuratoru centrs (DCC) dmponline.dcc.ac.uk

Dziļš ienirt FAIR datos: https://howtofair.dk/ - Ar Dānijas atbalsta atbalstu jums piedāvā Dānijas Nacionālais pētniecības datu pārvaldības forums Dānijas sadarbība e-infrastruktūras jomā (DeiC).