‘In Dataverse kan ik mijn data makkelijk opslaan, archiveren en delen’

Sander Groffen over hoe en waarom hij onderzoekdata deelt met anderen.

11-03-2019 | 15:31

‘Als we over ons onderzoek publiceren, willen we vanuit het oogpunt van wetenschappelijke integriteit ook de data beschikbaar stellen.’ Anderen moeten de data kunnen bekijken én hergebruiken, vindt Universitair Docent Sander Groffen van de afdeling Functionele Genoomanalyse (VU, Science /VUmc). ‘Het online platform Dataverse NL is daarvoor ideaal.’

Hoe stoten zenuwcellen signalen uit?
‘Onze afdeling onderzoekt de functie van genen. We zijn vooral geïnteresseerd in de genen die met neuroscience te maken hebben. We willen uitzoeken hoe zenuwcellen de signalen uitstoten naar andere zenuwcellen. Samen maken ze een netwerk en zo geven ze informatie door. Dat gaat allemaal razendsnel in milliseconden.’

Live imaging middels fluorescerende cellen
Om dit via live imaging te kunnen onderzoeken, kweken Sander en zijn collega’s zenuwcellen die ze fluorescent maken. Bijvoorbeeld door er fluorescerende eiwitten in te stoppen. Daarvan maken de onderzoekers time lapse opnames van zo’n drie minuten met heel veel beeldframes per seconde. OnderzoekGroffenAfbeeldingZenuwcellenKlein

Data bij publicatie beschikbaar stellen
‘Dat levert heel veel data op’, vertelt Groffen. ‘Zo heeft onze promovendus Roberta Mancini tijdens haar onderzoek wel vijf terabyte aan data verzameld. Als ze straks haar onderzoek gaat publiceren, willen we die data beschikbaar maken voor iedereen. Er zijn ook steeds meer tijdschriften die dat eisen, en dat vind ik een goede ontwikkeling.’

Kosten
‘Het kan wel erg kostbaar worden als je zulke grote hoeveelheden data hebt’, zegt Groffen. ‘Vanaf het moment van publicatie is er een wettelijke bewaarplicht van tien jaar. Maar het duurt soms enkele jaren voor je je data kunt publiceren. Dus je moet die data in totaal wel zo’n 10-15 jaar opslaan en er back ups van maken. Als je dat zelf moet doen, heb je een hele grote server nodig.’

Persistent identifier-url
‘Toen ik met Dataverse NL in aanraking kwam, zocht ik een plek waar ik een grote hoeveelheid data, die ik gebruikt had voor mijn paper, voor iedereen toegankelijk kon neerzetten. Als je je dataset in Dataverse zet, krijg je een persistent identifier-url, die je kunt vermelden in je publicatie. Daarmee zijn je data gemakkelijk te vinden, blijven ze altijd toegankelijk en kunnen andere onderzoekers je data hergebruiken.’

Onderzoeker bepaalt wie toegang krijgt
Als je je data opslaat in Dataverse kun je die ook met anderen delen. Je bepaalt als onderzoeker zelf wie toegang krijgt tot welk materiaal en wat hun rechten zijn (gebruiker, medewerker of curator). Je kiest ook zelf (binnen het beleid van je instelling) de licentie. Groffen koos voor Creative Commons Zero (CCO, No rights reserved). ‘Ik wil dat iedereen vanaf het moment van publiceren mijn data kan hergebruiken. Ik kan zien hoeveel mensen mijn data downloaden maar niet wie. Mijn eerste dataset is nu 60 keer gedownload.’

Gebruiksvriendelijk
Inmiddels heeft Groffen een tweede dataset in Dataverse opgeslagen. ‘Het is gebruiksvriendelijk en het wordt beheerd door mensen die dit goed kunnen. Ik ben geen ICT’er. Je kunt de opslag zo helemaal outsourcen. Je hoeft niemand meer data te sturen; ze kunnen die zelf downloaden.’

Over DataverseNL
DataverseNL is een netwerk van data repositories dat gebruikmaakt van de Dataverse-software ontwikkeld door de Universiteit van Harvard. Het wordt gezamenlijk aangeboden door de deelnemende instellingen en DANS. Sinds 2014 beheert DANS het netwerk. DataverseLogoHet beheer van de data in de lokale repositories ligt in de handen van de instellingen. Dataverse is niet geschikt voor het opslaan van privacygevoelige informatie.

Kosten gebruik Dataverse NL
Instellingen die gebruik maken van dataopslag in Dataverse NL betalen hiervoor jaarlijks een bijdrage aan DANS. Bij de VU wordt die bijdrage betaald uit centrale middelen.
Dit betekent dat onderzoekers voor datasets tot 50 GB kosteloos gebruik kunnen maken van Dataverse. Voor datasets boven de 50GB moet een onderzoeker toestemming vragen bij de afdelingsleiding.

Data voor opslag en archiveren selecteren
Om de kosten van dataopslag en -archivering beheersbaar te houden voor de Vrije Universiteit en de faculteiten is het van belang om voor je een dataset opslaat kritisch te kijken welke data echt bewaard moeten worden. Ook is het belangrijk om bij een subsidieaanvraag in de RDM-paragraaf (als mogelijk) budget aan te vragen voor het archiveren van je data. De kostprijs die de VU nu hanteert voor opslag in Dataverse is € 3,50 per GB per jaar. 

Data Archiveren & Dataverse
http://libguides.vu.nl/researchdata/data-archiving

Factsheet DANS: Lees meer over Dataverse

Dataverse Vrije Universiteit Amsterdam
https://dataverse.nl/dataverse/vuamsterdam