‘Data delen leidt tot meer citaties en zie ik als een morele verplichting’

Hoogleraar Peter Verburg vertelt waarom hij zijn data open deelt via DataverseNL.

23-04-2019 | 13:39

‘Bij mijn onderzoekgroep Environmental Geography archiveren en publiceren we onze data sinds kort in DataverseNL’, vertelt hoogleraar Peter Verburg enthousiast. ‘VU-onderzoekers kunnen DataverseNL voor datasets tot 50GB kosteloos gebruiken, en het is gebruiksvriendelijk. Bovendien kunnen we er onze data open delen, wat ik erg belangrijk vind.’ peterverburgklklein

Data over landgebruik
‘Als milieuonderzoekers zijn we geïnteresseerd in ruimtelijk data over landgebruik. Bijvoorbeeld over verstedelijking, ontbossing, en voedselproductie. We verzamelen data onder meer door het interpreteren van beelden gemaakt door satellieten en door zelf interviews af te nemen. Met die data maken we modellen (scenario’s) die tonen hoe het landgebruik er in de toekomst uit kan gaat zien.’

Toestemming vragen voor gebruik van onze data vinden wij niet nodig
‘We gebruiken veel data van anderen. Daarnaast produceren we met onze modellen ook weer data die anderen goed kunnen gebruiken. Bijvoorbeeld voor onderzoek naar biodiversiteit of CO2-reductie. Ik zie het als een morele verplichting onze data te delen. Onze groep heeft al heel lang als beleid dat we de data die we verzamelen en produceren publiceren en open beschikbaar stellen. Dit doen we na publicatie van de eerste paper over het onderwerp. Met open bedoel ik dat mensen ons geen toestemming hoeven te vragen voor (her)gebruik. Als onderzoeker kun je in Dataverse zelf aangeven of mensen je toestemming moeten vragen of niet.’

Meer citaties door open delen data
‘Het grote voordeel van het open delen van data is dat we meer citaties krijgen op onze papers. Dat is goed voor onze carrières en voor de onderzoekvisitaties. Mijn aio’s die hun datasets publiceren, hebben bovengemiddelde citatierecords. Ook zien we dat sommige van onze datamodellen gebruikt worden door onder andere het Joint Research Centre van de EU en de FAO.’ 

Transparantie
‘Een andere belangrijke reden om onze data open te delen is dat we willen dat ons onderzoek transparant en reproduceerbaar is. Anderen moeten het kunnen controleren. Ik ontvang af en toe berichten waarin onderzoekers grote waardering uitspreken voor het feit dat wij onze data open delen. We krijgen er respect voor uit de academische wereld.’

Nadelen
‘Een nadeel van open delen van data is dat je minder vaak gevraagd wordt om samenwerking of als coauteur. Als je je data open neerzet gaan mensen er zelf mee aan de slag zonder jou te hoeven vragen actief bij te dragen. Ook zien we dat ondanks de documentatie die we erbij leveren de modellen soms verkeerd gebruikt worden. Bijvoorbeeld in een context waarvoor ze niet bedoeld zijn. We krijgen ook wel veel vragen van onkundige gebruikers. Helaas kunnen we die geen ondersteuning bieden want dat kost ons teveel tijd. Tot slot zijn er jammer genoeg soms mensen die een kleine variatie maken in je dataset en het dan publiceren onder hun naam.’

Met publiek geld gemaakt
‘Voor mij wegen de voordelen van open data delen op tegen de nadelen. Ik wil ook dat het echt open is. Ik erger me aan mensen die “op hun data zitten” terwijl die met publiek geld gemaakt zijn. Sommige onderzoekers, die hun data wel publiceren maar niet open, stellen - als je ze toestemming vraagt voor gebruik - als voorwaarde dat zij coauteur worden. Dat zie ik als misbruik van je positie. Daarnaast vind ik dat financiers als ze het delen van data verplicht stellen, ook moeten controleren of dit wel op degelijke wijze gebeurt. Ik zie nog regelmatig dat onderzoekers alleen een scan van hun kaart laten zien.
Je kunt hun data dan niet gebruiken.’

Data in eigen beheer via DataverseNL
‘Het fijne van DataverseNL is dat je je data in eigen beheer houdt. Als je ze bij een uitgever of andere organisatie publiceert  kan je niet zomaar kleine foutjes herstellen of de documentatie verbeteren na het publiceren. Met Dataverse kunnen we er nog altijd zelf bij en houden we controle over onze data. We zijn tevreden met de ondersteuning die we via de Universiteitsbibliotheek krijgen.’

Data registreren in PURE
‘We registreren onze data ook zoveel mogelijk in PURE/de VU Research Portal, want data zijn ook onderzoekoutput. Via PURE maken we onderzoekoutput- rapportages dus het is belangrijk dat alles op een plek staat. Bovendien kunnen we ons op onze Profielpagina’s in PURE profileren met die datasets. Het laat zien wat we allemaal kunnen, en dat kan weer leiden tot nieuwe samenwerking. Je krijgt in PURE ook een permanent link naar je data zodat ze altijd goed vindbaar blijven. 

Kijk voor meer informatie over data archiveren & publiceren in de RDM-Libguide
https://libguides.vu.nl/researchdata/data-archiving

Kosten gebruik Dataverse NL
Instellingen (zoals de VU) die gebruik maken van dataopslag in Dataverse NL betalen hiervoor jaarlijks een bijdrage aan DANS. Bij de VU wordt die bijdrage betaald uit centrale middelen. Dit betekent dat onderzoekers voor datasets tot 50 GB kosteloos gebruik kunnen maken van Dataverse. Voor datasets boven de 50GB moet een onderzoeker toestemming vragen bij de afdelingsleiding.

Factsheet DANS: over Dataverse

Dataverse Vrije Universiteit Amsterdam
https://dataverse.nl/dataverse/vuamsterdam

Vragen?
Neem contact op via: researchdataservices.ub@vu.nl