Bezint eer ge begint met data voor je onderzoek verzamelen

De VU Research Data Management Support Desk denkt graag met je mee.

24-02-2020 | 11:01

Voor het maken van een Data Management Plan voor haar NWO-promotieonderzoek vroeg Heleen Blommers advies bij de VU Research Data Management Support Desk. ‘Jolien Scholten van de desk heeft me veel nuttige tips gegeven. En ook al had ik tevoren goed nagedacht over het beheren van mijn onderzoekdata, toch liep ik nog tegen onverwachte zaken aan. Het is belangrijk hiervoor veel tijd in te plannen en advies te vragen aan experts.’

Foto’s van archiefdocumenten alleen voor eigen gebruik
Voor haar onderzoekproject Deconstructing the War on Poverty: the rise of a policy failure narrative, 1964-1985 bij de faculteit Geesteswetenschappen, doet Blommers onderzoek in diverse archieven in de Verenigde Staten. ‘Als ik naar de VS ga maak ik daar foto’s van de documenten die ik vind’, vertelt ze. ‘Die foto’s mag ik maken voor mijn eigen persoonlijke onderzoek maar niet ter beschikking stellen aan anderen. Die archiefstukken zijn namelijk staatseigendom. Dit heeft gevolgen voor het opslaan en archiveren van de foto’s die mijn dataverzameling vormen.’

Uploadtijd “infinty”
Blommers vroeg de VU Research Data Management Support Desk advies over hoe ze haar data tijdens haar onderzoek het best kon opslaan en na afloop het best kon archiveren. ‘NWO verwacht dat je voor het opslaan van je data een cloudopslagdienst zoals SURF drive gebruikt. Dat was ook het advies van de Support Desk. Maar toen ik na enkele dagen archiefonderzoek in de VS mijn foto’s op SURF drive ging uploaden, kreeg ik de mededeling “uploadtijd drie weken” en nog wat later zelfs “uploadtijd infinity!”’

Drie harde schijven voor het opslaan van de data
‘Ik had zoveel en zulke zware foto’s dat ik een andere aanpak heb moeten kiezen. Nu zet ik alles op drie harde schijven: een waarop ik werk, een die altijd in de kluis op de VU ligt, en een thuis. Die drie schijven moet ik regelmatig synchroniseren. Als ik op reis ben, heb ik mijn werkschijf in mijn rugzak en een andere in het hotel.’

Archstore alleen toegankelijk voor verificatie
Blommers gaat haar data archiveren in een van de drie archiefsystemen die de VU biedt: ArchStor. In Archstore worden onderzoekdata tien jaar bewaard. Ze kunnen alleen geraadpleegd worden ter verificatie.’

Systematisch opslaan van data
Het goed en systematisch opslaan van mijn data kost veel tijd, vertelt Blommers. ‘Je moet hele precieze referenties maken naar in welke brondocumenten (foto’s) je wat gelezen hebt, in welke archieven en in welke dozen je de documenten gevonden hebt, wie de schrijver is, et cetera. Dit is belangrijk om goed te kunnen annoteren in mijn proefschrift en opdat mijn onderzoek transparant is. Ik gebruik hiervoor de archiefstructuur. Het is bewerkelijk dus ik adviseer collega onderzoekers daar veel tijd voor in te plannen.’

Optical Character Recognition software
Het doorlezen van alle gefotografeerde documenten, kost ook veel tijd. Daarom vroeg Blommers de support desk om advies over Optical Character Recognition software. ‘Ik zou de gefotografeerde documenten graag op trefwoorden kunnen doorzoeken. Jolien heeft me verwezen naar de tools en expertise van Clarin, en op het spoor gezet van een nieuwe gratis tool Transkribus. ‘Ik heb al die opties onderzocht en kwam erachter dat ik om die tools te kunnen gebruiken de foto’s op een speciale manier had moeten maken. Bij Transkribus heb je zelfs een tent nodig! Het is dus belangrijk om je over dit soort zaken al heel goed te informeren voor je start met je onderzoek en met het verzamelen van de data. Stel jezelf telkens de vraag “wat als…?”.

Vragen bij het opstellen van je Data Management Plan?
Neem dan contact op met de VU Research Data Management Support Desk. De RDM-specialisten hebben al veel onderzoekers geholpen en zo veel kennis en ervaring opgedaan die ze graag met je delen.’