Als onderzoeker heb je hard gewerkt aan jouw publicatie met de AHON-data, en het schrijven verloopt soepel. Uiteindelijk zijn de analyses klaar, de scriptie is geschreven en klaar om te worden ingediend voor review en publicatie. Echter, de onderliggende resultaten, AHON-data en scripts staan nog steeds op de werkomgeving. Hoe ga je daar verder mee om?

Publicatie/analyse check

Vraag allereerst iemand van AHON om de scripts en scriptie door te lezen. Naast hulp bij de interpretatie van de resultaten, is het belangrijk te controleren of de privacy van de deelnemende patiënten en praktijken goed is gewaarborgd. Denk hierbij aan K-anonimiteit (minimaal k = 5, maar bij voorkeur k = 10 patiënten per geaggregeerde groep). Ook willen we voorkomen dat er identificerende informatie over een enkele patiënt openbaar wordt gemaakt, bijvoorbeeld wanneer iemand in een klein dorp een zeldzame ziekte heeft en dus onbedoeld herkend kan worden. 

UMCG Research Code

De UMCG Research Code vereist dat ‘alle gegevens die nodig zijn voor het reproduceren of controleren van het onderzoek worden gearchiveerd in een UMCG-erkend archief, inclusief bijbehorende scripts en/of software die nodig zijn voor het analyseren van de onderzoeksgegevens.’ Op basis van enkele veelvoorkomende vragen, leggen we uit hoe je met de AHON-data omgaat na jouw onderzoek.

Kan ik alles simpelweg copy-pasten naar de UMCG Research Drive?

Dit is vaak geen goed idee. Heb je wel eens oude bestanden teruggevonden en geen idee wat ze betekenen of wat je ermee hebt gedaan? Dit komt veel onderzoekers bekend voor. De belangrijkste vraag rondom onderzoeksbestanden is: zodra jij of andere onderzoekers de bestanden later willen bekijken of aanpassen, is het dan eenvoudig te begrijpen wat er tijdens het onderzoek is gedaan? Denk hierbij aan een duidelijke mappenstructuur, bestandsnaam en versie control strategie. README-bestanden die kort en bondig het onderzoeksproces uitleggen van A tot Z zijn ook nuttig. 

Hoewel het handig is om hier vanaf het begin over na te denken, is het de moeite waard om aan het einde van het onderzoek wat tijd te nemen om alles te herorganiseren, terwijl het nog vers in je geheugen zit. Daarnaast verlopen er vaak dingen anders tijdens een project dan van tevoren gedacht. Vergeet daarom niet om aanpassingen in jouw Data Management Plan (DMP) door te voeren. Leg vast wat er met de data is gebeurd, waar de data is gearchiveerd en waar de data vandaan komt.   

Ik ben verwerkersverantwoordelijke, geen data-eigenaar. Hoe werkt het dan?  

Als onderzoeker mag je geen data downloaden; daarom wordt er gewerkt in de DRE (Digital Research Environment). Dit betekent dat de archivering van bestanden die in de DRE staan niet door de onderzoeker kan worden gedaan, maar alleen door AHON. Het is echter nog steeds verantwoordelijkheid van de onderzoeker om hier proactief in te handelen: 

  • Bepaal welke bestanden relevant zijn voor archivering met oog op reproduceerbaarheid en hergebruik. 
  • Bereid de bestanden goed voor op archivering. 
  • Vraag AHON om de Research Drive aan te maken en de bestanden van de DRE daarop te archiveren. Vanzelfsprekend blijven onderzoeksbestanden buiten de DRE de verantwoordelijkheid van de onderzoeker. Ook ben je verantwoordelijk voor het up-to-date houden van het DMP.   

Hoelang moet de data bewaard blijven?

Normaal gesproken is onderzoek met de AHON-database nWMO-onderzoek, en volgens de Research Code moet de data ten minste 15 jaar bewaard worden. AHON archiveert de datasets dus voor 15 jaar, tenzij er andere afspraken zijn gemaakt. 

De ruwe data staat toch in de database, kan ik alleen de scripts archiveren?

De AHON-database is longitudinaal en dynamisch, wat betekent dat de samenstelling in de loop der tijd kan veranderen. Bijvoorbeeld als patiënten de praktijk verlaten, gebruikmaken van het opt-out-systeem, of als er afwijkingen zijn in de data-aanlevering. Daarnaast is het soms te bewerkelijk om alle scripts weer opnieuw te draaien. Daarom is het belangrijk om opgeschoonde datasets te bewaren, zodat het onderzoek altijd reproduceerbaar blijft. 

Wat als anderen de data willen hergebruiken voor hun eigen onderzoek? 

Alle nieuwe onderzoeksvragen die met AHON-data onderzocht worden, moeten altijd door de AHON-commissie getoetst worden. Neem altijd contact op of verwijs een onderzoeker die geïnteresseerd is om met de data te werken naar AHON.

In het kort

Het artikel benadrukt het belang van het zorgvuldig omgaan met AHON-data na het onderzoek. Scripts en data moeten gecontroleerd worden door AHON om de privacy te waarborgen, conform de UMCG Research Code, die vereist dat alle onderzoeksdata en scripts worden gearchiveerd in een erkend archief. Onderzoekers mogen geen data zelf downloaden uit de Digital Research Environment (DRE); archivering via de DRE moet door AHON gebeuren. Het is essentieel om een duidelijke mappenstructuur, bestandsnamen en documentatie (zoals README-bestanden) te gebruiken voor reproduceerbaarheid. De data moet minimaal 15 jaar bewaard blijven en hergebruik moet via de AHON-commissie verlopen.

Contactgegevens:

Karina Sulim, datamanager AHON