Centre of Expertise Urban Vitality

FAIR: geen woorden maar data

Project

De wielrenners onder ons kennen het probleem: het ene merk maakt onderdelen die niet uitwisselbaar zijn met een ander merk. Shimano-schoenplaatjes werken niet op Look-pedalen en een Campagnolo-derailleur niet op een Shimano-tandwiel. Een vergelijkbaar probleem komt ook voor bij onderzoeksdata: deze zijn vaak niet goed uitwisselbaar tussen projectteams of instellingen. Inefficiënt, omdat je voor het beantwoorden van complexe onderzoeksvragen juist data van verschillende projecten of instellingen wilt combineren. In dit project verkennen onderzoekers daarom het efficiënter hergebruik van data door het toepassen van de FAIR-principes: Findable (vindbaar), Accessible (toegankelijk), Interoperable (uitwisselbaar) en Reusable (herbruikbaar).

FAIR-data

Problemen hergebruik data

Veel onderzoeksdata verdwijnen na afloop op schijven, zolders en servers waar niemand ze ooit nog terug kan vinden. Stel dat onderzoekers de data toch terug kunnen vinden, dan weten zij niet onder welke voorwaarden ze toegankelijk zijn voor anderen. En mochten andere instellingen over soortgelijke data beschikken, dan zijn deze waarschijnlijk niet uitwisselbaar omdat iedereen eigen dataformaten en -beschrijvingen gebruikt. Kortom, hergebruik van onderzoeksdata is vrijwel onmogelijk terwijl er meer met data gedaan kan worden dan alleen het beantwoorden van één onderzoeksvraag binnen het project.

FAIR en machines

Data moeten ook voor machines (computers) vindbaar, toegankelijk, uitwisselbaar en herbruikbaar zijn. Een machine moet ‘automatisch’ kunnen herkennen voor wie bepaalde data wel of niet toegankelijk zijn. En een machine moet begrijpen dat verschillende termen hetzelfde kunnen betekenen (bijv. ‘height’ en ‘lichaamslengte’) en dat dezelfde term (bijv. ‘HR’) naar verschillende concepten kan verwijzen. Daarom maakt het projectteam gebruik van semantic web en linked datatechnieken, gebaseerd op de fundamenten van het World Wide Web.

De menselijke maat

Het FAIR maken van data (FAIRificatie) bevat uiteraard ook een ethische kant. De data waar het hier om gaat, komen veelal van mensen die hebben deelgenomen aan een onderzoek, metingen hebben ondergaan en die hun, soms gevoelige, data met een bepaald doel ter beschikking hebben gesteld. Hoe voorkom je dat computers en algoritmes aan de haal gaan met deze gegevens? Wat vinden de deelnemers ervan dat hun gegevens voor vervolgonderzoek gebruikt worden? Hebben ze daar enige zeggenschap over? In FAIR-terminologie: wat zijn de voorwaarden waaronder data toegankelijk (de ‘A’ van FAIR) zijn om ze te mogen hergebruiken (de ‘R’ van FAIR)?

Uitdaging

De huidige manier van werken maakt hergebruik van data door het koppelen van datasets of het verrijken van datasets met databanken van ziekenhuizen, bedrijven of gemeentes, erg lastig. Laat staan dat deze data ‘machine-actionable’ zijn. Als we binnen het programma Mensen in Beweging data en machines optimaal willen inzetten dan is het noodzakelijk om te beschikken over FAIR data.

Doel

De focus in dit project ligt op het leren toepassen van de FAIR-principes en het verkennen van de implementatie binnen Urban Vitality/Mensen in Beweging. Het hoofddoel: onderzoeken hoe projectteams de FAIR-principes in kunnen zetten om data efficiënter en effectiever te (her)gebruiken.

Subdoelen

  • Verkrijgen van beter inzicht in eigen dataverzamelingen- en methoden.
  • Implementeren van een ‘algemene’ FAIR-procedure voor andere onderzoeksprojecten.
  • Opbouwen van FAIR-expertise en -bewustwording binnen de HvA.

Methode

Het projectteam maakt gebruik van een werkwijze voor het FAIRificatie-proces die andere projectteams eerder hebben gebruikt. Dit proces vraagt om een multidisciplinair team waarin datastewards centraal staan.

Resultaten

Het beschikbaar maken van tools (software, werkwijze, training en materialen) voor de FAIRificatie van onderzoeksdata van het programma Mensen in Beweging.

Wat draagt het bij aan praktijk/onderzoek/onderwijs?

  • Het projectteam deelt de opgedane kennis en ervaringen via gastcolleges met voornamelijk ICT-studenten. In de minor Software for Science van de opleiding HBO-ICT besteden docenten aandacht aan het FAIR ontwikkelen van software, het FAIR maken van data en hoe dit op een verantwoorde manier te doen.
  • Het projectteam bespreekt met docent-onderzoekers en de HvA datasteward community welke rol zij hebben bij het FAIR maken van hun onderzoeksdata.
  • Het bevorderen van transparantie, efficiëntie en samenwerking in onderzoek, en het op een verantwoorde manier toekomstbestendig maken van data.

HvA-onderzoeksteam

  • Jesse Aarden, lectoraat Acute ouderenzorg
  • Carliene van Dronkelaar, lectoraat Voeding en Beweging
  • Dennis van Erck, lectoraat ?
  • Anne de Jong, Urban Vitality
  • Marije Kanis, lectoraat Digital Life
  • Dennis van Kooij, Sport Data Valley
  • Gerben ter Riet, Urban Vitality
  • Michael Tieland, lectoraat Voeding en Beweging
  • Niek van Ulzen, Urban Vitality
  • Bart Visser, lectoraat Oefentherapie
  • Pascal Wiggers, HvA Expertisecentrum Applied AI

Externe partners

  • Amsterdam UMC, Klinische Informatiekunde (Dr. Ir. Ronald Cornet)
  • Leiden UMC, Humane Genetica (Dr. Marco Roos)
Gepubliceerd door  Urban Vitality 27 november 2020

Project Info

FAIR-data
Startdatum 06 jan 2020
Einddatum 06 apr 2020

Contact

Niek van Ulzen
Anne de Jong
Carliene van Dronkelaar
Dennis van Erck