HvA Bibliotheek

Geautomatiseerd datasetrecords importeren in Pure

Het belang van registratie en zichtbaar maken van datasetrecords neemt toe, zowel op landelijk niveau als op universitair niveau. Registratie en het zichtbaar maken van datasetrecords maken dan ook deel uit van het Nationaal Programma Open Science en het HvA-beleidsplan.

De HvA maakt al geruime tijd gebruik van UvA/HvA Figshare, een systeem voor het veilig opslaan, gecontroleerd delen en publiceren van onderzoeksdata. Dit systeem is gekoppeld aan Pure voor registratie. Om meer datasetrecords in Pure op te nemen en zichtbaar te maken, is daar een koppeling aan toegevoegd met het zogenoemde Data Monitor.

Data Monitor

Data Monitor is een database met metadata van datasets uit een groot aantal wetenschappelijke data repositories, zoals: Zenodo, EASY, 4TU.ResearchData, Mendeley Data. Zowel domein specifieke als bredere repositories zijn opgenomen.

Koppeling Data Monitor en Pure

De Bibliotheek heeft Data Monitor in gebruik genomen en daarmee een koppeling van de database met registratiesysteem Pure. Via deze importkoppeling wordt metadata van datasets automatisch geïmporteerd in Pure zodra er een match is. De importkoppeling tussen Data Monitor en Pure betreft een geautomatiseerde koppeling. Datasetrecords worden - indien er een match is - automatisch geïmporteerd. De onderzoeker hoeft het datasetrecord niet meer zelf te registreren aangezien dit automatisch gebeurt.

Van HvA-geaffilieerde datasets uit Data Monitor worden de gegevens ingelezen en opgeslagen in Pure. Tijdens de import in Pure wordt geprobeerd om geautomatiseerd een match op HvA-onderzoeker in Pure te maken. Die match slaagt helaas niet altijd, maar het validatieteam van de Bibliotheek spant zich ervoor in handmatig te matchen op HvA-onderzoeker en de gegevens verder aan te vullen. Daarnaast controleert het validatieteam alle nieuwe datasetrecords en valideert deze - indien het record in orde is. Van onderzoekers wordt alleen nog gevraagd de registratie na te kijken op mogelijke fouten, en op de compleetheid en juistheid van affiliaties.

Vragen?

Bekijk de veelgestelde vragen en bijbehorende antwoorden. Staat jouw vraag er niet tussen of kom je er toch niet uit? Neem dan gerust contact op met pure@hva.nl of met jouw Pure facultaire Pure-beheerder.

Veelgestelde vragen

Gebruik

Nee, de dataset zelf wordt niet geïmporteerd vanuit Data Monitor naar Pure. Het betreft alleen de metadata over de dataset, zoals de titel en de DOI naar de dataset zelf.

De validatieafdeling van de Bibliotheek controleert de datasetrecords en valideert de records indien in orde.

Als je toch fouten ziet staan, of affiliaties wilt wijzigen of toevoegen, dan kun je de records aanpassen. Na het aanbrengen van die wijzigingen krijgen de valideerders van de Bibliotheek (afhankelijk van welk veld het betreft) het record opnieuw ter validatie aangeboden. Zij zullen vervolgens de voorgestelde wijzigingen beoordelen.

Via de importkoppeling tussen Data Monitor en Pure kan naast het importeren van de dataset ook automatisch een relatie worden gelegd met de betreffende publicatie in Pure. Voorwaarden zijn:

  1. Deze relatie moet in Data Monitor (het bronsysteem) bekend zijn.
  2. De betreffende publicatie staat al in Pure geregistreerd.
  3. De betreffende publicatie heeft een DOI.

Is het datasetrecord niet automatisch gekoppeld aan de publicatie en wil je alsnog koppelen? Ga dan in Pure naar de tab Datasets, zoek de betreffende dataset op en open dat datasetrecord. Scroll vervolgens naar onderen in het record naar het kopje Relations to other content. Voeg via het kopje Research output de betreffende publicatie toe. N.B.: vergeet vervolgens niet op de blauwe Save te drukken.

Na koppelen zal die relatie zichtbaar zijn op de HvA Research Database.

Zichtbaarheid

  • De geïmporteerde datasetrecords uit Data Monitor zijn zichtbaar in Pure onder het kopje ‘Datasets’.
  • Indien er een match is met een HvA-onderzoeker, zijn de datasetrecords enkele seconden na import in Pure zichtbaar in de HvA Research Database. De betreffende HvA-onderzoeker ziet zijn/haar datasetrecords in Pure HvA terug in de publicatietab, onder het kopje ‘datasets’. Dit is ongeacht de workflowstatus in Pure (Entry in progress, For validation of Validated).
  • Indien het geïmporteerde datasetrecord in Pure is gekoppeld aan een publicatierecord in Pure is het datasetrecord tevens te vinden als ‘Related dataset’ bij de betreffende publicatie in de HvA Research Database.

Indien de geautomatiseerde match niet is gelukt, maar de valideerders handmatig alsnog een dataset weten te matchen aan een Internal Person van een onderzoeker in Pure, dan ontvangt de HvA-onderzoeker hierover standaard een notificatie per e-mail en in Pure (onder het kopje Notifications) met de tekst dat Pure jou heeft toegevoegd aan de dataset. Dit, tenzij de onderzoeker deze optie in zijn/haar e-mailinstellingen of takenlijst in Pure heeft uitgezet.

Ja, het toevoegen van jouw ORCID en/of Scopus-ID in Pure kan de geautomatiseerde import van datasetrecords uit Data Monitor in Pure verbeteren. Er zal vaker een match zijn, ofwel een dataset zal vaker aan jou worden gematcht. Let wel: ook al heb je een ORCID-iD en/of Scopus-ID toegevoegd in je Pure-profiel, kan het toch zijn dat er geen match volgt. In Data Monitor moet er namelijk ook een ORCID-iD of Scopus-ID aanwezig zijn om te matchen.

Wil je jouw ORCID en/of Scopus-ID toevoegen in Pure of wil je checken of die al is toegevoegd?

  • ORCID: log in op Pure en klik op Edit profile. Scroll naar het veld ORCID en klik op: Create or Connect your ORCID ID.
  • Scopus-ID: log in op Pure UvA en klik op Edit profile. Selecteer vervolgens bij het veld ID als type Scopus Author ID: vul daar jouw Scopus-ID in.

Validatie en workflow

Na de automatische import van de geïmporteerde datasetrecords uit Data Monitor krijgt het datasetrecord de workflowstap For Validation in Pure. Dit betekent dat het datasetrecord in de takenlijst van de validatieafdeling van de Bibliotheek gereed staat om te controleren en indien in orde, te valideren. N.B.: prioriteit bij het valideren hebben de datasets van recente(re) jaren.

Na validatie zal het datasetrecord de status Validated krijgen.

Het kan voorkomen dat de valideerders een geïmporteerd datasetrecord terugzetten van For validation naar Entry in progress, bijvoorbeeld omdat het een non-HvA dataset is of omdat aanvullende informatie nodig is. Non-HvA datasets worden niet gevalideerd en zullen dus blijven staan op Entry in progress.

Indien valideerders een record terugzetten naar Entry in progress vanwege het ontbreken van informatie, ontvang jij als onderzoeker de vraag om aanvullende informatie aan te leveren en het record dan te zetten op For Validation.

Data Monitor wordt 1x per week doorzocht op nieuw te importeren datasetrecords.

Datasetrecords die zijn gepubliceerd in de periode 2016-heden worden binnengehaald via de koppeling Data Monitor – Pure. Vanwege de aanzienlijke aanwas van geïmporteerde datasetrecords via de koppeling kunnen deze datasetrecords niet onmiddellijk worden gevalideerd. Prioriteit bij het valideren gaat uit naar datasetrecords van de meest recente jaren.

Gepubliceerd door  HvA Bibliotheek 2 januari 2024