Åtgärder

Kontroll av metadata

Från DAU-handboken

Metadata i SND:s forskningsdatakatalog

Det krävs att ett antal metadataelement fylls i för att beskriva forskningsdata i SND:s formulär för att beskriva data. SND har tagit fram en miniminivå som uppfyller de grundläggande kraven för att en databeskrivning ska kunna publiceras i SND:s forskningsdataportal. Syftet med miniminivån är att säkerställa att forskningsdata som publiceras i katalogen har tillräcklig mängd metadata för att data ska vara sökbara, tillgängliga och åtkomliga, samt att vidare spridning av metadata ska vara möjlig. Att följa kraven på miniminivå för metadata är också ett viktigt steg i arbetet med att uppfylla FAIR-principerna [1], [2].

Fil:Metadatapyramid web.png
En beskrivning av SND:s tre metadatanivåer.

Miniminivån för metadata beskrivs i SND:s kravbeskrivningsdokument. Alla databeskrivningar som publiceras i SND:s portal ska omfattas av tillräckliga metadata enligt följande:

  1. Metadata som utgör en rimlig lägsta nivå för att data ska kunna hittas (lägsta nivå kan skilja sig mellan ämnesområden).
  2. Metadata som talar om var och hur data finns tillgängliga. Måste data beställas eller kan de laddas ner direkt från webbplatsen?
  3. Metadata som är obligatoriska i DataCite (alternativt kan mappas till DataCite:s obligatoriska krav) och som krävs för att data ska kunna tilldelas en Digital Object Identifier (DOI).
  4. Metadata som är obligatoriska eller centrala i relevanta metadatastandarder (t.ex. INSPIRE, DDI, META-SHARE) eller hos andra centrala aktörer (t.ex. Clarin, CESSDA).
  5. Metadata som är viktiga ur ett administrativt perspektiv för att kunna lokalisera ansvar och möjliggöra förmedling av data.

Miniminivån för metadata är uppdelad i två delar. Nivå 1 gäller gemensamma metadata för alla datatyper, oavsett ämnesområde, och nivå 2 gäller för ämnesspecifika metadata som inte används av samtliga ämnesområden. För närvarande finns det ämnesanpassade metadataprofiler för följande områden, varav tre redan är implementerade på Mitt SND:

  • Arkeologi och historia
  • Medicin och hälsovetenskap
  • Miljö-, klimat- och geovetenskaper *implementerad
  • Samhällsvetenskap *implementerad
  • Språkdata *implementerad

Det finns också möjlighet att använda en allmän metadataprofil som fortfarande uppfyller SND:s krav.

Allmänna och specifika metadataelement listas på sidan Metadataprofil tillsammans med definitioner (på svenska och engelska) och eventuella kommentarer. Genom att beskriva data i formuläret på Mitt SND kommer metadata direkt att finnas i ett strukturerat format i enlighet med SND:s metadataprofiler, och kan sedan fortsätta bearbetas på Mitt SND.

Kontroll av metadata för inkommande data

Minimikraven på metadata är bara ett första steg för att säkerställa att forskningsdata kan hittas och återanvändas. Vilka metadatafält som ska fyllas i och hur de ska fyllas i beror bl.a. på vilka typer av data som lämnas in och vilket ämnesområde de hör till. Överlämnarens önskemål om hur data ska förmedlas och vilken som är den tilltänkta målgruppen för data är också viktiga faktorer för vilka metadata som är lämpliga att ange.

OBS! Flikarna stämmer nu, men texten nedan behöver skrivas om! OBS!

Det finns några fält som man bör kontrollera extra noga när nya metadata skickas in via Mitt SND:

Flik: Tillgänglighet, ansvar & roller

  • Stämmer tillgänglighetsnivån med forskarens/överlämnarens behov och data? Det förekommer fall där det är tydligt att överlämnaren har valt fel tillgänglighetsnivå för data.
  • Har en lämplig ämnesprofil valts?
  • Fälten Data i studien innefattar personuppgifter och Data innefattar annan skyddsvärd information ska alltid kontrolleras. Om de inte stämmer bör överlämnaren kontaktas för mer information.
  • Finns det några restriktioner på data? T.ex. embargo eller citeringskrav.
  • Om datainnehållet pekar på att en etikprövning bör ha gjorts ska detta anges.

Flik: Allmän beskrivning

  • Databeskrivningen bör innehålla en beskrivning. Det kan vara värt att uppmuntra överlämnaren att skriva (eller klistra in) något kort om vad data handlar om.
  • Tidsperiod(er) som undersökts i förhållande till insamlingshändelse (under fliken Data, insamling & åtkomst). När tidsperioden som undersöktes (t.ex. bronsåldern i en arkeologisk utgrävning) inte är densamma som tidsperioden då data samlades in (dvs. själva utgrävningen) kan det hända att överlämnaren anger datainsamlingsperioderna i fältet "Tidsperiod(er) som undersökts". Detta kan göra det svårare för andra att hitta data.

Flik: Ämnesord och nyckelord

  • Här väljer forskaren vilket ämnesområde som datamaterialet tillhör.
  • Finns det några nyckelord som beskriver data? Forskaren kan välja nyckelord från kontrollerade vokabulär eller skapa egna.

Flik: Geografisk täckning

  • Under fältet som heter Geografiskt område kan forskaren välja ut ett eller flera geografiska platser som omfattas av datamaterialet.

Flik: Data, insamling & åtkomst

  • Titeln på ett dataset kan ofta skilja sig från "studiens" titel (dvs. huvudtiteln).
  • Finns det bara ett dataset så förväntas det att de flesta metadatafälten upprepas från andra flikar. Då kommer de flesta fält under den här fliken att vara tomma.
  • Däremot kan informationen på datasetsnivå vara mer specifik än den på studienivå om det finns fler än ett dataset.
  • Det är viktigt att skilja mellan insamlingshändelse och tidsperiod(er) som undersöktes. Oftast täcker båda fälten exakt samma tidsperiod, men det förekommer fall där de inte gör det (t.ex. historiska data, C14-analyser och arkeologiska undersökningar).

Flik: Publikationer

  • Citeringsinformation om publikationer som hör ihop med studien eller datasetet.

Flik: Språkresurser

  • Den här fliken syns endast om forskaren har valt ämnesprofilen som heter Språkresurser.

Flik: Dokumentationsfiler

  • Inga metadatafält här. Här laddas dokumentationsfilerna upp. Information om hur man behandlar dokumentationsfiler finns på sidan Dokumentation.