Åtgärder

Kontroll av metadata

Från DAU-handboken

Version från den 4 oktober 2018 kl. 11.29 av 10.240.145.11 (diskussion) (Skapade sidan med '== Metadata på SND:s metadatakatalog == Det krävs ett antal metadataelement för att beskriva forsknings-data på ett slags miniminivå som räcker för publicering i SND:s...')
(skillnad) ← Äldre version | Nuvarande version (skillnad) | Nyare version → (skillnad)

Metadata på SND:s metadatakatalog

Det krävs ett antal metadataelement för att beskriva forsknings-data på ett slags miniminivå som räcker för publicering i SND:s forskningsdataportal. Syftet med denna miniminivå är att forskningsdata som publiceras i metadatakatalogen ska vara sökbara, tillgängliga och åtkomliga, samt att vidare spridning av metadata ska vara möjlig. Att följa kraven på miniminivå för metadata är också ett viktigt steg i arbetet med att uppfylla FAIR-principerna 1, 2.

Miniminivån på metadata beskrivs i SND:s kravbeskrivningsdokument, och säkerställer att de databeskrivningar som publiceras i SND:s portal innefattar tillräckliga metadata enligt följande kriterier:


# Metadata som utgör en rimlig lägsta nivå för att data ska kunna hittas (lägsta nivå kan skilja sig mellan ämnesområden).
# Metadata som talar om var och hur data finns tillgängliga.
# Metadata som är obligatoriska i DataCite (alternativt kan mappas till DataCite:s obligatoriska krav) och som möjliggör att data kan tilldelas en Digital Object Identifier (DOI).
# Metadata som är obligatoriska eller centrala i relevanta metadatastandarder (t.ex. INSPIRE, META-SHARE, Data Docu-mentation Initiative) eller hos andra centrala aktörer (t.ex. Clarin, CESSDA).
# Metadata som är viktiga ur ett administrativt perspektiv för att kunna lokalisera ansvar och möjliggöra förmedling av data.

Miniminivån för metadata är uppdelad i två delar, gemensamma metadata och ämnesanpassade metadata. Miniminivån för gemensamma metadata gäller för alla typer av data, oavsett ämnesområde, medan ämnesspecifika metadata är anpassade efter ämnesområde. För närvarande finns ämnes-anpassade metadataprofiler för följande områden, varav två är redan implementerade på Mitt SND:

  • Arkeologi
  • Medicin och hälsovetenskap
  • Miljö-, klimat- och geovetenskaper *implementerad
  • Samhällsvetenskap
  • Språkdata *implementerad

Det finns också möjlighet att använda en allmän metadataprofil som fortfarande uppfyller SND:s krav.

Allmänna och specifika metadataelement listas på sidan Metadataprofil tillsammans med definitioner (svenska och engelska) och eventuella kommentarer. Genom att beskriva data i formuläret på Mitt SND, som följer SND:s metadataprofil, kommer metadata direkt att finnas i ett strukturerat format som kan sedan bearbetas på Mitt SND.

Kontroll av metadata på inkommande data

Minimikraven på metadata är bara ett första steg för att göra att forskningsdata ska kunna hittas och återanvändas. Vilka metadatafält ska fyllas i och hur beror bl.a. på vilka typer av data som lämnas in och vilket ämnesområde de hör till. Överlämnarens önskemål spelar på hur data ska förmedlas och vilken som är den 'designated community' för data är också viktiga.

Det finns några fält som man bör kolla extra noga när ny metadata skickas in via Mitt SND:

Flik: Obligatorisk information

  • Stämmer tillgänglighetsnivån med forskarens/överlämnarens behov och data? T.ex., det förekomma fall där det är tydligt att överlämnaren väljer fel tillgänglighetsnivå för data.
  • Har en lämplig metadataprofil valts?
  • Finns det några restriktioner på data? T.ex. embargo, citeringskrav, osv.

Flik: Administrativa uppgiften

  • Om datainnehållet pekar på att etikprövning behövdes ska etikprövningsnämnden anges.

Flik: Studiebeskrivning

  • Det är alltid bra att ha ett syfte eller en sammanfattning. Det kan vara värt att uppmuntra överlämnaren att skriva (eller klistra in) något kort om vad data handlar om.
  • Fälten Land eller geografisk plats gör det mycket lättare att filtrera bort data som är irrelevant när man söker.
  • Fälten Studien kopplad till biobank och Data i studien innefattar personuppgifter - dessa fält ska alltid kollas. Stämmer de inte så bör överlämnaren kontaktas för mer information.
  • Tidsperioder som undersökts vs. insamlingshändelse (under fliken datainsamling). När tidsperioden som undersöktes (t.ex. bronsåldern i en arkeologisk utgrävning) är inte samma som tidsperioden där data samlades in (dvs själva utgrävningen) kan det hända att överlämnaren anger datainsamlingsperioderna i fältet 'tidsperiod som undersöks). Detta kan göra data svårare att hitta av andra.

Flik: Dokument

  • Inga metadatafält här. Information om hur man behandlas dokumentation finns på sidan Dokumentation

Flik: Ämnesord och nyckelord

  • Finns det några nyckelord som beskriver data? Nyckelord är inte ett krav men gör att data blir mycket mer sökbart. Det kan vara värt att skapa några nyckelord från titeln, syftet eller sammanfattningen, eller till och med genom att läsa bifogade dokument (om de finns). Man kan välja nyckelord från kontrollerade vokabulär, men man kan också skapa egna.

Flik: Dataset

  • Titel på dataset kan ofta skilja sig från 'studiens' titel (dvs huvudtiteln).
  • Finns det bara en dataset så förväntas det att de mesta metadatafälten upprepas från andra flikar. DÅ kommer de flesta fälten vara tomma under den här fliken.
  • Däremot kan informationen på datasetnivå vara mer specifik än den på studienivå om det finns fler än ett dataset.

Flik: Datainsamling

  • Det är viktigt att skilja mellan insamlingshändelse och tidsperioden som undersöktes. Oftast täcker bode fält exakt samma tidsperiod, men det förekommer fall där de inte gör det (t.ex. historiska data, C14 analyser, och arkeologiska undersökningar)