Kontroll av metadata
Från DAU-handboken
Metadata i SND:s forskningsdatakatalog
För att säkerställa att de externa krav och referensmodeller som SND har att förhålla sig till uppfylls, har SND tagit fram en mininivå av metadataelement som krävs för att en databeskrivning ska publiceras i SND:s katalog.
Syftet med denna miniminivå är att säkerställa att forskningsdata som publiceras i katalogen har tillräcklig mängd metadata för att data ska vara sökbara, tillgängliga och åtkomliga, samt att vidare spridning av metadata ska vara möjlig. Att följa kraven på miniminivå för metadata är också ett viktigt steg i arbetet med att uppfylla FAIR-principerna [1], [2], som i sin tur leder till att forskningsdata är framtidssäkrade genom att de blir lättare att finna, tillgängliga och åtkomliga samt möjliga att återanvända.
Miniminivån för metadata beskrivs i SND:s kravbeskrivningsdokument.
I SND:s formulär för att beskriva data är de fält som ingår i miniminivån markerade med en orange markering och dessa är obligatoriska innan databeskrivningen kan publiceras i SND:s katalog. För en överlämnare går det att skicka in en databeskrivning även om de markerade fälten inte är ifyllda, men i de här fallen behöver DAU fylla i den saknade informationen eller be inlämnaren om kompletteringar (innan databeskrivningen slutligen kan publiceras).
Vilka fält som är obligatoriska (markerade i formuläret) skiljer mellan vilken metadataprofil som är vald. Miniminivån för metadata är består av två delar. Nivå 1 utgörs av den gemensamma miniminivån och består av ett antal element som är obligatoriska för alla databeskrivningar (oavsett valt ämnesprofil). Nivå 2 består av ämnesanpassade metadata som är obligatoriska utifrån vald ämnesprofil.
Miniminivån för metadata är uppdelad i två delar. Nivå 1 gäller gemensamma metadata för alla datatyper, oavsett ämnesområde, och nivå 2 gäller för ämnesspecifika metadata som inte används av samtliga ämnesområden. För närvarande finns det ämnesanpassade metadataprofiler för följande områden, varav tre redan är implementerade på Mitt SND:
- Arkeologi och historia
- Medicin och hälsovetenskap
- Miljö-, klimat- och geovetenskaper *implementerad
- Samhällsvetenskap *implementerad
- Språkdata *implementerad
Det finns även möjlighet att använda en allmän metadataprofil som också den uppfyller SND:s krav och som ska fungera för alla övriga ämnesområden och tvärvetenskaplig forskning.
Allmänna och specifika metadataelement listas på sidan Metadataprofil tillsammans med definitioner (på svenska och engelska) och eventuella kommentarer. Genom att beskriva data i formuläret på Mitt SND kommer metadata direkt att finnas i ett strukturerat format i enlighet med SND:s metadataprofiler, och kan sedan fortsätta bearbetas på Mitt SND.
Kontroll av metadata för inkommande data
Vilka metadatafält som ska fyllas i och hur de ska fyllas i beror bland annat på vilka typer av data som lämnas in och vilket ämnesområde de hör till. Överlämnarens önskemål om hur data ska förmedlas och vilken som är den tilltänkta målgruppen för data är också viktiga faktorer för vilka metadata som är lämpliga att ange.
OBS! Flikarna stämmer nu, men texten nedan behöver skrivas om! OBS!
Det finns några fält som man bör kontrollera extra noga när nya metadata skickas in via Mitt SND:
Flik: Tillgänglighet, ansvar & roller
- Tillgänglighetsnivå för data: Stämmer tillgänglighetsnivån med forskarens/överlämnarens behov och data? Det förekommer fall där det är tydligt att forskaren har valt fel tillgänglighetsnivå för data. Om 'Åtkomst till data via extern aktör' så ska DAU:en se till att datamaterialet går att få tag i. Är data markerade som fritt tillgängliga eller fritt tillgängliga via beställning ska
- Har en lämplig ämnesprofil valts?
- Har forskaren angett rätt huvudman och Skapare/primärforskare? Skaparen/Primärforskaren kan vara en organisation, men det kan inte både finnas en eller flera personer som är Skapare/primärforskare och en eller flera organisationer som är Skapare/primärforskare för samma datamaterial. Forkaren ska antingen ange person(er) som Skapare/primärforskare eller organisation(er).
- ÄrData i studien innefattar personuppgifter och Data innefattar annan skyddsvärd information korrekt ifyllda?
- Finns det några restriktioner för hur data kan tillgängliggöras? T.ex. embargo eller citeringskrav.
- Har en forskningsetisk prövning gjorts?
Flik: Allmän beskrivning
- Har forskaren skrivit en beskrivning av datamaterialet? Beskrivningen är viktig för att en forskare som letar efter data ska förstå vad en studie handlar om.
- Har forskaren fyllt i Tidsperiod(er) som undersökts på ett korrekt sätt? Tidsperioden som har undersöktes (det kan gälla specifika år och månader, men det kan också gälla historiska tidsperioder såsom "bronsåldern") inte är densamma som tidsperioden då data samlades in. Kontrollera att forskaren inte anger datainsamlingsperioderna i fältet "Tidsperiod(er) som undersökts".
Flik: Ämnesord och nyckelord
- Har forskaren valt vilket ämnesområde som datamaterialet tillhör?
- Finns det några nyckelord som beskriver data? Forskaren kan välja nyckelord från kontrollerade vokabulär eller skapa egna. DAU kan hjälpa forskaren att komplettera nyckelorden. Nyckelorden gör att datamaterialet är lättare att söka fram i forskningsdatakatalogen.
Flik: Geografisk täckning
- Har forskaren angettt vilket/vilka geografiska områden som omfattas av datamaterialet? Under fältet som heter Geografiskt område kan forskaren välja ut ett eller flera geografiska platser som omfattas av datamaterialet.
Flik: Data, insamling & åtkomst
- Har forskaren angett en titel på varje dataset? Titeln på ett dataset kan ofta skilja sig från "studiens" titel (dvs. huvudtiteln).
- Finns det bara ett dataset så förväntas det att de flesta metadatafälten upprepas från andra flikar. Då kommer de flesta fält under den här fliken att vara tomma.
- Däremot kan informationen på datasetsnivå vara mer specifik än den på studienivå om det finns fler än ett dataset.
- Det är viktigt att skilja mellan insamlingshändelse och tidsperiod(er) som undersöktes. Oftast täcker båda fälten exakt samma tidsperiod, men det förekommer fall där de inte gör det (t.ex. historiska data, C14-analyser och arkeologiska undersökningar).
Flik: Publikationer
- Citeringsinformation om publikationer som hör ihop med studien eller datasetet.
Flik: Språkresurser
- Den här fliken syns endast om forskaren har valt ämnesprofilen som heter Språkresurser.
Flik: Dokumentationsfiler
- Inga metadatafält här. Här laddas dokumentationsfilerna upp. Information om hur man behandlar dokumentationsfiler finns på sidan Dokumentation.