Åtgärder

Skillnad mellan versioner av "Kontroll av metadata"

Från DAU-handboken

m
 
(136 mellanliggande versioner av 10 användare visas inte)
Rad 1: Rad 1:
== Metadata i SND:s forskningsdatakatalog ==
'''(UPPDATERING PÅGÅR)'''


För att säkerställa att de externa krav och referensmodeller som SND har att förhålla sig till uppfylls, har SND tagit fram en mininivå av metadataelement som krävs för att en databeskrivning ska publiceras i SND:s katalog.
==Metadata i SND:s forskningsdatakatalog==


Syftet med denna miniminivå är att säkerställa att forskningsdata som publiceras i katalogen har tillräcklig mängd metadata för att data ska vara sökbara, tillgängliga och åtkomliga, samt att vidare spridning av metadata ska vara möjlig. Att följa kraven på miniminivå för metadata är också ett viktigt steg i arbetet med att uppfylla FAIR-principerna [https://www.force11.org/group/fairgroup/fairprinciples], [https://www.dtls.nl/fair-data/fair-principles-explained/], som i sin tur leder till att forskningsdata är framtidssäkrade genom att de blir lättare att finna, tillgängliga och åtkomliga samt möjliga att återanvända.
[[Checklista: kontroll av metadata|Checklista för att kontrollera metadata]]<br>
[[Fil:Metadatapyramid web.png|miniatyr|En beskrivning av SND:s tre metadatanivåer.]]
Miniminivån för metadata beskrivs i SND:s [https://bitbucket.org/swedishnationaldataservice/dau-handboken/downloads/SND_kravbeskrivning_v1_2018-05.28.pdf kravbeskrivningsdokument].


I SND:s formulär för att beskriva data är de fält som ingår i miniminivån markerade med en orange markering och dessa är obligatoriska innan databeskrivningen kan publiceras i SND:s katalog. För en överlämnare går det att skicka in en databeskrivning även om de markerade fälten inte är ifyllda, men i de här fallen behöver DAU fylla i den saknade informationen eller be inlämnaren om kompletteringar (innan databeskrivningen slutligen kan publiceras).
[[Checklista: kontroll av data|Checklista för att kontrollera data]]


Vilka fält som är obligatoriska (markerade i formuläret) skiljer mellan vilken metadataprofil som är vald. Miniminivån för metadata är består av två delar. Nivå 1 utgörs av den gemensamma miniminivån och består av ett antal element som är obligatoriska för alla databeskrivningar (oavsett valt ämnesprofil). Nivå 2 består av ämnesanpassade metadata som är obligatoriska utifrån vald ämnesprofil.  
SND har tagit fram en mininivå av metadataelement som krävs för att en databeskrivning ska publiceras i SND:s katalog.


Miniminivån för metadata är uppdelad i två delar. Nivå 1 gäller gemensamma metadata för alla datatyper, oavsett ämnesområde, och nivå 2 gäller för ämnesspecifika metadata som inte används av samtliga ämnesområden. För närvarande finns det ämnesanpassade metadataprofiler för följande områden, varav tre redan är implementerade [[Mitt SND]]:
Syftet med miniminivån är att säkerställa att forskningsdata som publiceras i katalogen har tillräcklig mängd metadata för att data ska vara sökbara, tillgängliga och åtkomliga, samt att vidare spridning av metadata ska vara möjlig. Att följa kraven på miniminivå för metadata är också ett viktigt steg i arbetet med att uppfylla [https://snd.gu.se/sv/hantera-data/fardigstalla-tillgangliggora/FAIR-principerna FAIR-principerna] [https://www.force11.org/group/fairgroup/fairprinciples], [https://www.dtls.nl/fair-data/fair-principles-explained/]. I [https://public.3.basecamp.com/p/MiDvvyv2umez8z2WAyCxQigh Kravbeskrivningen] finns mer information om syftet med miniminivån för metadata.
 
 
I formuläret som används för att beskriva data är de fält som ingår i miniminivån markerade med en orangeröd symbol. Dessa fält är obligatoriska innan en databeskrivning kan publiceras i SND:s forskningsdatakatalog. Forskare kan skicka in en databeskrivning även om det saknas information i obligatoriska fält, men i de här fallen behöver DAU fylla i den saknade informationen eller be om kompletteringar (innan databeskrivningen slutligen kan publiceras).
 
Vilka fält som är obligatoriska (markerade i formuläret) skiljer sig beroende på vilken metadataprofil som är vald. Miniminivån för metadata består dels av en gemensam del som gäller för alla databeskrivningar och dels av en ämnesanpassad del. Förutom de obligatoriska metadatafälten finns också ett antal valfria fält. 
 
[[Fil:Metadata.png|250px]]
 
För närvarande finns det ''ämnesanpassade metadataprofiler'' för följande områden implementerade i formuläret i [https://doris.snd.gu.se/ DORIS]:


* Arkeologi och historia
* Arkeologi och historia
* Medicin och hälsovetenskap
* Medicin och hälsovetenskap
* Miljö-, klimat- och geovetenskaper  
* Miljö-, klimat- och geovetenskaper  
* Naturvetenskap
* Samhällsvetenskap  
* Samhällsvetenskap  
* Språkdata
* Språkresurser
* Teknik
 
Det går också att väja en '''allmän profil''' för att beskriva data från övriga ämnesområden, och som också den uppfyller SND:s krav på metadata.


Det går också att använda en allmän metadataprofil som även den uppfyller SND:s krav och som ska fungera för alla övriga ämnesområden och för tvärvetenskapliga forskningsdata.  
Utöver ovan listade profiler finns också möjlighet för en organisation i SND-nätverket att välja till profilen '''[[Registrera data]]'''. Den här profilen innehåller en minimal uppsättning av metadataelement och uppfyller inte FAIR-principerna på samma sätt som övriga profiler. Data tilldelas en DOI i samband med publicering. För att kunna välja till den här profilen på organisationsnivå krävs att data lagras lokalt (då profilen inte uppfyller de SND:s TDR-certifiering).


De element som ingår i miniminivåerna (både de gemensamma och de ämnesspecifika) listas på sidan [[Metadataprofil|Metadataprofil]] tillsammans med definitioner (på svenska och engelska) och eventuella kommentarer. Genom att beskriva data i formuläret på Mitt SND kommer metadata direkt att finnas i ett strukturerat format i enlighet med SND:s metadataprofiler, och kan sedan fortsätta bearbetas på Mitt SND.
De metadataelement som är obligatoriska för alla databeskrivningar, oavsett ämnesprofil, listas på sidan [[Obligatoriska metadata]] tillsammans med definitioner (på svenska och engelska) och eventuella kommentarer.


== Kontroll av metadata för inkommande data ==
== Kontroll av metadata för inkommande data ==


Vilka metadatafält som ska fyllas i och hur de ska fyllas i beror bland annat på vilka typer av data som lämnas in och vilket ämnesområde de hör till. Överlämnarens önskemål om hur data ska förmedlas och vilken som är den tilltänkta målgruppen för data är också viktiga faktorer för vilka metadata som är lämpliga att ange.
Utgångsläget när man granskar metadata för en databeskrivning är att forskaren som skapat databeskrivningen är den som bäst kan beskriva data. Granskningen går därför till stor del ut på att se till att obligatoriska fält och att relevanta övriga/valfria fält är ifyllda. Och att den information som finns där verkar rimlig. Generellt kan sägas att SND-kontoret inte ”dubbelkollar” de ifyllda uppgifterna, men vi kontrollerar att den information som finns i varje fält är rimlig utifrån den dokumentation som har blivit medskickad. <br>
 
En del mindre ändringar i metadata kan vara enklast att göra själv som DAU-medarbetare, det kan t.ex. handla om att lägga till fler nyckelord. Medan en del andra fält är bättre om forskaren själv fyller i, t.ex. Beskrivning. Gör man ändringar som DAU är det bra att i samband med att man ber forskaren godkänna förhandsvisningen av katalogposten stämma av om de ändringar som gjorts.
 
Vilka metadatafält som ska fyllas i och hur de ska fyllas i beror bland annat på vilka typer av data som lämnas in och vilket ämnesområde de hör till.
 
==Checklista för kontroll av metadata==
 
Du hittar [[Checklista: kontroll av metadata]] här.
 
==Granskning i formuläret, avsnitt för avsnitt==
Här nedan listas ett urval av de fält som finns i formuläret, med en diskussion kring granskning av fältet. Fälten är indelade efter vilket avsnitt de ligger under i formuläret. Kom ihåg att vilka fält som syns i formuläret varierar med vald ämnesprofil.
 
'''Ämnesprofil'''<br>
Om en lämplig ämnesprofil valts visar sig oftast först efter vidare granskning. Det går att byta metadataprofil i formuläret även efter att beskrivningen är inskickad, men informationen i ämnesspecifika fält försvinner i samband med profilbytet.<br>
Det är inte nödvändigt att använda "rätt" ämnesprofil men det bidrar generellt till mer välbeskrivna data då metadata är anpassade efter de olika ämnesområdena.
 
=== Avsnitt 1. Filer och åtkomst ===
Här anges de data- och dokumentationsfiler som ska delas för datasetet. Om SND CARE används laddas filerna upp, om lokal lagring används gäller lokala rutiner för hur datafilerna anges.<br>
För data med begränsad åtkomst är det särskilt viktigt att dokumentationsfilerna anges på rätt ställe, då de ska vara öppet tillgängliga i katalogposten.
 
* '''Tillgång till SND eller via annan aktör'''<br>
Med ''Åtkomst till data via SND:s forskningsdatakatalog'' menas att data kan laddas ner eller beställas från SND:s forskningsdatakatalog, var data finns lagrade har ingen betydelse i det här sammanhanget.<br>
''Åtkomst till data via extern aktör'' meddelar att data kan laddas ner eller beställas från någon annan hemsida, portal, databas, etc. För den här åtkomstnivån tilldelas datasetet ingen DOI av DORIS, utan PID ska ha tilldelats datasetet på annat sätt (i enlighet med [https://doi.org/10.5281/zenodo.6351343 SND:s PID-policy]).
 
* '''Tillgänglighetsnivå'''<br>
Viktigt att kontrollera att vald [http://tillgänglighetsnivå https://snd.gu.se/sv/hitta-data/forskningsdatakatalogen/tillganglighetsnivaer-hos-snd tillgänglighetsnivå] stämmer överens med innehållet i data, avseende både [https://snd.gu.se/sv/hantera-data/planera/forskningsdata-med-personuppgifter personuppgifter] och annan skyddsvärd information. Om data t.ex. innehåller [https://snd.gu.se/sv/hantera-data/planera/forskningsdata-med-personuppgifter personuppgifter] som inte får delas öppet ska tillgänglighetsnivån vara ''Åtkomst till data är begränsad'', vilket innebär att en förfrågan måste göras innan data kan lämnas vidare. <br>
Tänk på att även om data inte kan vara direkt nedladdningsbara så bör dokumentationsfilerna vara det. Det är viktigt för någon som ska göra en förfrågan om ett material att de vet vad det är de frågar om.
 
* '''Licens''' och '''Upphovsrätt'''
Här är det viktigt att kontrollera så att informationen inte krockar med vald tillgänglighetsnivå, lärosätets eventuella lokala policys m.m.
 
* '''Data i studien innefattar personuppgifter''' och '''Data innefattar annan skyddsvärd information'''
Viktig att det är korrekt information som anges här och det krävs ofta både vidare granskning och en dialog med forskaren för att säkerställa detta.
 
=== Avsnitt 2. Citering och beskrivning ===
 
* '''Titel'''
Titel ska helst anges både på svenska och på engelska, men undantas från det generella kravet om tvåspråkighet då det kan vara svårt att ta fram en passande titel på svenska enbart för datapubliceringen. En svensk titel ökar sökbarheten i katalogen (svenska söket). Obligatoriskt är dock att ange titel på engelska, för internationell sökbarhet.<br>
Fältet för svensk titel går också med fördel att använda om det finns en titel på ett tredje språk.  


Vad som är en rimlig nivå av granskningen är upp till varje enskilt lärosäte att bedöma och sätta upp egna rutiner kring.  
* '''Skapare/primärforskare'''
Detta kan vara en eller flera person(er) eller organisation(er). Det är ganska sällan som det är både personer och organisationer som är skapare/primärforskare för ett dataset, det förekommer men det brukar vara antingen det ena eller andra. Att ange organisation istället för person är aktuellt i de fall det rör sig om ett större forskningsprojekt eller samarbete mellan flera forskargrupper, SOM-institutet anger t.ex. organisation som skapare för deras nationella undersökningar.<br>
De personer/organisationer som anges här syns i dataciteringen. <br>
Ange med fördel ORCID eller ROR ID. <br>
Om en forskare tillhör en organisation vars namn saknar officiell svensk översättning ska det engelska namnet upprepas som det svenska namnet istället för att lämna fältet tomt.


* '''Beskrivning'''
Detta är ett centralt fält för en databeskrivning. Det är genom den information som anges här som en användare på ett enkelt sätt kan få en överblick av vad det är för typ av data och i vilket sammanhang data har samlats in/förekommer.
Beskrivningen ska utformas så att potentiella återanvändare kan göra en snabb bedömning över om datasetet är tillräckligt intressant och relevant att undersöka vidare (t.ex läser tillhörande dokumentation, eller ladda ner).<br>
Det händer att en del forskare bara skriver en kort mening här, vilket inte är tillräckligt .<br>


==Granskning i formuläret, flik för flik==
Fältet är obligatoriskt både på svenska och på engelska. Däremot behöver inte texten vara identisk på båda språken och det går bra att ha en kortare text på t.ex. svenska med en hänvisning till den engelska katalogsidan för ytterligare information. Ett tips är att i första hand be forskaren att översätta beskrivningen - det tar ofta tid att översätta själv och kan vara svårt om det är ett för dig ovant forskningsområde.


Här nedan listas ett urval av de fält som finns i SND:s formulär för att beskriva data, med en diskussion kring granskning av fältet. Fälten är uppdelade efter vilken flik de ligger under i formuläret. Vilka fält som syns i formuläret varierar med vald ämnesprofil.
=== Avsnitt 3. Administrativ information ===
* '''Forskningshuvudman''' <br>
Det kan ibland vara svårt att veta vad som ska anges här, exempelvis om rör sig om ett samarbete mellan flera lärosäten eller om privata aktörer är inblandade. Vilka som är angivna som Skapare/primärforskare eller Medverkande kan ge en indikation på vilka organisationer som står bakom datamaterialet. Det är viktigt att ha en dialog med forskaren om man misstänker att huvudmannaskapet inte är självklart.<br>
Forskningshuvudman i det här fältet avser ''Organisation i vars verksamhet forskningen har utförts och som har det yttersta ansvaret för forskningen. Om flera forskningshuvudmän anges här den organisation som ansvarar för tillgängliggörande av data.'' <br>


=== Flik: Tillgänglighet, ansvar & roller ===
Det finns möjlighet att ange ytterligare forskningshuvudmän i fältet ''Övriga forskningshuvudmän''.<br>
* Stämmer '''tillgänglighetsnivån''' med forskarens/överlämnarens behov och data? Ibland händer det att det är tydligt att forskaren har valt fel tillgänglighetsnivå för data. Den här informationen behöver också kontrolleras i relation till fältet om personuppgifter lite längre ner. Om data innehåller personuppgifter bör den exempelvis inte vara direkt nerladdningsbar.


* Har en lämplig '''ämnesprofil''' valts? Svaret på den frågan kanske visare sig först efter vidare granskning. Kom ihåg att det enkelt går att byta metadataprofil i formuläret även efter att beskrivningen är inskickad.
'''Observera att vald forskningshuvudman inte går att ändra''' (detta beror bland annat att den valda huvudmannen avgör vilken lagringsyta som används för databeskrivningen och vilken DAU som ska anropas för granskning). Om fel huvudman är vald får man skapa en ny databeskrivning med rätt huvudman, eller kontakta SND-kontoret för att undersöka möjliga lösningar.


* Är rätt '''huvudman''' vald? Ett tecken på att huvudmannaskapet kan vara krångligt är om det exempelvis rör sig om ett samarbete mellan flera lärosäten eller om privata aktörer är inblandade. Vilka som är angivna som Skapare/primärforskare eller Medverkande kan ge en indikation på vilka organisationer som står bakom datamaterialet. I de fall en DAU-funktion med kopplad lagringsyta finns på plats går inte att ändra en vald huvudman i Mitt SND utan i detta måste då göras av SND manuellt (beror bland annat på att den valda huvudmannen avgör vilken lagringsyta som används för databeskrivningen).
=== Avsnitt 4. Insamling och metod ===


* Har forskaren angett rätt '''Skapare/primärforskare'''? Skaparen/primärforskaren kan vara en eller flera person(er) eller organisation(er). De personer/organisationer som anges här syns i dataciteringen.
* '''Tidsperiod(er) som undersökts'''  
Kan anges både som ett datum (ex. år, månad) eller en period (ex. bronsålder). Det är viktigt att vara observant på att ''Tidsperiod(er) som undersökts'' inte per automatik är samma som den ''tidsperiod då data samlades in'', exempelvis för en arkeologisk studie är tidsperioden som undersöks stenåldern medan tidsperiod som data samlas in är 2016-2017. Om överlämnaren har angett ett brett tidsspann (till – från), men sen bara undersökt några enstaka delar/tidpunkter av intervallet kan det vara bättre att ange tidsperioderna en och en, istället för ett intervall. Det ger bättre sökträffar i katalogen. Ex. tidsintervallet AA – ÖÖ är valt, men bara AA, EE och ÖÖ täcks av data. Det är då bättre att ange AA, EE, och ÖÖ som upprepade tidsperioder.


* Är ''Data i studien innefattar personuppgifter'' och ''Data innefattar annan skyddsvärd information'' ifyllda? Huruvida de här uppgifterna är korrekta kanske visar sig i ett senare skede när granskningen och mer ingående kontroller av data görs.
=== Avsnitt 5. Ämnesområde och nyckelord ===


* Finns det några '''restriktioner''' för hur data kan tillgängliggöras? T.ex. embargo eller citeringskrav. Har forskaren/överlämnaren angett något här är det viktigt att detta följa upp och att det förs en dialog om vad som är rimligt/möjligt utifrån olika aspekter (administrativa, juridiska mm.)
* '''Forskningsområde'''
Det är obligatoriskt att ange minst ett ''ämnesområde'' från SCB:s [http://Standard%20för%20svensk%20indelning%20av%20forskningsämnen Standard för svensk indelning av forskningsämnen]. Beroende på forskningsområde och vilken typ av data det är kan [https://www.cessda.eu CESSDA:s] eller [https://inspire.ec.europa.eu INSPIRE:s] klassificering också anges. CESSDA gäller främst samhällsvetenskaplig forskning, INSPIRE är att föredra om det handlar om [[spatiala data]].


=== Flik: Allmän beskrivning ===
* '''Nyckelord'''
I möjligaste mån bör nyckelord väljas från nån av de kontrollerade listorna. Saknas någon term är det möjligt att lägga in egna nyckelord som fritext. Det avancerade nyckelordssöket kan användas för att söka inom specifika ämnesområden och vokabulärer. Det går även att söka efter nyckelord i den engelska versionen av nyckelordslistorna, då det ibland saknas översättning till svenska för vissa termer.


* '''Titel''' ska helst anges både på svenska och engelska. Om en svensk titel saknas kan forskaren kontaktas för komplettering. Om översättning till  inte är lämplig är det bättre att ange den engelska titeln än att ”hitta på” en svensk titel. Fältet för svensk titel går också med fördel att använda om det finns en titel annat originalspråk.
[[Fil:DORIS 2.jpg|thumb|höger|Exempel nyckelordssök i SND:s formulär ]]


* För '''Beskrivning''' är det obligatoriskt att ange en information både på svenska och på engelska. Däremot behöver inte texten var identisk för de båda språken och det går bra att ha en kortare text på t.ex. svenska med en hänvisning till den engelska katalogsidan för ytterligare information. Beskrivningen är viktig för att en forskare som letar efter data ska förstå vad en studie handlar om få en bra överblick över vad datamaterialet innehåller. Se till att i första hand be forskaren att översätta beskrivningen - det tar ofta tid att översätta beskrivningen själv, speciellt om den är lång.
Vid granskning kan man hjälpa forskaren att komplettera nyckelorden. Nyckelord ökar sökbarheten för data i forskningsdatakatalogen. Det är obligatoriskt för en databeskrivning att innehålla minst ett nyckelord.
Följande nyckelordslistor finns i dag i SND:s system:
*:AAT [https://www.getty.edu/research/tools/vocabularies/aat/]: Art & Architecture Thesaurus Online.  


* Har forskaren fyllt i '''Tidsperiod(er) som undersökts''' på ett korrekt sätt? Det är viktigt att vara observant på att Tidsperiod(er) som undersökts (det kan gälla specifika år och månader, men det kan också gälla historiska tidsperioder såsom "bronsåldern") är inte per automatik är samma som den tidsperiod då data samlades in, men det kan mycket väl vara samma datum. Kontrollera att forskaren/överlämnaren inte angett insamlingsperioderna i fältet Tidsperiod(er) som undersökts.
*:ALLFO [https://finto.fi/yso/sv/]: Allmän finländsk ontologi. Trespråkig ontologi med bred täckning, kan mappas mot [https://finto.fi/yso/sv/ Library of congress] 
Om överlämnaren har angett ett brett tidsspann (till – från), men sen bara undersökt några enstaka delar/tidpunkter av intervallet kan det istället vara bättre att ange tidsperioderna en och en, istället för ett intervall. Det ger nämligen bättre sökträffar i katalogen. Ex. Tidsintervallet AA – ÖÖ är valt, men bara AA, EE och ÖÖ täcks av data. Det är då bättre att ange AA, EE, och ÖÖ som upprepade tidsperioder.


=== Flik: Ämnesord och nyckelord ===
*:EnvThes [http://vocabs.ceh.ac.uk/evn/tbl/envthes.evn]: Environmental Thesaurus, för långsiktig ekologisk forskning, övervakning och experiment.


* Det är obligatoriskt att ange minst ett '''ämnesområde''' från Standard för svensk indelning av forskningsämnen. Beroende på forskningsområde och vilken typ av data det är kan Cessdas eller INSPIRE:s klassificering också anges. Cessda gäller främst samhällsvetenskapliga data eller tvärvetenskapliga undersökningar där samhällsvetenskap berörs. INSPIRE är att föredra om det handlar om spatiala data.
*:ELLST [https://elsst.ukdataservice.ac.uk/]: European Language Social Science Thesaurus, en bred, flerspråkig tesaurus för samhällsvetenskaper.


* Forskaren/överlämnaren kan välja nyckelord från kontrollerade listor eller skapa egna nyckelord i de fall det saknas passande termer. DAU kan hjälpa forskaren att komplettera nyckelorden. Nyckelord ökar sökbarheten för data i forskningsdatakatalogen.
*:FISH Monument Types [http://www.heritage-standards.org.uk/fish-vocabularies/]: Terminology relating to the built and buried heritage.  
Det kan vara bra att känna till att nyckelordsöket i dagsläget inte fungerar optimalt. Exempelvis söker det bara i det språk som formuläret visas på (svenska/engelska). Vissa nyckelordlistor är inte fullständigt översatta och det kan därför vara värt att testa att byta språk (framförallt till engelska) och göra nya sökningar på engelska termer om det är svårt att få bra träffar på den svenska sidan.
För varje term visas till höger vilken nyckelordlista de tillhör. Om möjligt är det bra att välja termer från nyckelordlistor som är relevanta för det ämnesområde data täcker.
Följande nyckelordslistor finns i dag i SND:s system:
EnvThes: Envrionmental Tesaurus, för långsiktig ekologisk forskning, övervakning och experiment.
ELLST: European Language Social Science Thesaurus, en bred, flerspråkig tesaurus för samhällsvetenskaper.
MeSH: Medical Subject Headings och är en kontrollerad vokabulär inom livsvetenskaperna
GEMET: General Multilingual Environmental Thesaurus
GCMD: Global Change Master Directory, en kontrollerad vokabulär för “Earth science data”


*:MeSH [https://www.nlm.nih.gov/mesh/meshhome.html]: Medical Subject Headings och är en kontrollerad vokabulär inom livsvetenskaperna.


=== Flik: Geografisk täckning ===
*:NASA Thesaurus [https://www.sti.nasa.gov/nasa-thesaurus/] Omfattar alla områden inom teknik och fysik, rymdvetenskap, geovetenskap och biologisk vetenskap.


* Här finns möjlighet att ange vilket geografiskt område som data täcker. Det finns även möjlighet att lägga till en fritextbeskrivning.  
*:ICD-10 [http://icd.internetmedicin.se/]: Internationell statistisk klassifikation av sjukdomar och relaterade hälsoproblem – systematisk förteckning. Kontrollerad lista för sjukdomsklassifikation.
* Att använda Bounding Box-funktionen är att rekommendera om data täcker ett tydligt avgränsat område då databeskrivningen kommer synas i kartsöket i katalogen och illustreras på karta i katalogposten. Man kan skapa bounding box genom att ange koordinater eller genom att rita direkt på kartan.


=== Flik: Data, insamling & åtkomst ===
*:GEMET [https://www.eionet.europa.eu/gemet/en/about/]: General Multilingual Environmental Thesaurus


* Har databeskrivningen bara ett dataset kan titeln för datasetet vara densamma som för den övergripande databeskrivningen. Däremot om det finns flera dataset är det viktigt att de ha unika titlar så att enkelt kan skiljas åt (det kan dock räcka med olika årtal i titeln ex. Lufttemperatur i Göteborg 2018 och Lufttemperatur i Göteborg 2019).
*:GCMD [https://earthdata.nasa.gov/about/gcmd/global-change-master-directory-gcmd-keywords]: Global Change Master Directory, en kontrollerad vokabulär för “Earth science data”
* Har överlämnaren laddat upp flera olika filpaket där data beskriver olika saker, kan det vara en idé att fundera på om det skulle vara bra presentera materialet med olika dataset. (Ex. I en undersökning har data samlats in från två olika platser och är dokumenterade i olika datafiler. Detta kan visas under en gemensam databeskrivning men med två dataset -en per plats).
* Det är viktigt att skilja mellan insamlingshändelse och tidsperiod(er) som undersöktes. Oftast täcker båda fälten exakt samma tidsperiod, men det förekommer fall där de inte gör det (t.ex. historiska data, C14-analyser och arkeologiska undersökningar).
* Återigen: Det är viktigt att skilja mellan period för datainsamling och tidsperiod(er) som undersöktes. Oftast täcker båda fälten samma tidsperiod, men det förekommer fall där de inte gör det (t.ex. historiska data, C14-analyser och arkeologiska undersökningar).
* För fälten Licens och Upphovsrätt är det viktigt att kontrollera så att informationen här inte krockar med vald tillgänglighetsnivå.


=== Flik: Publikationer ===
=== Avsnitt 6. Geografisk täckning ===
* Här är möjligt att koppla publikationer till data. Det är informationen i citeringsfältet som kommer att synas i katalogen, så det är en fördel om eventuell DOI finns med i citeringen.  
Ger genom ett antal olika metadatafält möjlighet att ange vilket geografiskt område som data täcker. Att ange geografiskt område från den valbara listan eller genom att markera området/platsen på kartan blir databeskrivningen sökbar i kartsöket i forskningsdatakatalogen, och området/platsen illustreras med en karta i katalogposten.  
* Många forskare lämnar in en databeskrivning i samband med publicering av en artikel. Det är viktigt att hålla kontakt med forskaren för att se till att artikeln läggs till databeskrivningen. Just nu finns det ingen möjlighet för varken forskare eller DAU att uppdatera metadata efter en databeskrivning publiceras,utom man får kontakta SND om uppdateringar på publicerade data och metadata behövs. Denna begränsning kommer att åtgärdas inom en snar framtid.
Det finns även möjlighet att lägga till en fritextbeskrivning om den geografiska beskrivningen.


=== Flik: Språkresurser ===
=== Avsnitt 7. Publikationer och relationer ===
* Den här fliken syns endast om forskaren har valt ämnesprofilen som heter ''Språkresurser''.
Här är möjligt att koppla '''publikationer''' till data. Det är informationen i citeringsfältet som kommer att synas i katalogen, så det är en fördel om eventuell DOI finns med i referensen.  


=== Flik: Dokumentationsfiler ===
Många forskare tillgängliggör data i samband med publicering av en artikel. I de här fallen är det särskilt viktigt att artikeln kopplas till databeskrivningen. Dessutom bor en kopia av artikeln sparas, även om forskningsartikeln publiceras Open Access.


* Inga metadatafält här. Här laddas dokumentationsfilerna upp. Information om hur man behandlar dokumentationsfiler finns på sidan [[Dokumentation]].
=== Avsnitt 8: Språkresurser ===
Det här avsnittet syns endast om forskaren har valt ämnesprofilen som heter '''Språkresurser'''. <br>
''Mer information om granskning av dessa metadata kommer.''

Nuvarande version från 22 maj 2024 kl. 13.59

(UPPDATERING PÅGÅR)

Metadata i SND:s forskningsdatakatalog

Checklista för att kontrollera metadata

Checklista för att kontrollera data

SND har tagit fram en mininivå av metadataelement som krävs för att en databeskrivning ska publiceras i SND:s katalog.

Syftet med miniminivån är att säkerställa att forskningsdata som publiceras i katalogen har tillräcklig mängd metadata för att data ska vara sökbara, tillgängliga och åtkomliga, samt att vidare spridning av metadata ska vara möjlig. Att följa kraven på miniminivå för metadata är också ett viktigt steg i arbetet med att uppfylla FAIR-principerna [1], [2]. I Kravbeskrivningen finns mer information om syftet med miniminivån för metadata.


I formuläret som används för att beskriva data är de fält som ingår i miniminivån markerade med en orangeröd symbol. Dessa fält är obligatoriska innan en databeskrivning kan publiceras i SND:s forskningsdatakatalog. Forskare kan skicka in en databeskrivning även om det saknas information i obligatoriska fält, men i de här fallen behöver DAU fylla i den saknade informationen eller be om kompletteringar (innan databeskrivningen slutligen kan publiceras).

Vilka fält som är obligatoriska (markerade i formuläret) skiljer sig beroende på vilken metadataprofil som är vald. Miniminivån för metadata består dels av en gemensam del som gäller för alla databeskrivningar och dels av en ämnesanpassad del. Förutom de obligatoriska metadatafälten finns också ett antal valfria fält.

Metadata.png

För närvarande finns det ämnesanpassade metadataprofiler för följande områden implementerade i formuläret i DORIS:

  • Arkeologi och historia
  • Medicin och hälsovetenskap
  • Miljö-, klimat- och geovetenskaper
  • Naturvetenskap
  • Samhällsvetenskap
  • Språkresurser
  • Teknik

Det går också att väja en allmän profil för att beskriva data från övriga ämnesområden, och som också den uppfyller SND:s krav på metadata.

Utöver ovan listade profiler finns också möjlighet för en organisation i SND-nätverket att välja till profilen Registrera data. Den här profilen innehåller en minimal uppsättning av metadataelement och uppfyller inte FAIR-principerna på samma sätt som övriga profiler. Data tilldelas en DOI i samband med publicering. För att kunna välja till den här profilen på organisationsnivå krävs att data lagras lokalt (då profilen inte uppfyller de SND:s TDR-certifiering).

De metadataelement som är obligatoriska för alla databeskrivningar, oavsett ämnesprofil, listas på sidan Obligatoriska metadata tillsammans med definitioner (på svenska och engelska) och eventuella kommentarer.

Kontroll av metadata för inkommande data

Utgångsläget när man granskar metadata för en databeskrivning är att forskaren som skapat databeskrivningen är den som bäst kan beskriva data. Granskningen går därför till stor del ut på att se till att obligatoriska fält och att relevanta övriga/valfria fält är ifyllda. Och att den information som finns där verkar rimlig. Generellt kan sägas att SND-kontoret inte ”dubbelkollar” de ifyllda uppgifterna, men vi kontrollerar att den information som finns i varje fält är rimlig utifrån den dokumentation som har blivit medskickad.

En del mindre ändringar i metadata kan vara enklast att göra själv som DAU-medarbetare, det kan t.ex. handla om att lägga till fler nyckelord. Medan en del andra fält är bättre om forskaren själv fyller i, t.ex. Beskrivning. Gör man ändringar som DAU är det bra att i samband med att man ber forskaren godkänna förhandsvisningen av katalogposten stämma av om de ändringar som gjorts.

Vilka metadatafält som ska fyllas i och hur de ska fyllas i beror bland annat på vilka typer av data som lämnas in och vilket ämnesområde de hör till.

Checklista för kontroll av metadata

Du hittar Checklista: kontroll av metadata här.

Granskning i formuläret, avsnitt för avsnitt

Här nedan listas ett urval av de fält som finns i formuläret, med en diskussion kring granskning av fältet. Fälten är indelade efter vilket avsnitt de ligger under i formuläret. Kom ihåg att vilka fält som syns i formuläret varierar med vald ämnesprofil.

Ämnesprofil
Om en lämplig ämnesprofil valts visar sig oftast först efter vidare granskning. Det går att byta metadataprofil i formuläret även efter att beskrivningen är inskickad, men informationen i ämnesspecifika fält försvinner i samband med profilbytet.
Det är inte nödvändigt att använda "rätt" ämnesprofil men det bidrar generellt till mer välbeskrivna data då metadata är anpassade efter de olika ämnesområdena.

Avsnitt 1. Filer och åtkomst

Här anges de data- och dokumentationsfiler som ska delas för datasetet. Om SND CARE används laddas filerna upp, om lokal lagring används gäller lokala rutiner för hur datafilerna anges.
För data med begränsad åtkomst är det särskilt viktigt att dokumentationsfilerna anges på rätt ställe, då de ska vara öppet tillgängliga i katalogposten.

  • Tillgång till SND eller via annan aktör

Med Åtkomst till data via SND:s forskningsdatakatalog menas att data kan laddas ner eller beställas från SND:s forskningsdatakatalog, var data finns lagrade har ingen betydelse i det här sammanhanget.
Åtkomst till data via extern aktör meddelar att data kan laddas ner eller beställas från någon annan hemsida, portal, databas, etc. För den här åtkomstnivån tilldelas datasetet ingen DOI av DORIS, utan PID ska ha tilldelats datasetet på annat sätt (i enlighet med SND:s PID-policy).

  • Tillgänglighetsnivå

Viktigt att kontrollera att vald https://snd.gu.se/sv/hitta-data/forskningsdatakatalogen/tillganglighetsnivaer-hos-snd tillgänglighetsnivå stämmer överens med innehållet i data, avseende både personuppgifter och annan skyddsvärd information. Om data t.ex. innehåller personuppgifter som inte får delas öppet ska tillgänglighetsnivån vara Åtkomst till data är begränsad, vilket innebär att en förfrågan måste göras innan data kan lämnas vidare.
Tänk på att även om data inte kan vara direkt nedladdningsbara så bör dokumentationsfilerna vara det. Det är viktigt för någon som ska göra en förfrågan om ett material att de vet vad det är de frågar om.

  • Licens och Upphovsrätt

Här är det viktigt att kontrollera så att informationen inte krockar med vald tillgänglighetsnivå, lärosätets eventuella lokala policys m.m.

  • Data i studien innefattar personuppgifter och Data innefattar annan skyddsvärd information

Viktig att det är korrekt information som anges här och det krävs ofta både vidare granskning och en dialog med forskaren för att säkerställa detta.

Avsnitt 2. Citering och beskrivning

  • Titel

Titel ska helst anges både på svenska och på engelska, men undantas från det generella kravet om tvåspråkighet då det kan vara svårt att ta fram en passande titel på svenska enbart för datapubliceringen. En svensk titel ökar sökbarheten i katalogen (svenska söket). Obligatoriskt är dock att ange titel på engelska, för internationell sökbarhet.
Fältet för svensk titel går också med fördel att använda om det finns en titel på ett tredje språk.

  • Skapare/primärforskare

Detta kan vara en eller flera person(er) eller organisation(er). Det är ganska sällan som det är både personer och organisationer som är skapare/primärforskare för ett dataset, det förekommer men det brukar vara antingen det ena eller andra. Att ange organisation istället för person är aktuellt i de fall det rör sig om ett större forskningsprojekt eller samarbete mellan flera forskargrupper, SOM-institutet anger t.ex. organisation som skapare för deras nationella undersökningar.
De personer/organisationer som anges här syns i dataciteringen.
Ange med fördel ORCID eller ROR ID.
Om en forskare tillhör en organisation vars namn saknar officiell svensk översättning ska det engelska namnet upprepas som det svenska namnet istället för att lämna fältet tomt.

  • Beskrivning

Detta är ett centralt fält för en databeskrivning. Det är genom den information som anges här som en användare på ett enkelt sätt kan få en överblick av vad det är för typ av data och i vilket sammanhang data har samlats in/förekommer. Beskrivningen ska utformas så att potentiella återanvändare kan göra en snabb bedömning över om datasetet är tillräckligt intressant och relevant att undersöka vidare (t.ex läser tillhörande dokumentation, eller ladda ner).
Det händer att en del forskare bara skriver en kort mening här, vilket inte är tillräckligt .

Fältet är obligatoriskt både på svenska och på engelska. Däremot behöver inte texten vara identisk på båda språken och det går bra att ha en kortare text på t.ex. svenska med en hänvisning till den engelska katalogsidan för ytterligare information. Ett tips är att i första hand be forskaren att översätta beskrivningen - det tar ofta tid att översätta själv och kan vara svårt om det är ett för dig ovant forskningsområde.

Avsnitt 3. Administrativ information

  • Forskningshuvudman

Det kan ibland vara svårt att veta vad som ska anges här, exempelvis om rör sig om ett samarbete mellan flera lärosäten eller om privata aktörer är inblandade. Vilka som är angivna som Skapare/primärforskare eller Medverkande kan ge en indikation på vilka organisationer som står bakom datamaterialet. Det är viktigt att ha en dialog med forskaren om man misstänker att huvudmannaskapet inte är självklart.
Forskningshuvudman i det här fältet avser Organisation i vars verksamhet forskningen har utförts och som har det yttersta ansvaret för forskningen. Om flera forskningshuvudmän anges här den organisation som ansvarar för tillgängliggörande av data.

Det finns möjlighet att ange ytterligare forskningshuvudmän i fältet Övriga forskningshuvudmän.

Observera att vald forskningshuvudman inte går att ändra (detta beror bland annat på att den valda huvudmannen avgör vilken lagringsyta som används för databeskrivningen och vilken DAU som ska anropas för granskning). Om fel huvudman är vald får man skapa en ny databeskrivning med rätt huvudman, eller kontakta SND-kontoret för att undersöka möjliga lösningar.

Avsnitt 4. Insamling och metod

  • Tidsperiod(er) som undersökts

Kan anges både som ett datum (ex. år, månad) eller en period (ex. bronsålder). Det är viktigt att vara observant på att Tidsperiod(er) som undersökts inte per automatik är samma som den tidsperiod då data samlades in, exempelvis för en arkeologisk studie är tidsperioden som undersöks stenåldern medan tidsperiod som data samlas in är 2016-2017. Om överlämnaren har angett ett brett tidsspann (till – från), men sen bara undersökt några enstaka delar/tidpunkter av intervallet kan det vara bättre att ange tidsperioderna en och en, istället för ett intervall. Det ger bättre sökträffar i katalogen. Ex. tidsintervallet AA – ÖÖ är valt, men bara AA, EE och ÖÖ täcks av data. Det är då bättre att ange AA, EE, och ÖÖ som upprepade tidsperioder.

Avsnitt 5. Ämnesområde och nyckelord

  • Forskningsområde

Det är obligatoriskt att ange minst ett ämnesområde från SCB:s Standard för svensk indelning av forskningsämnen. Beroende på forskningsområde och vilken typ av data det är kan CESSDA:s eller INSPIRE:s klassificering också anges. CESSDA gäller främst samhällsvetenskaplig forskning, INSPIRE är att föredra om det handlar om spatiala data.

  • Nyckelord

I möjligaste mån bör nyckelord väljas från nån av de kontrollerade listorna. Saknas någon term är det möjligt att lägga in egna nyckelord som fritext. Det avancerade nyckelordssöket kan användas för att söka inom specifika ämnesområden och vokabulärer. Det går även att söka efter nyckelord i den engelska versionen av nyckelordslistorna, då det ibland saknas översättning till svenska för vissa termer.

Exempel på nyckelordssök i SND:s formulär

Vid granskning kan man hjälpa forskaren att komplettera nyckelorden. Nyckelord ökar sökbarheten för data i forskningsdatakatalogen. Det är obligatoriskt för en databeskrivning att innehålla minst ett nyckelord.

Följande nyckelordslistor finns i dag i SND:s system:

  • AAT [3]: Art & Architecture Thesaurus Online.
  • ALLFO [4]: Allmän finländsk ontologi. Trespråkig ontologi med bred täckning, kan mappas mot Library of congress
  • EnvThes [5]: Environmental Thesaurus, för långsiktig ekologisk forskning, övervakning och experiment.
  • ELLST [6]: European Language Social Science Thesaurus, en bred, flerspråkig tesaurus för samhällsvetenskaper.
  • FISH Monument Types [7]: Terminology relating to the built and buried heritage.
  • MeSH [8]: Medical Subject Headings och är en kontrollerad vokabulär inom livsvetenskaperna.
  • NASA Thesaurus [9] Omfattar alla områden inom teknik och fysik, rymdvetenskap, geovetenskap och biologisk vetenskap.
  • ICD-10 [10]: Internationell statistisk klassifikation av sjukdomar och relaterade hälsoproblem – systematisk förteckning. Kontrollerad lista för sjukdomsklassifikation.
  • GEMET [11]: General Multilingual Environmental Thesaurus
  • GCMD [12]: Global Change Master Directory, en kontrollerad vokabulär för “Earth science data”

Avsnitt 6. Geografisk täckning

Ger genom ett antal olika metadatafält möjlighet att ange vilket geografiskt område som data täcker. Att ange geografiskt område från den valbara listan eller genom att markera området/platsen på kartan blir databeskrivningen sökbar i kartsöket i forskningsdatakatalogen, och området/platsen illustreras med en karta i katalogposten. Det finns även möjlighet att lägga till en fritextbeskrivning om den geografiska beskrivningen.

Avsnitt 7. Publikationer och relationer

Här är möjligt att koppla publikationer till data. Det är informationen i citeringsfältet som kommer att synas i katalogen, så det är en fördel om eventuell DOI finns med i referensen.

Många forskare tillgängliggör data i samband med publicering av en artikel. I de här fallen är det särskilt viktigt att artikeln kopplas till databeskrivningen. Dessutom bor en kopia av artikeln sparas, även om forskningsartikeln publiceras Open Access.

Avsnitt 8: Språkresurser

Det här avsnittet syns endast om forskaren har valt ämnesprofilen som heter Språkresurser.
Mer information om granskning av dessa metadata kommer.