Åtgärder

Checklista: kontroll av data

Från DAU-handboken

Checklista för kontroll av data

Den här checklistan är en kortfattad översikt över vad man behöver kontrollera för att säkerställa att data uppfyller minimikrav för SND:s katalog. Utförligare beskrivning finns på sidan [[Kontroll av inkommande data]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data).

+-----------------------------------+-----------------------------------+ | Aktiviteter | Checklista | +-----------------------------------+-----------------------------------+ | 1. **Säkerställ att | - Originaldata ligger på | | originalversionen av data | lärosätets lagringsyta[^6] | | finns sparad på en säker | | | lagringsyta** | - Originaldata ligger avskilt | | | från bearbetade[^7] versioner | | | | | | *Har data kommit till DAU på | | | något annat sätt (t.ex. på en | | | extern hårddisk)?* | | | | | | Se till att data laddas upp till | | | lärosätets lagringsyta. | +-----------------------------------+-----------------------------------+ | 2. **Gör viruskontroll** | - Levererade filer innehåller | | | inte virus | | | | | | *Misstänker du att leveransen | | | innehåller virus?* | | | | | | Kontakta din IT-avdelning. | +-----------------------------------+-----------------------------------+ | > **Läs igenom metadata och titta | | | > på eventuell dokumentation | | | > innan du går vidare.** | | | > | | | > Att använda metadata och | | | > dokumentation som referens kan | | | > vara till stor hjälp medan du | | | > fortsätter att granska inkomna | | | > data. | | +-----------------------------------+-----------------------------------+ | 3. **Kontrollera att leveransen | - Alla nödvändiga filer finns | | är komplett** | | | | *\ | | *Information om vilka filer som | Misstänker du att det saknas | | ska ingå i leveransen går att | filer?* | | hitta i metadatafälten (t.ex. | | | Beskrivning) eller i | Kontakta forskaren. | | dokumentationen (t.ex. Bifogad | | | artikel).* | | +-----------------------------------+-----------------------------------+ | 4. **Kontrollera läsbarheten för | - Filerna går att öppna | | datafiler** | | | | - Ett urval av filerna går | | | att öppna[^8] | | | | | | - Alla olika filformat kan | | | öppnas | | | | | | *Går filerna inte att öppna?* | | | | | | Kontrollera att du använder rätt | | | mjukvara. Har du inte tillgång | | | till mjukvaran kan du be | | | forskaren om icke-licencerade | | | alternativ. Har du rätt mjukvara | | | med filerna går ändå inte att | | | öppna? Kontakta forskaren. | +-----------------------------------+-----------------------------------+ | 5. **Kontrollera filformat** | - Filerna är i ett lämpligt | | | format för återanvändning och | | | tillgängliggörande | | | | | | *Är filformaten inte lämpliga för | | | återanvändning och/eller | | | tillgängliggörande?* | | | | | | Konvertera filerna till ett mer | | | lämpligt format. | | | | | | Om du är osäker på vilket format | | | filerna bör vara i kan du ta | | | hjälp av SND:s guide för | | | [[rekommenderade | | | filformat]{.underline}](https://s | | | nd.gu.se/sv/hantera-data/guider/f | | | ilformat). | | | Läs även [[avsnittet om filformat | | | i | | | DAU-handboken]{.underline}](https | | | ://dhb.snd.gu.se/wiki/Kontroll_av | | | _inkommande_data#filformat). | +-----------------------------------+-----------------------------------+ | 6. **Kontrollera filnamn och | - Filer har logiska filnamn[^9] | | mappstruktur** | | | | - Det går att avgöra vilka | | | filer som hör ihop eller | | | har samma typ av innehåll | | | | | | - Filnamnen dokumenteras | | | via readme-fil, artikel, | | | separat fillista, eller | | | på något annan sätt. | | | | | | - Mappstrukturen är logisk och | | | går att navigera | +-----------------------------------+-----------------------------------+ | 7. **Kontrollera att det finns | - Dokumentationen är | | tillräcklig dokumentation** | tillräcklig för att data ska | | | kunna förstås och | | | återanv[^10]ändas | +-----------------------------------+-----------------------------------+

[^1]: Lärosätets lagringsyta - En lagringsyta avsedd för långtidslagring

   och publicering av forskningsdata. Ett exempel kan vara en SUNET-yta
   som lärosätet hyr ut.

[^2]: Med bearbetning menas att data på något sätt förändras från

   versionen som först lämnades av forskaren för publicering. Exempel
   på bearbetning kan vara: byte av filnamn, konvertering till andra
   (t.ex. arkivbeständiga) filformat, redigering av innehållet.

[^3]: Om det rör sig om väldigt många datafiler kan det anses som en

   orimligt stor arbetsmängd att öppna alla. Det kan då istället vara
   aktuellt att öppna ett urval av filerna och att välja filer av alla
   de olika filformaten.

[^4]: Exempel på logiska filnamn: (1) Ett dataset med tusen bilder där

   varje bild har ett sekventiellt namn (img001, img002) och varje namn
   är dokumenterat i ett separat csv-fil. (2) Ett dataset med tusen
   csv-filer där varje filnamn innehåller kodad information
   (analysis\_PhLevels\_point1; analysis\_PhLevels\_point2;
   analysis\_CO2Levels\_point1; osv.), och där kodningen förklaras i
   ett separat textfil eller går att förstå genom att läsa artikeln.
   (3) Dataset som innehåller en csv-fil, en pdf-fil och en bild, där
   alla filer har ett förklarande namn (t.ex.:
   medieval\_farmstead\_database.csv, historical\_text\_scan.pdf,
   historical\_map\_1352.tif)

[^5]: Läs

   [[1]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#dokumentation)
   för exempel på hur dokumention kan se ut beroende på datatyp.

[^6]: Lärosätets lagringsyta - En lagringsyta avsedd för långtidslagring

   och publicering av forskningsdata. Ett exempel kan vara en SUNET-yta
   som lärosätet hyr ut.

[^7]: Med bearbetning menas att data på något sätt förändras från

   versionen som först lämnades av forskaren för publicering. Exempel
   på bearbetning kan vara: byte av filnamn, konvertering till andra
   (t.ex. arkivbeständiga) filformat, redigering av innehållet.

[^8]: Om det rör sig om väldigt många datafiler kan det anses som en

   orimligt stor arbetsmängd att öppna alla. Det kan då istället vara
   aktuellt att öppna ett urval av filerna och att välja filer av alla
   de olika filformaten.

[^9]: Exempel på logiska filnamn: (1) Ett dataset med tusen bilder där

   varje bild har ett sekventiellt namn (img001, img002) och varje namn
   är dokumenterat i ett separat csv-fil. (2) Ett dataset med tusen
   csv-filer där varje filnamn innehåller kodad information
   (analysis\_PhLevels\_point1; analysis\_PhLevels\_point2;
   analysis\_CO2Levels\_point1; osv.), och där kodningen förklaras i
   ett separat textfil eller går att förstå genom att läsa artikeln.
   (3) Dataset som innehåller en csv-fil, en pdf-fil och en bild, där
   alla filer har ett förklarande namn (t.ex.:
   medieval\_farmstead\_database.csv, historical\_text\_scan.pdf,
   historical\_map\_1352.tif)

[^10]: Läs

   [[2]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#dokumentation)
   för exempel på hur dokumention kan se ut beroende på datatyp.