Åtgärder

Skillnad mellan versioner av "Checklista: kontroll av data"

Från DAU-handboken

Rad 1: Rad 1:
<style type="text/css">
### Checklista för kontroll av data
.tg  {border-collapse:collapse;border-spacing:0;}
 
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
Den här checklistan är en kortfattad översikt över vad man behöver kontrollera för att säkerställa att data uppfyller minimikrav för SND:s katalog. Utförligare beskrivning finns på sidan[Kontroll av inkommande data](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data).
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
 
.tg .tg-0pky{border-color:inherit;text-align:left;vertical-align:top}
| Aktiviteter | Checklista |
.tg .tg-0lax{text-align:left;vertical-align:top}
| --- | --- |
</style>
|
<table class="tg">
1. **1.**** Säkerställ att originalversionen av data finns sparad på en säker lagringsyta**
  <tr>
|
    <th class="tg-0pky"></th>
-
    <th class="tg-0pky"></th>
❏❏Originaldata ligger på lärosätets lagringsyta1
    <th class="tg-0pky"></th>
-
    <th class="tg-0pky"></th>
❏❏Originaldata ligger avskilt från bearbetade2 versioner
    <th class="tg-0pky"></th>
_Har data kommit till DAU på något annat sätt (t.ex. på en extern hårddisk)?_ Se till att data laddas upp till lärosätets lagringsyta. |
  </tr>
|
  <tr>
1. **2.**** Gör viruskontroll**
    <td class="tg-0pky">Aktiviteter</td>
|
    <td class="tg-0pky">Checklista</td>
- ❏❏Levererade filer innehåller inte virus
    <td class="tg-0pky"></td>
_Misstänker du att leveransen innehåller virus?_ Kontakta din IT-avdelning. |
    <td class="tg-0pky"></td>
| **Läs igenom metadata och titta på eventuell dokumentation innan du går vidare.** Att använda metadata och dokumentation som referens kan vara till stor hjälp medan du fortsätter att granska inkomna data. |
    <td class="tg-0pky"></td>
|
  </tr>
1. **3.**** Kontrollera att leveransen är komplett**
  <tr>
_Information om vilka filer som ska ingå i leveransen går att hitta i metadatafälten (t.ex. Beskrivning) eller i dokumentationen (t.ex. Bifogad artikel)._ |
    <td class="tg-0pky">Säkerställ att originalversionen av data finns sparad på en säker lagringsyta</td>
- ❏❏Alla nödvändiga filer finns
    <td class="tg-0pky">Originaldata ligger på lärosätets lagringsytaOriginaldata ligger avskilt från bearbetadeversionerHar data kommit till DAU på något annat sätt (t.ex. på en extern hårddisk)?Se till att data laddas upp till lärosätets lagringsyta.</td>
 
    <td class="tg-0pky"></td>
_Misstänker du att det saknas filer?_ Kontakta forskaren. |
    <td class="tg-0pky"></td>
|
    <td class="tg-0pky"></td>
1. **4.**** Kontrollera läsbarheten för datafiler**
  </tr>
|
  <tr>
- ❏❏Filerna går att öppna
    <td class="tg-0pky">Gör viruskontroll</td>
  -
    <td class="tg-0pky">Levererade filer innehåller inte virusMisstänker du att leveransen innehåller virus?Kontakta din IT-avdelning.</td>
❏❏Ett urval av filerna går att öppna3
    <td class="tg-0pky"></td>
  - ❏❏Alla olika filformat kan öppnas
    <td class="tg-0pky"></td>
_Går filerna inte att öppna?_ Kontrollera att du använder rätt mjukvara. Har du inte tillgång till mjukvaran kan du be forskaren om icke-licencerade alternativ. Har du rätt mjukvara med filerna går ändå inte att öppna? Kontakta forskaren. |
    <td class="tg-0pky"></td>
|
  </tr>
1. **5.**** Kontrollera filformat**
  <tr>
   |
    <td class="tg-0lax">Läs igenom metadata och titta på eventuell dokumentation innan du går vidare.Att använda metadata och dokumentation som referens kan vara till stor hjälp medan du fortsätter att granska inkomna data.</td>
- ❏❏Filerna är i ett lämpligt format för återanvändning och tillgängliggörande
    <td class="tg-0lax"></td>
_Är filformaten inte lämpliga för återanvändning och/eller tillgängliggörande?_Konvertera filerna till ett mer lämpligt format.Om du är osäker på vilket format filerna bör vara i kan du ta hjälp av SND:s guide för [rekommenderade filformat](https://snd.gu.se/sv/hantera-data/guider/filformat). Läs även [avsnittet om filformat i DAU-handboken](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#filformat). |
    <td class="tg-0lax"></td>
|
    <td class="tg-0lax"></td>
1. **6.**** Kontrollera filnamn och mappstruktur**
    <td class="tg-0lax"></td>
|
  </tr>
-
  <tr>
❏❏Filer har logiska filnamn4
    <td class="tg-0lax">Kontrollera att leveransen är komplettInformation om vilka filer som ska ingå i leveransen går att hitta i metadatafälten (t.ex. Beskrivning) eller i dokumentationen (t.ex. Bifogad artikel).</td>
 
    <td class="tg-0lax">Alla nödvändiga filer finnsMisstänker du att det saknas filer?Kontakta forskaren.</td>
  - ❏❏Det går att avgöra vilka filer som hör ihop eller har samma typ av innehåll
    <td class="tg-0lax"></td>
  - ❏❏Filnamnen dokumenteras via readme-fil, artikel, separat fillista, eller på något annan sätt.
    <td class="tg-0lax"></td>
- ❏❏Mappstrukturen är logisk och går att navigera
    <td class="tg-0lax"></td>
   |
  </tr>
|
  <tr>
1. **7.**** Kontrollera att det finns tillräcklig dokumentation**
    <td class="tg-0lax">Kontrollera läsbarheten för datafiler</td>
  |
    <td class="tg-0lax">Filerna går att öppnaEtt urval av filerna går att öppnaAlla olika filformat kan öppnasGår filerna inte att öppna?Kontrollera att du använder rätt mjukvara. Har du inte tillgång till mjukvaran kan du be forskaren om icke-licencerade alternativ. Har du rätt mjukvara med filerna går ändå inte att öppna? Kontakta forskaren.</td>
-
    <td class="tg-0lax"></td>
❏❏Dokumentationen är tillräcklig för att data ska kunna förstås och återanv5ändas
    <td class="tg-0lax"></td>
|
    <td class="tg-0lax"></td>
 
  </tr>
1
   <tr>
 
    <td class="tg-0lax">Kontrollera filformat</td>
#
    <td class="tg-0lax">Filerna är i ett lämpligt format för återanvändning och tillgängliggörandeÄr filformaten inte lämpliga för återanvändning och/eller tillgängliggörande?Konvertera filerna till ett mer lämpligt format.Om du är osäker på vilket format filerna bör vara i kan du ta hjälp av SND:s guide förrekommenderade filformat. Läs ävenavsnittet om filformat i DAU-handboken.</td>
Lärosätets lagringsyta - En lagringsyta avsedd för långtidslagring och publicering av forskningsdata. Ett exempel kan vara en SUNET-yta som lärosätet hyr ut.
    <td class="tg-0lax"></td>
 
    <td class="tg-0lax"></td>
2
    <td class="tg-0lax"></td>
 
  </tr>
#
  <tr>
Med bearbetning menas att data på något sätt förändras från versionen som först lämnades av forskaren för publicering. Exempel på bearbetning kan vara: byte av filnamn, konvertering till andra (t.ex. arkivbeständiga) filformat, redigering av innehållet.
    <td class="tg-0lax">Kontrollera filnamn och mappstruktur</td>
 
    <td class="tg-0lax">Filer har logiska filnamnDet går att avgöra vilka filer som hör ihop eller har samma typ av innehållFilnamnen dokumenteras via readme-fil, artikel, separat fillista, eller på något annan sätt.Mappstrukturen är logisk och går att navigera</td>
3
    <td class="tg-0lax"></td>
 
    <td class="tg-0lax"></td>
#
    <td class="tg-0lax"></td>
Om det rör sig om väldigt många datafiler kan det anses som en orimligt stor arbetsmängd att öppna alla. Det kan då istället vara aktuellt att öppna ett urval av filerna och att välja filer av alla de olika filformaten.
   </tr>
 
  <tr>
4
    <td class="tg-0lax">Kontrollera att det finns tillräcklig dokumentation</td>
 
    <td class="tg-0lax">Dokumentationen är tillräcklig för att data ska kunna förstås och återanvändas</td>
#
    <td class="tg-0lax"></td>
Exempel på logiska filnamn: (1) Ett dataset med tusen bilder där varje bild har ett sekventiellt namn (img001, img002) och varje namn är dokumenterat i ett separat csv-fil. (2) Ett dataset med tusen csv-filer där varje filnamn innehåller kodad information (analysis\_PhLevels\_point1; analysis\_PhLevels\_point2; analysis\_CO2Levels\_point1; osv.), och där kodningen förklaras i ett separat textfil eller går att förstå genom att läsa artikeln. (3) Dataset som innehåller en csv-fil, en pdf-fil och en bild, där alla filer har ett förklarande namn (t.ex.: medieval\_farmstead\_database.csv, historical\_text\_scan.pdf, historical\_map\_1352.tif)
    <td class="tg-0lax"></td>
 
    <td class="tg-0lax"></td>
5
  </tr>
 
</table>
#
Läs [https://dhb.snd.gu.se/wiki/Kontroll\_av\_inkommande\_data#dokumentation](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#dokumentation) för exempel på hur dokumention kan se ut beroende på datatyp.

Versionen från 24 oktober 2019 kl. 11.23

      1. Checklista för kontroll av data

Den här checklistan är en kortfattad översikt över vad man behöver kontrollera för att säkerställa att data uppfyller minimikrav för SND:s katalog. Utförligare beskrivning finns på sidan[Kontroll av inkommande data](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data).

| Aktiviteter | Checklista | | --- | --- | | 1. **1.**** Säkerställ att originalversionen av data finns sparad på en säker lagringsyta**

|

- ❏❏Originaldata ligger på lärosätets lagringsyta1 - ❏❏Originaldata ligger avskilt från bearbetade2 versioner

_Har data kommit till DAU  på något annat sätt (t.ex. på en extern hårddisk)?_ Se till att data laddas upp till lärosätets lagringsyta. |

| 1. **2.**** Gör viruskontroll**

|

- ❏❏Levererade filer innehåller inte virus

_Misstänker du att leveransen innehåller virus?_ Kontakta din IT-avdelning. |

| **Läs igenom metadata och titta på eventuell dokumentation innan du går vidare.** Att använda metadata och dokumentation som referens kan vara till stor hjälp medan du fortsätter att granska inkomna data. | | 1. **3.**** Kontrollera att leveransen är komplett** _Information om vilka filer som ska ingå i leveransen går att hitta i metadatafälten (t.ex. Beskrivning) eller i dokumentationen (t.ex. Bifogad artikel)._ | - ❏❏Alla nödvändiga filer finns

_Misstänker du att det saknas filer?_ Kontakta forskaren. | | 1. **4.**** Kontrollera läsbarheten för datafiler**

|

- ❏❏Filerna går att öppna

 -

❏❏Ett urval av filerna går att öppna3

 - ❏❏Alla olika filformat kan öppnas
_Går filerna inte att öppna?_ Kontrollera att du använder rätt mjukvara. Har du inte tillgång till mjukvaran kan du be forskaren om icke-licencerade alternativ. Har du rätt mjukvara med filerna går ändå inte att öppna? Kontakta forskaren. |

| 1. **5.**** Kontrollera filformat**

 |

- ❏❏Filerna är i ett lämpligt format för återanvändning och tillgängliggörande

_Är filformaten inte lämpliga för återanvändning och/eller tillgängliggörande?_Konvertera filerna till ett mer lämpligt format.Om du är osäker på vilket format filerna bör vara i kan du ta hjälp av SND:s guide för [rekommenderade filformat](https://snd.gu.se/sv/hantera-data/guider/filformat). Läs även [avsnittet om filformat i DAU-handboken](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#filformat). |

| 1. **6.**** Kontrollera filnamn och mappstruktur**

|

- ❏❏Filer har logiska filnamn4

 - ❏❏Det går att avgöra vilka filer som hör ihop eller har samma typ av innehåll
 - ❏❏Filnamnen dokumenteras via readme-fil, artikel, separat fillista, eller på något annan sätt.

- ❏❏Mappstrukturen är logisk och går att navigera

 |

| 1. **7.**** Kontrollera att det finns tillräcklig dokumentation**

 |

- ❏❏Dokumentationen är tillräcklig för att data ska kunna förstås och återanv5ändas

|

1

Lärosätets lagringsyta - En lagringsyta avsedd för långtidslagring och publicering av forskningsdata. Ett exempel kan vara en SUNET-yta som lärosätet hyr ut.

2

Med bearbetning menas att data på något sätt förändras från versionen som först lämnades av forskaren för publicering. Exempel på bearbetning kan vara: byte av filnamn, konvertering till andra (t.ex. arkivbeständiga) filformat, redigering av innehållet.

3

Om det rör sig om väldigt många datafiler kan det anses som en orimligt stor arbetsmängd att öppna alla. Det kan då istället vara aktuellt att öppna ett urval av filerna och att välja filer av alla de olika filformaten.

4

Exempel på logiska filnamn: (1) Ett dataset med tusen bilder där varje bild har ett sekventiellt namn (img001, img002) och varje namn är dokumenterat i ett separat csv-fil. (2) Ett dataset med tusen csv-filer där varje filnamn innehåller kodad information (analysis\_PhLevels\_point1; analysis\_PhLevels\_point2; analysis\_CO2Levels\_point1; osv.), och där kodningen förklaras i ett separat textfil eller går att förstå genom att läsa artikeln. (3) Dataset som innehåller en csv-fil, en pdf-fil och en bild, där alla filer har ett förklarande namn (t.ex.: medieval\_farmstead\_database.csv, historical\_text\_scan.pdf, historical\_map\_1352.tif)

5

Läs [1](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#dokumentation) för exempel på hur dokumention kan se ut beroende på datatyp.