Åtgärder

Skillnad mellan versioner av "Checklista: kontroll av data"

Från DAU-handboken

 
(30 mellanliggande versioner av en annan användare visas inte)
Rad 1: Rad 1:
Checklista för kontroll av data
Den här checklistan är en kortfattad översikt över vad man behöver kontrollera för att säkerställa att data uppfyller minimikrav för SND:s katalog. Utförligare beskrivning finns på sidan [https://dhb.snd.gu.se/wiki/Kontroll_av_inkommen_databeskrivning <span class="underline">Kontroll av inkommen databeskrivning</span>]. [https://dhb.snd.gu.se/w/images/f/f3/Checklista_f%C3%B6r_kontroll_av_metadata_och_data.pdf Ladda ner checklistan i pdf-format].


Den här checklistan är en kortfattad översikt över vad man behöver
kontrollera för att säkerställa att data uppfyller minimikrav för SND:s
katalog. Utförligare beskrivning finns på sidan [[Kontroll av inkommande
data]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data).


+-----------------------------------+-----------------------------------+
| Aktiviteter                      | Checklista                        |
+-----------------------------------+-----------------------------------+
| 1.  **Säkerställ att              | -  Originaldata ligger på        |
|    originalversionen av data    |    lärosätets lagringsyta[^6]    |
|    finns sparad på en säker      |                                  |
|    lagringsyta**                | -  Originaldata ligger avskilt  |
|                                  |    från bearbetade[^7] versioner |
|                                  |                                  |
|                                  | *Har data kommit till DAU på      |
|                                  | något annat sätt (t.ex. på en    |
|                                  | extern hårddisk)?*                |
|                                  |                                  |
|                                  | Se till att data laddas upp till  |
|                                  | lärosätets lagringsyta.          |
+-----------------------------------+-----------------------------------+
| 2.  **Gör viruskontroll**        | -  Levererade filer innehåller  |
|                                  |    inte virus                    |
|                                  |                                  |
|                                  | *Misstänker du att leveransen    |
|                                  | innehåller virus?*                |
|                                  |                                  |
|                                  | Kontakta din IT-avdelning.        |
+-----------------------------------+-----------------------------------+
| > **Läs igenom metadata och titta |                                  |
| > på eventuell dokumentation      |                                  |
| > innan du går vidare.**          |                                  |
| >                                |                                  |
| > Att använda metadata och        |                                  |
| > dokumentation som referens kan  |                                  |
| > vara till stor hjälp medan du  |                                  |
| > fortsätter att granska inkomna  |                                  |
| > data.                          |                                  |
+-----------------------------------+-----------------------------------+
| 3.  **Kontrollera att leveransen  | -  Alla nödvändiga filer finns  |
|    är komplett**                |                                  |
|                                  | *\                                |
| *Information om vilka filer som  | Misstänker du att det saknas      |
| ska ingå i leveransen går att    | filer?*                          |
| hitta i metadatafälten (t.ex.    |                                  |
| Beskrivning) eller i              | Kontakta forskaren.              |
| dokumentationen (t.ex. Bifogad    |                                  |
| artikel).*                        |                                  |
+-----------------------------------+-----------------------------------+
| 4.  **Kontrollera läsbarheten för | -  Filerna går att öppna        |
|    datafiler**                  |                                  |
|                                  |    -  Ett urval av filerna går  |
|                                  |        att öppna[^8]            |
|                                  |                                  |
|                                  |    -  Alla olika filformat kan  |
|                                  |        öppnas                    |
|                                  |                                  |
|                                  | *Går filerna inte att öppna?*    |
|                                  |                                  |
|                                  | Kontrollera att du använder rätt  |
|                                  | mjukvara. Har du inte tillgång    |
|                                  | till mjukvaran kan du be          |
|                                  | forskaren om icke-licencerade    |
|                                  | alternativ. Har du rätt mjukvara  |
|                                  | med filerna går ändå inte att    |
|                                  | öppna? Kontakta forskaren.        |
+-----------------------------------+-----------------------------------+
| 5.  **Kontrollera filformat**    | -  Filerna är i ett lämpligt    |
|                                  |    format för återanvändning och |
|                                  |    tillgängliggörande            |
|                                  |                                  |
|                                  | *Är filformaten inte lämpliga för |
|                                  | återanvändning och/eller          |
|                                  | tillgängliggörande?*              |
|                                  |                                  |
|                                  | Konvertera filerna till ett mer  |
|                                  | lämpligt format.                  |
|                                  |                                  |
|                                  | Om du är osäker på vilket format  |
|                                  | filerna bör vara i kan du ta      |
|                                  | hjälp av SND:s guide för          |
|                                  | [[rekommenderade                  |
|                                  | filformat]{.underline}](https://s |
|                                  | nd.gu.se/sv/hantera-data/guider/f |
|                                  | ilformat).                        |
|                                  | Läs även [[avsnittet om filformat |
|                                  | i                                |
|                                  | DAU-handboken]{.underline}](https |
|                                  | ://dhb.snd.gu.se/wiki/Kontroll_av |
|                                  | _inkommande_data#filformat).      |
+-----------------------------------+-----------------------------------+
| 6.  **Kontrollera filnamn och    | -  Filer har logiska filnamn[^9] |
|    mappstruktur**                |                                  |
|                                  |    -  Det går att avgöra vilka  |
|                                  |        filer som hör ihop eller  |
|                                  |        har samma typ av innehåll |
|                                  |                                  |
|                                  |    -  Filnamnen dokumenteras    |
|                                  |        via readme-fil, artikel,  |
|                                  |        separat fillista, eller  |
|                                  |        på något annan sätt.      |
|                                  |                                  |
|                                  | -  Mappstrukturen är logisk och  |
|                                  |    går att navigera              |
+-----------------------------------+-----------------------------------+
| 7.  **Kontrollera att det finns  | -  Dokumentationen är            |
|    tillräcklig dokumentation**  |    tillräcklig för att data ska  |
|                                  |    kunna förstås och            |
|                                  |    återanv[^10]ändas            |
+-----------------------------------+-----------------------------------+


[^1]: Lärosätets lagringsyta - En lagringsyta avsedd för långtidslagring
    och publicering av forskningsdata. Ett exempel kan vara en SUNET-yta
    som lärosätet hyr ut.


[^2]: Med bearbetning menas att data på något sätt förändras från
{|class="wikitable" style="width: 75%; margin: auto;" border="1"
    versionen som först lämnades av forskaren för publicering. Exempel
| Aktiviteter
    bearbetning kan vara: byte av filnamn, konvertering till andra
| Checklista
    (t.ex. arkivbeständiga) filformat, redigering av innehållet.
|-
|
# '''Säkerställ att originalversionen av data finns sparad en säker lagringsyta'''
|
* Originaldata ligger lärosätets lagringsyta
* Originaldata ligger avskilt från bearbetade versioner


[^3]: Om det rör sig om väldigt många datafiler kan det anses som en
''Har data kommit till DAU på något annat sätt (t.ex. på en extern hårddisk)?''
    orimligt stor arbetsmängd att öppna alla. Det kan då istället vara
    aktuellt att öppna ett urval av filerna och att välja filer av alla
    de olika filformaten.


[^4]: Exempel på logiska filnamn: (1) Ett dataset med tusen bilder där
Se till att data laddas upp till lärosätets lagringsyta.
    varje bild har ett sekventiellt namn (img001, img002) och varje namn
|-
    är dokumenterat i ett separat csv-fil. (2) Ett dataset med tusen
|
    csv-filer där varje filnamn innehåller kodad information
<ol start="2" style="list-style-type: decimal;">
    (analysis\_PhLevels\_point1; analysis\_PhLevels\_point2;
<li><p>'''Gör viruskontroll'''</p></li></ol>
    analysis\_CO2Levels\_point1; osv.), och där kodningen förklaras i
|
    ett separat textfil eller går att förstå genom att läsa artikeln.
* Levererade filer innehåller inte virus
    (3) Dataset som innehåller en csv-fil, en pdf-fil och en bild, där
    alla filer har ett förklarande namn (t.ex.:
    medieval\_farmstead\_database.csv, historical\_text\_scan.pdf,
    historical\_map\_1352.tif)


[^5]: Läs
''Misstänker du att leveransen innehåller virus?''
    [[https://dhb.snd.gu.se/wiki/Kontroll\_av\_inkommande\_data\#dokumentation]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#dokumentation)
    för exempel på hur dokumention kan se ut beroende på datatyp.


[^6]: Lärosätets lagringsyta - En lagringsyta avsedd för långtidslagring
Kontakta din IT-avdelning.
    och publicering av forskningsdata. Ett exempel kan vara en SUNET-yta
|-
    som lärosätet hyr ut.
|colspan="2" style="text-align:center;"| <blockquote>'''Läs igenom metadata och titta på eventuell dokumentation innan du går vidare.'''


[^7]: Med bearbetning menas att data på något sätt förändras från
Att använda metadata och dokumentation som referens kan vara till stor hjälp medan du fortsätter att granska inkomna data.
    versionen som först lämnades av forskaren för publicering. Exempel
</blockquote>
    på bearbetning kan vara: byte av filnamn, konvertering till andra
|-
    (t.ex. arkivbeständiga) filformat, redigering av innehållet.
|
<ol start="3" style="list-style-type: decimal;">
<li><p>'''Kontrollera att leveransen är komplett'''</p></li></ol>


[^8]: Om det rör sig om väldigt många datafiler kan det anses som en
''Information om vilka filer som ska ingå i leveransen går att hitta i metadatafälten (t.ex. Beskrivning) eller i dokumentationen (t.ex. Bifogad artikel).''
    orimligt stor arbetsmängd att öppna alla. Det kan då istället vara
|
    aktuellt att öppna ett urval av filerna och att välja filer av alla
* Alla nödvändiga filer finns
    de olika filformaten.


[^9]: Exempel på logiska filnamn: (1) Ett dataset med tusen bilder där
''Misstänker du att det saknas filer?''
    varje bild har ett sekventiellt namn (img001, img002) och varje namn
    är dokumenterat i ett separat csv-fil. (2) Ett dataset med tusen
    csv-filer där varje filnamn innehåller kodad information
    (analysis\_PhLevels\_point1; analysis\_PhLevels\_point2;
    analysis\_CO2Levels\_point1; osv.), och där kodningen förklaras i
    ett separat textfil eller går att förstå genom att läsa artikeln.
    (3) Dataset som innehåller en csv-fil, en pdf-fil och en bild, där
    alla filer har ett förklarande namn (t.ex.:
    medieval\_farmstead\_database.csv, historical\_text\_scan.pdf,
    historical\_map\_1352.tif)


[^10]: Läs
Kontakta forskaren.
    [[https://dhb.snd.gu.se/wiki/Kontroll\_av\_inkommande\_data\#dokumentation]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#dokumentation)
|-
    för exempel på hur dokumention kan se ut beroende på datatyp.
|
<ol start="4" style="list-style-type: decimal;">
<li><p>'''Kontrollera läsbarheten för datafiler'''</p></li></ol>
|
* Filerna går att öppna
** Ett urval av filerna går att öppna
** Alla olika filformat kan öppnas
 
''Går filerna inte att öppna?''
 
Kontrollera att du använder rätt mjukvara. Har du inte tillgång till mjukvaran kan du be forskaren om icke-licencerade alternativ. Har du rätt mjukvara med filerna går ändå inte att öppna? Kontakta forskaren.
|-
|
<ol start="5" style="list-style-type: decimal;">
<li><p>'''Kontrollera filformat'''</p></li></ol>
|
* Filerna är i ett lämpligt format för återanvändning och tillgängliggörande
 
''Är filformaten inte lämpliga för återanvändning och/eller tillgängliggörande?''
 
Konvertera filerna till ett mer lämpligt format.
 
Om du är osäker på vilket format filerna bör vara i kan du ta hjälp av SND:s guide för [https://snd.gu.se/sv/hantera-data/guider/filformat <span class="underline">rekommenderade filformat</span>]. Läs även [https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#filformat <span class="underline">avsnittet om filformat i DAU-handboken</span>].
|-
|
<ol start="6" style="list-style-type: decimal;">
<li><p>'''Kontrollera filnamn och mappstruktur'''</p></li></ol>
|
* Filer har logiska filnamn
** Det går att avgöra vilka filer som hör ihop eller har samma typ av innehåll
** Filnamnen dokumenteras via readme-fil, artikel, separat fillista, eller på något annan sätt.
* Mappstrukturen är logisk och går att navigera
|-
|
<ol start="7" style="list-style-type: decimal;">
<li><p>'''Kontrollera att det finns tillräcklig dokumentation'''</p></li></ol>
|
* Dokumentationen är tillräcklig för att data ska kunna förstås och återanvändas
|}

Nuvarande version från 22 juni 2020 kl. 04.59

Den här checklistan är en kortfattad översikt över vad man behöver kontrollera för att säkerställa att data uppfyller minimikrav för SND:s katalog. Utförligare beskrivning finns på sidan Kontroll av inkommen databeskrivning. Ladda ner checklistan i pdf-format.



Aktiviteter Checklista
  1. Säkerställ att originalversionen av data finns sparad på en säker lagringsyta
  • Originaldata ligger på lärosätets lagringsyta
  • Originaldata ligger avskilt från bearbetade versioner

Har data kommit till DAU på något annat sätt (t.ex. på en extern hårddisk)?

Se till att data laddas upp till lärosätets lagringsyta.

  1. Gör viruskontroll

  • Levererade filer innehåller inte virus

Misstänker du att leveransen innehåller virus?

Kontakta din IT-avdelning.

Läs igenom metadata och titta på eventuell dokumentation innan du går vidare.

Att använda metadata och dokumentation som referens kan vara till stor hjälp medan du fortsätter att granska inkomna data.

  1. Kontrollera att leveransen är komplett

Information om vilka filer som ska ingå i leveransen går att hitta i metadatafälten (t.ex. Beskrivning) eller i dokumentationen (t.ex. Bifogad artikel).

  • Alla nödvändiga filer finns

Misstänker du att det saknas filer?

Kontakta forskaren.

  1. Kontrollera läsbarheten för datafiler

  • Filerna går att öppna
    • Ett urval av filerna går att öppna
    • Alla olika filformat kan öppnas

Går filerna inte att öppna?

Kontrollera att du använder rätt mjukvara. Har du inte tillgång till mjukvaran kan du be forskaren om icke-licencerade alternativ. Har du rätt mjukvara med filerna går ändå inte att öppna? Kontakta forskaren.

  1. Kontrollera filformat

  • Filerna är i ett lämpligt format för återanvändning och tillgängliggörande

Är filformaten inte lämpliga för återanvändning och/eller tillgängliggörande?

Konvertera filerna till ett mer lämpligt format.

Om du är osäker på vilket format filerna bör vara i kan du ta hjälp av SND:s guide för rekommenderade filformat. Läs även avsnittet om filformat i DAU-handboken.

  1. Kontrollera filnamn och mappstruktur

  • Filer har logiska filnamn
    • Det går att avgöra vilka filer som hör ihop eller har samma typ av innehåll
    • Filnamnen dokumenteras via readme-fil, artikel, separat fillista, eller på något annan sätt.
  • Mappstrukturen är logisk och går att navigera
  1. Kontrollera att det finns tillräcklig dokumentation

  • Dokumentationen är tillräcklig för att data ska kunna förstås och återanvändas