Åtgärder

Skillnad mellan versioner av "Checklista: kontroll av data"

Från DAU-handboken

Rad 1: Rad 1:
Checklista för kontroll av data
Den här checklistan är en kortfattad översikt över vad man behöver
kontrollera för att säkerställa att data uppfyller minimikrav för SND:s
katalog. Utförligare beskrivning finns på sidan [[Kontroll av inkommande
data]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data).
+-----------------------------------+-----------------------------------+
+-----------------------------------+-----------------------------------+
| Aktiviteter                      | Checklista                        |
| Aktiviteter                      | Checklista                        |
Rad 111: Rad 104:
|                                  |    återanv[^10]ändas            |
|                                  |    återanv[^10]ändas            |
+-----------------------------------+-----------------------------------+
+-----------------------------------+-----------------------------------+
[^1]: Lärosätets lagringsyta - En lagringsyta avsedd för långtidslagring
    och publicering av forskningsdata. Ett exempel kan vara en SUNET-yta
    som lärosätet hyr ut.
[^2]: Med bearbetning menas att data på något sätt förändras från
    versionen som först lämnades av forskaren för publicering. Exempel
    på bearbetning kan vara: byte av filnamn, konvertering till andra
    (t.ex. arkivbeständiga) filformat, redigering av innehållet.
[^3]: Om det rör sig om väldigt många datafiler kan det anses som en
    orimligt stor arbetsmängd att öppna alla. Det kan då istället vara
    aktuellt att öppna ett urval av filerna och att välja filer av alla
    de olika filformaten.
[^4]: Exempel på logiska filnamn: (1) Ett dataset med tusen bilder där
    varje bild har ett sekventiellt namn (img001, img002) och varje namn
    är dokumenterat i ett separat csv-fil. (2) Ett dataset med tusen
    csv-filer där varje filnamn innehåller kodad information
    (analysis\_PhLevels\_point1; analysis\_PhLevels\_point2;
    analysis\_CO2Levels\_point1; osv.), och där kodningen förklaras i
    ett separat textfil eller går att förstå genom att läsa artikeln.
    (3) Dataset som innehåller en csv-fil, en pdf-fil och en bild, där
    alla filer har ett förklarande namn (t.ex.:
    medieval\_farmstead\_database.csv, historical\_text\_scan.pdf,
    historical\_map\_1352.tif)
[^5]: Läs
    [[https://dhb.snd.gu.se/wiki/Kontroll\_av\_inkommande\_data\#dokumentation]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#dokumentation)
    för exempel på hur dokumention kan se ut beroende på datatyp.
[^6]: Lärosätets lagringsyta - En lagringsyta avsedd för långtidslagring
    och publicering av forskningsdata. Ett exempel kan vara en SUNET-yta
    som lärosätet hyr ut.
[^7]: Med bearbetning menas att data på något sätt förändras från
    versionen som först lämnades av forskaren för publicering. Exempel
    på bearbetning kan vara: byte av filnamn, konvertering till andra
    (t.ex. arkivbeständiga) filformat, redigering av innehållet.
[^8]: Om det rör sig om väldigt många datafiler kan det anses som en
    orimligt stor arbetsmängd att öppna alla. Det kan då istället vara
    aktuellt att öppna ett urval av filerna och att välja filer av alla
    de olika filformaten.
[^9]: Exempel på logiska filnamn: (1) Ett dataset med tusen bilder där
    varje bild har ett sekventiellt namn (img001, img002) och varje namn
    är dokumenterat i ett separat csv-fil. (2) Ett dataset med tusen
    csv-filer där varje filnamn innehåller kodad information
    (analysis\_PhLevels\_point1; analysis\_PhLevels\_point2;
    analysis\_CO2Levels\_point1; osv.), och där kodningen förklaras i
    ett separat textfil eller går att förstå genom att läsa artikeln.
    (3) Dataset som innehåller en csv-fil, en pdf-fil och en bild, där
    alla filer har ett förklarande namn (t.ex.:
    medieval\_farmstead\_database.csv, historical\_text\_scan.pdf,
    historical\_map\_1352.tif)
[^10]: Läs
    [[https://dhb.snd.gu.se/wiki/Kontroll\_av\_inkommande\_data\#dokumentation]{.underline}](https://dhb.snd.gu.se/wiki/Kontroll_av_inkommande_data#dokumentation)
    för exempel på hur dokumention kan se ut beroende på datatyp.

Versionen från 24 oktober 2019 kl. 11.37

+-----------------------------------+-----------------------------------+ | Aktiviteter | Checklista | +-----------------------------------+-----------------------------------+ | 1. **Säkerställ att | - Originaldata ligger på | | originalversionen av data | lärosätets lagringsyta[^6] | | finns sparad på en säker | | | lagringsyta** | - Originaldata ligger avskilt | | | från bearbetade[^7] versioner | | | | | | *Har data kommit till DAU på | | | något annat sätt (t.ex. på en | | | extern hårddisk)?* | | | | | | Se till att data laddas upp till | | | lärosätets lagringsyta. | +-----------------------------------+-----------------------------------+ | 2. **Gör viruskontroll** | - Levererade filer innehåller | | | inte virus | | | | | | *Misstänker du att leveransen | | | innehåller virus?* | | | | | | Kontakta din IT-avdelning. | +-----------------------------------+-----------------------------------+ | > **Läs igenom metadata och titta | | | > på eventuell dokumentation | | | > innan du går vidare.** | | | > | | | > Att använda metadata och | | | > dokumentation som referens kan | | | > vara till stor hjälp medan du | | | > fortsätter att granska inkomna | | | > data. | | +-----------------------------------+-----------------------------------+ | 3. **Kontrollera att leveransen | - Alla nödvändiga filer finns | | är komplett** | | | | *\ | | *Information om vilka filer som | Misstänker du att det saknas | | ska ingå i leveransen går att | filer?* | | hitta i metadatafälten (t.ex. | | | Beskrivning) eller i | Kontakta forskaren. | | dokumentationen (t.ex. Bifogad | | | artikel).* | | +-----------------------------------+-----------------------------------+ | 4. **Kontrollera läsbarheten för | - Filerna går att öppna | | datafiler** | | | | - Ett urval av filerna går | | | att öppna[^8] | | | | | | - Alla olika filformat kan | | | öppnas | | | | | | *Går filerna inte att öppna?* | | | | | | Kontrollera att du använder rätt | | | mjukvara. Har du inte tillgång | | | till mjukvaran kan du be | | | forskaren om icke-licencerade | | | alternativ. Har du rätt mjukvara | | | med filerna går ändå inte att | | | öppna? Kontakta forskaren. | +-----------------------------------+-----------------------------------+ | 5. **Kontrollera filformat** | - Filerna är i ett lämpligt | | | format för återanvändning och | | | tillgängliggörande | | | | | | *Är filformaten inte lämpliga för | | | återanvändning och/eller | | | tillgängliggörande?* | | | | | | Konvertera filerna till ett mer | | | lämpligt format. | | | | | | Om du är osäker på vilket format | | | filerna bör vara i kan du ta | | | hjälp av SND:s guide för | | | [[rekommenderade | | | filformat]{.underline}](https://s | | | nd.gu.se/sv/hantera-data/guider/f | | | ilformat). | | | Läs även [[avsnittet om filformat | | | i | | | DAU-handboken]{.underline}](https | | | ://dhb.snd.gu.se/wiki/Kontroll_av | | | _inkommande_data#filformat). | +-----------------------------------+-----------------------------------+ | 6. **Kontrollera filnamn och | - Filer har logiska filnamn[^9] | | mappstruktur** | | | | - Det går att avgöra vilka | | | filer som hör ihop eller | | | har samma typ av innehåll | | | | | | - Filnamnen dokumenteras | | | via readme-fil, artikel, | | | separat fillista, eller | | | på något annan sätt. | | | | | | - Mappstrukturen är logisk och | | | går att navigera | +-----------------------------------+-----------------------------------+ | 7. **Kontrollera att det finns | - Dokumentationen är | | tillräcklig dokumentation** | tillräcklig för att data ska | | | kunna förstås och | | | återanv[^10]ändas | +-----------------------------------+-----------------------------------+