Åtgärder

Kontroll av data

Från DAU-handboken

Överlämning av data

Så fort en forskare har lämnat ett datamaterial till DAU genom Mitt SND blir det möjligt för DAU att ladda ner datamaterialet för kontroll. Storleksgränsen för datamaterial som lämnas in på det här sättet är i dagsläget på 100Mb, men kommer att utökas. Det innebär att för närvarande måste större datamängder lämnas in till DAU:en på andra sätt, t.ex. via extern hårddisk eller Boxkonto. I takt med att varje DAU tillämpar egna lagringslösningar kommer denna gräns att höjas och andra lösningar för större material kan komma på plats.

Notera att kravet är att data måste finnas lagrade på en säker lagringsyta. Däremot föreligger inget krav från SND på någon särskild lagringslösning, eftersom ansvaret för lagring ligger på respektive lärosäte. Observera att för certifiering finns det särskilda krav på lagringslösningar och strukturer vilka SND kan rådge kring om så önskas.

Kontroll av data

Det är viktigt att forskningsdata som förmedlas genom SND:s forskningsdataportal kan förstås och återanvändas av andra. Forskningsdata som laddas ned eller förmedlas via SND:s forskningsdataportal ska ha genomgått följande kontroller:

  • Kontroll att leveransen är komplett: Leveransen innehåller alla data avsedda för förmedling tillsammans med dokumentation som är nödvändig för återanvändning.
  • Viruskontroll: Levererade filer innehåller inga virus.
  • Kontroll av läsbarhet: Levererade filer går att öppna och läsa.
  • Filerna är i ett lämpligt format för återanvändning och tillgängliggörande.
  • Originalversionen av data finns sparad på en säker lagringsyta.


Rent praktiskt kan man göra så här:

1. Öppna studien via SND:s gränssnitt.

2. Ladda ner filer och kontrollera:

   i. Är datasetet tillräckligt komplett för att det ska vara möjligt att förstå vad det innehåller? Är det sannolikt att en sekundärforskare kan återanvända materialet? Varje datamaterial är unikt så den här bedömningen måste ske från fall till fall.
   ii. Går alla filer att öppna? Är det väldigt många filer kan du göra ett urval, men se gärna till att öppna någon/några filer av varje filtyp. Skulle en viss filtyp inte kunna öppnas kan anledningen vara att du inte har rätt programvara installerad. Ta reda på om så är fallet. Är du lite tekniskt lagd så kan en annan lösning vara att skriva ett script som testar att alla filer i en mapp går att öppna.


   iii. Finns alla nödvändiga filer? Information om kompletthet kan fås från metadata om datasetet och tillhörande dokumentation. Ofta deponeras bara en del av datamaterialet som producerades under forskningsprojektet. Så länge materialet går att återanvända kan man fortsätta processen med att publicera det, men forskaren kan alltid uppmuntras att publicera mer än vad som krävs av till exempel tidskriften i syfte att underlätta för en sekundäranvändare.
   iv. Finns det tillräckligt med metadata för att kunna publicera materialet? Minimikraven för publicering av metadata i SND:s forskningsdataportal uppfylls automatiskt genom att alla obligatoriska fält fylls i, men det är upp till dig att avgöra om det behövs mer metadata. För även om det går att publicera datamaterialet med endast obligatoriska metadata kan det vara värt att be forskaren komplettera för att göra det lättare för en sekundäranvändare att hitta studien. Ibland kan du komplettera med metadata från tillhörande dokumentation, men kom ihåg att det som kan innebära en stor arbetsinsats för dig kanske inte är särskilt svårt eller tidskrävande för forskaren, eller vice versa (för ibland är det enklast och snabbast att själv komplettera studiebeskrivningen).


   v. Finns det tillräcklig dokumentation? Vad som är tillräcklig information kan skilja sig åt mellan olika ämnesområden. Det är viktigt att det finns dokumentation som beskriver datamaterialets innehåll - t.ex. fältbeskrivningar om det finns tabulära data, beskrivningar av fotografier, osv.


  Data som laddas upp via Mitt SND kontrolleras för virus.


Går data att läsa?

Forskningsmaterial som lämnas till SND ska lagras på sådant sätt att framtida återanvändning möjliggörs. Detta innebär att åtgärder görs på flera plan.

Bitstream
Läsbar – att lagringsmediet är kompatibelt med aktuell hårdvara eller migreras vid behov.
Filnivå
I ett lämpligt format – att teckentabeller, komprimeringsalgoritmer och binärkod är läsbar och begriplig och att formatet är kompatibelt med operativsystemet.
Representation
Begriplig - att den samling filer som tillsammans utgör en begriplig enhet bevaras tillsammans med en innehållsbeskrivning (t.ex. text, foto).


Är data begripliga?

Förutom originaldata/rådata är det nödvändigt att dokumentation som hör till forskningsprojektet levereras tillsammans med data. Dokumentationen är ofta nödvändig för att en sekundäranvändare ska kunna förstå forskningsmaterialet. Exempel på dokumentation är kodböcker, frågeformulär, publikationer, undersökningsrapporter och tekniska rapporter.