Vad ska göras tillgängligt?
Från DAU-handboken
== Draft
==
När en forskare hör av sig för att deponera sina data kan frågan om vilka data ska egentligen deponeras uppstå. Olika projekt kan producera väldigt olika data, men några generella riktlinjer gäller för de flesta, om inte alla, projekt:
Rådata, kalibrerade data, bearbetade data, mm.
Forskningsdatas formen kan bero på olika faktorer, som forskningsområde, projektmål, osv. Olika saker kan räknas som forskningsdata beroende på forskningsprojektet, till exempel:
- Rådata
- Bearbetade data
- Mjukvaror
- Kod
- Algoritmer
- Modeller
- Metoder
Många beteckningar kan sättas på material som produceras i olika faser av ett forskningsprojekt, och frågan kan uppstå om vilken del av dessa material räknas som data, samt vilken del av det som kallas för data ska publiceras. Här ska man råda forskaren att fundera över rollerna publikation av forskningsdata spela. Att publicera forskningsdata möjliggör för andra att verifiera resultaten som presenteras i en artikel genom att reproducerbara dem. Att publicera forskningsdata gör det också möjligt för andra att återanvända data i andra syften.
Samtidigt ska det data som publiceras vara användbart, genom skaplig kalibrering, gallring, omformatering och andra bearbetningsprocesser.
Man fundera över vilken nytta man har av att tillgängliggöra data från olika faser av ett forskningsprojekt. Räcker det med bearbetade data, eller finns det nytta i att publicera rådata, data från olika faser i projektet, osv?
Ett exempel: ...
Dokumentation och stödmaterial
Att en del av materialet som produceras under ett forskningsprojekt inte räknas som data betyder inte att man ska avstå från att publicera det. Om en del av eller hela materialet bedöms vara av hjälp för att verifiera eller återanvända de data som publiceras kan det också tillgängliggöras som dokumentation i samband med att själva data publiceras.
Ett exempel: En forskare vill publicera sina tabulära data. Forskaren har använt sig av kod för att implementera en algoritm för att omvandla sina data till lätt tolkade tabeller som publicerades i artikeln. Även om koden inte kan räknas som data kan den publiceras vid sidan av datamaterialet under samma katalogpost.
Arbetsflödet
I vissa fall är det viktigt att hela arbetsflödet som ledde till det slutliga materialet kan förstås av andra. I det fallet kan det vara viktigt för forskaren att deponera samma data fast från olika faser av projektet. Till exempel, råa temperaturmätningar, kalibrerade mätningar, och en resultaten från en temperaturmodell som använder dessa mätningar. I
ska man deponera allt eller bara tillräckligt för att kunna förstå arbetsflödet (är det väldigt månda steg som ger små skillnader i data och resulterar i stora mängder av data kan man kanske röja mellanstegen som inte är så viktiga) Bara finaldata som krävs av artikeln? Ladda upp viktig dokumentation så att datamaterialet kan återanvändas