Åtgärder

Skillnad mellan versioner av "Vad ska göras tillgängligt?"

Från DAU-handboken

Rad 11: Rad 11:


=== Att publicera data från olika delar av forskningsprojektets gång===
=== Att publicera data från olika delar av forskningsprojektets gång===
I vissa fall är det viktigt att hela arbetsflödet som ledde till det slutliga materialet ska kunna förstås av andra. I det här fallet kan det vara viktigt för forskaren att publicera data från olika faser av projektet. Till exempel, råa temperaturmätningar, kalibrerade mätningar, och den resulterande temperaturmodellen som skapades av dessa mätningar. Här kan det vara bra att endast publicera de mest nödvändiga stegen i processen. Data från steg som kan lätt återskapas av andra behöver inte följa med.  
I vissa fall är det viktigt att hela arbetsflödet som ledde till det slutliga materialet ska kunna förstås av andra. I det här fallet kan det vara viktigt för forskaren att publicera data från olika faser av projektet. Till exempel: råa temperaturmätningar, kalibrerade mätningar, och den resulterande temperaturmodellen som skapades av dessa mätningar.  
 
Det är viktigt att inte 'överpublicera', och endast publicera de mest nödvändiga stegen i processen, så att den kan återskapas. Data från steg som kan lätt återskapas av andra behöver inte följa med.  


Till exempel: Om man vill publicera spatiala data där man gick in och röjde eller ändrade värden för hand så kan det vissa (obs. inte alla) fall vara önskvärt att publicera en tidigare version av datamaterialet. Har man istället temperaturdata där den enda bearbetningen som gjordes var att konvertera Celsius till Kelvin så är det inte lika viktigt att både versionerna publiceras.
Till exempel: Om man vill publicera spatiala data där man gick in och röjde eller ändrade värden för hand så kan det vissa (obs. inte alla) fall vara önskvärt att publicera en tidigare version av datamaterialet. Har man istället temperaturdata där den enda bearbetningen som gjordes var att konvertera Celsius till Kelvin så är det inte lika viktigt att både versionerna publiceras.
I många fall är det däremot inte rimligt, eller ens önskvärt, att publicera data från olika faser i ett forskningsprojekt.


=== Dokumentation och stödmaterial ===
=== Dokumentation och stödmaterial ===
Att en del av materialet som produceras under ett forskningsprojekt inte räknas som data betyder inte att man måste avstå från att publicera det. Om en del av eller hela materialet bedöms vara av hjälp för att verifiera eller återanvända de data som publiceras kan det också tillgängliggöras som dokumentation. Ett vanligt krav vi sätter på forskare är att en förklaring av alla variabler/kolumner i ett dataset ska förberedas i form av ett dokument. Förklaringen publiceras tillsammans med data.
Att en del av materialet som produceras under ett forskningsprojekt inte räknas som data betyder inte att man måste avstå från att publicera det. Om en del av materialet bedöms kunna hjälpa verifiera eller återanvända de data som publiceras kan det också tillgängliggöras som dokumentation. Ett vanligt krav vi sätter på forskare är att en förklaring av alla variabler/kolumner i ett dataset ska förberedas i form av ett dokument. Förklaringen publiceras tillsammans med datamaterialet.  


Ett ytterligare exempel: En forskare vill publicera sina tabulära data. Forskaren har använt sig av kod för att implementera en algoritm för att omvandla sina data till lätt tolkade tabeller som publicerades i artikeln. Även om koden inte kan räknas som data i det här fallet kan den publiceras vid sidan av datamaterialet under samma katalogpost.
Ett ytterligare exempel: En forskare vill publicera tabulära data. Forskaren har använt sig av programkod för att implementera en algoritm för att omvandla data till lätt-tolkade tabeller som publicerades i tillhörande artikeln. Även om koden inte kan räknas som data i det här fallet kan den publiceras vid sidan av datamaterialet under samma katalogpost.

Versionen från 21 januari 2019 kl. 12.36

När en forskare hör av sig för att deponera sina data kan frågan uppstå om vilka data ska egentligen deponeras. Olika projekt kan producera väldigt olika data, men några generella riktlinjer gäller för de flesta, om inte alla, projekt:

Rådata, kalibrerade data, bearbetade data, mm.

Forskningsdatas form kan bero på olika faktorer, som forskningsområde, projektmål, o.s.v. Olika saker kan räknas som forskningsdata beroende på forskningsprojektet, till exempel, rådata, bearbetade data, modeller, mjukvaror, kod, algoritmer och metoder.

Ett forskningsprojekt kan producera mycket material, och frågan kan uppstå om vilken del av dessa material räknas som data, samt vilken del av det som kallas för data ska publiceras. Och var hamnar allt annat som inte är data? Frågorna kan vara mer eller mindre lättbesvarade. Här ska man råda forskaren att fundera över rollerna publikationen av forskningsdata spelar. Att publicera forskningsdata möjliggör för andra att återanvända data i andra syften samt att verifiera resultaten som presenteras i en artikel genom att reproducera dem.

Man ska alltså publicera tillräckligt mycket data(och metadata, och dokumentation) för att göra det möjligt att uppfylla de här två syften. Samtidigt ska det data som publiceras vara användbart och i rimlig mängd, genom skaplig kalibrering, gallring, omformatering och annan bearbetning.

Man kan också fundera över vilken nytta man har av att tillgängliggöra data från olika faser av ett forskningsprojekt. Räcker det med bearbetade data, eller finns det nytta i att publicera rådata, data från olika faser i projektet, o.s.v?

Att publicera data från olika delar av forskningsprojektets gång

I vissa fall är det viktigt att hela arbetsflödet som ledde till det slutliga materialet ska kunna förstås av andra. I det här fallet kan det vara viktigt för forskaren att publicera data från olika faser av projektet. Till exempel: råa temperaturmätningar, kalibrerade mätningar, och den resulterande temperaturmodellen som skapades av dessa mätningar.

Det är viktigt att inte 'överpublicera', och endast publicera de mest nödvändiga stegen i processen, så att den kan återskapas. Data från steg som kan lätt återskapas av andra behöver inte följa med.

Till exempel: Om man vill publicera spatiala data där man gick in och röjde eller ändrade värden för hand så kan det vissa (obs. inte alla) fall vara önskvärt att publicera en tidigare version av datamaterialet. Har man istället temperaturdata där den enda bearbetningen som gjordes var att konvertera Celsius till Kelvin så är det inte lika viktigt att både versionerna publiceras.

I många fall är det däremot inte rimligt, eller ens önskvärt, att publicera data från olika faser i ett forskningsprojekt.

Dokumentation och stödmaterial

Att en del av materialet som produceras under ett forskningsprojekt inte räknas som data betyder inte att man måste avstå från att publicera det. Om en del av materialet bedöms kunna hjälpa verifiera eller återanvända de data som publiceras kan det också tillgängliggöras som dokumentation. Ett vanligt krav vi sätter på forskare är att en förklaring av alla variabler/kolumner i ett dataset ska förberedas i form av ett dokument. Förklaringen publiceras tillsammans med datamaterialet.

Ett ytterligare exempel: En forskare vill publicera tabulära data. Forskaren har använt sig av programkod för att implementera en algoritm för att omvandla data till lätt-tolkade tabeller som publicerades i tillhörande artikeln. Även om koden inte kan räknas som data i det här fallet kan den publiceras vid sidan av datamaterialet under samma katalogpost.