Åtgärder

Filhantering hos SND

Från DAU-handboken

Version från den 14 maj 2019 kl. 11.14 av Olof (diskussion | bidrag) (länkar till dataflödespiloten)

På den här sidan kan du läsa om arbetsgången för lagring av data som deponeras till DAU under [dataflödespiloten]. Det finns inte några fastställda rutiner för hur dessa processer ska se ut efter dataflödespiloten, när DAU:erna tar hand om data från forskare och publicerar databeskrivningar utan att behöva gå genom SND.


Fil:Mappstruktur.png
Mappstruktur för data som lagras hos SND

Mappstruktur för deponerade data under dataflödespiloten

Databeskrivningar som lämnas över via Mitt SND hamnar i en automatiskt skapad mappstruktur. Mappstrukturen innehåller mappar för data, metadata och dokumentation. Bilden till höger innehåller mer information om mappinnehållet. DAU:en behöver kunna hantera mappstrukturen för att kunna skicka vidare kurerade data till SND.

Nuvarande lagringsrutiner på SND

Data och metadata som deponeras hos SND via överlämningsformuläret efter att de blivit accepterade av SND hamnar i SND:s interna management system (SIMS) som inkommande data. Via SIMS kan man direkt exportera metadata till en ny studie med nytt studienummer i systemet samt skapa en bearbetningsyta med data på en så kallad ”Staging”-mapp som används internt på SND. De ursprungliga datafilerna och dokumenten, eller de så kallade SIP-filerna (Submission Information Package), exporteras automatiskt till den här studiemappen på Staging-ytan i en mapp som heter ”Original”. Datasamordnare på SND skapar manuellt ett AIP (Archival Information Package) utifrån de ursprungliga datafilerna i en annan mapp som innehåller version 1.0 av studien. Eventuella senare versioner av datan skapas i nya mappar med respektive versionsnummer. Datafilerna och tillhörande dokumentation med den version av filpaketet som blir förmedlingsbar, eller de så kallade DIP-filerna (Dissemination Information Package), läggs in i en mapp som heter ”Distribution”.

När mappen med alla dataset i studien är färdig och studien har publicerats i SND:s forskningsdatakatalog flyttas den till SND:s arkiv som för närvarande underhålls av SNIC i väntan på en framtida lagringslösning.

Lösningar för långtidslagring

I nuläget finns det ingen fast lösning för långtidslagring av forskningsdata som kommer att användas av alla DAU:er på alla lärosäten.

Svensk Nationell Datatjänst använder för närvarande SNIC (Swedish National Infrastructure for Computing) för att lagra forskningsdata som deponeras och tillgängliggörs av forskare via SND. För tillfället kan detta vara ett förslag för andra lärosäten under dataflödespiloten. SND kan hjälpa med att upprätta en tillfällig SNIC-yta som kan användas under datapilotens gång, tills en mer permanent lösning hittas.

I framtiden planeras en mer omfattande lösning via SUNET (Swedish University Computer Network) där noder byggs upp på flera lärosäten. Även lärosäten utan egen nod ska kunna köpa kapacitet i denna lösning.