Åtgärder

Skillnad mellan versioner av "Filhantering hos SND"

Från DAU-handboken

 
(110 mellanliggande versioner av 6 användare visas inte)
Rad 1: Rad 1:
__TOC__
== Filhantering ==


= Lagring av data =
Lärosäten och forskande organisationer inom SND-nätverket kommer allt närmare egen lokal lagring för forskningsdata med koppling till DORIS och forskningsdatakatalogen via lagrings-API:et. Dokumentet [https://doi.org/10.5281/zenodo.10124920 ''Mapp- och filstruktur för SND CARE''] går igenom hur filhantering hanteras på SND-kontoret, vilket kan fungera som underlag för hur filer hanteras lokalt vid lärosätet. Viktigt att poängtera att filhantering är organisationens egna ansvar, och att dokumentet endast erbjuder ett vägledande exempel.  
På den här sidan kan du läsa om arbetsgången för lagring av data som deponeras till DAU under dataflödespiloten. Det finns inte några fastställda rutiner för hur dessa processer ska se ut efter dataflödespiloten, när DAU:erna tar hand om data från forskare och publicerar databeskrivningar utan att behöva gå genom SND.
 
[[Fil:Mappstruktur.png|miniatyr|Mappstruktur för data som lagras hos SND]]
 
<span id="mappstruktur"></span>
== Mappstruktur för deponerade data under dataflödespiloten ==
Databeskrivningar som lämnas över via Mitt SND hamnar i en automatiskt skapad mappstruktur. Mappstrukturen innehåller mappar för data, metadata och dokumentation. Bilden till höger innehåller mer information om mappinnehållet. DAU:en behöver kunna hantera mappstrukturen för att kunna skicka vidare kurerade data till SND.
 
== Nuvarande lagringsrutiner på SND ==
Data och metadata som deponeras hos SND via överlämningsformuläret efter att de blivit accepterade av SND hamnar i SND:s interna management system (SIMS) som inkommande data. Via SIMS kan man direkt exportera metadata till en ny studie med nytt studienummer i systemet samt skapa en bearbetningsyta med data på en så kallad ”Staging”-mapp som används internt på SND. De ursprungliga datafilerna och dokumenten, eller de så kallade SIP-filerna (Submission Information Package), exporteras automatiskt till den här studiemappen på Staging-ytan i en mapp som heter ”Original”. Datasamordnare på SND skapar manuellt ett AIP (Archival Information Package) utifrån de ursprungliga datafilerna i en annan mapp som innehåller version 1.0 av studien. Eventuella senare versioner av datan skapas i nya mappar med respektive versionsnummer. Datafilerna och tillhörande dokumentation med den version av filpaketet som blir förmedlingsbar, eller de så kallade DIP-filerna (Dissemination Information Package), läggs in i en mapp som heter ”Distribution”.
 
När mappen med alla dataset i studien är färdig och studien har publicerats i SND:s forskningsdatakatalog flyttas den till SND:s arkiv som för närvarande underhålls av SNIC i väntan på en framtida lagringslösning.


== Lösningar för långtidslagring ==
== Lösningar för långtidslagring ==
I nuläget finns det ingen fast lösning för långtidslagring av forskningsdata som kommer att användas av alla DAU:er på alla lärosäten.
I nuläget finns det ingen fast lösning för långtidslagring av forskningsdata som kommer att användas av alla DAU:er på alla lärosäten.


Svensk Nationell Datatjänst använder för närvarande [https://www.snic.se SNIC (Swedish National Infrastructure for Computing)] för att lagra forskningsdata som deponeras och tillgängliggörs av forskare via SND. För tillfället kan detta vara ett förslag för andra lärosäten under dataflödespiloten. SND kan hjälpa med att upprätta en tillfällig SNIC-yta som kan användas under datapilotens gång, tills en mer permanent lösning hittas.
SND är ett certifierat repositorium [https://www.coretrustseal.org/ CoreTrustSeal] för forskningsdata. Den del av verksamheten som är certifierad betecknas SND CARE och omfattar de data som lagras hos SND-kontoret. SND CARE använder en lagringsyta hos Göteborgs universitet (researchstore) för att lagra forskningsdata som deponeras och tillgängliggörs av forskare via SND.  


I framtiden planeras en mer omfattande lösning via [https://www.sunet.se SUNET (Swedish University Computer Network)] där noder byggs upp på flera lärosäten. Även lärosäten utan egen nod ska kunna köpa kapacitet i denna lösning.
I framtiden planeras en mer omfattande lösning via [https://www.sunet.se SUNET (Swedish University Computer Network)] där noder byggs upp på flera lärosäten. Även lärosäten utan egen nod ska kunna köpa kapacitet i denna lösning.

Nuvarande version från 13 december 2023 kl. 13.51

Filhantering

Lärosäten och forskande organisationer inom SND-nätverket kommer allt närmare egen lokal lagring för forskningsdata med koppling till DORIS och forskningsdatakatalogen via lagrings-API:et. Dokumentet Mapp- och filstruktur för SND CARE går igenom hur filhantering hanteras på SND-kontoret, vilket kan fungera som underlag för hur filer hanteras lokalt vid lärosätet. Viktigt att poängtera att filhantering är organisationens egna ansvar, och att dokumentet endast erbjuder ett vägledande exempel.

Lösningar för långtidslagring

I nuläget finns det ingen fast lösning för långtidslagring av forskningsdata som kommer att användas av alla DAU:er på alla lärosäten.

SND är ett certifierat repositorium CoreTrustSeal för forskningsdata. Den del av verksamheten som är certifierad betecknas SND CARE och omfattar de data som lagras hos SND-kontoret. SND CARE använder en lagringsyta hos Göteborgs universitet (researchstore) för att lagra forskningsdata som deponeras och tillgängliggörs av forskare via SND.

I framtiden planeras en mer omfattande lösning via SUNET (Swedish University Computer Network) där noder byggs upp på flera lärosäten. Även lärosäten utan egen nod ska kunna köpa kapacitet i denna lösning.