Åtgärder

Skillnad mellan versioner av "Dokument och text"

Från DAU-handboken

(Skapade sidan med '= Dokument och text = De vanligaste filtyperna som skapas under ett forskningsprojekt är olika typer av dokument och textfiler. Oavsett typ av forskningsprojekt så kommer,...')
 
 
(15 mellanliggande versioner av 6 användare visas inte)
Rad 1: Rad 1:
= Dokument och text =
== Översikt ==
 
De vanligaste filtyperna som skapas under ett forskningsprojekt är olika typer av dokument och textfiler. Oavsett typ av forskningsprojekt så kommer det, om inte annat, att författas en slutrapport i form av ett textdokument. Textdokument kan skapas på flera olika sätt, men de flesta skapas via olika ordbehandlingsprogram som Microsoft Word eller OpenOffice-baserade program (LibreOffice, Apache OpenOffice, NeoOffice osv.). Förutom via ordbehandlingsprogram kan dokument också skapas som ett resultat av digitalisering. Digitalisering av facktidskrifter i syfte att bevara eller tillgängliggöra samlingar som skapades före den digitala åldern är oftast den största källan till digitala texter, utöver de som skapas med ett ordbehandlingsprogram.
De vanligaste filtyperna som skapas under ett forskningsprojekt är olika typer av dokument och textfiler. Oavsett typ av forskningsprojekt så kommer, om inte annat, en slutrapport i form av ett textdokument att skrivas. Textdokument kan skapas på flera olika sätt men de flesta skapas via olika ordbehandlingsprogram som t.ex. Microsoft Word eller OpenOffice-baserade program (LibreOffice, Apache OpenOffice, NeoOffice etc.). Förutom att dokument skapas via ordbehandlingsprogram, kan dokument också skapas som ett resultat av digitalisering. Digitalisering av facktidskrifter i syfte att bevara eller tillgängliggöra samlingar skapade före den digitala åldern är oftast den största källan till digitala texter bortsett från de som skapas med ett ordbehandlingsprogram.


== Viktiga egenskaper ==
== Viktiga egenskaper ==


Viktiga egenskaper, dvs. de grundläggande element i texter och dokument som ska bevaras och underhållas, beskrivs nedan:
Viktiga egenskaper, dvs. de grundläggande elementen i texter och dokument som ska bevaras och underhållas, beskrivs nedan:


* Ord och ordföljd i dokumentet
* Ord och ordföljd i dokumentet
* Den hierarkiska strukturen i dokumentet (t.ex. olika rubriknivåer)
* Den hierarkiska strukturen i dokumentet (t.ex. olika rubriknivåer)
* Formateringen inom dokumentet (t.ex. fetstil, kursiv stil)
* Formateringen inom dokumentet (t.ex. fetstil, kursiv stil)
* Sidnumreringen av dokumentet. Detta är viktigt om dokumentet är en rapport eller en avhandling, publicerat eller ej. Om en användare vill citera och referera till dokumentet så måste sidangivelsen vara korrekt. Det gäller att vara extra observant om dokumentet migreras ett flertal gånger
* Sidnumreringen av dokumentet. Detta är viktigt om dokumentet är en rapport eller en avhandling, publicerad eller ej. Om en användare vill citera och referera till dokumentet så måste sidangivelsen vara korrekt. Det gäller att vara extra observant om dokumentet migreras ett flertal gånger
* Infogat material, som bilder och datatabeller. Säkerställ att de bevaras separat
* Infogade material, som bilder och datatabeller. Säkerställ att de bevaras separat
 
Det finns även egenskaper som inte alltid ses som viktiga att bevara. Däribland fonttyp och fontstorlek (förutsatt att det inte påverkar formatering och sidbrytning). Viktiga egenskaper i ett dokument kan dock förändras beroende på dokumentet som ska bevaras. Oavsett så bör man vid genomgång av ett dokument som ska långtidslagras bedöma vilka av ovanstående element som måste bevaras.
 
== Filformat för långtidslagring ==


Tittar man på filformat för långtidslagring och arkivering finns det idag en generell rekommendation att använda sig av standardiserade XML-format som Microsofts OOXML (docx) och OpenOffice ODF (odt). ODF använder sig ett bättre sätt av öppna och existerande standarder som t.ex. SVG (Scalable Vector Graphics). Som komplement till dessa XML-baserade format kan PDF/A vara ett potentiellt format för långtidslagring men då i huvudsak för dokument som annars bara existerar i PDF-format. Även om PDF/A är ett binärt format så är det en öppen standard där programvara för att kunna läsa filerna är gratis och lätt att hitta, bland annat genom ett ökat tredjepartsstöd.
Det finns även egenskaper som inte alltid ses som viktiga att bevara. Däribland teckensnitt och teckenstorlek (förutsatt att det inte påverkar formatering och sidbrytning). Viktiga egenskaper i ett dokument kan dock förändras beroende dokumentet som ska bevaras. Oavsett bör man vid genomgång av ett dokument som ska långtidslagras bedöma vilka av ovanstående element som måste bevaras.


''Föredragna format''
== Text som forskningsdata ==


* ASCII (.txt)
På Basecamp https://3.basecamp.com/3853863/buckets/5947445/vaults/3391584764 finns videomaterial om textdata skapat av Caspar Jordan, SND, 2020.
* MS Word (.docx)
* OpenDocument Text (.odt)
* PDF/A (.pdf)
* Unicode (.txt)


''Accepterade format''
Målgruppen är DAU- och SND-medarbetare. Materialet består av ett antal fallbeskrivningar av hantering av olika typer av data man kan stöta på i textforskning. Utbildnings- och uppslagsmaterial.


* MS Word (.doc)
== Guide ==
* PDF (.pdf)
[https://snd.gu.se/sites/default/files/page/SND%3B%20Dokument%20och%20digital%20text%3B%20En%20guide%20till%20god%20hantering_2017-03-13.pdf#overlay-context=sv/datahantering/guider Guide för dokument och text]
* Rich Text Format (.rtf)

Nuvarande version från 22 februari 2022 kl. 14.17

Översikt

De vanligaste filtyperna som skapas under ett forskningsprojekt är olika typer av dokument och textfiler. Oavsett typ av forskningsprojekt så kommer det, om inte annat, att författas en slutrapport i form av ett textdokument. Textdokument kan skapas på flera olika sätt, men de flesta skapas via olika ordbehandlingsprogram som Microsoft Word eller OpenOffice-baserade program (LibreOffice, Apache OpenOffice, NeoOffice osv.). Förutom via ordbehandlingsprogram kan dokument också skapas som ett resultat av digitalisering. Digitalisering av facktidskrifter i syfte att bevara eller tillgängliggöra samlingar som skapades före den digitala åldern är oftast den största källan till digitala texter, utöver de som skapas med ett ordbehandlingsprogram.

Viktiga egenskaper

Viktiga egenskaper, dvs. de grundläggande elementen i texter och dokument som ska bevaras och underhållas, beskrivs nedan:

  • Ord och ordföljd i dokumentet
  • Den hierarkiska strukturen i dokumentet (t.ex. olika rubriknivåer)
  • Formateringen inom dokumentet (t.ex. fetstil, kursiv stil)
  • Sidnumreringen av dokumentet. Detta är viktigt om dokumentet är en rapport eller en avhandling, publicerad eller ej. Om en användare vill citera och referera till dokumentet så måste sidangivelsen vara korrekt. Det gäller att vara extra observant om dokumentet migreras ett flertal gånger
  • Infogade material, som bilder och datatabeller. Säkerställ att de bevaras separat

Det finns även egenskaper som inte alltid ses som viktiga att bevara. Däribland teckensnitt och teckenstorlek (förutsatt att det inte påverkar formatering och sidbrytning). Viktiga egenskaper i ett dokument kan dock förändras beroende på dokumentet som ska bevaras. Oavsett så bör man vid genomgång av ett dokument som ska långtidslagras bedöma vilka av ovanstående element som måste bevaras.

Text som forskningsdata

På Basecamp https://3.basecamp.com/3853863/buckets/5947445/vaults/3391584764 finns videomaterial om textdata skapat av Caspar Jordan, SND, 2020.

Målgruppen är DAU- och SND-medarbetare. Materialet består av ett antal fallbeskrivningar av hantering av olika typer av data man kan stöta på i textforskning. Utbildnings- och uppslagsmaterial.

Guide

Guide för dokument och text