Åtgärder

RStudio

Från DAU-handboken

Information om RStudio

R är ett programmeringsspråk och en programvara för statistiska analyser och grafisk visualisering. RStudio är ett grafiskt gränssnitt och en integrerad utvecklingsmiljö ovanpå R. RStudio har utvecklats för att underlätta användningen av R. RStudio förutsätter att programvaran R redan finns installerad för att fungera.

R har en stark och aktiv användarbas och är bl.a. känd för att dela med sig av egenutvecklade s.k. ”packages”. Ett package är en samling funktioner som ger utökade analysmöjligheter. Dessa kan vara väldigt specialiserade, och ibland komma i konflikt med varandra.

RStudio underlättar arbetet med tabulära data genom sitt grafiska gränssnitt och möjligheterna att spara och dokumentera arbetet fortlöpande på ett överskådligt sätt. Man kan även lagra och återanvända algoritmer, objekt och variabler i ett forskningsprojekt. Det finns även en inbyggd filhanterare för att enkelt kunna hitta och importera externa data.

R är tillgängligt som öppen källkod (open source) och finns tillgängligt för Windows, MacOS och Linux. R kan laddas ned från cran.r-project.org.

RStudio är tillgängligt både som ”open source” och i kommersiella versioner och kan laddas ned från download RStudio antingen för desktop eller för server.

Lathund

Beskrivningen rör version 1.2.5019 av RStudio (Windows-installationen).

Dokumentationsmöjligheter

Det finns många olika sätt att berika data som analyserats i RStudio med metadata. Inom RStudio finns flera “packages” som på olika sätt kan användas för att dokumentera och göra data återanvändbar, se exempelvis denna sammanställning. Nedan listas några av de möjligheter till metadataberikning som finns i RStudio:

1. Till en fil eller grupp med filer (projekt) kan en README-fil (Text file) bifogas. Här kan man skriva vad filerna innehåller och hur de är tänkta att användas. Välj File - New File - Text File för att skapa en README-fil. Filen sparas i det aktuella projektet.

2. R Markdown ingår i RStudio och gör det möjligt att skapa dokumentation som kombinerar data och metadata i ett gemensamt dokument. Dokumentationen kan sparas i formaten .html, .pdf och .docx (Word). Det går även att ladda ner artikelmallar för olika tidskrifter i LaTeX. Ett R Markdown-dokument inleds vanligtvis med metadata om titel, författare, datum och filformat på utdatan.

3. R Notebook är en variant av R Markdown. Här körs inte koden automatiskt då dokumentet sparas i visningsformat, vilket kan göra R Notebook bättre lämpat för dokumentation av det egna arbetet.

4. DataMeta är ett package som skapar ett "uppslagsverk" och lägger till det till datasetet som ett attribut tillsammans med information om när datan senast hanterades, användarnamn och en generell beskrivning av datasetet. Detta är ett något mer kod-baserat sätt att göra dokumentationen på.

Filtyper som stöds i RStudio

RStudio kan importera data i formaten: .csv (Comma separated values), .tsv (Tab separated values), .xls (Excel binary file format), .xlsx (Excel – Office Open XML format), .sav (SPSS), dta (Stata), .por (SPSS portable) och .sas/.sd7 (SAS). I praktiken innebär det möjlighet att importera data inom tre kategorier: komma/tab-separerad data, Excel-data och data från kod, men kräver då att ett speciellt “package” laddas ner.

"connections" och paket möjliggör också att till exempel kunna arbeta direkt mot en databas. En sammanställd lista finns här: https://support.rstudio.com/hc/en-us/articles/201057987-Quick-list-of-useful-R-packages

Resultatet kan exporteras till .csv, .tsv och till Excel anpassad .csv.

Att öppna och spara en fil

RStudio är uppdelat i fyra fönster: editor, console, environment, working directory.

Ett dataset kan importeras via Import Dataset, i environment-fönstret, eller via kod i console-fönstret. Det är praxis att skriva kod i editor-fönstret och skicka koden till console-fönstret med Ctrl+Enter (Mac: Cmd+Enter). Detta då datan i console-fönstret inte sparas, utan det är data i editorn som sparas.

Genom att skapa ett projekt, hålls de filer man jobbar med ihop. De kan stängas samtidigt, för att sedan öppnas och visa samma arbetsyta som när man stängde.

RStudio kan inte hantera filnamn med å, ä, ö.

Spara/exportera data

Data kan exporteras med kod i console-fönstret med hjälp av kommandot write.format(data frame, “fil”). Format kan vara csv eller table (tab-separerad text).

Exempel:

write.csv(mina data, “c:\data\mina_data.csv”)

write.table(mina andra data, “c:\data\minaandradata.tsv”, sep=”\t”, col.names=F)

Det finns även möjlighet att exportera till specifika format (foreign). Dessa kräver normalt att ett särskilt package installeras.

Exempel exportera till SPSS:

require(foreign)

write.foreign(minadata,“minadata.txt”,“minadata.sps”, package=”SPSS”)

Hela projektet sparas med File - Save As…



Författare 2018: Urban Andersson, Alejandro Crespo, Anders Karlsson & Greta Linder. Uppdaterad 2019 av Jenny Johansson, Malin Almstedt Jansson, Helena Eckerbom, Henrik Levin, Magnus Åberg. Uppdaterad 2019-12-04 av Susanne Hansson, Pär Sundling, Johanna Cinber, Pauline Jönsson, Birgitta Edenius och Göran Lindkvist

Senast uppdaterad: 2019-12-04