RStudio
Från DAU-handboken
Information om RStudio
R är ett programmeringsspråk och en integrerad plattform/miljö av olika programvaror som är användbara exempelvis för statistikbehandling, datamanipulering, dataanalys, kalkylering och grafisk visualisering. RStudio är ett grafiskt gränssnitt och en integrerad utvecklingsmiljö ovanpå R. R är tillgängligt som ”open source” och finns tillgängligt för Windows, MacOS och Linux. R kan laddas ned från http://cran.r-project.org.
RStudio är tillgängligt både som ”open source” och i kommersiella versioner och kan laddas ned från https://www.rstudio.com/products/rstudio/download/ antingen för desktop eller för server. RStudio förutsätter att programvaran R 3.0.1+ redan finns installerad för att fungera.
R har en stark och aktiv användarbas och är bl.a. kända för att denna ”community” delar med sig av egenutvecklade s.k ”packages”. Ett package är en samling funktioner som ger utökade möjligheter. Dessa kan vara väldigt specialiserade, och ibland komma i konflikt med varandra.
RStudio underlättar i arbetet med data genom sitt grafiska gränssnitt och möjligheterna att spara och dokumentera arbetet fortlöpande på ett överskådligt sätt. Man kan även lagra och återanvända algoritmer, objekt och variabler i projekten. Det finns även en inbyggd filhanterare för att enkelt kunna hitta och importera externa data.
Lathund
Beskrivningen rör version 1.1.442 av RStudio (Windows-installationen).
Dokumentationsmöjligheter
R Markdown ingår i RStudio och gör det möjligt att skapa dokumentation som kombinerar innehåll och kod för dataanalys i ett gemensamt dokument. Dokumentationen kan sparas i formaten html, pdf och word. Men det går även att ladda ner artikelmallar för olika tidskrifter i LaTeX. Ett R Markdown-dokument inleds vanligtvis med metadata om titel, författare, datum och filformat på utdatan.
R Notebook är en variant av R Markdown. Här körs inte koden automatiskt då dokumentet sparas i visningsformat, vilket kan göra R Notebook bättre lämpat för dokumentation av det egna arbetet.
DataMeta är ett package som skapar ett "uppslagsverk" och lägger det till datasetet som ett attribut tillsammans med information om när datan senast hanterades, användarnamn och en generell beskrivning av datasetet. Detta är ett något mer kod-baserat sätt att göra dokumentationen [1].
Det finns många olika packages som på olika sätt kan användas för att dokumentera och göra data återanvändbar, se exempelvis denna sammanställning. Till en fil eller grupp med filer (projekt) kan även README-fil bifogas. Här kan man skriva vad filerna innehåller och hur de är tänkta att användas.
Välj File - New File - Text File för att skapa README. Sparas i det aktuella projektet.
Filtyper som stöds i RStudio
RStudio kan importera data i formaten: .csv (Comma separated values), .tsv (Tab separated values), .xls (Excel binary file format), .xlsx (Excel – Office Open XML format), .sav (SPSS), dta (Stata), .por (SPSS portable) och .sas/.sd7 (SAS). I praktiken innebär det möjlighet att importera data inom tre kategorier: komma/tab-separerad data, Excel-data och data från kod, men kräver då att ett speciellt “package” laddas ner.
Resultatet kan exporteras till .csv, .tsv och till excel anpassad csv.
Att öppna och spara en fil
RStudio är uppdelat i fyra fönster: editor, console, environment, working directory.
Ett dataset kan importeras via Import Dataset, i environment-fönstret, eller via kod i console-fönstret. Det är praxis att skriva kod i editor-fönstret och skicka koden till console-fönstret med Ctrl+Enter (Mac: Cmd+Enter). Detta då datan i console-fönstret inte sparas, utan det är data i editorn som sparas.
Genom att skapa ett projekt, hålls de filer man jobbar med ihop. De kan stängas samtidigt, för att sedan öppnas och visa samma arbetsyta som när man stängde.
Spara/exportera data
Data kan exporteras med kod i console-fönstret med hjälp av kommandot write.format(data frame, “fil”). Format kan vara csv eller table (tab-separerad text).
Exempel:
write.csv(mina data, “c:\data\mina_data.csv”)
write.table(mina andra data, “c:\data\minaandradata.tsv”, sep=”\t”, col.names=F)
Det finns även möjlighet att exportera till specifika format (foreign). Dessa kräver normalt att ett särskilt package installeras.
Exempel exportera till SPSS:
require(foreign)
write.foreign(minadata,“minadata.txt”,“minadata.sps”, package=”SPSS”)
Hela projektet sparas med File - Save As…
Författare: Urban Andersson, Alejandro Crespo, Anders Karlsson & Greta Linder
Senast uppdaterad: 2018-05-03