Åtgärder

KNIME

Från DAU-handboken

Information om KNIME

KNIME är en förkortning för KoNstanz Information MinEr och uttalas "naim" med tyst "k". Knime Analytics-plattform är byggd på öppen källkod och är gratis att använda, men finns också som betalversion. Det är skrivet i Java och baserat på Eclipse. Verktyget är tillgänglig för Windows, Linux och MacOS.

Syftet med KNIME är att bearbeta, analysera och modellera data visuellt. Det går att visuellt skapa dataflöden, selektivt utföra några eller alla analyssteg och granska resultaten, modellerna och de olika interaktiva vyerna. Verktyget innehåller fler än 1000 färdiga moduler och hundratals färdiga exempel på tillämpningar. Det finns funktionalitet för att använda maskininlärning för att göra prognoser.

Lathund

Verktyget KNIME har ett omfattande bibliotek av funktioner (noder) med vilka man principiellt kan bygga egna rutiner för dokumentation av data. Vid behov kan egna noder definieras/programmeras via ett IDE som är fritt tillgängligt. Nedan följer en kortare beskrivning av några av de vanligaste noderna för hantering av in- och utdata.

Dokumentationsmöjligheter

Själva arbetsflödet i KNIME kan exporteras till en svg-fil, vilket är SNDs föredragna format för vektorbaserade bildfiler. Detta gör det möjligt att på ett enkelt sätt dokumentera vilka noder som används och hur de sitter ihop. Det ger dock inte insikt i hur varje nod är konfigurerad och ger heller ingen möjlighet att komma åt underliggande analys. För att göra detta måste man exportera arbetsflödet till en knwf-fil (KNIME workflow) som endast kan öppnas av KNIME. Vill man utanför KNIME komma åt inställningar hos varje nod så sparas dessa i xml-filer i en mappstruktur på den lokala filytan. Om man vill dokumentera metadata så kan detta göras via noder för in-och ut data vilket sedan kan exporteras till de format som stöds av KNIME.

Filtyper som stöds i KNIME

KNIME har i sitt arbetsflöde default-stöd för att skriva och läsa en rad olika filtyper. Detta görs genom att man lägger in en nod som skriver eller läser en specifik typ av data, och sedan kopplar denna nod till andra analys- och bearbetningsnoder.

Följande noder kan läsa in data i KNIME:

  • Excel Reader (XLS): läser filer av typ xls och xlsx. Läser endast data av typen numeric, date, boolean och string och utelämnar alla typer av bilder eller diagram. Läser endast från ett worksheet.
  • File Reader: Läser alla typer av ASCII-filer.
  • ARFF Reader: Läser ARFF-filer, men ej 'sparse' ARFF.
  • CSV Reader: Läser CSV-filer.
  • Line Reader:Läser från en rad från en fil eller URL till en kolumnrad.
  • Table Reader: Läser data skrivna av KNIMEs egen Table Writer nod.
  • PMML Reader: Läser en modell från en PMML kompatibel XML fil.
  • Model Reader: Läser en KNIME model port objekt från en fil.
  • Fixed Width File Reader: Läser ASCII filer där kolumnen definieras av antalet karaktärer och inte av en specifik kolumnavgränsare.
  • List Files: Skapar en lista med plats och URL för filer i en specifierad mapp.
  • Read Excel Sheet Names (XLS):Läser in de 'sheet names' som finns i en excel-fil.
  • Read Images: Läser bilder från en lista av URLs och lägger till dessa som nya kolumner.

Följande noder kan skriva data från KNIME:

  • CSV Writer: Skriver data till en ASCII-fil.
  • ARFF Writer: Skriver data till en ARFF-fil.
  • Table Writer: Skriver data till en fil som använder ett för KNIME internt format.
  • PMML Writer:Läser en modell från en PMML port och skriver denna som en PMML v4.0 kompatibel fil.
  • Model Writer: Skriver en KNIME model port objekt tiill en fil.
  • Image Writer (Port): Skriver en a bild-objekt till en fil.
  • Image Writer (Table Column): Skriver alla bildobjekt till en mapp.
  • Excel Sheet Appender (XLS): Lägger till ett 'worksheet' till en redan existerande excel-fil (xls, xslx, xslm).
  • Excel Writer (XLS): Skriver data till en ny excel-fil (xls eller xlsx, inte xlsm).
  • Explorer Writer:Tillåter kopiering av filer till mappar som är monterade (tillgängliga) i den inbyggda filhanteraren (KNIME explorer).

Att öppna och spara en fil

När ett nytt arbetsflöde/workspace öppnas i Knime skapas en workspace-mapp där de Knime-specifika filerna sparas i Knimes egna format. Att skapa, öppna och spara ett Workspace görs under File-menyn. Övriga filformat importeras och exporteras genom Reader/Writer-noder i arbetsflödet. Se guide under rubriken Filformat.

Övrigt

För ytterligare information, se:


Författare (2020-01-14): Göran Lindkvist, Johanna Cinber, Birgitta Edenius, Susanne Hansson, Pauline Jonsson, Pär Sundling

Version 1.0: Senast uppdaterad: 2020-01-29