Åtgärder

Computerized Language Analysis (CLAN)

Från DAU-handboken

Version från den 9 april 2019 kl. 06.33 av JoakimPhilipson (diskussion | bidrag) (→‎Lathund)
(skillnad) ← Äldre version | Nuvarande version (skillnad) | Nyare version → (skillnad)

Information om Computerized Language Analysis (CLAN)

CLANWin V 27-Apr-2018 11:00 nedladdat från http://alpha.talkbank.org/clan/

CHAT och CLAN är delar av CHILDES (CHIld Language Data Exchange System), som innehåller verktyg för att studera konversation och talat språk överhuvudtaget [inte bara hos barn], och dessutom är ett internationellt repositorium för språk-korpora (databaser).

CHAT är ett fritt nedladdningsbart program för transkription av ljudfiler enligt en regelstandard (CHAT- formatet). CLAN är ett program för dataanalys av transkriptioner i CHAT-format.[1]

Lathund

Det finns omfattande manualer här: https://talkbank.org/manuals/Clin-CLAN.pdf (Feb. 2018) och här: https://talkbank.org/manuals/CLAN.pdf (Apr. 2018). I Clin-CLAN.pdf (s. 5-12) lär man sig relativt enkelt hur man skapar en ny transkription och kopplar den (texten) till en audio/video-fil.

Man kan sedan följa med i texten till transkriptionen rad för rad genom att placera pekaren på en rad och välja Escape-8, varvid audio/videofilen spelas upp därifrån och rad för rad markeras i texten eftersom uppspelningen fortskrider.

För att lära sig transkribera riktigt krävs dock att man lär sig transkriptionsreglerna; detta är något för professionella lingvister. Detsamma gäller för att använda CLAN som analysverktyg; det kräver en del programmeringsvana eller åtminstone vilja att lära sig. Speciellt för morfologisk analys måste man ladda ner en s.k. MOR grammatik (som f.n. finns för 11 språk, däribland danska, hebreiska, kinesiska, men inte svenska) genom att inifrån en transkriptionsfil (.cha) i CLAN under File välja Get MOR Grammar för önskat språk.

Dokumentationsmöjligheter

Rätt goda möjligheter erbjuds att infoga metadata direkt i transkriberingen. Via menyn Tiers / ID headers (se bild 1) kan man lägga in information om datum för den transkriberade inspelningen, språk som konversationen förs på, deltagare i samtalet (roll, ålder, namn, kön), namn på korpus m.m.

Bild 1

Data från ifyllda fält blir synliga som vanlig text överst i transkriptfilen. I transkriptfilen finns även möjlighet att infoga kommentarer kopplat till enskilda uttalanden (rader), med hjälp av kommandot %COM: + tab. Det är möjligt att lägga in tidsmarkörer för enskilda uttalanden i ljud-/videofilen med hjälp av kommandot Ctrl + i. D länkas en viss rad (transkribering av ett uttalande) till den tidpunkten i den associerade mediafilen. Den sistnämnda funktionen bryts om filen sparas i ett format som inte är CLAN:s eget (t.ex. om man vill spara som .txt eller dylikt) men själva informationen bevaras som text.

Filtyper som stöds i [programnamnet]

Filformat för kopplade audio/video-filer som kan användas är exempelvis .wav, mp3, VLC (.m4v), .mov, .mp4 ; CLAN känner igen dessa filformat automatiskt vid koppling till transkription. Egna filformat är .cha, .cex (output från MOR-analys av .cha-filer) och .cut (kodfiler). Dessa filformat (.cha, .cex och .cut) förekommer valigtvis inte utanför CLAN, men kan sparas som / öppnas i några andra format som .rtf, .txt, .odt, ods, .xls - men däremot inte i .docx. Det tycks inte finnas någon annan exportmöjlighet/-kommando inifrån CLAN än just Spara som … . Enligt manualen Clin-CLAN.pdf (s. 23) finns några tilläggsverktyg (program) som KIDEVAL, EVAL och FLUCALC, som kan skicka outputfiler från CLAN med analysresultat direkt till Excelark för vidarebehandling.

Ytterligare några “exportmöjligheter” - https://talkbank.org/manuals/CLAN.pdf s.33

Via menyn Mode -> Send to sound analyzer kan man från en .cha-fil som kopplats till en ljudfil skicka ljudklipp till något av programmen Praat eller Pitchworks för vidare fonetisk analys.

Chatter är en applikation man kan använda för att validera CHAT transkriberingar (.cha-filer) och konvertera dem till XML enligt gällande schema. Kan köras på hela mappar med ett flertal .cha-filer och som output får man en ny mapp med motsvarande välformade och väldokumenterade XML-filer. Vi har testat med gott resultat.

Att öppna och spara en fil

När du öppnat CLAN, klicka på New File och därefter Save as för att spara en ny fil för transkribering. Filen ska sparas i en mapp tillsammans med den ljud-/videofil som ska transkriberas. Detta gör att filerna kan länkas samman, så att du t.ex. kan lägga in tidsmarkörer i transkriberingen som länkar till en viss punkt i den tillhörande mediafilen.

Vanligt förekommande kortkommandon som t.ex. Ctrl + O / N / S fungerar.



Författare: Rolf Hasslöw, Tobias Pernler, Joakim Philipson, Marianne Svanberg

Senast uppdaterad: 2018-06-04