Digitalt ljud
Från DAU-handboken
Digitalt ljud
Precis som med digitala bilder och videofiler innehåller digitala ljudfiler en rad viktiga egenskaper som påverkar kvaliteten och storleken på ljudfilen, och som är direkt relaterade till det valda filformatet. Digitalt ljud kan beskrivas som den teknik som används för att spela in, lagra, generera, manipulera och återge ljud med hjälp av ljudsignaler som har kodats i digital form.
Förenklat kan processen beskrivas som att en mikrofon tar upp ljud och omvandlar det till en analog elektrisk signal. En analog-till-digital-omvandlare (förkortat ADC, AD eller A/D) transformerar sedan den analoga signalen till en digital signal. När ljudvågen omvandlas till digitalt ljud så ”samplas” den analoga signalen. Sampling betyder egentligen provtagning och det är också i princip vad som händer när man samplar. Man hämtar in mätvärden i regelbundna tidsintervall med några mikrosekunders mellanrum och ett värde registreras vid varje givet ögonblick. Ju fler värden som registreras, desto bättre blir återgivningen. Om man har en samplingsfrekvens på 44.1kHz (vilket är vanligt för CD-skivor), så tar man alltså 44100 mätvärden (samplingar) per sekund. Den digitala signalen, eller det digitala ljudet, kan därefter redigeras och manipuleras med hjälp av digitala ljudverktyg. När inspelningen sedan ska avlyssnas, utför en digital-till-analog-omvandlare den omvända processen och transformerar den digitala signalen tillbaka till en analog signal som skickas till hörlurarna eller högtalaren.
En digital ljudfil som är tänkt att bevaras bör helst kodas och lagras i ett okomprimerat filformat, men okomprimerade filer är ofta väldigt stora. Därför används ofta kodekar. En kodek är ett program som kodar och avkodar digitala dataflöden eller signaler på olika sätt. Dess uppgift är normalt att komprimera och packa upp data så att man kan lagra och överföra filer med en mindre filstorlek. Det finns kodekar som bevarar ljudfilen i ursprungligt skick, antingen helt utan komprimering eller med förlustfri komprimering. Det finns också kodekar som använder sig av så kallad ”förstörande”, eller destruktiv komprimering. Destruktiv komprimering innebär att en del av informationen går förlorad varvid filen blir mindre i storlek. Ur ett långtidsperspektiv är det dock rekommenderat att skapa och bevara en ljudfil med så hög kvalitet som möjligt och i ett okomprimerat format.
Viktiga egenskaper
Viktiga egenskaper hos en ljudfil som bör bibehållas under hela bevarandeprocessen är i korthet:
- Varaktighet – dvs.. längden på ljudfilen i tidskodat teckenformat (timecoded character format) (TCF). Kontroller bör göras för att säkerställa att filen matchar den avsedda längden.
- Bit Depth – anger hur många bitar av information som lagras per prov (sample) och är en indikator på ljudkvalitet (t.ex. 16 eller 24 bitar).
- Samplingsfrekvens - en indikator för antalet samplingar per sekund. Samplingsfrekvens är oftast uttryckt i hertz t.ex. 44,1 kHz (en vanlig samplingsfrekvens) och är, liksom Bit Depth, en indikator på kvaliteten på filen.
- Kanaler - beskriver antalet överföringskanaler som används för att bära fram ljudet till högtalaren. Mono (en kanal), Stereo (två kanaler) och Surround (fler än två kanaler, ofta 5,1 eller 5,2).
- Kanaltilldelning - om varje kanal har tilldelats ett kanalnummer kan dataskaparen välja varifrån ljudet tillhörande olika kanaler ska komma. I en stereoinspelning av en intervju skulle det exempelvis gå att bestämma att ljudspåret med intervjuaren tilldelas kanal 1 och hörs i vänster högtalare och ljudspåret med respondenten tilldelas kanal 2 och hörs i höger högtalare.
Filformat för långtidsbevarande
De filformat som beskrivs nedan är de som rekommenderas för bevarandet av ljudfiler:
Föredragna format | Accepterade format |
---|---|
AIFF (.aif, .aiff) | AAC (.aac) |
Broadcast Wave Format (.bwf) | Audio Video Interleave (.avi) |
FLAC (.flac) | MP3 (.mp3) |
Matroska (.mka) | MPEG-4 Part 14/MP4 (.mp4) |
MPEG-1 (.mpg, .mpeg, …) | Ogg Vorbis (.ogg) |
MPEG-2 (.mpg, .mpeg, …) | Opus (.opus) |
Waveform Audio (.wav) | Speex (.speex) |