Klog på tre minutter: Alt du behøver vide om komprimering af lyd

Hvilket format skal jeg gemme mine musikfiler i? Og hvordan undgår jeg, at lyden bliver elendig? Få et hurtigt overblik over, hvordan du kan komprimere dine lydfiler.

19. marts 2013 kl. 18.31

Kirk McElhearn

Måske vil adgangen til praktisk talt ubegrænset lagerplads og båndbredde engang i fremtiden betyde, at det bliver normen at anvende ukomprimerede lydfiler. Men i dag komprimerer man oftest lydfiler for at spare plads og for at gøre det hurtigere at downloade og flytte sine lydfiler.

På trods af den udbredte antagelse, at lydkomprimering nødvendigvis får musik til at lyde dårligere, så er det ikke altid tilfældet. I det følgende kan du få et hurtigt indblik i de mest almindelige typer af lydkomprimering.

Komprimering med eller uden tab

Der findes to overordnede typer af lydkomprimering: Komprimering med eller uden tab (hvilket også kaldes henholdsvis lossy og lossless). Komprimering med tab sker med formater såsom MP3 og AAC, som nok de fleste vil være bekendte med. Med denne type komprimering mistes data fra den oprindelige musik. Disse data genskabes ikke, når musikken dekomprimeres i forbindelse med afspilning, og de er således tabt. Om dette tab påvirker den lyd, der faktisk kan høres, er et spørgsmål, jeg vender tilbage til.

Komprimering uden tab sørger dog for, at de data, der komprimeres, kan genskabes nøjagtigt i forbindelse med afspilning. Det er samme koncept, som når filer pakkes i ZIP-arkiver. Når man komprimerer et billede eller et tekstdokument til en ZIP-fil, sparer man plads, men når man pakker ZIP-filen ud igen, er hver en bit og hvert et tegn nøjagtigt som før komprimering.

De mest udbredte lydformater med komprimering uden tab er Apple Lossless, der er skabt af Apple og bruges i iTunes samt FLAC (Free Lossless Audio Codec), der er et open source-format, som understøttes af meget forskelligt lydudstyr og som anvendes til såvel professionel optagelse af livekoncerter som rip i høj kvalitet af især klassisk musik af privatpersoner.

Hvad er der egentlig på en musik-cd?

En musik-cd indeholder en PCM-datastrøm (pulse code modulation). Kopierer man disse ukomprimerede data over på en computer, pakkes de ind i en container som enten en AIFF- eller WAV-fil. En sådan fil består blot af rå PCM-data med en header, der gør, at den kan læses af et program. Bitraten for ukomprimerede lydfiler kopieret fra musik-cd'er er 1411 kilobit per sekund (kbps).

Hvordan fungerer komprimering uden tab?

Ligesom ved komprimeringen anvendt i grafikformater såsom TIFF eller PNG leder formater til lydkomprimering uden tab efter redundante data, som erstattes af data med kortere strenge, som ved dekomprimering kan genskabes til de nøjagtigt samme data som før komprimering. Med komprimering uden tab kan musikfiler reduceres i størrelse med mellem 40 og 75 procent, afhængig af hvor kompleks musikken er.

Hvad går tabt ved komprimering med tab?

Data, der er komprimeret med tab, kan ikke genskabes til fulde ved dekomprimering. Ved denne type komprimering sigtes der blot efter at genskabe dataene i en ikke perfekt men tilstrækkelig kvalitet inden for fastsatte grænser, som defineret af bitrate eller filstørrelse.

Lydkvaliteten kan blive mærkbart forringet, når man ripper en cd til AAC eller MP3, men hvis komprimeringen sker ved en tilstrækkelig høj bitrate, vil tabet ikke være til at høre for de fleste lyttere og på de fleste musikanlæg.

Under alle omstændigheder er målet her at reducere filstørrelsen, så man får plads til mere musik eller så filerne lettere og hurtigere kan overføres fra apparat til apparat eller via internettet.

Det grundlæggende princip ved lydkomprimering med tab er, at der her gøres brug af viden om menneskets opfattelse af lyd til kun at gemme de lyde og frekvenser, det er menneskeligt muligt at høre.

Selv om forskellen i bitrate - og derfor filstørrelse - mellem den ukompromerede lydfil og den komprimerede udgave er stor, så vil lytteren ikke nødvendigvis opfatte nogen stor forskel i lyden.

Bruges der såkaldt "joint stereo" i komprimeringen, gemmes meget lave frekvenser i mono i stedet for stereo, hvilket oftest ikke forringer lydoplevelsen, fordi lydbølgerne ved disse lave frekvenser er så lange, at lytteren ikke kan opfatte, om de afspilles i stereo eller ej. (En lydbølge på 100 Hz er cirka 3,4 meter lang.)

Det er også derfor, surround sound-anlæg kun har en enkelt subwoofer og placeringen af den ikke er så vigtig. De fleste har svært ved at høre lyde over 16.000-18.000 Hz, så de meget høje frekvenser herover fjernes som regel også.

Sådan opnås endnu højere komprimering

Der kan også benyttes kodning i variabel bitrate (VBR). Det gør det muligt for programmet, der komprimerer, at kode de mindre komplekse dele af en lydfil med en lavere bitrate og de mere komplekse dele med en højere bitrate.

Herudover reducerer visse formater til komprimering med tab filstørrelsen yderligere ved oveni at komprimere uden tab.

Der kan opnås en endnu større reduktion i filstørrelse, når det drejer sig om komprimering af lydfiler med stemmeoptagelse, såsom hvis man ripper lydbøger fra cd. For eksempel tilbyder iTunes en foruddefineret import-indstilling ved navn Spoken Podcast. Denne indstilling komprimerer filer til en meget lav bitrate (32 kbps i mono eller 64 kbps i stereo), men bruger en særlig stemmefiltrering.

Da den menneskelige stemme ligger i et meget begrænset frekvensområde (fra cirka 85 til 255 Hz), selv hvis man tager højde for overtoner, så kan man i komprimeringen holde sig inden for dette snævre frekvensområde for på den måde at fjerne en meget stor mængde data uden at påvirke den opfattede lyd.

Tilbage i Napster-dagene var det almindeligt, at MP3-filer med musik var kodet i 64 eller 96 kbps. Det gav generelt en lyd, der var mærkbart ringere end lyden fra cd. Men i dag sælger iTunes-butikken musik i 256 kbps, ligesom også Amazon og andre forhandlere af downloadet musik benytter en tilsvarende bitrate eller kvalitet.

Lydkomprimeringen er desuden blevet generelt forbedret med bedre MP3-kodere og mere avancerede formater såsom AAC, der leverer en højere lydkvalitet ved lavere bitrater.

Selv om nogle lyttere mener at kunne høre forskel på komprimerede og ukomprimerede musikfiler, kan man jo altid foretage en blindtest, for at finde ud af om man selv kan høre forskel.

Oversat af Thomas Bøndergaard