AAC og AAC+

AAC (Advanced Audio Coding)  er en videreutvikling av MP-familien, basert på samme prinsipper, og på ti års erfaring med MP-koding: Nå vet man hva som ‘lønner seg’, og hvilke koder man ‘gjerne skulle hatt’ i analysen av lydfiler.

Tommelfinger-regelen er at for samme lydkvalitet minst halverer AAC størrelsen på lydfila, eller bitraten, sammenlignet med MP3. Som med MP3 lærer programutviklerne seg gradvis «lure triks» som bedrer kvaliteten ved samme bitrate.

Jo mer regnekraft man har til disposisjon, jo bedre kodinger er det mulig å finne: Har du tid til det, kan du prøve alternative kodinger, dekode dem og se hvilket alternativ som gir minst avvik fra originallyden, eller du kan sette et tak for tillatt avvik, og velge det av alternativene som gir minst filstørrelse og som holder seg under grensen.

DAB+ er DAB-sendinger der lyden er kodet med AAC+ i stedet for MP2. Bortsett fra lydkodingen er alt annet likt; senderne ‘vet ikke’ hvordan lyden er kodet. En signalpakke kan inneholde både MP2 (DAB) og AAC+ (DAB+) kanaler; det finnes ikke noe eget «DAB+ nett».

I likhet med MP3 er AAC mer følsom for feil enn MP2: Når AAC sendes i et DAB-nett brukes ekstra feilkorreksjon, utover det MP2 krever. Selv om ‘rå’ AAC-komprimering er tre ganger så god som MP2, reduserer feilkodene gevinsten til en faktor på to: En DAB+ (AAC+)-kanal på 96 kbps tilsvarer røfft regnet en DAB (MP2)-kanal på 192 kbs. Man finner stadig nye «lure triks» med AAC: De nyeste koderne er nær like gode på 64 kbps AAC+ som MP2 på 192 kbps.

Nødvendig bitrate

Hvis vi reduserer bitraten steg for steg (dvs. komprimerer hardere og hardere) faller lydkvaliteten for MP2/MP3 relativt langsomt ned mot 112-96 kbps. Under 96 kbps blir MP3 raskt dramatisk dårligere, og en bitrate på 64 kbps er bare egnet for tale. AAC+ gir utmerket musikkvalitet ved 80-96 kbps, god kvalitet ved 64 kbps. Så faller det langsomt ned til 20-24 kbps, noe avhenigig av koderen. 24 kbps oppleves av mange som godt nok for musikk­underholdning i bil.

Med mer erfaring har man funnet metoder for å identifisere hvilke elementer i lyden som kan kodes mer effektivt, og for musikk ligger i dag knekkpuntet på omlag 24-32 kbps: Ned til 24 kbps faller kvaliteten gradvis, men der er det en alvorlig knekk. For enda lavere bitrater blir kvaliteten raskt ‘uholdbar’ for musikk.

Prøver på 24 kbps AAC+ komprimering:

Funky gitar (42 sec, 129 kbyte): Inner City Blues, Grover Washington, fra CD-en The Best of Grover Washington

Vokalharmonier a capella (39 sec, 121 kbyte): Trilo, Lena Willemark og Ale Møller, fra CD-en Nordan

Treblåser-harmonier (48 sec, 147 kbyte): La Casquette, Quintet Clarinettes, fra CD-en Musique Têtue

Prøver på 12 kbps AAC+ komprimering (dvs. ekstremt hardt komprimert!):

Ingen forsøker å hevde at lyd komprimert til 1/120 av originalen er fri for artefakter. Når vi vurderer såpass drastisk komprimert lyd må vi se på det som en erstatning for tidligere tiders AM-sendinger, men også som en indikasjon på minimums-kvailteten for det som kan leveres med DRM-teknologi over lang- og mellombølge, nærmest uansett signalforhold.

For lydprøvene nedenfor må det understrekes at bitraten er mindre enn femtedelen av en tradisjonell telefonikanal (som er på 64 kbps).

Alarmer/disharmonisk lyd: Time, Pink Floyd, fra CDen The Dark Side of the Moon

Dobra: The Boy Who Wouldn’t Hoe Corn, fra CD-en Alison Krauss + Union Station: Live

Tablas: Mallezennou, fra CD-en Trio Eric Marchand: An tri breur

Det som klarer seg forbausende dårlig gjennom lav bitrate AAC+ komprimering er tale. AAC+ hanterer ‘musikalske’ regulære toner med harmoniske overtone-spektra bra.

12 kbps kan (anno 2016) betraktes som en absolutt nedre grense for akseptabel musikkgjengivelse er ved bruk av AAC+ der tilgang til båndbredde er svært dårlig.

Opplesing / tale, som ikke følger (akustisk sett) harmoniske mønstre, er derimot langt vanskeligere komprimere vellykket med AAC-teknologi:

Opplesing: Fra Doppler, av Erlend Loe:

For tale ligger absolutt nedre grense for akseptabel lydkvalietet på rundt 20 kbps.

NRK Vær distribueres på 16 kbps; dette gir en kvalitet som må vurderes som ikke akseptabel.

Plusstegnet i AAC+

Plussen i AAC+ og DAB+ er ikke tilfeldig; den viser til en spesifikk teknikk brukt i lyd-miljøer også før digital radio var aktuelt: Det menneskelige øre er følsomt for overtoner, men har svært dårlig ‘absolutt gehør’ i de øverste to oktavene: Vi hører styrken på overtonen, men hører dårlig hvilken tone det er; den kan være ganske omtrentlig. «Pluss» er fag-sjargong for der man fjerner alle overtoner fra lyden: Kun frekvenser under 7 kHz bevares, og man får et langt enklere lydsignal å komprimere. Overtonene blir ikke droppet, de blir analysert og omformet til kommandoer overført på en egen sidekanal til mottakeren, om hvordan mottakeren skal generere overtoner basert på innhodet i basis-signalet. Kommandoene krever en liten brøkdel av den plassen man sparer ved å kun kode lyd under 7 kHz direkte, maksimalt 3 kbps av bitstrømmen[1] – i praksis brukes ofte langt mindre.

Parametrisk stereo: PS

En annen betegnelse vi ofte ser i AAC-sammenheng er «PS», Parametric Stereo. Som med overtoner i DAB+ fjernes direkte kodet informasjon, og erstattes av  en delkanal med kommandoer slik at mottakeren kan regenerere det ble hold tilbake. Her gjelder det stereo-informasjonen.

PS brukes kun på bitrater fra 48 kbps og lavere. Normalt handteres stereo som to uavhengige kanaler, men mye av lyden er lik eller nesten lik: For en plateprater med én mikrofon, midt i lydbildet, er det ingen forskjell – samme info sendes i begge kanaler. Også FM utnytter dette: Hovedsignalet er i mono, mens stereo-informasjonen er et differanse-signal som angir forskjellen mellom høyre- og venstre-kanal. PS er en videreutvikling av dette: Hovedsignalet er mono-lyd, men i stedet for å angi differansen mellom kanalene direkte, overføres parametere til en matematisk funksjon som fordeler lyden mellom kanalene. Dette reduserer datavolumet betydelig. Parameter-strømmen tar maksimalt 3 kbps av kapasiteten.

Flere kanaler

AAC/AAC+ -standarden definerer kodingen av opp til 48 hovedkanaler og 16 sub-kanaler, inkludert hvordan en mottaker/dekoder skal handtere flere kanaler enn hva den leverer ut til forsterkeren.

Ingen av de norske radiokanalene har hittil begynt å sende f.eks. musikk eller radioteater i 5.1 eller 7.1-format, og ingen planer har blitt annonsert (pr. juni 2016). Når en radiokanal ønsker å ta det i bruk, kreves ingen endringer i sendernettet; alle nødvendige endringer gjøres i lydstudio. Lytternes mottakere vil fungere. Naturligvis vil en ren stereo-mottaker kun motta stereolyd; for å gjøre seg nytte av multikanal-lyden må lytteren ha en mottaker som kan levere flere kanaler til en multikanal forsterker.

[1] Både 7 kHz som øvre frekvens og 3 kbps som grense for ekstrakanalen er spesifikke for AAC+, men andre ‘plus-teknikker’ har grenser i samme område.