Szaturációk és torzítások

Az előző részben megismerkedtünk a klasszikus modulációs effektekkel, amikkel elsősorban a műsoranyagot színezzük. A színezésnek létezik azonban egy másik formája is, ami sokkal inkább magát a hanghullámot változtatja meg, nem az "előadást". Ezt a fajta színezést hívják angolul coloring-nak, color-nak, vagy karakternek. Az ilyen, mikró szinten történő színezés erőssége szerint megkülönböztetünk szaturációt, túlvezérlést (overdrive) és torzítást (distortion), bár mindhárom torzításnak minősül. Ez a témakör talán az egyik legbonyolultabb a zenei keverésben, mert egyrészt erősen szubjektív, másrészt nagyon széles körben kiterjed, mind elméleti, mind gyakorlati területen. Nyugodtan nevezhetjük akár egy mély fekete lyuknak is. Mi most nem mászunk le ebbe a lyukba, csak éppen bekukucskálunk, de így is eleget fogunk látni ahhoz, hogy eredményesen használhassuk saját mixeinkben.


Mi az a torzítás?
Sokféle torzítás létezik, de minket a hanggal kapcsolatos torzítás érdekel, és bár a levegőben terjedő hanghullám is torzulhat, most mégsem ezzel foglalkozunk, sokkal inkább a hanghullámok elektromos jelekké történő átalakítása után létrejövőkkel. Minden olyan elváltozást torzításnak nevezünk, ami az eredeti hullámforma alakját megváltoztatja. A statikus jelszint változás nem nevezhető torzításnak, hiszen az csak az amplitúdót változtatja, a hullámformát nem.

Tipp:
Ha egy rendszer torzítását szeretnénk mérni, akkor a legtöbbször tökéletes szinuszhullámot használunk, mert ez az egyetlen olyan hullámforma, ami nem hoz létre felharmonikusokat. Erről részletesebben olvashatunk a clipperekről szóló részben.

Zaj
Analóg elektromos rendszerekben a termodinamika törvényei miatt bekapcsolt állapotban mindig van zaj. Az ilyen rendszeren áthaladó elektromos áram (esetünkben a hang hullámformája) ezt a zajt minden esetben "magára veszi", vagyis kimenetén a bemenő hullámforma és a zaj interferenciájából adódó hullámforma lép ki. Ez tehát egy olyan torzítás, ami ellen nem tudunk védekezni, mindig megtörténik, de talán pont ezért nem soroljuk a torzítások közé. Ebbe a kategóriába tartoznak még a hálózati zaj (zümmögés, vagy szaknyelven brumm, 50Hz) és a kívülről érkező egyéb interferenciák is. A mellékelt ábrán piros színnel láthatjuk a tiszta szinusz hullámot, kékkel pedig a zajjal keveredettet.

Tipp:
Aki úgy gondolja, hogy a zajt ellenkező fázissal visszatáplálva teljes mértékben ki tudná azt oltani, az sajnos téved, ugyanis a zaj alapvető tulajdonsága a véletlenszerűség. A kioltás csak akkor működne tökéletesen, ha a zaj hullámformája mindig ugyanolyan maradna. Erre jó ellenpélda a szimmetrikus kábel, ami pontosan az ellenkező fázisú zaj kioltásával működik, de csak azért, mert mindkét ér pontosan ugyanolyan és ugyanott halad, tehát ugyanazokat a zajokat szedi össze. 100%-os eredményt azonban ez sem nyújt.

64 bites lebegőpontos, 44,1 kHz-es mintavételezésű,
digitálisan előállított -18dBFS kivezérlésű szinusz hullám
frekvencia diagramja
A digitális rendszerben, matematikai úton előállított szinusz hullámra -amíg nem lép ki az analóg tartományba- nincsen hatással a rendszer fizikailag létező alkatrészeinek zaja, hiszen csak virtuálisan van jelen, számjegyek formájában. A spektrum analizátoron mégis minden esetben láthatunk mellette zajt is. Ezt kvantálási zajnak nevezik, és a digitális audió velejárója. A kvantálási zaj már a 16 bites fixpontos rendszerekben sem igazán hallható, de a modern 24 bites ábrázolásoknak köszönhetően a zajküszöb tovább csökken. Ha lebegőpontos ábrázolást használunk, legyen az 32 vagy 64 bites, akkor a zajküszöb a jelszinttel együtt változik. Vagyis egy -18dBFS jelszintű, 64 bit lebegőpontosan ábrázolt szinuszhullám a spektrum analizátoron kb. -160dB zajszintet generál, míg egy 0dBFS kivezérlésű -144dB-t. Az elméleti értékek ettől eltérőek, 0 dBFS jelszint esetén 32 bitFP-nál -156dB, míg 64 bitFP-nál -331dB a kvantálási zaj szintje. (Ebből azt a következtetést vonhatjuk le, hogy az ábra elkészítéséhez használt plugin nem képes 64 bites jelfeldolgozásra, csak 32 bitesre.) Ez persze csak a DAW-on belül igaz, hiszen a ma létező digitál-analóg audió konverterek maximum 24 bit fixpontosak, ezek átlagos gyakorlati zajküszöb értéke pedig -120dB.

Torzítások
Torzítatlan hullámformának nevezzük azt, amit tökéletesen leképezhetünk egy egyszerűbb matematikai képlettel. Ha a hullámforma alakjának felrajzolásához már bonyolultabb képlet szükséges, akkor ezt torzításnak nevezzük. Ha a szükséges függvény elsőfokú (lineáris), pl. egy szűrő esetében, aminek az erősítése és/vagy a késleltetése a frekvenciával változik, akkor lineáris torzításról beszélünk. Ez a fajta torzítás nem hoz létre újabb frekvencia összetevőket, de megváltoztatja a meglévők amplitúdóját, más néven az eloszlásukat.

Ha a szükséges függvény nem lineáris, akkor olyan torzítás lép fel, ami újabb frekvencia összetevőket hoz létre, vagyis megjelennek a felharmonikusok. Aktív erősítőfokozatokban (elektroncsövek, tranzisztorok, IC-k és digitális algoritmusok) minden esetben nemlineáris torzítások jönnek létre, passzív rendszerekben (vezetékek, vagy pl. passzív ekvalizerek, algoritmusok) pedig lineárisok. Tehát alapvetően elmondható, hogy minden jelfeldolgozás (legyen az analóg vagy digitális) torzítást okoz. Ennek káros mértéke azonban egy bizonyos tűréshatár alatt tartva gyakorlatilag nem hallható, vagyis elhanyagolható.

Amplitúdó torzítás
Ha a kimenő jel amplitúdója nem az általunk kívánt függvénynek megfelelően változik, akkor amplitúdó torzításról beszélünk. Esetünkben -mármint ami a színezést illeti- ez a legfontosabb torzítás, ezzel fogunk bővebben foglalkozni. Mérőszáma a THD, vagyis teljes harmonikus torzítás, amit decibelben, vagy az RMS érték százalékos arányában szoktak megadni. Maga az érték nem teljesen egyértelmű, ugyanis a torzítás hallhatósága erősen függ a torzítás jellegétől. Vagyis eltérő jellegű torzítás esetén azonos mért értékeknek nem azonos a hallható hatásuk. A keresztváltók által okozott torzítás például sokkal inkább hallható, mint az azonos értékű soft-clipping. Az amplitúdó torzításnak két fajtáját különböztetjük meg:

Harmonikus torzítás
A szinuszhullám alap frekvenciájának felharmonikusai, vagyis egész számú többszörösei. Egyszerűen mérhető egy szinuszhullám segítségével, mint azt a fent már említett cikkben is láthatjuk. A különböző rendszerek különböző felharmonikusokat állítanak elő, van pl. páros és páratlan.

Intermodulációs torzítás
Ebben az esetben a jelben jelenlévő kettő vagy több szinuszhullám frekvenciája összegének és különbségének, valamint ezek összegének és különbségének megfelelő frekvenciák jönnek létre. ((X+Y), (X-Y), (2X-Y), (2Y-X), általánosságban (mX ± nY))

Frekvenciamenet torzítás
Ha egy adott rendszerben a különböző frekvenciák eltérő mértékben kerülnek erősítésre, akkor nemlineáris frekvenciamenetről, vagyis frekvenciatorzításról beszélünk. Ha mindez egy szűrőben, vagy ekvalizerben történik meg, akkor ezt nyilván szándékosan tesszük (függetlenül attól, hogy nemkívánatos frekvenciatorzítás is történik). Sajnos a jelenség az alkalmazott vezetékekben, mikrofonokban, hangszórókban is jelen van, ami már egyáltalában nem szándékos.

Fázistorzítás és csoportfutási idő
Az analóg áramköri elemek és hozzájuk hasonlóan a digitális algoritmusok is szinte minden esetben fázisforgatást eredményeznek, emellett időre van szükségük, hogy a feladatukat elvégezhessék, ez pedig késleltetést, vagyis fázis eltolást hoz létre. Mindkettő megváltoztatja a hullámformát. Ez a késleltetés alapvetően nem okozna problémát mindaddig, amíg a hullámforma nem keveredik saját magával, sajnos azonban az eltolás a különböző frekvenciákon különböző mértékű, ezért mindenképpen torzulások jönnek létre.

Tranziens torzítás
Mint azt már a nevéből is sejthetjük, ez a torzítás a hirtelen fellépő jelszint változások esetében jön létre. Ha csak szinusz hullámmal mérjük, akkor egy adott rendszer lehet teljesen lineáris, viszont ha magas tranzienstartalmú jelet küldünk rá (pl. négyszöghullám), ez a linearitás már megszűnhet. Mindez a rendszer sebességéből adódik, ugyanis nem képes követni a hirtelen jelszint változást. Ebben az esetben könnyen belátható, hogy az eredeti hullámforma nem képes a kimeneten változatlan formában megjelenni, vagyis torzulni fog. Ez a fajta torzítás jellemző pl. a DA  (digitál-analóg) átalakítókra, különösen a gyengébb minőségűekre.

Torzítás digitális audió rendszerekben
Az audió jelek (hangok) digitálissá-, majd ismét analóggá alakításában, illetve a digitális audió feldolgozásában is találkozhatunk torzításokkal, amik elsősorban a "végtelen" felbontású analóg jelek véges számú biteken történő ábrázolásából erednek. Ezek a torzítások jelentkeznek a bitmélység, vagy a mintavételezési ráta változtatásakor is, de sokkal nagyobb problémát okozhat az aliasing. Egy másik elkerülhetetlen torzítás a kvantálási zaj, de szerencsére ez olyan alacsony értékű, hogy a mai 16 és 24 bites audió esetében gyakorlatilag nem hallható. Sokkal problémásabbak a túlvezérelt digitál-analóg konverterek. Bár a digitális audió elméletileg nem lépi át a 0dBFS jelszintet, a DA konverteren létrejöhetnek olyan hullámformák, amik csúcsértéke ezt meghaladja. Ezt True Peak-nek (TP) nevezzük, és a legújabb szabványok szerint készült hanganyagok már nem léphetik át a meghatározott értéket (-1dBTP). A régebbi, vagy gyengébb DA konverterek ilyen esetben hibát érzékelnek és leállítják a működésüket, ami valljuk be, nem túl jó dolog egy zeneszám hallgatása közben. "Jobb" esetben folytatják az átalakítást, de a létrejövő kiemelkedő csúcsérték a konvertert követő analóg eszközökben (erősítő, hangszóró) fog torzítást okozni.


Nemkívánatos torzítások
Ha a hangfelvétel készítést és visszajátszást (lehallgatást) vesszük alapul, akkor a hanghullám formájának megváltozása inkább hibának, nemkívánatos rossz tulajdonságnak tekinthető, mint jónak. Elméletileg minden fizikailag létező analóg eszköz torzít, ez a fizikai törvényszerűségekből adódik. Az már egy egészen más kérdés, hogy ez a torzítás milyen mértékű. A legkisebb torzítással a masztering minőségű stúdióeszközök rendelkeznek, ezért is nevezték el őket így. Máskülönben -nagyjából- ugyanolyan eszközök, mint a "normál" stúdió berendezések. Természetesen ez a torzítás a digitális rendszerek analóg összetevőinél is jelentkezik, de miután a hangot már konvertáltuk számokká, a torzítás a továbbiakban csak jelfeldolgozás után következik be.

Ha egy analóg rendszerben a hangot többször átmásoljuk, akkor az minden ciklus után torzítottabb lesz, míg digitális rendszerben ez nem történik meg, a másolás nem rontja a hangfelvétel minőségét. Más a helyzet akkor, ha digitális jelfeldolgozást végzünk, történjen az a jelszint, vagy  a frekvencia vonatkozásában. Ilyenkor digitálisan is elkerülhetetlen a hullámforma alakjának megváltozása, vagyis szintén torzítás lép fel. Ez sok esetben magának a beavatkozásnak az elkerülhetetlen része, de a legtöbbször inkább a pontatlan számítások miatt történik. Az alkalmazott bitmélység növelésével, és a lebegőpontos ábrázolás alkalmazásával ez utóbbi hiba olyan mértékűre csökkenthető, ami már meghaladja a fizikai korlátok miatt elkészíthető legjobb analóg kapcsolások teljesítőképességét is, tehát gyakorlatilag elmondható, hogy olyan kismértékűre csökkentek, hogy elhanyagolhatóvá váltak. Természetesen mindez csak addig igaz, amíg a hang a digitális tartományban marad, mert a digitál-analóg átalakítás során ismét torzítás(ok) keletkeznek.


Kívánatos torzítások
A torzítás minden esetben megváltoztatja a hullámformát, ez pedig azt jelenti, hogy nem az eredeti hangot halljuk. Elméletileg tehát ez hiba, és kerülni kell. Vannak azonban olyan esetek is, amikor a torzítás egyáltalában nem káros a hangzásra, sőt...

Felharmonikusok
Amennyiben a létrejövő torzítás a megszólaló frekvenciáknak egész számú többszörösén jelentkező frekvenciákat generál, akkor felharmonikusok keletkezéséről beszélünk. Ezek harmóniában vannak az eredeti hanggal, vagyis zeneileg nem zavaróak, sőt inkább kellemesek. Ha viszont a torzítás olyan frekvenciákat hoz létre amelyek ettől eltérőek, azokat egyáltalában nem hallgatjuk szívesen.

Alap-, páros-. és páratlan felharmonikusok.
(Nagyításhoz katt. a képre!)
A létrejövő felharmonikusokat két nagyobb csoportba sorolhatjuk attól függően, hogy az alapharmonikushoz (alaphanghoz) képest milyen frekvencián jelennek meg. Ha a felharmonikus frekvenciája páros számú többszöröse az alapfrekvenciának (2, 4, 6...), akkor páros, ha páratlan számú többszöröse (3, 5, 7...), akkor páratlan felharmonikusról beszélünk. A páros felharmonikusok zeneileg szimpatikus, finom, tiszta hangzást adnak, míg a páratlanok durva, éles, szemcsés, hegyes jellegűt, amit gazdagabb, teltebb hangzásnak, további mélységnek is nevezhetünk. Ugyanakkor, a magasabb rendű felharmonikusok által létrehozott szemcsés, érdes hangzás már nem éppen muzikális, ezért ezeket a frekvenciákat általában vágjuk, így sokkal kellemesebb hangzást kapunk. Erősített elektromos gitároknál ez a szűrés például automatikusan megtörténik a gitárláda hangszórója által, ami kb. 4kHz felett elég meredeken vág. Így már sokkal érthetőbb, hogy láda nélkül még a legdrágább erősítő is csak zizegős hangzást ad.

Bár a legtöbb esetben a torzított hang hallhatóan is kevésbé tiszta mint a torzítatlan, ha megfelelően választjuk meg a torzítást és annak mértékét, a létrejövő felharmonikusok miatt élesebbnek hallhatjuk, és ezt sokszor tisztább hangnak érzékeljük. Legjobb példa erre az Aphex Aural Exciter. (Egy EQ csak a már meglévő frekvenciákat tudja erősíteni, egy exciter viszont újakat hoz létre.) Tehát bizonyos torzítások által létrehozott felharmonikusok és megváltozott dinamika egyáltalában nem kellemetlen, sőt kifejezetten kellemes hatást biztosít(hat). Sokszor ezért használnak még manapság is analóg stúdióeszközöket.

Bár jelfeldolgozás közben a rendelkezésre álló dinamikatartományon belül digitális audió esetében is elkerülhetetlenek a torzítások, azok normál esetben emberi füllel nehezen hallhatóak. Régebben sokan voltak (ma már kevesebben) azok az emberek, akik szerint a digitális audió hideg hangzású. Ez egyrészt a korai 16 bites rendszerek és azok hibás használatából eredő hibák miatt, másrészt az analóg rendszerekben természetszerűleg meglévő (felharmonikus) torzítások hiánya miatt történt. Ezért digitális keverés közben sok esetben szándékosan adjuk hozzá a hanghoz azokat a torzításokat, amikkel az analóg eszközök működését szimuláljuk, amivel így az emberi fülnek kellemesebb hangzást hozhatunk létre. Ebben a cikkben elsősorban erről lesz szó.

Tipp:
Fontos tudni, hogy technikailag jelenleg a lehető legtökéletesebb hangrögzítési eljárás a digitális. Minősége minden tekintetben jelentősen túlszárnyalja a legjobb analóg rendszerek képességeit, a tárolás és visszajátszás során semmit nem veszít a rögzített minőségből, és feldolgozás közben is csak olyan kismértékű a torzítás, amit csak gyakorlott fül érzékelhet. Ezt különböző eljárásokkal (dither, antialiasing) gyakorlatilag meg is szüntethetjük.

Miért fontosak a felharmonikusok?
A válasz nagyon egyszerű: mert ezek határoznak meg egy jellegzetes, felismerhető hangzást. Egy trombita, egy zongora, vagy akár egy ember is képes az alap 440Hz-es "A" hang megszólaltatására, a három esetben mégsem pontosan ugyanazt halljuk, vagyis nagyon egyszerűen meg tudjuk különböztetni, hogy zongorát, trombitát, vagy embert hallunk-e. Ha nem így lenne, nem lenne értelme annyi féle hangszernek... Ez pedig a megszólaló alaphanggal együtt hallható felharmonikusoknak köszönhető.

Könnyen belátható, hogy a felharmonikusok azok, amik meghatározzák a hangzás jellegét, egyáltalában nem mindegy tehát hogy mennyi és milyen van belőlük a mixünkben. Extrém esetben előfordulhat, hogy a túlzott torzítás miatt az eredeti hangot teljesen másnak halljuk. Ez ma már természetes a torzítós gitárhangoknál, de nem hiszem, hogy bárki örülne neki, ha a mixében hallható hangszereket nem lehetne felismerni emiatt. Tehát figyeljünk oda a felharmonikus tartalomra!

Torzítás, mint művészi kifejező eszköz
A valóságról készült modern digitális másolat (legyen az hang vagy kép) egy átlagember számára általában teljesen életű, vagyis nem képes az eltérést érzékelni. Ha ez a célunk, akkor természetesen mindent megteszünk annak érdekében, hogy a lehető legalacsonyabban tartsuk az elkerülhetetlen torzítások mértékét. Van azonban, amikor nem ez a célunk, és szeretnénk az adott felvételt kicsit puhítani, vagy épp ellenkezőleg keményebbé, érdesebbé tenni. Ekkor a torzítást arra használjuk, hogy az adott felvételt úgy mutassuk be, ahogyan mi szeretnénk láttatni, nem pedig úgy, ahogyan az a valóságban létezett.

Torzítás, mint hangzásjavító eszköz
Sok esetben a torzított felvétel a legtöbb embernek sokkal jobban tetszik, mint a torzítatlan, mert kiemeli az előnyöket és elnyomja a hátrányokat. Ezt mondhatjuk úgy is, hogy javítja a felvétel minőségét, amennyiben a minőség az élvezeti szintet jelenti. A legtöbb esetben ezért használjuk a szándékos szaturációt, még akkor is, ha analóg tartományban ez elkerülhetetlen (volt). Egyik legjobb példa a szalagos magnók, elektroncsövek és traszformátorok szaturációja, finomabban fogalmazva színezése, amit sokan meleg hangzásnak neveznek. Szerencsére a digitális technika ma már mindenkinek lehetővé teszi, hogy a lehető legjobb torzításokat alkalmazhassuk úgy, hogy ne kelljen milliókat költenünk egy-egy torzítóra, akarom mondani analóg stúdióeszközre.


Torzítás fajtái erősség szerint
Analóg hangrögzítés és feldolgozás esetében, ha növeljük a jelszintet, a hang egy ideig csak erősebb (hangosabb) lesz, ha viszont tovább növeljük, akkor először elkezd szaturálódni, majd amikor már túlzottá válik a jelcsúcsok levágása, hallhatóan is torzít. Ez a torzítás felharmonikusokat hoz létre, ami zeneileg illik az adott hangmagassághoz, tehát az emberi fül számára nem kifejezetten kellemetlen. Ezzel szemben digitális rendszerben (ha nem alkalmazunk analóg működést modellező algoritmusokat) a hang csak egy bizonyos értékig képes erősödni, viszont addig torzítás nélkül. Ezt követően azonban nem torzítás, hanem pattogás, kattogás és egyéb hangok jönnek létre a DA átalakítás során, és ez egyáltalában nem kellemes hangú. Ezért figyeljünk rá, hogy a hangkártyából, audió interfészből kilépő jel soha ne legyen túlvezérelt!

A ma alkalmazott digitális hangrögzítésben és jelfeldolgozásban használt modellezések olyan mértékben képesek utánozni az analóg kapcsolások működését, hogy gyakorlatilag nincsen köztük hallható különbség. Ezért a következőkben tárgyalt torzítások ugyanúgy érvényesek a digitális rendszerekben található algoritmusokra, mint az analóg rendszerekre. Ha a torzítást szándékosan adjuk a hanghoz, akkor azt alapvetően valamilyen karakternek nevezzük. A torzítás erősségét és jellegét a következő csoportokba soroljuk:

Szaturáció (Saturation)
A szaturáció szó azt jelenti, hogy telítettség. Ez a legkevésbé hallható nyilvánvaló torzítás, amit a legtöbbször meleg (warm) hangzásnak is hívnak, jelentsen ez bármit is.

Mágnesszalag szaturáció (tape saturation)
1000 Hz-es szinusz hullám mágnesszalag szaturációjának
spektrum diagramja. Lila színnel a tiszta szinusz látható.
A mágnesszalag szaturáció (kompresszió) működésének lényege, hogy egy bizonyos jelszint felett a szalagon már nincsen elegendő mágneses részecske a megnövekedett mágneses tér tárolásához, vagyis kifogynak a tartalékok, ezért nem képes magasabb szintű jelet tárolni. Ez elég különlegesnek számít az analóg szaturációk között, ugyanis működése mind dinamikai, mind frekvencia tartományban érzékelhető, ráadásul mindkettőben nemlineáris jelleget mutat. A szalag túlvezérlésekor harmonikus torzításba kezd, elsősorban a mély hangokat érintő alacsonyfrekvenciás felharmonikusok létrehozásával (lásd a lenti ábrán). Ezzel együtt frekvencia és fázis torzítás is tapasztalható, és természetesen a dinamika is csökken, ami viszont elsősorban a magasfrekvenciájú tranzienseket érinti. Itt tehát kis túlzással egy többsávos kompresszorról és tranziens formálóról beszélhetünk, amik együttesen ekvalizerként is működnek. Ez kiemeli a mélyeket és vágja a magasakat (kis túlzással).

50 Hz-es szinusz hullám mágnesszalag szaturációjának
spektrum diagramja. Figyeljük meg, hogy az alacsony
frekvenciákon sokkal több harmonikus keletkezik.
Jellemző hangzás:
- alacsonyfrekvenciák kiemelése és dúsítása, erős alacsonyfrekvenciás jelek esetében páratlan felharmonikusok keletkezésével
- középfrekvenciák emelése, főként alacsony szalagsebességeken
- magasfrekvenciák csengése, magasfrekvenciás tranziensek dinamikájának csökkentése. Tulajdonképpen ez adja az analóg hangzást, mert nem egyszerű szűrőként működik.
- dinamika csökkenés, kompresszió
- sztereó alkalmazás esetében a két oldal tűrésbeli eltérései miatt szélesebb, a harmadik dimenzióban pedig távolabbi hangkép alakul ki, ugyanakkor az egymáshoz közel elhelyezkedő író és olvasó fejek miatt áthallás is tapasztalható.

Transzformátor szaturáció (transformer saturation)
1000 Hz-es szinusz hullám transzformátor szaturációjának
spektrum diagramja. Lila színnel a tiszta szinusz látható.
Hasonlóan a mágnesszalaghoz, a transzformátorok is mágneses módon működnek, nem véletlen tehát, hogy hasonló nemlineáris működést és harmonikus torzítást tapasztalhatunk. Bizonyos jelszint felett a trafó magja telítődik (szaturálódik), mert a mágneses fluxus sűrűsége már nem képes tovább növekedni. Ez természetesen azt eredményezi, hogy a hullámforma teteje levágódik, ami egyenes út a felharmonikusokhoz. Ami igazán szerethetővé teszi a transzformátor szaturációt az az, hogy a létrejövő torzítás fordítottan arányos a frekvenciával. Vagyis alacsony frekvenciákon erősebb a torzítás mint a magasakon, ettől a hangzás lágyabbá, melegebbé válik. További érdekesség, hogy a fém mag gyorsabban mágneseződik át, mint ahogyan a felvett mágnesességet elveszíti. Az ilyen működést hiszterézisnek nevezzük, és ennek köszönhetően az alacsony frekvenciák torzítása nem csak magas jelszinteknél történik meg, hanem alacsonyabbaknál is. Mivel a mag lassan veszíti el az összegyűjtött mágnesességet, ezért az alacsony frekvenciák, amik rendszerint nagyobb energiát képviselnek mint a magasak, nem csak túlvezérlés esetén torzulnak, hanem szinte mindig (hasonlóan a mágnesszalaghoz).

50 Hz-es szinusz hullám transzformátor szaturációjának
spektrum diagramja. Figyeljük meg, hogy bár a trafó
szaturáció hasonló mint a mágnesszalag, 
itt mégsem
jelentkezik az alacsony frekvenciák extra dúsulása. 
Jellemző hangzás:
- alacsonyfrekvenciák kiemelése és dúsítása, erős alacsonyfrekvenciás jelek esetében páratlan felharmonikusok keletkezésével
- az alacsony jelszintek több felharmonikust termelnek, ezért dúsabbnak hangzanak, mint a magasak
- a mag anyagától függően változik a létrejövő torzítás
- a magas frekvenciák kiemelkednek

Tipp:
Sokan úgy gondolják, hogy az elektroncsövek adják egy-egy legendás stúdió eszköz egyedi hangzását. Figyeljük azonban meg, hogy ezekben a legtöbbször ugyanazok a csövek találhatóak! Akkor mégis mi okozza, hogy hangzásuk teljesen eltérő? Hát a bennük használt eltérő transzformátorok!

Elektroncsöves és tranzisztoros szaturáció
1000 Hz-es szinusz hullám elektroncsöves szaturációjának
spektrum diagramja. Lila színnel a tiszta szinusz látható.
A mágnesszalagos és az elektroncsöves szaturáció a két legismertebb torzítás, ők versenyezhetnek a legnépszerűbb cím elnyeréséért. Valójában a csöves torzítás ami nagyobb eséllyel indul, ugyanis a mágnesszalagos rögzítők gyakorlatilag kihaltak, így pár 10 év múlva a fiatalok már azt sem tudják majd, mi fán terem. Ugyanakkor az elektroncsöves gitárerősítők mostanság reneszánszukat élik, aki egy kicsit is "ért hozzá" ilyet szeretne, de a vérhifisták is esküdnek a csöves hangzás mindenhatóságára. Pedig sajnos nincsen igazuk. A tranzisztorok az elektroncsövek leváltására készültek, így azt lehet mondani, hogy elméletileg mindenben jobbak náluk. Az igazság az, hogy egyik sem jobb a másiknál. Az egyik erre a célra, a másik arra jobb, de tökéletes eredményt egyik sem képes adni. Persze ez most minket nem érdekel, ugyanis most éppen hogy nem a tökéletességükkel, hanem sokkal inkább a tökéletlenségükkel foglalkozunk, vagyis a torzításukkal. Bár sokak szerint az elektroncsöves eszközök adják a jó szaturációt és meleg hangzást, ne felejtsük el, hogy a világ talán legelismertebb hangzását adó Neve előerősítők, ekvalizerek és keverőpultok nem tartalmaznak elektroncsöveket, csak tranzisztorokat! Mindenesetre ezt a kis bevezetőt itt hagyom, hogy egyértelmű legyen, miért nem választottam az elektroncsöveket és a tranzisztorokat külön.

1000 Hz-es szinusz hullám tranzisztoros szaturációjának
spektrum diagramja. Lila színnel a tiszta szinusz látható.
A túlvezérlés természetesen mindkét technológia esetében felharmonikusokat generál. Ha megfigyeljük egy túlvezérelt szinusz hullám formáját, azt tapasztalhatjuk, hogy a jelcsúcsok levágása kétféle képpen történhet meg. A lekerekített sarkút soft-clippingnek nevezzük, az éles sarkút pedig hard clipping-nek. Sokan úgy tartják, hogy az elektroncsövek viszonylag lassan reagálnak, és ebből adódik, hogy a hullámforma élei csöves szaturáció esetén lekerekítettek lesznek. Ez azonban nem igaz, ugyanis a lekerekítettebb élek nem az elektroncső alkalmazásából, hanem az elektroncsövet tartalmazó (a tranzisztorostól eltérő) kapcsolásból ered. A tranzisztoros erősítő fokozatokban nagyobb visszacsatolást alkalmaznak, és ez adja az élesebb sarkokat, nem maga a tranzisztor. Újabb tévhit, hogy az elektroncsövek páros felharmonikusokat állítanak elő, míg a tranzisztorok páratlanokat, ugyanis a kapcsolás tervezése az, ami nagyban befolyásolja a létrejövő felharmonikusokat. Egy-egy elektroncsövet akár többféle kapcsolásban is használhatunk, a triódák például általában egyvégű áramkörökben használatosak, és meglehetősen sok páros és páratlan felharmonikust eredményeznek, míg a pentódát általában az ún. "A" vagy "AB" osztályú "push-pull" kimeneti áramkörökbe építik, amelyek kiszűrik a páros felharmonikusokat, így csak a páratlan harmonikus torzításokat hagyják meg. Fogadjuk hát el, hogy az áramkör tervezése sokkal inkább befolyásolja a létrejövő felharmonikusokat, mint az, hogy elektroncső vagy tranzisztor dolgozik-e benne.

Jellemző hangzás:
- Az elektroncsövek viszonylag alacsony jelszinten is szaturálnak, ezzel szemben a tranzisztorok inkább csak magasabbaknál
- A tranzisztorok a túlvezérlési jelszintig viszonylag tiszta hangzásúak, azt átlépve viszont erős torzításba kezdenek
- Az elektroncsövek a jelszint emelkedésével arányosan, folyamatosan növelik a torzítás mértékét, ezért sokan kellemesebbnek tartják a hangzásukat
- A legtöbb plugin esetében az elektroncsöves szaturáció páros felharmonikusokat állít elő, míg a tranzisztoros inkább páratlanokat

Kifejezetten elektroncső modellezésből elég sok plugint találunk, de nem ilyen széles a választék, ha tranzisztoros szaturációra vágyunk. Elektroncsöves vagy tranzisztoros szaturációt kapunk a legtöbb analóg modellezésű pluginben, de ha nincsen szükségünk ezek kompresszor vagy ekvalizer részére, csak magára a szaturációra, akkor használjunk keverőpult, vagy összegző erősítő modellezést. Ezek a legtöbbször inkább tranzisztoros modellezések, mint csövesek. Néhány esetben külön-külön és együtt is használhatjuk őket, pl. a Nomad Factory Drum tools, IK Multimedia Saturator X, Waves Cobalt Sapphira, Klanghelm SDRR, Black Box HG-2, Unfiltered Audio Indent 2, Vertigo VSM3, hogy csak néhányat említsek.


1000 Hz-es szinusz hullám soft-clip túlvezérlése.
Jól látható az eredeti és a túlvezérelt hullámforma
közötti különbség.
Túlvezérlés (Overdrive)
Ez az az állapot, amikor a jelszintet a rendszer által leírható érték fölé szeretnénk növelni, de ez ugye nem lehetséges, ezért a jelcsúcsok a felső határértéken maximalizálódnak, vagyis azt túllépni nem tudják. A hullámforma teteje levágódik, de hogy ez milyen hullámformát eredményez, az az adott kapcsolástól, vagy algoritmustól függ. Ez a fajta torzítás még nem hallatszik kifejezetten torznak. Túlvezérléskor minden esetben felharmonikusok jönnek létre, de hogy páros, páratlan, vagy mindkettő, az az adott eszköztől, technológiától függ. A digitális túlvezérlés adja a legrosszabb hangot, sokak szerint az elektroncsöves pedig a legjobbat.
(Az ábra az előzőekkel azonosan készült, azaz a lila szín jelzi a torzítatlan 1000 Hz-es szinuszhullámot. A kissé eltérő megjelenés a grafikon összenyomásából ered.)

Kis túlzással azt is mondhatjuk, hogy a szaturációnál leírtak mind érvényesek a túlvezérlésre is, hiszen a szaturációt a legtöbb esetben az adott rendszer túlvezérlése okozza. Vagyis ha a szaturáció elérésekor nem állunk le, és tovább növeljük a jelszintet, hamarosan túlvezérlést érünk el, a szó klasszikus (overdrive) értelmében, ami már hallhatóbb torzítást eredményez. Ez azonban még messze áll a tipikus torzítós hangzástól, itt még elég jól felismerhetőek a hullámformák, és az erősebb felharmonikus tartalom is inkább kellemes, mintsem érdes hangzású. Ha a mixünknek, vagy egyes sávoknak szeretnénk egy kicsit agresszívebb, dögösebb, keményebb hangzást adni, akkor egyértelműen a túlvezérléshez kell nyúlnunk. Nem csak elektromos hangszereken, de dobokon és akár éneken is jól használható!

Tranzisztor túlvezérlés
Az enyhe túlvezérlés egyik legjobb tulajdonsága, hogy segítségével nagyon sok felharmonikust tudunk létrehozni (hallható torzítás nélkül), és ezek jelszintje akár el is érheti az alaphang jelszintjét. Ezzel a megoldással elérhetjük, hogy a sávunk hangosabbá válik, miközben a kivezérlése megmarad, vagy éppen csökken. A legtöbb analóg mixben ezt a trükköt alkalmazzák, ami jól jöhet akkor is, ha maszkolás miatt nem hallható rendesen egy adott hangszer. Ilyenkor a felharmonikusok segítenek az agyunknak megtalálni az elnyomott frekvenciákat, így ekvalizer -és további bonyodalmak- nélkül oldhatjuk meg a problémát. Szintén jó hasznát vehetjük a harmonikus tartalomnak akkor is, ha olyan (általában alacsony) frekvenciákkal dolgozunk, amit a gyengébb lejátszók már nem képesek visszaadni. Ilyenkor pár felharmonikus hozzáadásával a basszus a kis hangszórókon is könnyen hallhatóvá válik. A túlvezérlés nem csak frekvencia tartományban változtatja meg a hangot, hanem dinamikájában is, hiszen a levágásra kerülő részek kimeneti csúcsértéke csökken, vagyis kompresszió és/vagy limitálás jön létre. A túlvezérlést tehát ilyen eszközök helyett is használhatjuk, bár csak igen kis mértékben. (A dolog visszafelé is működik, hiszen az erős limitálás vagy kompresszió torzítást okoz. Erről részletesebben olvashatunk itt és itt.)

Elektroncső túlvezérlés. Jól látszik az
egyenirányított hullámforma megjelenése.
Sok esetben kifejezetten jótékony hatású az erős tranziensek csökkentése, amit szintén szaturációval, vagy túlvezérléssel is megoldhatunk. Ettől a hangzásunk simább lesz, sokan ezt azonosítják az analóg hangzással, ahol az erős tranziensek az elektronikai alkatrészek működéséből következően természetszerűleg levágódnak. Ennek digitális modellezése pl. a Waves-NLS pluginben is megtalálható.

Digitális vs. analóg túlvezérlés
Analóg környezetben a torzítás egyik alapvető oka az áramkör felső teljesítménykorlátja. Ez azt jelenti, hogy adott eszköz nem képes egy bizonyos áramerősségnél és feszültségnél nagyobbat elviselni. Ha ez történik, akkor jó esetben torzít, rosszabb esetben felgyullad.

Digitális környezetben is létezik felső korlát, ismertebb nevén 0dBFS. A túl magas jelszint itt is problémát okoz, de itt nem történhet meg az eszköz kigyulladása, csak maga a torzítás. Ez viszont az analóg eszközökkel szemben kifejezetten kellemetlen hangzást ad.

Jellemző hangzás:
- Kicsit érdes, érces hangzás, de még nem kifejezetten torz
- Kellemesen dúsítja a felharmonikusokat, amitől vastagabbnak, teltebbnek, erősebbnek halljuk a hangot


Torzítók (Distortion)
Hard-clipping
A torzítók által előállított torzítás hasonló a túlvezérléshez, de annál sokkal jobban túlhajtjuk az áramkört (vagy algoritmust) amit kifejezetten azzal a céllal készítettek, hogy torzítson. Ezért itt nem kell attól tartani, hogy esetleg kigyulladna. A legalapvetőbb torzító az úgynevezett hard-clip, amikor a levágott hullámcsúcsok éles sarkokat (vagy azokhoz nagyon közeli kis íveket) tartalmaznak. Ez a soft-clippinghez képest sokkal több felharmonikust hoz létre.

Hard-clipping létrejöhet analóg és digitális rendszerben is, bár a hullámforma sarkosodása analóg eszközöknél soha nem éri el a teljes élességet, mindig marad egy kicsi lekerekítettség. Ez igaz arra az esetre is, amikor digitálisan állítunk elő pl. négyszöghullámot, ami matematikailag teljesen szögletes, de gyakorlatilag egyetlen DA átalakító sem tudja ezt matematikai pontossággal leképezni, sem pedig erősítő vagy hangszóró megszólaltatni.

Elektroncsöves vs tranzisztoros torzítás
Sokan úgy gondolják, hogy az elektroncsöves torzítók egyik legjellemzőbb tulajdonsága az aszimmetrikus vágás (asymmetrical clipping), más néven az egyenirányítás (angolul rectification, ami ismerős lehet a híres rectifier gitárerősítőkből). Ez azonban nem igaz, sőt a tranzisztoros kapcsolások sokkal inkább aszimmetrikus hullámformákat állítanak elő (lásd fuzz torzítás), ami a bennük alkalmazott magasabb előfeszültségből adódik.

Az egyenirányítás azt jelenti, hogy a váltakozó áramból egyenáramot állítunk elő, vagyis annak feszültség értéke csak pozitív irányba tér el a nullától, negatív irányba nem. Egyutas együtemű egyenirányításról beszélünk, ha csak a hullámforma felső részét tartjuk meg (ez látható a mellékelt ábrán), kétütemű egyenirányításról beszélünk, ha mindkét felet megtartjuk, de az alsót invertáljuk. Ebben az esetben nem csak felharmonikusok jönnek létre, hanem hangmagasság változás  (vagyis hangmagasság torzítás) is.

A jó torzítós hangzás egyik titka a megfelelően szűrt ki- és bemenő jel. A csöves gitárerősítők például tartalmaznak egy "rejtett" ekvalizert, ami extra basszust és magasakat állít elő. Ezt a hangszóró impedancia görbéje, és a végfok relatív magas kimeneti ellenállása eredményezi. A régebbi és a modernebb gitárerősítő-torzítások hangzása között nem az alkalmazott technológia (csö vagy tranzosztor) miatt van különbség, hanem hogy hova helyezik el a kapcsolásban az EQ-t. Régebbi úgynevezett nem master hangerős erősítőknél (VOX AC, Fender Tweed, Marshall Super Lead, JTM) a torzító fokozat elé kerül, az újabbakban viszont utána.

Alapvető torzító fajták
Dallas Arbiter Fuzz Face, az első torzító belülről.
Bár a következőkben rendre gitárokról és gitár pedálokról beszélünk, ezeket a torzításokat nem csak elektromos gitárokra alkalmazhatjuk! Sokan használják őket más elektromos hangszereken is, mint pl. elektromos zongorák, clavinet, elektromos orgonák, stb., de effektként akár éneken is jól szólnak. Az egyik tipikus nem elektromos hangszer amin előszeretettel alkalmaznak torzítót a keveréskor, a pergődob.

Az első kifejezetten torzításra készült gitár pedál az 1960-as években született, és az általa előállított torzítást Fuzz-nak nevezték el. Alapvető feladata a gitár hangjának vastagabbá tétele volt. Használatával erősebb basszust, és kásás hangot kapunk, sokan azonban ezt túl mesterségesnek ítélik meg, mert a hangzás erőszakosabbá válik tőle. Legismertebb használója Jimi Hendrix volt.

Bár maga a túlvezérlés az erősítőkben is megvalósítható, bizonyos hangzásokat csak úgy lehet elérni, ha a torzítást még magasabb fokra emeljük. Ezt a gitárerősítő elé kötött külön elő-erősítőkkel (pl. ADA MP1), vagy úgynevezett overdrive pedálokkal tehetjük meg. Az egyik leghíresebb ezek közül az Ibanez Tube Screamer, ami elektroncsöves túlvezérlést állít elő. Ilyenkor alapvetően megőrizzük a gitár eredeti hangját, és ehhez keverhetünk hozzá némi túlvezérlésből eredő ércességet. Ez többek között már a Metallica és Stevie Ray Vaughan hangzása.

A fejlődés persze nem állt meg, és sokan sokkal több felharmonikusra, úgynevezett torzításra vágytak. Ezt ma distortion néven találhatjuk meg a különböző pedálokban, amiből a legismertebbek a Boss DS sorozat, és a legendás MT-2 MetalZone. A torzítás sokkal agresszívebb, mint az overdrive pedáloknál, hiszen ezeket arra tervezték, hogy drasztikusan megváltoztassák a gitár eredeti hangját. Alapvetően a súlyos, vastag, metal stílusban megszokott hangzásokat kapjuk tőlük.


Visszahajtó torzítás. Mint ahogyan az a mellékelt ábrán is látható, ebben a torzítási fajtában az eddigiektől eltérően a hullámforma csúcsai nem vágódnak le, hanem a maximális jelszint elérése után negatív előjellel adódnak hozzá a jelszinthez. Vagyis a lehetséges csúcsérték elérése után "tükröződnek", visszafordulnak, más szóval visszahajlítódnak. Ezért hívjuk ezt foldback, azaz visszahajtó torzításnak. Jól látható, hogy ilyenkor milyen hegyes, éles sarkok alakulnak ki, és ahogy várható, ez rendkívül sok felharmonikust hoz létre.

Páros vs páratlan felharmonikusok
Az egyik népszerű technikai téma a torzítókkal kapcsolatban, hogy páros, páratlan, vagy mindkét felharmonikusokat generálnak-e. Sokan (köztük szakemberek is) úgy tartják, hogy a szimmetrikus vágások alapvetően páratlan felharmonikusokat, míg az aszimmetrikus vágások elsősorban páros felharmonikusokat hoznak létre. Ez azonban nem igaz! A valóságban az aszimmetrikus torzítások páros és páratlan felharmonikusokat is előállítanak, míg a szimmetrikus vágások csak páratlanokat. Ez utóbbi méréséhez megfelelő pontosságú teszt berendezés szükséges és természetesen csak tiszta szinuszhullámmal lehetséges, amit valljuk be, szinte egyetlen egy hangszer sem képes előállítani. A legtöbb hangforrás a rá jellemző felharmonikusokkal szólal meg, amik lehetnek párosak, páratlanok, vagy mindkettő. A gitár hangja például páros és páratlan felharmonikusokat is tartalmaz, így nem sok értelme van további párosakat hozzáadni. Ami sokkal fontosabb a szimmetrikus/aszimmetrikus vágással kapcsolatban az az, hogy aszimmetrikus esetben más intermodulációs torzítások jönnek létre, amik erősebb alapfrekvenciát, és kevesebb magasfrekvenciás tartalmat adnak. Ez utóbbi finomabb, selymesebb, kevésbé éles hangzást biztosít.

Száz szónak is egy a vége, a legtöbbeknek jobban tetszik a professzionális elektroncsöves erősítők torzítása, ami valószínűleg abból ered, hogy ezeket magasabb költséggel állítják elő, és ebbe a jobb tervezés is beletartozik. Ennek megfelelően sokkal magasabb áron is kerülnek értékesítésre, szemben az olcsóbb tranzisztoros erősítőkkel, amik ennek megfelelően gyengébb tervezést is kaptak. A hangzás különbség tehát nem az alkalmazott technológiából (csöves vagy tranzisztoros), hanem az alkalmazott tervezésből ered. Legjobb tanácsom: hallgassunk a fülünkre, és használjuk azt, amelyik a legjobban illik az adott feladathoz.


Digitális torzítás
Az analóg szaturációk és torzítások, és az őket modellező algoritmusok hatása gyakorlatilag megegyezik, ezért ilyen szempontból nem érdemes megkülönböztetni digitálist és analógot. A digitális jelfeldolgozás azonban olyan mértékben eltér az analóg technikától, hogy léteznek bizonyos torzítások, amiket csak digitális rendszerben tapasztalhatunk. Bár ezeket is használhatjuk kreatív célokra (vagyis tipikus hangzásként), a legtöbbször inkább problémának nevezhetőek.

A digitális hangrögzítéssel kapcsolatos hibák alapvetően abból erednek, hogy fixpontos ábrázolásban csak egész számokat tudunk felírni. Vagyis 1,2,3, stb. Nem ábrázolható 1/2, 0,3, 1,523. Ez pedig azt jelenti, hogy az elméleti szinusz hullámunk formája megváltozik. Ugyan a lebegőpontos ábrázolásnak köszönhetően törteket is tudunk tárolni és feldolgozni, de a digitál-analóg konverterek még mindig csak fixpontos értékeket képesek fogadni. Vagyis hiába "pontos" az ábrázolás a digitális tartományban, ha azt nem tudjuk az eredetivel megegyezően visszaalakítani analóg jellé, hogy halljuk is.

Bitszám csökkentés (Bit reduction)
Az első ábrán bitszám csökkentést láthatunk, amivel a digitális minta bitszámát, azaz a dinamikatartományát csökkentettük. Ez matematikailag egy osztási műveletnek felel meg. Ha pl. a bitszámot a felére csökkentjük, az azt jelenti, hogy az adott minta értékét osztjuk kettővel. Ez persze nem nagy dolog abban az esetben, ha az így kapott érték egész szám, és ábrázolható a rendelkezésre álló bitek számával. Ha viszont ez nem így van, akkor az eredményt valamilyen módon illeszteni kell az adott bitmélységhez (bitszámhoz). Ezt kétféle módon tehetjük meg. Vagy csonkolással, ahol a túlcsordult biteket egyszerűen elfelejtjük (levágjuk), vagy kerekítéssel, ahol megpróbáljuk a lehető legközelebbi még ábrázolható értéket megtalálni. A torzítás mindkét esetben létrejön, de a csonkolásos eljárásnál sokkal erősebben, így ha szándékosan alkalmazunk digitális torzítást, egyértelmű, hogy ezt a módszert választjuk. A mellékelt ábrán 50%-os bitszám csökkentést láthatunk, vagyis a 24 bites audióból 12 bitest készítettünk. (A bitszám további csökkentése folyamatosan erősödő torzítást generál!) Figyeljük meg, hogy a hullámforma szinte semmit sem változott, a spektrum diagramon mégis jól látható a létrejövő rengeteg felharmonikus. Sokan ezekért a felharmonikusokért szeretik a régebbi 12 bites digitális eszközöket és samplereket, szintetizátorokat, ezért bizonyos szempontból ezt is nevezhetjük meleg hangzásnak. Ha nekünk nincsen ilyen eszközünk, akkor egy bitcrusher pluginnel viszonylag egyszerűen modellezhetjük mindezt. Viszont jó ha figyelembe vesszük ezt a torzítást akkor is, amikor a 24 bites audiónkat 16 bitesre csökkentjük, pl. CD-re íráshoz, vagy streaming kódoláshoz!

Tipp:
A modern audió munkaállomások (DAW) a legtöbbször 32 (64) bit lebegőpontos ábrázolással, az audió interfészek pedig 24 bit fixpontos DA átalakítókkal dolgoznak. Ez azt jelenti, hogy a maszter buszról kilépő jelet valahol, valamikor 24 bitre kell csökkenteni. Hogy ez hol és hogyan történik meg, nagyban befolyásolja a létrejövő hang tisztaságát. Mint az imént láthattuk, a konverzió bizony minden esetben torzítást és felharmonikusokat hoz létre, amit csak csökkenteni tudunk, de teljesen megszüntetni nem. (Ezért érdemes dithert használni akkor is, ha nem renderelünk, csak hallgatjuk a mixet.)

Mintavételi ráta csökkentés (down sampling)
A következő ábrán egy másik lehetséges digitális torzítást láthatunk, amikor is nem a bitmélységet, hanem a használt mintavételezési frekvenciát csökkentjük. Ilyenkor két problémával is találkozhatunk. Az egyik, hogy a Shannon-Nyquist tétel ilyenkor is él, vagyis a legmagasabb tökéletesen reprodukálható hullámforma frekvenciája a mintavételi frekvencia feléig terjed. Ha ennél magasabb frekvenciák is jelen vannak, akkor azok átlapolódnak (lásd lejjebb az aliasing fejezetben). A túl ritka mintavételezés hatására a magas frekvenciájú komponensekből alacsony frekvenciájú komponensek lesznek, azaz a jel frekvencia komponensei felcserélődnek. Ez olyan frekvenciák megjelenését eredményezi, amik addig nem szerepeltek a jelben, vagyis torzítás történik, de ez sajnos nem harmonikus torzítás, vagyis a létrejövő hangzás nem éppen kellemes. Ezért a jobb szoftverekbe úgynevezett antialiasing szűrőket építenek be, amik megakadályozzák, hogy a magas frekvenciák visszalapolódhassanak.

A mintavételezési frekvencia csökkentésekor létrejövő torzítás másik forrása a digitális audió egész számú, különálló mintákból felépülő rendszeréből adódik. Abban az esetben, ha az eredeti frekvencia egész számú többszöröse a csökkentettnek, nincsen túl nehéz dolgunk, mindössze kihagyjuk a felesleges mintákat. Például 88,2 kHz-ről 44,1 kHz-re csökkentésnél a hallható tartományon belül szinte semmilyen torzítás nem jön létre (ha jó antialiasing szűrőt használunk). Mi a helyzet akkor, ha 96 kHz-ről szeretnénk 44,1-re csökkenteni? Ekkor minden 2,17687074829932 minta értéket kéne csak figyelembe venni. Ez viszont nem lehetséges, hiszen csak egész számú minták állnak rendelkezésre, vagyis torzítást kapunk, még akkor is, ha nincsen 22,1 kHz-nél magasabb frekvencia a jelben.

A mellékelt ábrán egy 44,1 kHz-es mintavátelezésű, 1000 Hz-es szinuszhullámot tartalmazó jel mintavételezési frekvenciáját csökkentettünk 30%-ra, azaz 14,69 kHz-re, majd alakítottuk vissza 44,1 kHz-re. Jól látható, hogy itt viszonylag szabályosan, rengeteg frekvencia alakul ki, amit akár felharmonikusnak is gondolhatunk egészen addig, amíg meg nem mérjük a frekvenciájukat. Azok pedig nem egész számú többszörösei az 1000-nek, így nem is nevezhetjük őket felharmonikusoknak. Ezek bizony az átlapolás termékei. Ha más értékkel csökkentünk, akkor a létrejövő frekvenciák száma és elhelyezkedése teljesen eltérő lesz! A látható hullámforma alakját nem érdemes túl komolyan venni, mivel a digitál-analóg konverterek más formát állítanának elő, viszont jelenleg nem áll rendelkezésemre önálló oszcilloszkóp, hogy erről képet készítsek.

Ez a fajta torzítás nem csak mintavételi frekvencia csökkentéskor jön létre, hanem akkor is, amikor a rátát növeljük. Ekkor azonban talán még nehezebb feladatunk van, hiszen ki kell találnunk, hogy mi lehetett két minta között. Elvileg egy sima interpolációs technikát alkalmazva jó értéket kapunk, de a gyakorlatban nem így van, ezért nem egyszerű igazán jó felkonvertáló algoritmust írni.

Aliasing
Analóg jelek digitálissá alakítása minden esetben úgynevezett mintavételezéssel történik. Ez azt jelenti, hogy a "végtelen" nagy felbontású analóg jelből meghatározott időközönként mintát veszünk, azaz elektromos jelekké alakított hang esetében megmérjük az éppen aktuális feszültség értéket. Amikor a digitális jelet visszaalakítjuk analóggá (hogy halljuk is), a szükséges időpontban ezt a feszültségértéket hozzuk létre a DA átalakítón.

A Shannon-Nyquist tétel értelmében, egy folytonos idejű jel elvileg tökéletesen visszaállítható mintáiból, ha a mintavételi frekvencia legalább kétszer akkora, mint a jel sávszélessége. (Ez azt jelenti, hogy az emberi hallás kb. 20000 Hz-es felső határán lévő frekvenciákhoz minimum 40000 Hz-es mintavételezés szükséges.) Ez abból a megfigyelésből következik, hogy egy ideális mintavevő-tartó áramkörrel mintavételezett jel eredeti frekvenciaspektruma a mintavételezett jelben a mintavételi frekvencia minden többszörösével eltolva megismétlődik. Ha tehát a jel sávszélessége nagyobb, mint a mintavételi frekvencia, az menthetetlenül átlapolódik valamelyik eltoltjával. Ezt az átlapolást angolul aliasing-nak, és valljuk be, jobb híján manapság magyarul is ennek nevezzük. Hogy a mintavételezéskor ne kerülhessen a mintavételi frekvencia felénél magasabb a konverterbe, úgynevezett átlapolásgátló szűrőket (antialiasing filter) alkalmaznak a mintavételezés előtt, még az analóg fokozatban. Ezek általában aluláteresztő szűrők, és a mintavételi frekvencia felénél magasabb frekvenciájú jeleket hivatottak eltávolítani.

Aliasing keletkezése torzítás esetén. Mintavételi frekvencia 44,1 kHz.
Ugyanez igaz a digitálisan létrehozott frekvenciákra is, vagyis a mintavételezési frekvencia felénél magasabbak nem tűnnek el, hanem "visszatükröződnek" a felső frekvenciakorlátról, ez pedig olyan frekvenciák megjelenését jelenti a hallható spektrumban, amik nem kéne hogy ott legyenek. Ezek a legtöbbször nem felharmonikusok, ezért egyáltalában nem is kellemesek. Tegyük hozzá, hogy a legtöbb esetben a visszatükröződéseknek olyan alacsony a jelszintjük, hogy normál esetben nem hallhatóak, de természetesen itt is fennáll annak a veszélye, hogy további feldolgozás után, vagy több sávról összeadódva már jelentős energiát képviselhetnek.

Mint az előzőekben már láthattuk, torzításkor minden esetben felharmonikusok jönnek létre.  Bár a spektrum analizátoron úgy tűnhet, hogy ezek megszűnnek egy adott fokozat után, a valóságban nem így van, elméletileg a végtelenig terjednének. Vagyis szinte minden esetben a hallható 20kHz-es tartomány fölött is létrejönnek frekvenciák. Analóg áramkörökben az átlapolás nem létezik, így itt nem is kell tartanunk a káros hatásaitól, viszont mint azt fentebb már megtudtuk, a digitális technikában korlátozott az átviteli sávszélesség felső frekvencia értéke, ezért az ezt meghaladó frekvenciájú felharmonikusok minden esetben átlapolást idéznek elő, ami kellemetlen hangzáshoz vezet! (Lásd a fenti animáción.)

Újramintavétlezés (Resampling)
20kHz-en létrehozott 1000Hz-s szinusz hullám
 alulmintavételezése 5kHz-re, majd visszaalakítása
20 kHz-re
Sokan effektként használják a mintavételi ráta csökkentést, ami azt jelenti, hogy a plugin csökkenti a mintavételi frekvenciát, majd hogy az így létrejött hang valós időben is használható maradjon a DAW-ban, ismét növeli azt az eredetire. Ezt újramintavételezésnek is nevezzük. Ha a pluginben nincsen antialiasing szűrő, akkor az átlapolás szintén jelentkezik, és nem csak a mintavételezési frekvencia felett! A probléma abból adódik, hogy a digitális, vagyis különálló minták által létrehozható analóg hullámforma csak egy adott sávszélességen belül reprodukálja az eredeti frekvenciával a jelet, ezen sávszélesség felett pedig rendre a Nyquist-határt meghaladó értéknek megfelelő arányban. Ha például felére csökkentjük a mintavételi frekvenciát és nem használunk antialiasing szűrőt, akkor a csökkent sávszélességen belül lévő frekvenciák is átlapolódnak, nem csak a felette lévők.

Nézzünk egy egyszerű példát:
Az eredeti mintavételi frekvenciánk 20kHz, ezen ábrázolunk egy 1000 Hz-es szinusz hullámot (ennek ugye nincsenek felharmonikusai). Ha csökkentjük a mintavételi frekvenciát 10kHz-re, akkor megjelenik egy 1000Hz-es frekvencia, és egy 9000Hz-es is, mivel a 10kHz feletti frekvenciák visszatükröződnek a Nyquist-határtól. Vagyis 10000-1000=9000. Ha a mintavételi frekvenciát tovább csökkentjük 5kHz-re, akkor 1000Hz, és a 4000 Hz jelenik meg. Ha az alulmintavételezés sokad része az eredeti rátának, akkor nem csak az eredeti frekvencia felett, hanem alatta is megjelennek a visszalapolások!

Aliasing elkerülése
Hogyan védekezhetünk az aliasing-al szemben a digitális rendszeren belül? A megoldást két részre kell felbontanunk:

Antialiasing szűrő
A mintavételi ráta csökkentéséből adódó átlapolásokra elvileg egyszerű a megoldás, ugyanazt kell tennünk mint digitalizáláskor, vagyis a mintavételi frekvencia felénél magasabb frekvenciákat le kell vágni, természetesen még azelőtt, hogy a mintavételi frekvenciát csökkentettük. Ehhez célszerű lineáris fázisú szűrőt alkalmazni, máskülönben fázisproblémával találkozhatunk. Mindezt persze a konvertáló program kell hogy elvégezze, ami lehet maga a DAW, plugin, vagy különálló szoftver. Ha ez az antialiasing szűrés még a mintavételi ráta csökkentése előtt megtörténik, az átlapolás nem jelentkezik, csupán csak az átviteli sávszélesség csökken (a Nyquist-határ feletti frekvenciák levágódnak). Ha viszont nem történik szűrés, vagy nem kielégítő módon, akkor aliasing, vagyis torzítás lép fel.

Tipp:
Nem minden mintavételezési ráta konvertáló algoritmus működik egyformán! A legtöbb DAW-ba beépítve is találunk ilyet, de sok gyártó önálló szoftverként is elkészítette. Az Infinite Wave jóvoltából egyszerűen megtudhatjuk, hogy az általunk választott konvertáló milyen minőségű.

Túlmintavételezés (oversampling)
A digitális jelfeldolgozás közben (pl. torzításkor) létrejövő Nyquist-határ feletti frekvenciákból adódó átlapolások elkerülésére az egyik lehetséges megoldás, ha a feldolgozásokat magasabb mintavételi rátával végezzük mint az eredeti mintavételi frekvencia (célszerűen a létrejövő legmagasabb frekvencia dupláján), így azok nem lapolódnak át. A művelet elvégzése után az eredeti Nyquist-határnál magasabb frekvenciákat kiszűrjük (levágjuk), majd visszaállítjuk az eredeti mintavételi frekvenciát. Ezt a módszert nevezik túlmintavételezésnek. Ez persze csak a pluginen belül történhet meg, még mielőtt a jel visszakerül a DAW-ban. Ha az általunk használt plugin jó minőségű, akkor alkalmaz túlmintavételezést, de ha nem az, akkor nincsen más választásunk, mint magasabb mintavételezési rátával dolgozni a teljes DAW projektben, és csak a kész mixet konvertálni 44,1 kHz-re. Ezt azonban csak olyan szoftverrel érdemes elvégezni, ami képes az anitaliasing-ra! Ha nem ilyet használunk, akkor az egész hercehurcának semmi értelme nincsen, sőt többet árt, mint használ!

Aliasing bekapcsolt túlmintavételezéssel.
Szerintem sokkal egyszerűbb megoldás, ha a felharmonikusokat generáló pluginjeinket ellenőrizzük le, vajon okoznak-e aliasing-ot. Az ellenőrzés viszonylag egyszerű, én a következő megoldást ajánlom: Állítsuk be a DAW-ban a kívánt mintavételi frekvenciát (célszerűen 44,1kHz). Hangforrásként használhatunk egyszerű szinuszhullám generátort is, de szerintem sokkal könnyebb észrevenni az aliasing-ot, ha a frekvencia folyamatosan változik. Használjunk tehát sweep generátort, vagy automatizáljuk a hullámforma generátorunk frekvenciáját. A hangforrás után helyezzük el a tesztelni kívánt plugint, és állítsuk be a kívánt paramétereket. Az így kapott jelet vezessük egy spektrum analizátorba, amin állítsunk be kb. -100dB zajküszöböt, hogy egyszerűbb legyen látni a látnivalót. Indítsuk el a jelünket, vagy kapcsoljuk be a generátort, és figyeljük meg a spektrum analizátoron látható felharmonikusokat. Ha az első animáción látható módon a felharmonikusok nem szűnnek meg a felső frekvenciakorlátnál (22kHz), hanem elkezdenek visszafelé haladni az alsóbb frekvenciák irányába, akkor biztosak lehetünk benne, hogy erős aliasing-ot látunk és hallunk. Összehasonlítás képen ezen az animáción ugyanazt a plugint láthatjuk mint az első animáción, de most bekapcsolt túlmintavételezéssel.

A sorozat következő részében megvizsgáljuk, hogy a most tárgyaltak közül melyik torzítást mikor és mire tudjuk használni. Ezt a megszokott módon példákon keresztül fogjuk megtenni. Addig is eredményes keverést kívánok minden kedves olvasónak!

(Ha úgy érzed, hogy hasznos volt számodra a cikk, cserébe nézd meg a hirdetést.)

A következő részhez katt ide...

Felhasznált irodalom:
https://en.wikipedia.org/wiki/Distortion
https://en.wikipedia.org/wiki/Distortion_(music)
https://en.wikipedia.org/wiki/Intermodulation
https://en.wikipedia.org/wiki/Audio_bit_depth
http://diwaves.com/tmp/sample_bits.htm
http://www.myotis-audio.hu/torzitasok-az-er-sit-ben.html
http://www.vias.org/crowhurstba/crowhurst_basic_audio_vol2_080.html
https://www.soundonsound.com/techniques/analogue-warmth
https://www.diyrecordingequipment.com/blogs/news/explain-like-im-5-transformers
http://www.theaudioarchive.com/TAA_Resources_Tubes_versus_Solid_State.htm
http://www.tonestack.net/articles/guitar-amps/tube-vs-solid-state.html
https://en.wikipedia.org/wiki/Tube_sound
http://www.parallelhomeaudio.net/TypesAudioDistortion.html
https://www.soundonsound.com/techniques/distortion-studio
https://www.audiokinetic.com/library/edge/?source=Help&id=wwise_guitar_distortion_plug_in
https://www.youtube.com/watch?v=CHfeMGQC6WI
https://hu.wikipedia.org/wiki/Anal%C3%B3g-digit%C3%A1lis_%C3%A1talak%C3%ADt%C3%B3
https://www.soundonsound.com/techniques/digital-problems-practical-solutions

Nincsenek megjegyzések:

Megjegyzés küldése