Minden a decibelekről 3. rész


A decibelek világa cikksorozat előző részeiben (1. rész és 2. rész) megismerkedhettünk a decibellel, a különböző hangtechnikában használatos decibel skálákkal, valamint a referencia jelszintek jelentőségével.

Nézzünk most hogyan használhatjuk ezeket a gyakorlatban!





A hangfelvételek első lépése, hogy a hang bekerüljön a rögzítő eszközbe. Ehhez mikrofonokat, vagy vonal szintű jeleket használunk, amit egy előerősítőn keresztül küldünk a hangrögzítő berendezésünkbe. Az egyszerűség kedvéért most csak a digitális rögzítésről lesz szó, de analóg eszközökre is ugyan ez vonatkozik.

A jel útja felvételkor:

A jelforrást általában egy vezetéken keresztül küldjük a hangkártyánkra, interfészünkre, stb. Ezen belül található egy erősítő áramkör, ami hajtja az Analóg-Digitál (AD) átalakítót.


Természetesen ennek az előerősítő áramkörnek is van egy optimális működési tartománya, ha túlhajtjuk torzítani fog, ha pedig kevés jelet kap, zajos és élettelen, vékony lesz a felvétel (tekintsünk most el az alacsony frekvenciás jelektől, ill. az impedancia és jelszint illesztéstől (DI-BOX). Tehát itt is érvényesíteni kell a 0 VU elvet. Ha eszközünk rendelkezik kivezérlés mérővel, az nagyon jó hír, hiszen azon jól látható a beérkező jel szintje. Állítsuk hát 0VU-ra.


A jel útja az AD átalakítón vezet tovább, ami az analóg hangot digitalizálja, azaz számokká alakítja, hogy azt egy számítógép értelmezni és tárolni tudja. Ennek az áramkörnek szintén egy optimális jelszintre van szüksége a jó minőségű átalakításhoz. Ezt az optimális jelszintet a DAW szoftverünkben is leolvashatjuk a felvételi csatorna kivezérlés (peak) mérőjén. Ajánlott a legnagyobb jelszintet -10dBFS peak-en tartani, ezzel elkerülhető az AD átalakító túlvezérlése, valamint nem kockáztatjuk, hogy a felvételünkben túlvezérlés lesz.
VU meter a bejövő csatorna első inzert pontján,
-18 dBFS-re kalibrálva
Ha a bemenő csatornánkra valós idejű monitorozást is használunk, az első insert slotba beilleszthetünk egy VU meter plugint, amit -18dBFS-re kalibrálva tovább ellenőrizhetjük a helyes felvételi szintet. Ennek természetesen 0VU-n kell lennie, de a jelcsúcsokon semmi képen ne haladja meg a +3dBVU-t.

24bit vs 16bit

A régi időkben, amikor még csak 16 bites AD átalakítókat használtak a stúdiókban (és otthon), mindenki azt ajánlotta, hogy a lehető legnagyobb jelszinttel (0dBFS) vegyünk fel hogy a legnagyobb felbontást tudjuk elérni, vagyis addig toljuk az előerősítő potiját felfelé, amíg csak túlvezérlés nélkül tudjuk. Ekkor persze a hangkártya előerősítője és az AD átalakító is jócskán az optimális működési értékek felett volt hajtva, főként pillanatnyi jelcsúcsok esetén (amit észre sem lehet venni a kivezérlésmérő műszeren), ami torzítást és nemkívánatos dinamika változásokat vitt a felvételbe. Ezért mondták régebben, hogy a digitális technika hidegen, nem emberien szól. Nem csoda, hiszen ők nem rendeltetésszerűen használták!

A 24 bites AD átalakítók esetében is fennáll ez az effektus, de ezeket már nem kell csúcsra járatnunk, hogy ugyan olyan, sőt a 16bit-nél sokkal jobb felbontást érhessünk el. Ha tehát a felvételünket -18dBFS RMS-en hajtjuk végre, az 21 bites felbontást jelent (ami 126 dB dinamika tartománynak felel meg, ezt a jobb stúdió mikrofonok tudják csak), ami máris sokkal jobb, mint amit egy CD valaha is tudna. Ez az érték kb. -10dBFS peak-nek felel meg a peakmeter-en. Ha tehát nincs VU meter pluginünk, akkor is tudjuk ellenőrizni az optimális felvételi jelszintet.

Újabb kérdés, hogy az általunk használt interfész vajon a valóságban milyen SNR (signal to noise ratio, Jel zaj viszony)-al rendelkezik. Ugyanis attól, hogy 24 biten továbbítja az adatokat, még nem biztos hogy képes is azokat ilyen széles dinamika tartománnyal kezelni. A legjobb mai konverterek 124 dB-el rendelkeznek, egy átlagos pedig 98-100 körül. Tehát hiába is vezéreljük ki a felvételt 0dBFS-re, abból a 24 bitre eső 144 dB-ből csak 100 lesz hasznos, a maradék 44 pedig zaj. És persze túlvezérelt is lesz...

Analóg gain staging
Gain staging, avagy...
A gain staging (jelszint kezelés) lényege, hogy minden a hang-láncban lévő egységnek (készüléknek, plugin-nek) a neki leginkább megfelelő jelszintet adjuk tovább, azaz egy egészséges jel-zaj viszonyt tartunk fent a láncban.

Milyen jelszinttel vegyek fel?

A tartalékról sokat lehet hallani, angolul Headroom-nak hívják és egy nagyon fontos dolog ahhoz, hogy a zenénk igazán jól szóljon. A zene nem egy statikus zaj, hanem izgő-mozgó ritmusos energia, aminek helyre van szüksége ahhoz hogy lélegezni tudjon, akár csak egy jó táncosnak ahhoz hogy ne csak egy helyben topogjon.

Térjünk vissza tehát a jó öreg tradicionális analóg hangrendszerünkhöz. Tudjuk, hogy 0VU-n érzi magát a legjobban, ami ugye +4dBu értéknek felel meg. A VU méterek átlag értéket mutatnak, tehát nem jelzik a jelcsúcsokat! A profi analóg cuccok kb. +24 dBu jelszint elviselésére vannak tervezve, tehát +20 dB (+24dBu-4dBu=20dB) tartalékkal rendelkeznek a 0 VU felett. Az analóg VU métereken ez a plusz 20 decibel tartalék nincs feltüntetve, a VU skála csak +3 dB-ig van jelezve! Itt tehát sokkal kevesebbet lehetett tévedni a túlvezérlést illetően. A digitális peak méterek természetesen mutatják ezt a +20dB-t is, ezért sok hozzá nem értő úgy gondolta, hogy ki kell használni ezt is és túlhajtotta az áramköröket, amik soha nem voltak arra tervezve, hogy egy ilyen +20 dB-es értéken működjenek (számoljunk utána, hogy +20dB = 10x nagyobb feszültség). Arról nem is beszélve, ha az előadó művész-úr/nő egy kicsit hangosabban dolgozott, akkor lehetett elölről kezdeni a felvételt...

Érdemes a DAW peak meterjét személyre szabni
Tehát a digitális rögzítéskor alkalmazott -18dBFS szinttel csupán csak leutánozzuk a régi, jól bevált profi módszert. Egy tipikus analóg keverőpult zajszintje általában -100 dBu, ha ehhez hozzáadjuk a +24dBu még elviselhető jelszintet, 124 dB dinamika tartományt kapunk, ami kb. megfelel a mai 24 bites profi hangkártyák dinamika tartományának.

Szóval a -18dBFS felvételi jelszint maximálisan megegyezik a profi stúdiók által régóta használtnak, nyugodtan használhatjuk alacsony költségvetésű házi stúdiónkban is, ezzel nem kerülünk hátrányba pl. Chris Lord Alge-hoz képest.

Ezt a jelszintet nem csak felvételkor kell megtartani, hanem pl. a pluginek között is. Minden plugin kezelési utasításában leírják, hogy milyen jelszintre lettek tervezve.

Gain Staging a pluginek között is!
  A DAW-k többsége 32 bit floating point (lebegőpontos) rendszerben dolgozik, ami azt jelenti, hogy virtuálisan nincs túlvezérlés, az így elérhető dinamika tartomány ugyanis 1500 dB. Ennek ellenére a pluginek nem biztos hogy fel vannak készítve ezekre a magas értékekre. 

Különösen igaz ez a valójában is létező analóg berendezéseket emuláló pluginekre. Ezek működését olyan precízen elemezték és modellezték, hogy ugyan úgy érzékenyek a bejövő-kimenő jelszintekre, mint való világ beli testvéreik. Ezekről általában elmondható, hogy a szabványtól nem térnek el, -18dBFS felel meg a 0 VU-nak. Ettől függetlenül a gyártók minden esetben feltüntetik, hogy az adott plugin milyen jelszintet tekint 0VU-nak, vagyis mire van kalibrálva. Előfordul az is, hogy a pluginben találhatunk kalibrációs lehetőséget, amivel saját igényeink szerint állíthatjuk be a 0 VU értéket.

32 bit Floating point felvétel:

Sok DAW felkínálja felvételi formátumnak a 24 bit mellett a 32 bitet is. Jó, ha tudjuk, hogy a 24 bites konverterünk soha nem fog 32 biten digitalizálni, sem lejátszani. Ezt az opciót akkor használjuk, ha a felvételt már eleve olyan plugineken keresztül készítjük, amik erősítik/processzálják a beérkező hangot. Mivel ez a formátum sokkal nagyobb tárhelyet és processzor teljesítményt igényel, jól gondoljuk meg hogy megéri-e!




Milyen jelszinttel játsszak le?

A helyes kivezérlés és a tartalék nem csak felvételkor fontos, hanem lejátszáskor is. Zenénket kénytelenek vagyunk a digitális formátumból analóggá visszaalakítani (DA konverter), amennyiben meg is kívánjuk hallgatni, és nem csak a hullámformákban gyönyörködni a képernyőn. Ekkor is nagyon fontos, hogy ne terheljük túl az áramköröket, ezért igyekezzünk tartani a szabványos -18dBFS kimeneti jelszintet.

Mivel a rendelkezésünkre álló egyetlen egy kivezérlésmérő sem képes a valós pillanatnyi értéket mutatni -vagyis átlagolnak-, ezért egy -18dBFS érték nem azt jelenti, hogy a pillanatnyi jelszint soha nem lép -18dBFS fölé. Lehetnek olyan csúcsok a hullámformában, amik akár 6-12dB-el is magasabbak ennél az átlag értéknél. Így a -18dBFS átlag értékkel nem kockáztatjuk a jel túlvezérlését. A legtöbb mai audió interfész -18dBFS kivezérléskor küld +4dBu jelet az analóg kimenetre, ami ugye 0 VU. (1000 hz szinusz jellel mérve). Ez különösen fontos akkor, ha a kiküldött analóg jel egy külső eszközbe, pl. keverőpult, kompresszor, EQ, reverb, stb. kerül, majd onnan vissza a DAW-ba. Ezzel biztosíthatjuk, hogy muzsikánk sehol sem lesz túlvezérelve.

Aki eddig 0dBFS-re kivezérelve hallgatta vissza zenéit, annak a szabványos -18dBFS talán halknak tűnhet... ebben az esetben hangosítsuk fel az erősítőnket, hiszen ezért szerelték rá a hangerő gombot! Viszont tartsuk szem előtt, hogy az ajánlott lehallgatási szint a szoba méretétől függően 74-85 dBSPL! Az ennél magasabb hangnyomásszinttel történő hosszútávú lehallgatás halláskárosodáshoz vezet! Ezt gondolom egyetlen egy hangmérnök sem szeretné elszenvedni. A referencia lehallgatási szint beállításáról a "Minden a lehallgatásról" sorozat harmadik részében olvashattok.

(Ne keverjük össze a keverést a masztereléssel, ahol a cél a CD lemez dinamika tartományának maximális kihasználása, vagyis a 24 bites jel 16 bitre alakításakor a jelszinttel minél jobban megközelíteni a 16 bites 0dBFS-t.)

 Gyors tipp: 
A helyes gain staging -vagyis a jelszint kezelés, jelszint menedzsment- végig kísér minket a felvételtől a kész zenéig. Nem csak praktikus, de kifejezetten ajánlott hogy munkamenetünket úgy szervezzük, hogy a processzorok (szoftver pluginek, vagy külső hardverek) kimenő és bemenő hangereje (vagyis jelszintje) nem különbözik egymástól. Ezzel több legyet üthetünk egy csapásra.

1. Először is hallhatjuk, hogy vajon történik-e valami hasznos is az adott processzorban, vagy csak azért halljuk jobbnak az anyagot, mert hangosabb? (A hangosabb zenét általában jobbnak halljuk, ez fülünk és hallásunk működési módjából adódik). Ennek ellenőrzéséhez ki-be kell kapcsolni (bypass) az adott egységet. Ha az előtte-utána hangerő nem azonos, akkor nem tudjuk a változást érzékelni.

2. Ha a bemenő jelszint megfelelő volt (mert ugye az volt!? különben minek olvasgatnád ezt az irományt?!), akkor az ezzel azonos kimenő szintre állítva a processzort, nem lehet gond a következő processzor bemeneti szintjével sem.

3. Ha valamelyik processzort ki kell kapcsolni, vagy hibát kell keresni, akkor sokkal egyszerűbben megoldható, mert nem kell az összes utána következő processzort átállítani.

Foglaljuk össze az eddig tanultakat:

Ajánlott felvételi szint:
0 dBVU / -18 dBFS /-10 dBFS peak (maximum -6 dBFS peak)

Ajánlott lejátszási jelszint: -18 dBFS -->0 dBVU

Ajánlott átviteli jelszint: -18 dBFS --> 0 dBVU

Nem kell rakéta tudósnak lenni ahhoz, hogy jó minőségű hangfelvételt készítsünk, csupán be kell tartani néhány alapszabályt, amit az előttünk járó hangmérnökök a saját bőrüket a vásárra víve tapasztaltak ki. Higgyétek el, ha a Grammy díjas hangmérnökök is így csinálják, az nem lehet rossz!

Elérkeztünk tehát a decibelekről szóló sorozat befejező részéhez.

A következő sorozatban a lehallgatással kezdünk foglalkozni. Az új sorozat első részében elsőként áttekintjük majd a lehallgatással kapcsolatos alapvető tudnivalókat.

Katt ide a következő részhez...







A témával kapcsolatos kérdéseket itt a kommentekben, vagy a facebook oldalon várom!

Kellemes mixelést kívánok mindenkinek!


Felhasznált irodalom:

Dinamika tartomány:
https://en.wikipedia.org/wiki/Dynamic_range
http://www.learndigitalaudio.com/blog/dynamic-range-compression-pt-1-what-is-dynamic-range

24 bit headroom:
http://www.soundonsound.com/sos/sep10/articles/qa0910-1.htm

Gain staging:
http://www.soundonsound.com/sos/sep13/articles/level-headed.htm

Digital recording levels:
http://dbzeebee.blogspot.hu/2009/10/digital-recording-levels-rule-of-thumb.html

Lehallgatás referencia:
http://www.soundonsound.com/sos/may14/articles/reference-monitoring.htm

6 megjegyzés:

  1. Egy olyan kérdésem lenne, hogy 32 bit Floating wav mentést végezhetek-e 64 bites win-en? Fl studiót használok, ahol keverésnél lenne erre szükségem, mert 32 bites wav-al az egész számot kitudom tenni sávokban, úgy hogy elbírja a gépem, ellenben ha 24 biten csinálom mindezt akkor nem. Ez úgy lehetséges, hogy van egy ilyen save funkció ami valahogyan bementi ezt a 32 bit Floating formátumot. Persze 24 bitnél kétszer több helyet foglal, de ez most nem számít. Szóval az érdekelne, hogy így nem veszít-e a minőségből a wav, hogy alakamas-e a gépem erre, mert a gyakorlatban működik, de félek hogy ez nem az aminek látszik!? (keveréshez használnám) Egyébként nagyon tetszik az oldal minden elismerésem a szerkesztőé, rengeteg mindent tanultam itt, és remélem soha nem hagyjátok abba! :)

    VálaszTörlés
  2. Kedves Bence!

    Köszönöm az elismerő szavakat, remélem a jövőben is sok hasznos információval szolgálhatok majd.

    Kérdésedre a válasz:
    Természetesen menthetsz 32 bites wav-ot a 64 bites oprendszeren, hiszen a kettőnek semmi köze egymáshoz. A 32 bites wav a hangfájlra vonatkozik, nem a fájlrendszerre, vagy az operációs rendszerre. Amint írtad is, ennek egyetlen hátránya, hogy sokkal nagyobb a fájl mérete. Gyakorlatilag nincsen minőség romlás, sem javulás a 24 bites wav fájlhoz képest, kivéve, ha a sávok valamelyike a keverés során túllépi a 24 bites dinamikatartománnyal leírható jelszintet. Ekkor a 32 bit floating point fájlban nem jelenik meg a túlvezérlés, a 24 bitesben viszont igen.

    Ha egy kicsit összezavartalak, akkor itt az egyszerűbb válasz: ha 32 bit floating point-ban mentesz, akkor biztos hogy nem lesz minőség csökkenés, sem túlvezérlés, csupán a fájlok mérete lesz nagyobb. Ha ezt bírja a géped és a tárhelyed is, akkor nyugodtan használd a keveréshez ezt a formátumot. Publikációhoz viszont (egyelőre) 16 bit szükséges, erről ne felejtkezz el!

    VálaszTörlés
  3. Köszönöm a remek és gyors választ, minden világos lett! Egy kérdés viszont felmerült közben bennem, ha betartom az ajánlott 0dBVU szintet, és a peak level semmiféleképpen nem lépi át a kb. 7 dBFS-t, majd ugyanez érvényesül a kész mixemen is (ami már egy sávban van, jelen esetben ugye 32 bit floating point-ban), majd ezt átalakítom 24 bit-be akkor lesz-e dinamika tartomány veszteség? Azt tudom, hogy 24 bit-ről 16 bit-re konvertáláskor van veszteség stb., de 32 bitről 24 bitre átalakításról történik-e ilyen, ha betartom a 0dBVU? Bocsi ha nagyon értetlenül írok, és kérdezek, megpróbáltam az adott témához kapcsolódóan feltenni mindezt, hátha másnak is majd tanulságul szolgál!

    VálaszTörlés
  4. A 0dBFS mindig az eszköz által megszólaltatható legmagasabb jelszint (ha úgy tetszik, akkor feszültség érték (V, mint Volt)). Az tehát, hogy hány bites a felvétel nem a leghangosabb, hanem a leghalkabb hangot jelenti, vagyis a zajszintet. A bit "vágás" alulról, a halk hangokból történik.

    Ha 8 biten történik a felvétel, akkor -18dBFS jelszintet 5 biten lehet ábrázolni. Ha 16 bites a felvétel, akkor 13 biten, ha 24 bites, akkor 21 biten. A dinamika tartomány a bitek számával nő. A 32 bit floating point hangfájl dinamikatartománya 1500dB, a 24 bitesé 144 dB. Tehát ha egy nagyobb bitszámról történik konverzió egy kisebb bitszámra, mindig van dinamika tartomány veszteség. Úgy is mondhatjuk, hogy minél hangosabb egy hang (egy adott halk hanghoz képest), annál több bit kell a torzításmentes megszólaltatásához. Ha tehát a mixed 32 bit floating point-ban van -18dBFS-re kivezérelve és ezt dither nélkül alakítod át 24 bitesre (vágással, angolul: truncate), akkor torzulni fog, felharmonikusok jönnek létre.
    Tehát a nagy bitszámnak igazából akkor van értelme, ha egymás után akarunk nagyon hangos és nagyon halk hangokat megszólaltatni. Már a 16 bites hang is elég dinamikatartománnyal rendelkezik, ezért nem érdemes 32 bitet használni. Stúdió körülmények között azért használunk 24 bitet, hogy még véletlenül se keletkezzen túlvezérlés a felvétel, vagy a keverés közben.

    VálaszTörlés
  5. Boz MIller, a Boz Digital Labs jóvoltából itt láthatsz egy videót arról, hogy mi történik, ha egy 64 bites audionak elkezdjük csökkenteni a bitmélységét egészen kb. 1 bitig. Szintén látható az is, hogy mi történik ha zajt adunk ilyenkor a hanghoz, ez a dither.

    https://www.youtube.com/watch?v=zHWRnL926y8

    VálaszTörlés
  6. Köszönöm szépen a választ, most már összeállt a teljes kép a bitekkel kapcsolatban!:D

    VálaszTörlés