Konvolúciós zengetők

A konvolúciós zengetők tökéletesen képesek egy adott hangzást visszaadni, legyen az akusztikus (természetes) zengetés, vagy akár egy analóg eszköz. Ebben vitathatatlan előnyük van az algoritmikus zengetőkkel szemben. Ugyanakkor pontosan ez az ami egyben korlátozza is őket, ugyanis a "normál" konvolúciós zengetők egyetlen egy felvételt ismételnek a hangzásról, ami viszont normál körülmények között folyamatosan változik. Úgy képzeljük ezt el, mint egy fényképfelvételt, csak hangban. A fényképen mindent teljesen élethűnek látunk, de csak egyetlen pillanatot. (A 3 dimenziós képek mélységet is adnak, és ez igaz a konvolúciós zengetőkre is, vagyis a zengetés terét nem veszítjük el velük.) A fénykép nem változik, nem mozog, így nem is kelt valódi élő hatást. Pontosan ez a probléma a klasszikus konvolúciós technikával, nem képes rögzíteni a hosszabb távú modulációt, ami pedig egyik alapfeltétele az élethű zengetésnek. Bár mint látni fogjuk, léteznek erre is próbálkozások, de szerintem még mindig az algoritmikus eszközök a zenei zengetés királyai.

Mi az a konvolúciós processzor?
A konvolúciós technológia alapja nagyon közel áll a hangszerek mintavételezéséhez, angol szóval a sampling-hez. Mi is az a sampling? Röviden összefoglalva: az adott hangról, pl. a zongora középső "C" hangjáról normál hangfelvételt készítünk, majd ezt a felvételt játsszuk vissza minden esetben, amikor egy vezérlőn (pl. egy elektromos billentyűzeten) a középső "C"-nek megfelelő billentyűt lenyomjuk.

A világ első mintavételezési technológiát alkalmazó hangszere a Mellotron volt, ami még analóg módon működött. Zongora szerű billentyűkkel lehetett vezérelni és minden billentyűhöz tartozott egy mágnesszalag (magnószalag), amin az adott hangszer adott hangmagasságában készült felvétele volt hallható. Ha lenyomtunk egy billentyűt, akkor az a lejátszó fejet a mágnesszalagra nyomta, és rajta keresztül hallhatóvá vált a szalagra rögzített hang. Ez egyébként bármi lehetett, de célszerűen az utánozni kívánt hangszer hangja volt. (A szalag hossza 8 másodpercnyi felvételt tett lehetővé.) Maga a mintavételezési technika tehát roppant egyszerű, a megvalósítása azonban már egy kicsit nehezebb.

Természetesen a technika fejlődésével a mintavételezés is fejlődött, és a rögzített hangot már nem magnószalagokon, hanem elektronikusan, memória csipekben tárolták, majd elektronikusan vezérelve billentyűzetekkel indították és állították meg. A digitális technika tehát itt is vezető szerephez jutott. Az egyes hangszerek mintavételezése közben néhány embernek az a benyomása támadt, hogy talán nem csak hangszerek hangját, hanem akusztikai tereket is lehetne mintavételezni.

Miután megszületett a konvolúciós jelfeldolgozás, az első eszközök (szoftverek) még olyan lassúak voltak, hogy akár egy napig is eltartott, amíg egy zengetést elkészítettek. 1999-ben aztán a Sony kiadta a DRE S777 nevű eszközét, ami a világ első kereskedelmi konvolúciós processzora volt. Bár a személyi számítógépekre korábban is készültek konvolúciós zengetők, az akkori magas memória és CPU árak miatt a teljesítményük nem volt túl optimális. Később persze ez is megváltozott, és manapság már vidáman futtathatunk otthoni gépünkön egyszerre akár több konvolúciós processzort is.

Sony DRE S777 A világ első kereskedelmi konvolúciós zengetője

Tipp:

A CPU igény persze még mindig magas, nézzük csak meg az Acustica Audio pluginjeit, amiből még ma is csak a leggyorsabb gépek képesek egyszerre annyit futtatni, hogy egy teljes mixet valós időben tudjunk elkészíteni.

Mi az a konvolúció?
A konvolúció jelentése: olyan matematikai művelet, amit két függvényen elvégezve egy harmadik függvényt kapunk, aminek eredménye megegyezik az egyik eredeti függvény módosított változatával. Az új függvény eredménye a két függvény pontonkénti szorzatának integrálását adja meg annak az összegnek a függvényében, amelyet az egyik eredeti függvény eltolásával kapunk. Ha ez nem érthető, akkor nézzük a mellékelt ábrát, ahol a konvolúció működését láthatjuk.

Forrás: https://hu.wikipedia.org/wiki/Konvololúció
Mivel mi a konvolúciós jelfeldolgozás digitális hangfeldolgozásbeli használatára vagyunk kíváncsiak, vegyünk egy konvolúciós zengető példát. A fenti animációban a vízszintes tengely jelentse az időt, a függőleges tengely pedig a jelszintet. A kék görbe jelképezze a használt impulzus választ (IR), a piros görbe pedig a beérkező hangot, vagyis azt amit zengetni szeretnénk. Mint látható, ahogy a piros vonal áthalad a kéken, egy vastag, fekete vonal rajzolódik ki. Ez jelképezi a létrejövő zengetést. Mondhatjuk úgy is, hogy a kék vonal a rögzített impulzus válaszunk, aminek "képére" igazítódik a beérkező piros vonallal jelölt hangból létrejövő fekete kimenő hang. Vagyis a kék és piros vonalak értéke folyamatosan átlagolódik, és ebből alakul ki a fekete vonal.

Nézzük egy kicsit tudományos -fizikai és matematikai- szemmel, hogy mi történik akkor, amikor megszólal egy hang, és mi azt halljuk. A hangforrás által keltett hanghullámok közül elsőként azokat érzékeljük, amik konkrétan a hangforrásból érkeznek, hiszen két pont között legrövidebb út az egyenes. Ezeket nevezzük direkt hangnak. Tételezzük fel, hogy ezek a hullámok pontosan ugyanazt a hangot adják vissza, mint amit a hangforrás kibocsátott. Ezt követően a hanghullámok visszaverődnek rólunk, és minden más tárgyról, illetve a falakról (ha vannak), majd ha minden jól megy, ismét felénk irányulnak. Ekkor azonban már nem a direkt hangot halljuk, hanem a különböző visszaverődések interferenciájából adódót. Az interferencia -mint már tudjuk- egyes frekvenciákat csillapít, másokat felerősít. Fizikai és akusztikai szempontból tehát egy helyiségben keletkezett visszaverődésekből létrejövő hallható hang jellege nem más, mint rengeteg szűrő egymás után kapcsolva. Vagyis nagyon leegyszerűsítve egy soksávos ekvalizernek is felfoghatjuk magát a helyiséget. Az IR ezeket a szűrő információkat tartalmazza, a felvétel hosszában folyamatosan "rögzítve".

Mint látható, maga a művelet nem túl bonyolult, a konvolúciós processzor gyakorlatilag rámásolja a tárolt jel jellegét a bejövő jelre. Ehhez persze kell egy tárolt jel, ami egy megfelelő impulzus válasz, ennek előállítása viszont már egy kicsit bonyolultabb.

Impulzus válasz létrehozása:
Impulzus választ (IR) létrehozni elvileg nem nehéz. Szükséges hozzá a térbe juttatott megfelelő mennyiségű (hang)energia, és egy rögzítő berendezés, ami az adott akusztikai tér reakcióját rögzíti. Az elmélet tehát nagyon egyszerű! Elhelyezünk egy hangkeltő eszközt az adott helyiségben, és egy mikrofonnal rögzítjük a létrejött hangot. A nehézség ott kezdődik, hogy a létrejövő IR csak azokat a frekvenciákat tartalmazza, ami a kisugárzott hangban megvolt, és pontosan azt a hangzást adja majd, ahol a hangforrás és ahogy a mikrofon elhelyezésre került!

Ebből következik, hogy a megszólaltatott hangnak a lehetséges összes frekvenciát tartalmaznia kell, és egyáltalában nem mindegy, hogy a hangforrást hová helyezzük el. Ha pl. a falhoz közel tesszük, az elszínezi a hangot, pontosan ugyanúgy, mint amikor egy pergődobot helyezünk el a felvételi helyiségben. Tehát elsőként meg kell találnunk a legmegfelelőbb helyet a hangkeltőnk részére, legyen ez most a példában egy hangszóró. És ez még mindig nem a vége a problémáknak, ugyanis ennek sugárzási irányát is megfelelően kell megválasztani, hiszen a hanghullámok elsősorban abba az irányba fognak elindulni. Ha igazán jó IR-t szeretnénk készíteni, akkor gömb karakterisztikájú hangsugárzót érdemes használni, mert ez minden irányba egyforma intenzitással sugároz.

Ugyanez vonatkozik a mikrofonra is! Nem mindegy, hogy hová helyezzük el, és milyen irányból képes a hangot rögzíteni, ugyanis pontosan azt fogja felvenni, amit mi is hallunk (természetesen a mikrofon képességeinek megfelelően). Ha csak egy mikrofont használunk, akkor a létrejövő IR mono lesz, ezért ha sztereó zengetést szeretnénk elérni, akkor két mikrofon kell, természetesen megfelelő sztereó mikrofonozási technikát alkalmazva. Ha többcsatornás (surround) térbeli hangzást szeretnénk rögzíteni, akkor minden csatornához egy újabb mikrofonra van szükség, vagy egyéb surround mikrofonozási technikára. A legélethűbb hatás eléréséhez binaurális mikrofonozást, vagyis egy emberi fejbe épített, vagy a fej fölé elhelyezett mikrofonokat érdemes használni.

Az IR rögzítésekor (capture) csak azok a frekvenciák fognak szerepelni az IR-ben, amiket a hangszórónk lesugároz, és csak azok, amiket a mikrofonunk (a felvevő rendszerünk) rögzíteni képes. Ha pl. a sávszélességünk valami oknál fogva csak 12kHz-ig terjed, akkor a konvolúciós feldolgozáskor a 12kHz feletti hangok nem fognak megszólalni. Ezért aztán nem véletlen, hogy a lehető legjobb hangkeltőt és mikrofont kell alkalmazni!

Már tudjuk, hogy csak azok a frekvenciák fognak a konvolúciós feldolgozás során megszólalni amiket rögzítünk, tehát célszerű az összes hallható frekvenciát felvenni. A felvevő rendszer sávszélessége is fontos, de ennél még fontosabb, hogy a létrejövő impulzus egyetlen időpillanatban tartalmazza az összes lehetséges frekvenciát. Miért fontos ez? Tételezzük fel, hogy a frekvenciák egyik része 1. időpillanatban szólal meg, a másik részük pedig 2. időpillanatban. Visszajátszáskor (a konvolúciós zengető használatakor) a 1. mintához tartozó frekvenciák mindig előbb fognak megszólalni, mint a 2 mintához tartozók. Ez azért eléggé zavaró lenne!

Pisztoly, lufi, csapó
Egyszerre szólaljon meg minden frekvencia, de csak egy pillanatig? Ez első hallásra szinte lehetetlen feladatnak tűnik, és valójában elég nehéz is jól kivitelezni. Szerencsére azonban van használható megoldás! A nagy erejű, nagyon rövid hangok olyan mennyiségű energiát juttatnak a levegőbe, amitől szinte az összes hallható frekvencia megszólal, ilyen pl. egy pisztolylövés. Ha tehát ennek hangját rögzítjük, nagy valószínűséggel jól használható impulzusválaszt kapunk. Ezt azonban nem minden helyiségben tehetjük meg, ilyenkor jön jól egy jó feszesre fújt lufi. Ennek kidurrantása (pl. egy tű segítségével) hasonló eredményt ad mint egy pisztolylövés, de nagyméretű helyiségekben lehetséges, hogy a létrejövő energia nem lesz elegendő, vagyis túl halk, ezáltal túl rövid és csökkent sávszélességű lesz az IR. Jól használhatóak még fából készült csapók, és legutolsó megoldáskánt a taps is. Sajnos ezeknek a módszereknek egy közös tulajdonságuk, hogy nem jól ismételhetőek. Pl. egy lufi kidurranása nem mindig pont ugyanazt a hangot adja, így nem tudhatjuk, hogy az aktuálisan rögzített visszhang vajon az "igazi-e", vagy ha más helyre állított hangforrást vagy mikrofont is szeretnénk rögzíteni, nem kapunk csereszabatos zengetést. Fontos az is, hogy az impulzusunk ne legyen jellegzetes. Pl egy hangvilla, vagy vasdarab megütésével készült IR mindig fémes hangzást fog létrehozni.

Hogy a lehető legélethűbb hatást érjük el, az IR rögzítésekor a lehető legrövidebb impulzust kell használnunk, hiszen ez adja meg az adott akusztika pontos jellegét. Ha hosszabb hangot használunk, akkor a visszaverődések már torzulnak. A pisztolyos módszer jó eredményt ad, de nem tökéleteset, hiszen az sem csak egy pillanatig tart. A tökéletes megoldás az egyetlen időpillanat hosszúságú, maximális jelszintű (pl. 120dBSPL) impulzus. Ezt digitálisan viszonylag egyszerű előállítani, de a Digitál-Analóg konverterek soha nem fogják valódi 1 sample hosszú impulzusként kiküldeni. Sokkal nehezebb feladat azonban, hogy ezt az impulzust hogyan változtassuk ilyen rövid és ilyen erős hanggá az analóg oldalon, ami kikerülhetetlen, hiszen a hangszórók analóg működésűek. Olyan hangszórót még nem készítettek, ami képes 0 idő alatt a maximális elmozdulására kiállni, majd egyetlen pillanat múlva és alatt visszatérni az alapállapotba, és ott mozdulatlanul maradni. Az impulzus pedig pont ezt jelentené, egyetlen, közel nulla ideid tartó löketet. Emellett a legtöbb hangszóró és erősítő nem jól tolerálja az ilyen nagy erejű, impulzus szerű energia löketeket, és hamar meghibásodhatnak. Másik probléma, hogy az impulzus elhangzása után a visszaverődéseket rögzítjük, ezek pedig természetes módon folyamatosan halkulnak. Eközben a jel/zaj viszonyunk folyamatosan romlik. Amikor a lecsengés a vége felé közeledik, szinte már csak a háttérzajt, vagy az alapzajt fogjuk rögzíteni, nem pedig az impulzus visszaverődéseit, és ez a zaj a visszaverődésekhez hasonlóan szintén rámásolódik a zengetett hangra. Ahhoz tehát, hogy az elméleti impulzushoz legközelebb álló impulzusválaszt állíthassuk elő, egy újfajta technikát kellett kidolgozni.

Söprés (sweep)
Ez az úgynevezett sweep, magyarul söprés. Lényege, hogy a szükséges legalacsonyabb és legmagasabb frekvenciák között folyamatosan -logaritmikusan- emelkedő frekvenciájú szinuszhullámot játszunk le egy hangszóróból, ezt rögzítjük, majd egy program segítségével a söprés időtartamát "összenyomjuk" egyetlen minta hosszúságúra, ami így már tartalmazni fogja az összes frekvenciát egyetlen minta hosszúságban. Ebből aztán már nagyon jó minőségű IR fájlt lehet előállítani, ami természetesen már nem egyetlen sample hosszúságú. Sok esetben az IR fájl további beavatkozásokat is igényel, pl. ha az IR és a zengetésre szánt anyag is túl tompa, a végeredmény is nagyon tompa hang lesz. Ilyenkor az IR-t érdemes egy EQ-val korrigálni.


Ennek a technikának további előnye, hogy a söprés időtartama viszonylag hosszú (több 10 másodperc), így szinte bármilyen hangszórót és erősítőt használhatunk. Ráadásul a kívánt hangnyomásszintet (a levegőbe vezetett energia mennyiségét) is sokkal egyszerűbben lehet így előállítani, mint egyetlen impulzust használva. Ezt a módszert eredményesen használhatjuk otthoni, vagy amatőr körülmények között is, ha valódi helyiségek akusztikáját szeretnénk rögzíteni. Analóg, vagy analóg módon összekapcsolt eszközök mintavételezésére szintén a sweep módszert használjuk. A söprés időtartama erősen meghatározza a létrejövő IR minőségét, vagyis a zajszintjét. Minél hosszabb a felvett hang, annál tisztább IR-t tudunk belőle készíteni. A legideálisabb esetben 1 perc, normál esetben 30 másodperc, nagyon sürgős esetben 10 másodperc a lejátszás ajánlott időtartama.

Digitális impulzus (Spike)
A digitálisan használt berendezések impulzusválaszának rögzítéséhez a digitális 1 minta hosszúságú impulzus a legjobb és legegyszerűbb megoldás, hiszen ezeket nem szükséges analóg eszközökön és hangszórón keresztül felvenni. Egyszerűen csak átvezetjük rajtuk az impulzust, amit aztán rögzítünk. Ezek lehetnek digitális külső eszközök, de akár pluginek is, amiket a DAW-on belül mintázunk. Mivel ez utóbbi esetben az impulzus nem kerül ki a digitális környezetből, így itt maximálisan biztosított a legjobb minőség, hiszen az impulzus a lehető legrövidebb és legmagasabb jelszintű maradhat. Sajnos a technológiából adódóan csak a felvételkor érvényes beállítások fognak rögzülni, ha tehát többféle lecsengési időt, vagy sűrűséget szeretnénk felvenni, akkor ehhez több IR-t kell készíteni. Egy jól használható 1 minta hosszúságú impulzust tölthetünk le az Altiverb oldaláról.

1 minta hosszú impulzus DA átalakítón megjelenő képéhez hasonló módon ábrázolva

IR mesterséges előállítása
Impulzus választ nem csak rögzítéssel, hanem szintetikusan is előállíthatunk, pl. sugárvetítéses módszerrel. Erre több különálló szoftver megoldás is létezik, ezeket RIR (Room Impulse Response) generátornak, vagy Impulse Modeler-nek hívják. A ReaVerb pluginben például kétféle beépített mesterséges visszaverődés előállító generátort is találhatunk. Az egyikkel a korai visszaverődéseket, a másikkal a zengést tudjuk szintetizálni. Ilyen módon gyakorlatilag egy korlátozott működésű algoritmikus zengetőt kapunk, ami annyiban tér el egy normál algoritmikustól, hogy bár maguk a visszaverődések sokkal élethűbbek lehetnek, de nem rendelkeznek modulációval. A mesterséges IR előállításával egy későbbi részben foglalkozunk majd részletesen. Ingyenes, online IR szintetizátort találhatunk pl a Wire Grind oldalán!

Dekonvolúció
Christian W.-Budde dekonvolúciós programja
Ha a pisztolylövés, vagy a digitális impulzus módszert használtuk a zengetés rögzítésére, akkor a legtöbbször elegendő az is, ha a forráshangot egyszerűen levágjuk a fájl elejéről, és máris kész a használható IR. Ha az általunk használt konvolúciós feldolgozó képes normál hangfájlokat is betölteni, akkor nincs további teendőnk, ha viszont nem ilyen, akkor a saját konvertáló algoritmusait kell használnunk.

Ha sweep módszert használtunk a felvételhez, akkor azt közvetlenül nem használhatjuk a konvolúciós zengetőben még akkor sem, ha az képes normál audió fájlok beolvasására. A sweep-el készített felvétel tartalmazza magát a sweep-et is, ezért ilyen esetben egy dekódolót kell alkalmaznunk, ami a felvett fájlon úgynevezett időkompressziót végez, ezzel előállítja a használható IR-t (ami ugyanolyan lesz, mintha egyetlen impulzussal készült volna). Ezt az eljárást dekonvolúciónak nevezzük, és bár léteznek kifejezetten ilyen célra készült programok, de manapság már a legtöbb konvolúciós zengető beépítve tartalmazza ezt a funkciót is. Ebben az esetben a legjobb megoldás, ha a saját maga által előállított sweep fájlt használjuk! Az Altiverb pl. többféle eszközből származó és többféle felvétellel is elboldogul, de nagyon fontos, hogy a konvertáláskor mindig azt az algoritmust válasszuk, amilyen eszközzel és módon a felvételt készítettük.

IR beszerzése
Talán már mindenki rájött, hogy a konvolúciós zengetők egyik legfontosabb eleme maga az IR. A drágább pluginekhez gyárilag kapunk jó minőségűeket, az olcsóbbakhoz viszont sokszor egyet sem. Ilyenkor vagy elkészítjük a sajátjainkat, vagy keresünk az interneten olyan oldalakat, ahonnan letölthetünk párat. Néhány esetben fizetnünk kell a fájlokért, ezek azonban általában teljesen professzionális minőséget is adnak. Sok esetben megéri a kért árat kifizetni, mert egy jó minőségű IR elkészítése rengeteg időt, drága felszerelést és szakértelmet igényel!

Vannak olyan oldalak is, ahol lelkes "amatőrök" által készített, ingyenes mintákat találunk. Ezek a legtöbbször jó minőségűek, de előfordulhatnak köztük szinte használhatatlanok is. Mivel általában ingyen jutunk hozzájuk, így reklamációra nincs jogunk, de jó ha tudjuk, hogy az IR minősége alapvetően meghatározza a létrejövő hangminőséget! A legtöbbször előforduló hibák: nincsen lecsengés, nem megfelelő konvertálás, hallatszik a teszt hang, alacsony bitmélység, nem megfelelő jelszint, magas zajszint, nem korrekt sztereó tér.


IR Könyvtárak:
A legtöbb mai DAW tartalmaz saját konvolúciós plugint, pl. Reaper, Cubase, Ableton live, Logic, Studio One, stb. Ezek mellett sok kereskedelmi zengetővel is találkozhatunk, pl. Audio Ease Altiverb, Avid TL Space, Waves IR-1, Liquidsonics-Reverberate 2, Voxengo Pristine Space és McDsp Revolver. Ezekhez szinte mind kapunk néhány, vagy akár több ezer IR-t is, amiből jó eséllyel ki tudjuk választani azokat, amikre szükségünk van. Ha mégsem így lenne, akkor keressünk rá a "Reverb Impulse Responses", "Reverb IR", vagy ha ingyenesekre vágyunk, a "Free Reverb IR" kulcsszavakra. Figyeljünk azonban rá, hogy a pluginünk képes legyen olvasni a letöltött formátumot!

Néhány, az általam összegyűjtött ingyenesek közül:
Samplicity-Bricasti M7
Big Gee's-Lexicon 480L
Wire Grind-IR Library
http://www.openairlib.net/
https://fokkie.home.xs4all.nl/IR.htm
http://www.echothief.com/
Joe's Hardware Impulses
Freeverb3-Library
Dubbhism


Bitmélység, bitráta
A létrehozott IR fájl bitmélysége alapvetően meghatározza a zengetés dinamikatartományát. Ha a fájl csak 16 bites, akkor hiába küldünk rá 24 bites audiót, a dinamikatartomány 96dB-ben korlátozott marad. Mivel a legtöbb ingyenes IR wav (vagy aiff) formátumú, így a bitmélységét egyszerűen ellenőrizhetjük, ha megnézzük a fájl tulajdonságait.

Ahhoz, hogy valósidejű eredményt kapjunk, az IR-ben alkalmazott bitráta elvileg egyező kell hogy legyen a rajta átküldött hang bitrátájával. Ez azonban a mai pluginek esetében már nem követelmény, mert ezek érzékelik a beérkező jel és az IR közötti különbséget, és a legoptimálisabb módon változtatják meg a belső mintavételezés frekvenciáját. Ha pl. a bejövő hang 44,1 kHz-es mintavételezéssel készült, az IR pedig 96kHz-el, akkor az optimális megoldás az IR átkonvertálása 44,1 kHz-re, hiszen így CPU teljesítményt takaríthatunk meg. Az ellenkező eset, ha az audió fájl 96kHz-es, az IR viszont csak 44,1. Ekkor a plugin az IR-t fogja 96kHz-re átmintavételezni, hogy az audió minőség ne romoljon.

1, 2, 4... x csatorna
Az 1 csatornás IR mono zengetést ad, a 2 csatornás monoból sztereót, a 4 csatornás pedig valódi sztereót. Mit jelent ez? Ha csak egy csatornás IR-t rögzítünk, akkor nem lesz térbeli információnk, vagyis a zengetés csak egy irányból érkezik. Ha 2 csatornás IR-t használunk, akkor a két csatorna jele eltérő lehet, amivel már képesek vagyunk sztereó zengetést előállítani, de csak egy adott pozícióból érkező hangról. Mit jelent ez?

Ha a mintavételezéskor 2 mikrofont használunk, akkor egyértelmű, hogy a rögzített IR sztereó lesz, vagyis nagy valószínűséggel közel azt a hatást halljuk, mint amit a helyiségben állva is hallanánk. Viszont ebben a sztereó jelben azt is halljuk, hogy a hangforrás hol helyezkedik el. Ha a teszthangot lejátszó hangszórót a két mikrofon közé középre helyezzük el, akkor a konvolúciós zengetést középről érkezőnek fogjuk hallani. Ha a zengetőre küldött jelet panorámával elmozdítjuk az egyik irányba, a zengetés is vele mozdul, vagyis eltolódik ugyanabba az irányba, de a két oldalban azonos arányban. Tehát egy 2 csatornás IR esetében, ha a beérkező jel csak a jobboldalon szól, akkor a zengetés is csak a jobboldalon fog szólni, a valóságban pedig nem így van! Ott ugyanis a jobboldalról szóló hang a baloldali falakról is visszaverődik, vagyis onnan is fogunk zengést hallani.

A megoldás az, hogyha nem csak egy sztereó IR-t rögzítünk, hanem kettőt. Az egyikben a hangforrást jobb oldalra, a másikban baloldalra helyezzük el, és természetesen mindkét esetben sztereóban rögzítünk. Ezzel a módszerrel egy négycsatornás, úgynevezett kvadro (quadro) fájlt kapunk, ami már képes a valódi sztereó zengetés előállítására. Tehát ebben az esetben a jobbra panorámázott hangunk nem csak jobboldalról fog szólni, hanem az IR-nek megfelelő erősséggel baloldalról is. Néhány esetben a konvolúciós zengető nem csak kvadró, hanem két sztereó fájlt is elfogad a valódi sztereó zengetéshez.

Természetesen nem csak sztereóban rögzíthetjük az IR-t, hanem tetszőleges számú csatornán, így akár 5.1, 7.1, stb., sőt akár a legújabb ambisonic kódolásban is. Ilyen pl. a Waves IR-360, Audioease-Altiverb XL, stb. Az ilyen surround felvételhez persze megfelelő számú mikrofon és felvételi csatorna szükséges, és a hangforrások helyzetét is változtatni kell, hogy valódi surround zengetést tudjunk később előállítani. Ezt leszámítva maga a módszer ugyanaz, mint az egy- vagy kétcsatornás felvételek esetében.

Erőforrás igény
Alapvetően elmondható, hogy a jó minőségű konvolúciós jelfeldolgozás késleltetésmentes használatának CPU teljesítményigénye nagyon magas. Ez még a mai (2018) korszerű processzorokkal is komoly feladat. Hangsúlyozom, hogy a késleltetésmentes használatról van szó, vagyis arról az esetről, amikor 0 minta az adott eszköz késleltetése (latency). Ez a probléma az algoritmikus zengetőknél nem áll fenn, így ezeket sokkal jobban alkalmazhatjuk ilyen feladatokra.

Ha azonban a teljes késésmentes jelfeldolgozás nem kritérium (pl. DAW-on belüli keveréskor), akkor elfogadható méretű késleltetéssel (pl. 64 minta) már jelentősen csökken a CPU igény, akár egy algoritmikus zengető szintjére is lemehetünk. Ha pedig még ennél magasabb késés is elfogadható, semmi akadálya, hogy jelentős CPU igény csökkenést érjünk el. Tehát könnyen előfordulhat, hogy a konvolúciós processzorunk kevesebb CPU teljesítményt igényel, mint az algoritmikus zengetőnk. Ezért, ha nem szükséges a valósidejű, késésmentes zengetés, néhány esetben még spórolhatunk is, ha a már tökéletesre beállított algoritmikus zengető hangját "konvertáljuk" egy IR-é.

Emellett a hosszú (vagy multi) IR-ek sok memóriát is igényelnek, ami a VST plugin technológia miatt sokszor korlátozott. Ezért könnyen előfordulhat, hogy egy-egy gyengébb plugin csak korlátozott hosszúságú IR-t képes betölteni. Szintén alapvető tulajdonság, hogy minél hosszabb egy IR, annál több CPU-t fogyaszt el, hiszen az IR teljes hosszában kell a számításokat elvégezni. Vagyis nem érdemes a hallható lecsengésnél sokkal hosszabb IR-t használni.

Konvolúciós zengetők felhasználása
Mi az a konvolúciós zengető? Röviden összefoglalva egy olyan feldolgozó program, ami képes a beérkező jelet -esetünkben digitális hangot- a benne tárolt mintának (IR, impulzus válasz) megfelelően megváltoztatni. A konvolúciós processzorok tehát nem csak zengetésre használhatóak, de mivel mi most ezzel a témakörrel foglalkozunk, maradjunk a konvolúciós zengetésnél.

IR spektrum diagramja és hullámformája
A konvolúciós zengetőben egy előre rögzített impulzusválaszon (IR) vezetjük keresztül a hangot, ami ezáltal az impulzusválasznak megfelelően fog az eszközből kilépni, vagyis megszólalni. Ha ez az IR egy zengetést tartalmaz, akkor a konvolúciós processzorunk zengetővé változik.

Elsősorban valóságban is létező akusztika szimulálására használhatjuk. Miért van erre szükség? -kérdezheti az az olvasó, aki leginkább csak zenei mixeket készít, és leginkább csak saját projekteken dolgozik. Nem véletlen, hogy a konvolúciós zengetők egyik legnagyobb felhasználója a filmipar. Képzeljük el, hogy egy adott jelenetet felvesznek (képet és hangot) egy adott helyszínen, majd később az egyik hangot -pl. az egyik színész szövegét- javítani kell. Ahhoz, hogy az utólagos javítás hangja ne térjen el észrevehető módon, elengedhetetlen, hogy a felvétel ugyanott és ugyanolyan körülmények között készüljön. Ez a legtöbbször csak nehezen megoldható. Ha viszont az eredeti felvétel után rögzítjük az adott jelenet akusztikájának impulzusválaszát, és az utólagos felvételeket ezen keresztül dolgozzuk fel, a különbség észrevehetetlen lesz, gyakorlatilag ugyanazt a hangzást kapjuk.

A konvolúciós technikát azonban nem csak a filmstúdiók használhatják jó eredménnyel, ugyanis nem csak akusztikai tereket, hanem bármilyen hangzást képesek "tárolni". Ilyenek lehetnek pl. a gitárerősítők, azok hangszórói, keverőpultok, és természetesen a különböző analóg és digitális zengetők (mind hardver, mind szoftver). Ezek "hangzását" éppúgy rögzíthetjük egy impulzusválasz segítségével, mint az akusztikai tereket, bár ebben az esetben nincs szükség az ott használt sweep hangra, csupán csak egyetlen impulzusra.

Jó hasznát vehetjük egy konvolúciós processzornak akkor is, ha pl. csak egy darab külső zengetővel rendelkezünk, de az annyira jó minőségű, hogy mindenképpen azt szeretnénk használni a mixben. Normál esetben egy jobb mix elkészítéséhez legalább 2, de inkább 4-5 különböző zengetésre van szükségünk, viszont zengetőnk ugye csak 1 van, ezzel pedig egyszerre csak 1 zengetési feladatot tudnánk ellátni. Régebben ezt a problémát úgy oldották meg, hogy beállították a zengetőt az első feladatnak megfelelően, ráküldték a szükséges sávokat, majd a zengető kimenetét felvették egy újabb sávra. Ezt a módszert folytatták az összes többi zengetési feladatnál és sávnál is. Így a munka végén megvolt az összes különböző zengető beállítás, legalábbis a magnószalagon. Sajnos innen kezdve maximum az arányt lehetett változtatni (a zengetést tartalmazó sáv faderével), de azt is csak az összes ide küldött sávra egyszerre. Ennél egy kicsit jobb megoldást ad, ha egy konvolúciós zengetővel mintavételezzük az adott zengető programokat, és ezt használjuk az egyes sávokon. Megmarad a valósidejű keverési lehetőségünk, és bizonyos keretek között a későbbi változtatás is egyszerűbb.

Egyszerű IR zengetők
A legtöbb IR zengető nagyon egyszerű, és ennél fogva elég korlátozott is. Működésük alapja a szimpla konvolúció, ami egy- vagy többcsatornás IR lejátszását jelenti. A legtöbb esetben képesek magát az IR-t kismértékben megváltoztatni, pl. nyújtani, vagy tömöríteni, ezzel a lecsengési időt változtatni. Ez a megoldás azonban a digitális technikából adódóan egy bizonyos érték után már hallható hibákat eredményez, így normál esetben egy 3 másodperces IR-ből nem készíthetünk 10 másodpercest, sem 0,5-öt. További egyszerűbb beavatkozási lehetőség az IR frekvencia szűrése, vagyis egy EQ. Ezzel a zengetés tonalitását tudjuk kismértékben változtatni. Természetesen az előkésleltetést, az IR jelszintjét, és a lejátszási irányát is könnyen megváltoztathatjuk, így egy egyszerű konvolúciós zengetővel is jó eredményt érhetünk el, ha sikerül a feladatnak megfelelő IR-t használnunk.

Hibrid zengetők
Léteznek olyan zengetők is, amik egyesítik az algoritmikus és a konvolúciós zengetők működését, ezeket nevezhetjük hibrid zengetőknek.

Ezek egyik fajtája az ingyenes Nuspace audio-Riviera. A honlapjukon komoly matematikai magyarázatokat is találhatunk a plugin működéséről, de mi most erre nem térünk ki ilyen részletességgel (talán egy későbbi részben). Legyen most elég ennyi: Mint tudjuk, az IR előállítása és maga a konvolúció is rendkívül időigényes, főként ha 100% pontossággal szeretnénk megvalósítani. Szerencsére néhány okos matematikusnak sikerült a visszaverődések kalkulációit olyan mértékben leegyszerűsíteni, hogy az eredmény nem tér el túl nagy mértékben a valóságtól, de már valós időben is kiszámíthatóak. Ennek köszönhetően az IR valós időben jön létre, és paramétereit, pl. terem alakja, mérete, falak anyaga, hangforrás helyzete, hallgató helyzete, stb., is valós időben tudjuk módosítani. Így a kialakult zengetés rendkívül élethű lesz.

Egy másik lehetséges hibrid, ha a zengetés egyik részét IR adja, a másikat pedig algoritmus. Ilyen megoldást találhatunk a Vienna Symphonic Library Hibrid zengetőjében. Itt a korai visszaverődéseket IR könyvtárakból választhatjuk ki, majd ehhez hoz létre a beépített algoritmikus zengető megfelelő lecsengéseket, amit már modulálni is tud. Ezt egyébként a ReaVerb-ben is megoldhatjuk egy csak korai visszaverődéseket tartalmazó IR és a Reverb Generator együttes alkalmazásával, bár ilyenkor a moduláció elmarad.

Nevezhetjük hibrid megoldásnak azokat is, ahol bár csak egyetlen, előre rögzített IR-t használunk, de azt valós időben, a felhasználás közben módosítjuk. Ilyen megoldást találunk a Waves IR-1-ben, amit ezen oknál fogva a gyártó parametrikus konvolúciós zengetőnek nevezett el. A parametrikus módosítás egyik lehetséges felhasználása, amikor az IR-nek burkológörbét adunk, vagyis képessé válunk azt utólag is a feladathoz illeszteni. Egy másik érdekes megoldás, hogy az IR-1 elemzi a betöltött IR-t, és megkeresi benne a korai visszaverődéseket, amiket ezután az algoritmikus zengetőkhöz hasonlóan a lecsengéstől elkülönítve tudunk paraméterezni. Szintén említésre érdemes a lecsengési fázis szűrése, ami az algoritmikus zengetők csillapítás paraméterének felel meg. Ezek mellett természetesen mindent tud, amit az egyszerű konvolúciós zengetők tudnak.

Multi-IR megoldások
A konvolúciós technológia legnagyobb hátránya, hogy csak egyetlen időpillanatot rögzít, vagyis a folyamatosan változó hangzást nem képes visszaadni. Mint tudjuk, a moduláció az egyik legfontosabb összetevője egy élethű zengetésnek, ezért ez a probléma sokkal nagyobb, mint azt sokan gondolnák. Természetesen a technika fejlődésével több ötlet is megszületett a probléma megoldására. Az egyik ilyen a Liquidsonics Fusion IR nevű rendszere. Ennek lényege, hogy a mintavételezés közben az időben előrehaladva több minta készül egyszerre, vagyis több IR-t rögzítünk, nem csak egyet. Az IR lejátszásakor ezek között váltunk, az adott programtól függően. Ezzel a módszerrel tehát megvalósítható ugyan a moduláció, de a mintavételezés sajátosságaiból adódóan itt is csak korlátozottan avatkozhatunk be a beállításokba. Másik probléma, hogy a sok IR sok memóriát és tárhelyet igényel, és a technológiától függően sok CPU teljesítményt is, hiszen egy időben legalább két különböző IR-t kell futtatni ahhoz, hogy közöttük a váltás észrevehetetlen maradjon.

Ingyenes konvolúciós pluginek:
Freeverb3 (Windows)
LiquidSonics-Reverberate LE (Windows 32 bit)
SIR1 (Windows 32 bit)
LAConvolver (Mac, AU)

Ennyi tehát, amit a konvolúciós technológiáról és elsősorban a konvolúciós zengetés működéséről tudni érdemes ahhoz, hogy a következő részekben elvégzett próbákat jobban megérthessük. Elsőként magát a konvolúciós zengetőt fogjuk kipróbálni, majd később megtudhatjuk azt is, hogy milyen módszerekkel és hogyan hozhatunk lére saját IR-eket.

Addig is eredményes keverést kívánok mindenkinek!

A következő részhez katt ide... 



Felhasznált irodalom:
https://hu.wikipedia.org/wiki/Konvol%C3%BAci%C3%B3
http://nagysandor.eu/AsimovTeka/convolution/index.html#expminusgauss
https://gyires.inf.unideb.hu/GyBITT/02/ch06s05.html
http://wiki.ham.hu/index.php/Konvol%C3%BAci%C3%B3
https://soundbridge.io/convolution-reverbs/
https://en.wikipedia.org/wiki/Convolution_reverb
https://ask.audio/articles/what-is-convolution-reverb
https://www.waves.com/1lib/pdf/plugins/ir-convolution-reverb.pdf
https://www.soundonsound.com/techniques/convolution-processing-impulse-responses
https://www.audioease.com/altiverb/sampling.php
https://hu.wikipedia.org/wiki/Mellotron
http://designingsound.org/2012/12/recording-impulse-responses/
https://www.youtube.com/watch?v=6HvH8elG1Qg