劉志晟
(TPM音樂工作室,北京 100062)
混音是音樂制作中的一個重要環節,對音樂作品的可聽性有著重要影響。塑造一個與作品風格特點相適應的空間,是音樂混音尤其是流行音樂混音的首要任務。
混音中的空間由寬度、高度和深度三個維度構成。其中寬度和高度的控制較為直觀,深度則相對復雜。因為深度的控制涉及的因素較多,且多數因素對深度的影響既獨立又相互關聯。當作為一個整體處理時,空間的深度需要以不同素材(特指混音工程文件中原始錄音的分軌材料)之間音量的對比來獲得基本的遠近關系。作為空間中個體的處理,素材的深度則由素材本身的頻率內容、聲音細節以及形體(本文中特指聲音在聽感空間中表現出的形狀和體積)獲得。本文結合實踐經驗,就塑造縱深感的技術手段進行分析和總結。
不同素材之間音量的對比關系是塑造空間深度的基礎。在整體的審聽中,調整各素材的電平有助于在初混階段明確素材之間的前后位置關系。只有通過這種方式,素材在整體空間中的重要性和價值才能得以展現。單獨審聽和調整某個素材的電平,而不將其放到音樂整體中比較,調整則將失去意義。
計算、調整素材的電平,除需通過聽覺判斷外,還需參考聲壓級與距離之間的計算公式——平方反比定律。此定律在以直達聲為主的聲場條件下才成立,而通常近距離錄制所得的素材與直達聲的概念十分相近。因此,距離與聲壓級的平方反比定律對混音中素材的電平調整具有指導意義。常用的聲壓級與距離的關系是:距離增加1倍,聲壓級下降6 dB。
“縱深區域”是混音中用于電平控制的概念,可作為素材電平調整的目標,用于理清素材之間距離的關系。根據素材在音樂織體中的意義和重要性,可劃分六個“縱深區域”進行控制。第一區域為0 dB~-4 dB;第二區域為-4 dB~-12 dB;第三區域為-12 dB~-20 dB;第四區域為-20 dB~-32 dB;第五區域為-32 dB~-48 dB;第六區域為-48 dB~-∞。“縱深區域”的應用主要針對電子音樂和流行音樂的混音,古典音樂類同期錄音的后期制作不在論述范圍內。
對于“縱深區域”劃分的依據是:第一,同一素材以不同的音量在相鄰縱深區域中(具有相同聲像位置)同時回放;第二,聲源距離越近,聲音的音量越高、動態越大。為了讓相鄰的、較遠的區域中動態較低的聲音不被淹沒,電平范圍以“向下”差值遞增的方式劃分,使電平的控制更加精準;第三,以領唱、低鼓、軍鼓、貝斯、節奏吉他、踩镲(Hi-Hat)等一些重要音樂元素在不同風格中較為常見的縱深擺位作為參考。
電平的讀值應以峰值表(包括數字PPM)為標準。使用峰值表的原因是:第一,峰值表使用5 ms作為采樣時間間隔,能夠準確反映瞬態信號的峰值;第二,峰值表讀值與聽音距離遵循相同的計算方式——對數關系。根據樂曲的風格特點,通過電平推子將瞬態信號峰值活動頻繁的區域調整到大致相應的“縱深區域”,再通過聽覺作精細調整。如在嘻哈(POP)風格中,主唱素材最大峰值電平為-3 dB,但其瞬態信號峰值多集中于-5 dB~-11 dB之間。在這種情況下,可考慮降低音量,將其定位在第二縱深區域。
素材的深度在不同的音樂段落是可變的,不同的樂曲段落可采用不同“縱深區域”處理。同時,各個素材通常按由少到多的方式分布到相應的由近及遠的“縱深區域”中,這樣能夠有效地避免前后素材之間在形體上的相互干擾。調整深度時,除遵循“縱深區域”的處理外,還應通過編組的電平推子降低各組的分軌素材電平,以求得輸出總線上的動態裕量。通常,不同編組總線上的電平推子應控制在-6 dB~-9 dB之間。
如果素材的瞬態峰值電平在短期內活動范圍過大且缺乏規律,素材的縱深感就可能失去穩定性。這時,使用壓限器可以控制瞬態信號峰值變化的范圍。瞬態信號峰值變化的幅度與音樂風格、樂器特點、演奏品質、錄音質量有關。不穩定的電平活動會導致素材在整體中不能始終保持清晰的聽感。
使用壓限器應考慮素材的織體類型。根據織體的類型,素材可分為旋律性、節奏性、持續性三類,它們有著不同的瞬態變化特點,在混音中應區別對待。旋律性素材,特別是瞬態變化豐富且變化范圍較大的素材,可以在兩個縱深區域間活動。適量的壓限可加強聲音的穩定性,減少聲音忽遠忽近的效果。對于節奏性素材,其瞬態響應快、音色包絡的動態大,瞬態峰值的變化復雜。有些打擊性節奏樂器,其瞬態峰值在短期內活動范圍較大,但卻是規律、穩定的。對此類樂器壓縮時,應特別注意忽略聲音啟動時段內的低頻和高頻。持續性聲源一般聲音啟動較慢,瞬態峰值多不明顯,動態范圍小且變化慢。因此,可作較少的壓縮處理。
除對素材軌道使用壓限處理外,在編組總線與輸出總線上使用適當的壓縮和限制會使聲源前后的位置結合得更緊密,從而增強音樂的整體性。但如果使用壓限不當,也會導致各聲源間的距離縮短,使空間變得擁擠和雜亂。因此,在總線上使用壓限應注意啟動時間、釋放時間以及壓縮量的調整。此外,各分軌音量的比例、頻率的平衡以及編組總線上頻率的處理,同樣對編組總線的壓縮結果有著重要的影響。混音開始時,在編組總線上提前添加一個預置的編組壓縮和限制具有很多益處。
除了混音中的電平控制和縱深感討論,前期錄音質量對縱深穩定性的影響也不可忽視。演唱及演奏過程中突兀的忽強忽弱、樂音樂句之間因呼吸停頓而導致連貫性的缺失、錄音中傳聲器距離過近等都會使聲源瞬態峰值的活動范圍及動態變得不穩定,導致在混音過程中瞬態信號峰值范圍過大。
頻率內容和聲音細節是形成縱深感的最重要的因素。由于前期錄音中錄音距離、傳聲器制式、設備性能和錄音環境等因素的影響,混音師在實際工作中用到的分軌素材質量可能有很大差別。而在后期混音過程中調整縱深感,雖然可能無法改變聲音的本質,但仍有一些有效的處理方法改變人耳對素材的深度印象。
理論上,距離的變化對聲音的頻率內容有兩方面影響。第一,距離增加,聲源高頻能量會因做功過多而明顯衰減;第二,距離增加會導致響度下降,含有的高低頻比例降低。以人聲為例,實際中距離和頻率的關系有三種。在距離非常近的情況下,聲音中含有低頻和高頻的比例很高,中低頻能量較明顯;距離稍遠的情況下,聲音以中頻為主,高低頻的比例明顯降低;距離非常遠的情況下,聲音以低頻為主,中高頻強烈衰減。最后這種情況在混音中很少使用,因為聲能總量很低和低頻充足的特征既會造成聲源自身不清楚,也會被較近的樂器干擾掩蓋。
運用均衡器對縱深感進行控制,應參考上述聲學原理及聲學現象。混音中可將整個頻譜劃分為低、中、高三個頻段,然后考慮不同頻段之間比例的控制。通常,20 Hz~250 Hz為低頻范圍;250 Hz~8 kHz為中頻范圍;8 kHz~20 kHz為高頻范圍。而中頻范圍又可再細分,250 Hz~2 kHz為基礎部分、2 kHz~8 kHz為延伸部分。
調整縱深感應考慮樂器頻率的特點,不同特點的樂器應使用不同的頻率處理方式。對貝斯、底鼓等以低頻為主的樂器,提高它們的中高頻可增加臨場感,有拉近距離的作用;對中低頻為主的聲源,如軍鼓、電吉他等,提升低頻可使能量更強、距離更近;對頻響較寬的聲源,如人聲、鋼琴等,增加或減少低頻和高頻,都會很明顯地影響距離感。對于旋律性樂器,衰減低頻并提升中高頻,可以將聲源明顯推遠。對于色彩明亮的樂器,如打擊樂、短笛等,提升中高頻、衰減中低頻有助于拉近距離。需要注意,高低頻段的提升和衰減應在聲源頻率存在的前提下進行,否則只能提高噪音。此外,控制頻率除可改變縱深感外,還會改變各個聲音之間頻率的相互掩蔽問題。因此,頻率調節應根據不同的混音目的去權衡處理的尺度。
聲音的距離越近,人耳對其啟振頻段能量的感知將越明顯。恰當地使用壓縮器,可以使頻率內容在時域上發生變化,突出素材啟振頻段,使細節更明顯。根據樂器的屬性類別確定相應的衰減量(控制閾值及壓縮比);調節壓縮器的啟動時間,放過樂器中高頻段的啟振以及低頻部分;調整釋放時間,改變瞬態的持續性;再次檢查閾值和壓縮比對峰值能量的衰減量后,通過增益恢復到素材原有的峰值電平值,使響度較弱的部分得以提升。壓縮器主要用于拉近聲源距離,而不當的操作和過量的壓縮限制將損害聲音的動態和能量,可能把聲音推遠。
混響效果分為早期反射和后期反射兩個階段,它們對干聲有著不同的作用。早期反射是指在直達聲之后緊接著反射回來的、在時域上獨立分離的反射,具有“聲音打在墻壁上反射回來”的聽感特征,這一點對縱深感起關鍵作用。后期反射是指起動時間較晚、聲能穩定,在時域上密不可分的反射,主要用于展現聲源的空間環境信息,對表現縱深的作用較少。使用混響等空間類效果,可降低素材細節、提供深度信息,使聲音更遠。
2.3.1 對早期反射中影響縱深感的參數的控制
早期反射是表現聲音深度最重要的因素。使用立體聲制式的早期反射,可以模糊素材本身的聲音細節,同時增添立體聲側反射信息。
實際運用中,某些混響器可以獨立調節早期反射的參數,包括起始時間、反射時長及聲能密度三個參數,聲音的深度由這些參數共同作用。早期反射的起始時間是指直達聲與第一次反射的時間差。這里的“第一次反射”可視為到達聽音位置距離最近的側反射。理論上,聲源距離越遠,早期反射相對直達聲的時間差越短,反之則越長。實際混音中,分軌素材需對齊節奏,故可忽略各直達聲之間的時間差。因此,實際應用中早期反射的起始時間應隨距離的增加而增加,通常控制在6 ms~30 ms之間。
而有一些混響器則不具備此參數,而是以房間大小(room size)來涵蓋對早期反射起始時間的控制。房間大小主要用來為素材添加空間環境信息,但對縱深感的影響同樣明顯。房間大小的參數設置越大,早期反射起始時間越長,反射聲能整體時長越長、包絡更加平直,各反射間隔越稀疏,制造的縱深感越強。其中,早期反射的時長和起動時間是影響縱深感的主要因素。
某些高端的DSP混響效果器在早期反射單元中會帶有獨立的、關于深度的調節參數,該參數多被命名為position、distant或depth。通過對混響與干聲之間波形的相似度和相位的干涉程度進行控制,從而改變干聲的細節。此參數值越大,被添加效果后干聲的中間信號越模糊,立體聲兩邊的側反射信號越明顯,縱深感越強。如果在總線上增加一個響度表,則將深度數值增大,聲音的響度有所降低,同時立體聲的寬度有所增加。獨立的深度參數被這些高端混響器的早期反射單元所采用,也恰恰印證了早期反射對改變聲音的深度具有不可替代的觀點。
除起始時間和反射時長外,早期反射的聲能密度也會對素材的深度產生影響。稀疏的反射有利于較為清晰地表現聲反射撞擊房間墻壁的聲音,對干聲的染色能夠明顯被感知,適合表現較大的空間,可將聲音推遠;密集的反射則不利于表現聲反射撞擊房間墻壁的聲音,可使聲音細節損失,模糊縱深的定位。
2.3.2 直混比的調節
從理論上講,直混比對聲音的深度起決定作用。在室內聲場中,聲源距離越近,直混比越高,聲能總和越大;聲源距離越遠,直混比越低,聲能總和越小;在臨界距離位置,直混比為1。通常,直混比的調整方式如下:如需聲音靠前,可提高干聲電平,降低混響發送電平;如需聲音靠后,則反之;如需聲音聽起來很遠,可將混響電平高于干聲電平,甚至去掉干聲,僅保留混響效果。
在直混比中對聲源的深度起重要作用的應是混響中大約前200 ms內聲反射電平,其對干聲的聲干涉最強。200 ms后的聲反射多表現為聲場環境感。前200 ms內的電平以早期反射的電平為主,并包含后期反射起始階段的電平包絡。對于聲源干聲與混響早期反射電平比例的調節有以下可能:當早期反射低于干聲6 dB以內,聲干涉將較為明顯且會產生顫動回聲效果;當早期反射低于干聲6 dB~12 dB之內時,聲干涉不明顯,但距離感明顯;當早期反射低于干聲12 dB及更多時,聲干涉不易察覺,距離感不明顯。根據“哈斯效應”理論,對于聲源干聲與混響后期反射峰值電平的比例調節有以下可能:當后期反射峰值高于干聲6 dB以上時,后期反射的起始時間應控制在40 ms內無回聲現象,有距離作用,但音質劣化明顯;當后期反射峰值大致等于干聲電平時,后期反射的起始時間控制在50 ms內無回聲現象,距離感明顯,音質較好;當后期反射峰值低于干聲6 dB時,后期反射的起始時間可控制在80 ms內無回聲現象,產生一定環境感,音質較好。
各干聲之間的電平關系和干聲的直混比是一種辯證關系。較高的干聲音量并不一定意味著聲源在整體音樂中離聽者更近,而較低的直混比也并不一定意味著聲源在整體混音中聲能較低。假設對兩個干聲添加相同的混響發送量,一個干聲的瞬態峰值較高,另一個干聲的瞬態峰值較低。那么兩者的縱深雖然相同,但瞬態峰值較高的那個干聲離聽者并不近。這種情況常用于一些風格較為傳統的主唱或獨奏中。如同現場樂隊中的獨奏聲部——演奏音量很大,同時混響能量也很大。混音中對混響電平的使用,主要取決于混音師對不同音樂風格縱深擺位的詮釋。
2.3.3 對后期反射中影響縱深感的參數的控制
后期反射對塑造縱深感起輔助作用。使用后期反射的混響時間和擴散程度可控制聲音細節的損失程度。絕大多數混響效果器中混響時間被定義為后期反射的時長。混響時間與干聲的音強之間有密切的聯系,對混響時間和混響發送量的選擇以勾股定理為基礎,見圖1。
首先根據音樂速度設定混響時間,計算公式可參考:60000 ms/速度×2拍或60000 ms/速度×4拍;然后調整混響發送量以及后期混響的電平推子。需要注意,在時域中混響電平具有動態特性。干聲的瞬態峰值越高,在同一時域內得到的混響電平也將越高。假設干聲中相鄰的兩個音符間隔0.2 s的時間;混響時間為1.2 s。兩個音符一個瞬態峰值為80 dB,另一個60 dB。當第一個音符結束混響大約衰減到60 dB左右時,第二個音符開始。在這種情況下,第一個音符的混響和第二個音符的干聲便音量相當、同時存在,干擾將變得明顯。這是一個極端的例子,但可以肯定,不當的混響發送量對自身后續的音符會產生干擾。從另一種角度上講,這會造成深度定位的模糊。

圖1 室內聲場中聲源音強與混響時間的動態關系
在實際混音中,為了體現空間感,混響效果器的添加一般不超過兩個。使用過多空間,可能造成對空間的聽覺混亂。目前計算機芯片處理能力強大,使對深度的處理有了更多的選擇。
對空間縱深感的塑造還可有以下方式:
(1)增加多個輔助效果軌,使用發送的方式為不同的干聲添加不同的早期反射;并使用發送的方式為不同的干聲添加同一個后期混響。
(2)在方法一的基礎上,使用延時效果代替早期反射。這樣,中間信號細節的模糊程度要少于添加早期反射,縱深感相對弱一些。
(3)去掉早期反射,將后期反射的起動時間提前,以后期反射代替早期反射。需注意如起動時間過長,會導致干聲在前、混響效果靠后的聲場分離現象。
聲音形體與縱深感在聽覺方面具有潛在的對應關系,與人的視覺類似,最簡單關系是“近大遠小”;人耳對聲音形體的感知在回放系統中比現實環境中更為明顯。這一規律多應用于音樂制作領域以雙聲道立體聲系統。本文對聲音形體的論述只限于雙聲道立體聲回放的制式下。下面是以聲音形體的角度對縱深感塑造的論述。
聲音形體是一種與距離有關的聽感印象,在調整深度時,還可以作為一種處理的目標存在。不同的形體適合不同深度的表現,其調整可參照與形體變化相關的聽音現象。
當音量較小,距離較遠時,以低頻為主的單聲道素材表現為一個點,以中頻為主的單聲道素材表現為一條垂直的線。當增加音量,拉近距離后,以低頻為主的單聲道素材會在兩個音箱之間變得更寬,并且高度得以延伸(監聽揚聲器系統尺寸越大高度現象越明顯),表現為一個球形,以中頻為主的單聲道素材大致表現為向上的錐形。這些現象主要與頻率的響度及傳播的方向性有關。
立體聲信號形體與立體聲的分離度有關。立體聲分離度越小,聲音越傾向于單聲道信號的形體特點;分離度越大,聲音的聲像越寬。聲場分布均勻的立體聲信號表現為水平方向上的橢圓形;有相位抵消或分離度過大的立體聲信號會出現中空的現象。提升音量以表現較近的距離時,立體聲信號的寬度不會發生變化,而高度將會有一定增加。
對聲音形體的調整通常由電平與頻率的相互協調完成。以中低頻為主的單聲道軍鼓信號為例:當需要將其推遠時,可以針對原始素材的特點來決定采用降低電平的方式,還是采用對聲音低頻進行滾降,甚至對兩者同時控制,但都需以獲得較“瘦”的形體為目標。又如:混音中較近的單聲道干聲含有的低頻過多,其體積較大,對其他聲源產生了干擾。對這種情況除采用降低電平外,還可以通過降低低頻來減小聲音的形體,使聲音變遠。
在混音中,對形體輪廓是否清晰(即聲源邊緣的界限是否明確)常使用聲聚焦進行評價。聲聚焦在原理上類似于光聚焦,指在具有反射條件的聲學環境下,在聲音反射聚焦的位置聲能將得到集中和增強。對干聲添加混響效果,其混響聲像越寬,得到的聲聚焦越模糊,邊緣界限越不明確。因此在添加混響時,應注意混響寬度的使用,最好使用具有立體聲分離的、且聲像寬度可調的混響效果器。另外,后期反射的擴散程度對形體輪廓的清晰也有影響,使用擴散過大的后期反射會導致松散的立體聲成像。除形體邊緣不明確外,聲音深度的定位將變得模糊。使用擴散較低的后期反射使聲音更加干凈和通透,有利于表現準確的深度定位。
包圍感與立體感是對形體的一種心理體驗。聲音的寬度、高度以及低頻的能量是包圍感與立體感的主要成因。增強包圍感和立體感能給人帶來更多親近的感受,拉近聽者與聲音畫面的距離。
立體感與聲音的響度有關。最常見的是使用壓限器加強聲音細節的表現。由于一般使用二分頻或三分頻的揚聲器系統,使用壓限器可使高、低頻在不同的揚聲器單元上得到強化,使原本扁平的聲音具有立體感,從而使聲音形體的感受更加清晰。
在音樂混音中,縱深感的塑造是最難處理的問題之一。適當的縱深處理可使音樂風格明確、前后層次分明、空間氛圍明顯。近年,隨著各種音樂風格之間頻繁的混搭以及電子合成類音樂的發展,從聲學、電聲到虛擬音色等多種素材的組合在制作中變得極為常見。能否將這些素材合理地整合到一起,并給出一個富有想象力的、出彩的虛擬空間,將決定著音樂作品的可聽性與流傳的廣泛程度。選擇和實現不同的縱深感構想既是對混音能力的考驗,同時也為混音帶來了極大的創造空間。
[1] William Molan著,吳瀟思、熊思鴻譯.混音藝術與創作[M].北京:人民郵電出版社,2009.
[2] 韓寶強.音的歷程[M].北京:中國文聯出版社,2003.
[3] Eddie Bazil.SOUND EFFECTS TIPS AND TRICKS[M].Great Britain:PC Publishing,2011.
[4] David Gibson.The art of Mixing[M].United States:artistpro.com llc,2005.
[5] Mixerman.Zen and the Art of Mixing[M].Milwaukee:Hal Leonard,2010.