摘" 要:當下的音頻發展,已經從點音源發展到場音源,單聲道的聲音已經無法滿足聽眾的欣賞要求,也可以理解為高清4K及以上的畫面世界的清晰度越來越高,所展現的視頻信息越來越龐大,而導致聲音元素以及變化形式越來越復雜,也就是豐富的畫面帶來豐富的聲音,音畫同步的震撼效果已經遠遠超越單聲道所能夠呈現的范圍。該文闡述的就是影視劇后期制作當中,如何將動態聲場或者說是動態聲場變換真正地體現出來。
關鍵詞:音頻;動態聲場;影視后期制作;自適應濾波器;層疊效應;遮掩效應
中圖分類號:J93 " "文獻標志碼:A" " " " " 文章編號:2095-2945(2023)25-0186-04
Abstract: The current audio development has developed from a point sound source to an on-site sound source. Mono sound can no longer meet the appreciation requirements of the audience, and it can also be understood that the definition of the picture world with high definition 4K and above is getting higher and higher. The video information shown is getting larger and larger, which leads to more and more complex sound elements and changing forms, that is, rich pictures bring rich sounds. The shock effect of sound-picture synchronization has gone far beyond the scope that mono can present. The purpose of this paper is to explain is how to transform the dynamic sound field or dynamic sound field in the post-production of film and TV series.
Keywords: audio; dynamic sound field; film and television post-production; adaptive filter; cascading effect; masking effect
當我們閉上眼睛,傾聽周圍的環境時,你就會聽到各種聲源,如果用更先進的儀器甚至可以檢測到各種聲音獨特的性質,如果你覺得這些還不夠,那么這些就是這個聲音的全部嗎?當然不是,這只是其一部分,還有更大的一部分是其在空間中的擴散,或者更精準地說,是一種膨脹,然后消失。聲音從一個點開始擴散,直到消失,這才是一個聲音的全部。而一個點音源,在相對穩定的狀態下所產生的聲音,在空間中所產生的聲壓級不隨時間變化而發生變化,就可以視為靜態聲場,這樣的聲音幾乎很少見。而大部分情況下聲音都是各種頻率相疊加,而且音源點也在各種空間之間不斷轉換,從而使研究越來越復雜,這樣的情況可以視為動態聲場,甚至可以叫做動態聲場變換。而本文闡述的就是影視劇后期制作當中,如何將動態聲場或者說是動態聲場變換真正地體現出來。手法之多而且特別復雜,甚至不能用幾句話來簡單說清楚,因為聲音本身看不見,只能通過聽覺來感受,而每一個人的聽覺都不盡相同,所以,聲音的后期制作是一個非常帶有主觀色彩的工作,也可以理解為是一種藝術創作。但并不是所有的聲音藝術形式都會被大眾接受,而是在恰當的時間、恰當的空間及恰當的畫面共同配合下,聲音的藝術創作,才會凸顯其獨特的魅力。如果只是單獨從音源的角度去欣賞,只能聽見其部分,而并不是全貌,甚至更無法想象它在還原一個什么樣的場景,聲音本身可以單獨作為一種存在,但是僅憑聲音就去理解這個世界,本身就是一種盲人摸象的行為。毫厘之間,變幻萬千。
層疊效應(Stacking Effect①)指的是多個音頻信號混合在一起時,因相互干擾產生的疊加效應。簡單來說,當多個信號疊加在一起時,其幅度將相加,因此,可能會發生削弱或增強的效應。層疊效應可能產生不同種類的影響,包括相位干涉、諧波失真、失真、動態范圍壓縮和空間效果。例如,2個聲波相遇時,其波峰和波谷可能會相互抵消或相互加強,從而導致相互干涉的問題。另一個問題是,當2個或多個信號同時共享一些頻率范圍時,它們可能會相互干擾,產生諧波失真或失真的聲音。在音頻混合中,了解層疊效應可以幫助混音工程師了解處理音軌的最佳方式,以避免在混音時產生不必要的干擾和失真,并保持混合信號的清晰度和準確性。
遮掩效應(Masking Effect②),又稱掩蔽效應,是當一個音頻信號對另一個相鄰的音頻信號產生影響,使人們很難聽到后者的現象。當一個音頻信號的聲音比另一個音頻信號更大,或者其頻率范圍與后者有所重疊,就可能發生遮掩效應。層疊效應和遮掩效應是聲音信號處理中的2個不同概念,盡管它們在某些情況下可能會發生并產生相似的結果。一個音頻信號可能包含多個頻率,其中一個頻率可能比其他頻率更強或更突出。在這種情況下,較弱的頻率可能會被掩蓋,從而其聲音幾乎不可察覺,無法被清晰聆聽到。這種情況稱為前向遮掩。同時,當我們聽一個音頻信號時,較強的頻率也可能會被周圍較弱的頻率所遮掩,這稱為后向遮掩。了解遮掩效應對音頻混合和后期制作非常重要,因為混音工程師需要了解如何處理被遮掩的頻率,以確保音頻信號在不破壞其他部分的情況下保持完整性和明晰度。在混合和后期處理過程中,可以使用動態范圍處理、均衡器、自適應濾波器等技術調整頻率范圍,以解決由遮掩效應引起的問題。
聲音的層疊效應是由英國科學家霍華德·弗萊明(Howard Fleming)于1894年發現的。弗萊明通過將2個聲源放置在不同的位置,并測量其混合在一起時產生的總聲級,從而描述了聲音疊加效應。這項發現在后來的音頻技術和音響系統設計中發揮了重要作用。
聲音的遮掩效應是由美國的物理學家Fletcher和Munson在1933年發現的。其研究了人類對于不同聲音頻率和強度的感知,并發現了一個統一的量化方法,后來被稱為“Fletcher-Munson曲線”,其描述了聲音遮掩效應的規律。這項研究對于后來音頻技術和音響系統的設計產生了重要影響。
在影視后期音頻制作環節中,單聲道的混音過程中經常會遇到以上2種效應的干擾,而多聲道的混音就會好很多,但是工作量會隨著聲道的增加而成倍增加。雖然現在市面上已經出現了將單聲道轉換成多聲道的軟件,而真正的多聲道制作理念卻是千變萬化,不可能僅用幾個固定模板和算法將其全部涵蓋,而且多聲道制作本身就是帶有自主意識的創造,甚至可以理解為矩陣對矩陣的,或者是多層矩陣的最終運算結果,而這也僅僅是一場聲音的制作,或者是幾個類似音源點的制作,當畫面的轉換以及激烈程度不斷增加時,整個的矩陣就會從靜態轉換為動態、甚至會在瞬時超越人耳所能承受的動態范圍。海量數據處理和人工智能的介入有可能會提供更便捷的方法,但最終的聲音才是想要的結果,而不同的人對不同頻段的、不同空間感的聲音都會有不同的感受,所以,最終的效果還是要經歷人耳的檢驗。
那么在動態聲場制作中應該注意哪些環節呢?動態聲場是相對于靜態聲場而提出的概念,靜態聲場的很多制作理念皆可以運用到動態聲場的制作中,或者可以理解為多個靜態聲場的疊加,當然這也僅是一部分,動態聲場的變換才最具挑戰性。如果僅僅是單聲道的音頻,或許對空間、方向、時間的考慮還不是那么全面,但是到了多聲道制作就完全不是一回事了,甚至在一些單聲道中滾瓜爛熟的理念,進入多聲道中幾乎到了推倒重來的境地。
在后期音頻制作環節中還應該注意一下以下的要點。①音量平衡,確保所有音軌在混音時有一個合適的音量平衡。確保所有音軌在混合過程中層次分明,聽起來清晰。②頻譜均衡:通過使用均衡器調整頻率,確保每個音軌的聲音在混音時能夠互相補充,還要確保不會出現太多的頻率交叉。③空間感,使用混響等效器可以讓混音具有更好的空間感。可以通過調整混響的大小和時長,來模擬不同的場所和空間。④母帶壓縮,在混音后,應用母帶壓縮以增強整個混音的音量和動態效果。壓縮應該是輕柔的,不要過度壓縮。這些只是混音指導的一些建議要點,在混音過程中,需要以實際情況為基礎,并隨時進行調整以達到最優的效果。在混音和后期處理過程中,可以使用動態范圍處理、均衡器、自適應濾波器等技術調整頻率范圍,以解決由遮掩和層疊效應引起的問題。自適應濾波器是一種能夠自動調整濾波器系數以適應不同輸入信號的數字信號處理器。自適應濾波器可以用于信號降噪、頻率響應均衡、預測修復等應用中。常見的自適應濾波器有以下幾種。
1" 最小均方誤差(Least Mean Squares,LMS)算法自適應濾波器
LMS算法根據所期望的輸出信號與實際輸出信號之間的差異來調整濾波器系數,并反饋到下一次迭代中。LMS算法計算變化快速、實現簡單,適用于實時應用,但是收斂速度緩慢,容易受到非線性失真的影響。LMS算法:$w(n+1)=w(n)+mu e(n)x(n)$。其中,$w$表示濾波器系數向量,$x$表示輸入信號,$e$表示期望輸出與實際輸出之間的誤差,$n$表示當前時刻,$mu$表示步長系數。一些音頻插件使用了LMS自適應濾波器算法。以下是幾個常見的插件。
1.1" Waves NS1 Noise Suppressor
該插件可以自適應地學習并過濾掉背景噪聲,使用LMS算法來保留人聲的清晰度和自然感。
1.2" iZotope RX 8 Advanced
該插件是一款強大的音頻編輯軟件,使用了包括LMS在內的多種機器學習算法,可以幫助用戶修復損壞的音頻信號,去除噪音、雜音、電流噪聲等。
1.3" Antares Auto-Tune Pro
該插件廣泛用于音樂錄制和制作中的聲線處理和修飾,使用LMS自適應濾波器對聲音信號進行強化或壓制,幫助用戶達到想要的音樂效果。
2" 遞歸最小二乘(Recursive Least Squares,RLS)算法自適應濾波器
RLS算法通過遞歸計算來盡可能減少方差的誤差,可以在精確性和收斂速度之間取得平衡,但是計算量大,需要較高的硬件要求。RLS算法:$w(n)=w(n-1)+K(n)e(n)$。其中,$K(n)$為濾波器增益向量,$e(n)$為實際輸出與期望輸出之間的誤差,$n$表示當前時刻。RLS(遞歸最小二乘算法)是一種適應性濾波算法,常常用于信號預測、反饋控制和濾波等音頻領域的應用。下面是一些市場上使用了RLS 算法的音頻插件。
2.1" Waves C4 Multiband Compressor
Waves C4 Multiband Compressor是一款著名的多頻帶壓縮器,可以自適應地學習音頻信號并濾除不必要的噪音。目前許多音頻專業人士在現場表演和錄音中廣泛使用C4,在音質和性能方面得到了很高的評價。
2.2" iZotope Ozone 9
iZotope Ozone 9是一款功能強大的音頻母帶處理軟件,其使用包括 RLS 在內的多項自適應濾波技術。可以用于控制音頻信號的飽和度、色調、動態范圍和其他重要參數,以及去除噪音和失真。
2.3" McDSP 6030 Ultimate Compressor
這是一款綜合性多功能壓縮器插件,其中包括了 RLS 算法的實現,可用于處理聲音的多個方面,包括動態、飽和度、控制等。
3" 歸一化最小均方(Normalized Least Mean Square,NLMS)算法自適應濾波器
NLMS算法以均方誤差為目標函數,進行濾波器參數的調整。相對于LMS算法,NLMS算法可以解決收斂速度慢的問題,并且不需要手動進行參數的歸一化,通常是較為成熟的自適應濾波算法之一。但是在實際應用中,NLMS算法在抑制噪聲的同時,也可能誤殺弱信號,因此需要進行合適的參數選擇和針對特定場景的優化。NLMS算法:$w(n+1)=w(n)+dfrac{mu e(n)x(n)}{||x(n)||^2+delta}$。其中,$||x(n)||^2$表示輸入信號向量$x(n)$的平方和,$delta$為正則化因子,通常設置為一個較小的值。NLMS算法在音頻處理中主要用于降噪和回聲消除等方面。市場上應用NLMS算法的音頻插件有很多,以下是一些常見的插件。
3.1" iZotope RX
iZotope RX是一款高級音頻編輯和修復軟件,可以進行噪聲消除、修復損壞的音頻和其他高級音頻處理。其中有很多功能采用了NLMS算法技術,比如噪聲消除和聲學回聲消除。
3.2" Waves WNS
WNS是另一款常用的高級噪聲消除插件,可以有效地降低各種類型的噪聲,包括電源嗡嗡聲、背景噪聲等。WNS使用了NLMS算法作為噪聲模型。
3.3" Accusonus ERA Noise Remover
ERA Noise Remover是一款高級噪聲消除插件,具有簡單易用、高效和精準的特點。該插件使用了NLMS算法技術,并且支持實時去噪。
3.4" Cedar Audio
Cedar是一家專業的音頻降噪軟硬件廠商,推出了許多基于NLMS算法的降噪軟件和硬件產品,被廣泛應用于電影、電視、廣播和錄音等領域。
4" 遞歸最大似然(Recursive Maximum Likelihood,RML)算法自適應濾波器
RML算法是基于最大熵原理進行估計,可以提高濾波器的降噪性能和估計精度。但是該算法計算量大,實現復雜,通常在非實時應用中使用。遞歸最大似然算法是一種用于難以建模的有聲成分的高級語音降噪方法,在音頻處理中也有廣泛的應用。以下是市場上一些應用RML方法的音頻插件。
4.1" Cedar Audio
Cedar是一家專業的音頻降噪軟硬件廠商,推出了基于RML算法的降噪軟件和硬件產品。該產品主要應用于電影、電視、廣播和錄音等領域。
4.2" Waves W43
W43是一款能夠在錄音室或廣播環境中去除噪音的插件,采用RML算法提高噪音的估計精度,并且結合了專業聲學處理的先進技術來實現噪聲消除。
4.3" iZotope RX
iZotope RX是一款高級音頻編輯和修復軟件,支持多種不同類型的噪聲消除算法,其中就包括基于RML算法的降噪算法。該插件支持自適應噪聲估計,可以應對多種不同類型的環境噪聲和語言數據。
4.4" Accusonus ERA
ERA系列是一系列音頻修復插件,其中一些插件采用了RML算法技術,提供了高效、精準的降噪功能,可用于個人制作、自媒體等領域。
總體來看,自適應濾波器可以根據不同的需求和場景選擇不同的算法,通過自動調整濾波器參數,實現對信號的降噪、濾波和預測修復等各種處理。
參考文獻:
[1] 耿秀峰.新媒體時代下的影視后期制作[J].中國新通信,2022,24(1):149-150.
[2] 李璟.影視后期制作在影視藝術中的應用[J].藝術大觀,2022(35):97-99.
[3] 徐憶新.影視后期制作階段的創作技巧研究[J].電視技術,2021,45(12):30-33.