(中影電影數字制作基地有限公司,北京 101400)
隨著iZotope RX 的版本不斷升級,針對音頻修復方面的功能更加全面。尤其是2019 年底問世的Dialogue Match和2020年推出的最新版本RX 8都解決了很多以前不可能解決的音頻修復問題,它開始影響著傳統的制作工藝。
iZotope RX 分為獨立運行模式和插入 (Plugin)運行模式(作為插件使用),在獨立運行模式下功能是最全的,可以同時開啟多個處理模塊對同一音頻進行修復,如圖1所示。iZotope RX 最大的特點是將聲音可視化,聲音通過光譜的形式展示出來,可以精準地對任何一個頻段進行處理,經驗豐富的聲音剪輯僅從光譜顯示上就能直觀地看出哪些位置的聲音是需要處理的。其次,iZotope RX 是迄今為止集所有修復功能于一身的專業級修復軟件,它幾乎涵蓋所有在對白剪輯階段需要用到的功能。無論算法還是處理的精細程度相比過去很多插件,修復效果更好,對源文件的損傷也更小。
文章主要對影視后期制作中常用的人聲修復處理的相關功能進行簡述,體現iZotope RX 使用的便捷性以及處理結果的滿意度。

圖1 iZotope RX 的修復界面
影視劇對白制作經常會用到這一功能,比如某場戲的同期聲由于年代穿幫或質量等原因無法使用,需要后期配音,這樣就會遇到同期聲和ADR 交叉使用的情況,Ambience Match就是解決這兩部分環境聲銜接的問題。
過去為了給ADR 補上相同的環境聲,最普遍的做法就是在同一場甚至是同一鏡頭的同期聲素材中找到干凈的環境聲區域,摳出一些短小的環境聲素材,拼接出一條可用的長度。這種做法一是費時間,二是如果臺詞節奏緊湊且拍攝條數不夠多的話,很難拼接出一條長度合適且干凈的環境聲。
Ambience Match很好地解決了這些問題,通過選取一段干凈的同期環境聲作為采樣參照,操作界面里點Learn功能鍵,軟件會自動分析所選區域環境聲的特性并模仿復制出基本相同的聲音,我們根據需要選擇要粘貼的區域并點擊Process直接處理,按照以上操作就可以把整段對白中環境缺失的部分補充完整。如果不想把新生成的環境聲和對白混合處理成一條聲音文件,也可以選擇Output Ambience Only選項,單獨生成環境聲根據需要剪切使用。
很多聲音聽感上已經失真的時候,往往波形也都處于削波狀態。De-Clip 就是專門修復這類問題。
修復界面打開右側Quality 的選項,通常默認都是高質量(High)模式。界面左邊 是 Threshold (門限),是指聲音從什么位置開始削波的。這個門限的使用有兩種方式,一是在Threshold下方有一個Suggest選項,將失真的區域選好,點擊Suggest系統自動計算并處理之后,波形即可恢復正常。另一種是手動處理削波,可以拉動門限的滑塊來選擇波峰或波谷要處理的范圍區域,處理完的聲音還可以進行增益補償 (Makeup gain),避免削波處理后的聲音衰減過多。還有一個后限制器 (Post-limiter)選項,通常默認是勾選的,防止處理完再次削波,如圖2所示。

圖2 De-Clip修復窗口
De-Click主要針對比較細小的噼啪聲,而De-Crackle是針對更加復雜粗糙的噼啪聲。在處理結果上這些聲音只能被盡量弱化,完全去除的可能性較小。
通過Quality (質量)、Strength (處理強度)和Amplitude skew (偏移程度)幾個參數進行調整。偏移程度主要是選擇這個噼啪聲是偏高頻多一些還是低頻多一些,通過滑塊左右滑動進行微調。
人聲中齒音過多不但影響美感且容易造成聽覺疲勞,所以在混音之前都需要將人聲中這些明顯的齒音弱化處理。
處理算法有Classic和Spectral兩種。Classic是探測到齒音就會全頻段整體往下降,其他聲音也會同時被衰減;Spectral的方式是通過分析探測到齒音的時候,只降低齒音部分的頻段,其他頻段不處理。可以調整Threshold (門限)和Cutoff freq(頻率切除)等參數進一步處理。
錄音中有時因為內部線路或設備等問題會聽到一個恒定的電流底噪。De-Hum 就可以有效地去除這種交流電“哼”聲。


圖3 De-Hum 修復窗口
聲音導入之后,從光譜中就能看到一條直線波形一直穩定存在,這就是我們說的Hum (哼聲)的聲音。首先在預設里有50 Hz和60Hz兩類不同標準,在歐洲、中國等國家使用的電壓都是50 Hz,而美國的電壓是60Hz。所以在處理聲音文件的時候也要先選準聲音源的基頻,否則是不起作用的,如果不清楚可以使用Suggest進行自動分析并處理,如圖3所示。
通過Sensitivity (敏感度)、Strength (強度)和Frequency limit(頻率限制)幾個參數進行調整。敏感度數值越高,偵測聲音就越精細;強度越高去除得越多,但同時可能會對原音頻造成一定程度的損傷;頻率限制具體來說就是如果調到200Hz,那么低于這個數值的頻率就會被降低,人聲噴話筒基本都出現在低頻區域,一般來講200 Hz以下就足夠了,如果參數設置太高容易修復過度,造成音頻損傷,修復痕跡明顯。也可以在Compare模式下對比四種預設,選擇效果最接近的再進一步微調,達到理想的效果。
無論是影視對白、語言類節目,或者人物采訪都會涉及到房間混響過大進而影響語言清晰度的問題。以前遇到類似情況很難徹底解決,最多是通過一些簡單的插件處理,或是將混響長度人為的剪短并盡量處理得自然一些,而這一功能為我們解決了這一棘手的問題。

圖4 De-Reverb修復界面
De-Reverb在使用時通過選擇一段五秒以內的素材進行采樣(Learn),采樣素材最好是選擇既有人聲(干信號)部分又有比較完整的殘響 (殘響盡量完整,盡量沒有被后面新的信號所掩蔽),這樣才能最好地識別出混響的聲音信號。通過采樣自動識別出采樣曲線,灰色曲線 (Input)是原始輸入進來的信號,白色曲線 (Output)是自動處理后輸出的波形,同時下面黃色的線 (Boost/reduction)可以看出哪些地方是通過多段壓縮器進行過補償或者衰減,如圖4所示。通過Reduction (衰減量的多少)和旁邊的多段壓縮器再進行更進一步的調整。不得不說De-Reverb的處理結果還是相當令人滿意的。
無論音樂還是人聲有時候會出現音尾突然斷掉,也就是電平突然歸零失去尾音了 (斷點的地方就會聽到“啪”的一聲),聲音缺乏完整沒有自然的結束,如圖5所示。這時就可以通過切點處理對音頻結尾處做一些補償,讓聲音可以自然平滑地結尾。

圖5 斷點修復前
功能界面里只有一個Quality 的滑塊供調整,根據需求自行選擇處理質量的高低。在要處理的音頻結尾斷點處選一段不超過4000Sample的長度進行處理。由于此功能一次最多處理4000Sample,所以只能用來處理較短的信號補償,如圖6所示。

圖6 斷點修復后
人聲錄制時不可避免會出現一些口水聲,以前處理這些粘膩的口水聲最常用的方式就是用筆一點點把這些口水音劃掉或者通過剪輯手法把這些聲音摳掉,費時間且效果不一定好。
而Mouth De-Click通過Sensitivity (敏感度)、Frequency skew (頻率范圍)和Click widening(click的寬度)的調整就可以非常有效地將口水音去除干凈,省時省力。
人聲降噪有兩種模式,Adaptive mode(實時降噪)模式下,播放時會對未來幾秒鐘長度的聲音進行系統自動預處理,這樣在播放的同時聽到的就是實時處理后的效果。Optimize for Dialogue/Music(優化對白或是音樂里唱歌的部分)的模式下,選擇要處理的聲音的類型。主要區別是在Music模式下,針對音樂的特性會有類似拖長音或是有一些弱弱的顫音這種演唱方式,軟件在處理的時候就會遵循音樂的特點,不會過多傷害到中間那些細膩的顫音等。
使用時可以選擇一段干凈的噪聲作為采樣,點擊Learn自動分析識別,就會出現這個噪聲的頻響曲線,通過Thereshold (門限)和Reduction (衰減量)來控制降噪的程度和比例,如圖7和圖8所示。

圖7 降噪前 (灰色區域為噪聲采樣區域)

圖8 降噪處理完成
這是最復雜也是功能最強大的降噪工具,在影視劇和語言類節目的制作中會經常用到,像模擬磁帶的聲音,電流的哼聲還有各種室內外環境噪音都可以通過它來處理。
軟件的處理有兩種模式,一種是Learn (學習采樣),選取一段干凈的噪聲作為采樣參照自動分析識別;另一種是Adaptive mode(實時處理),在播放的過程中軟件自動進行預處理,這樣在播放的過程中聽到的就是實時處理后的效果。實時處理的時間通過旁邊的滑塊選擇,比如選擇3秒的時長,軟件就會預處理后面3秒的長度,到了這個3秒又會自適應處理下一個3秒的長度。Learn的模式通常是針對同一空間內或是同一場景下的底噪;Adaptive mode大部分時候可以應用于環境底噪發生明顯變化的時候,比如場景在室內和室外來回切換,在底噪不同的情況下,可以通過自適應模式進行處理。不過在影視作品中,特別是電影的聲音制作,通常會將不同環境、不同場景的對白單獨進行處理。
基本的參數調整也是常用的,類似Threshold(門限)、Reduction (衰減值)、Quality (質量)和Artifact(精準度)等在其他的功能中都有類似的調整參數。除此之外,還有可供選擇的擴展區,能夠對聲音進行更精準的處理。比如Algorithm Behavior(算法模式),分為極度算法、高級算法、簡單算法和高級加極度算法;Noise Floor (底噪),有Synthesis(類似合成底噪)和Enhancement(增強人聲信號)兩種。有些段落經過處理后幾乎沒有了底噪,播放到這部分就會像一個“坑”一樣聲音突然掉下去,整體底噪就不平了,Synthesis就是通過算法合成出一個底噪把這些“坑”填平。在去除掉的底噪里面如果還存在部分人聲頻率,就通過Enhancement將底噪里面的人聲強化出來。另外還有Masking (心里聲學的算法),默認20Hz 以下和20KHz以上就不再處理;Whitening (添加白噪聲),為了避免去掉噪聲之后人聲過于干凈顯得比較突兀,可以選擇添加這個選項,使已經去掉的底噪和去不掉的底噪都接近于白噪聲;Dynamics (動態),可以通過Knee(拐點)進行更細的調整,如圖9所示。

圖9 綜合降噪

圖10 綜合修復模塊
這是一個具有綜合修復功能的工具,它能夠衰減或是去除各種不同的噪聲和雜音。它一共有四種模式:Attenuate(衰減),在這個模式下可以通過水平方向、縱向和2D 方向 (水平+縱向)來衰減噪聲,通過光譜中噪聲顯示的形態進行選擇;Replace(替換),用另外一個聲音來替換想要處理的聲音;Pattern (圖形),和Replace使用相似,但是算法不同;Partials+Noise類似Replace的升級版,可以對諧波進行補償替換,也可以通過Instant process(快速處理模式),選擇噪音位置和范圍,直接進行快捷處理,如圖10所示。
使用中盡量采取少量多次的原則進行處理,以免處理過度造成頻率損傷。
將要處理的聲音文件導入之后,可以從光譜上很明顯地看到風噪區域,基本上大部分的風噪都集中在低頻區域。通過調節四個比較基本的參數就能夠有效地去除風聲。Reduction (衰減量),控制風噪去掉的多少;Crossover frequency (預設值),比如將滑塊設置在500 Hz的位置上,那么超過500 Hz的頻率就不再處理;Fundamental recovery,主要用來補償去除風噪之后損失掉的部分人聲;Artifact smoothing,順滑程度的調整,參數越大修復的效果越好,但同時修改痕跡越重。
現場拍攝時演員的動作過大或是著裝臃腫等都容易與無線話筒產生摩擦聲。
最簡單的方法是通過四種不同強度的預設處理對比選擇一個效果最好的,然后再通過Reduction strength (衰減強度)和Ambience preservation(環境聲保留比例)進行參數細節的微調。衰減較大時,環境聲也會跟著被衰減,所以在衰減量調整到比較滿意的程度之后,通過環境聲保留比例的增減找到最舒適的聽感。
處理同期聲的時候,有時會需要將對白提取出來,也就是去掉同期除了對白以外所有的噪聲,環境聲甚至動效。
處理方式主要就是控制對白和噪聲的增益,通過調整分離程度的多少來實現提取對白的目的。調整模塊有Dialogue gain (對白增益)、Noise gain(噪聲增益)和Separation strength (分離強度)三部分。這個功能模塊沒有Preview (預聽)模式,可以調整預存幾種不同的方案,通過Compare(對比)進行預聽對比,同時進行微調。
iZotope RX 在2019 年12 月 發 布 了Dialogue Match這款插件,它被稱為是全新的革命性的工具插件,它的出現將改變影視劇對白傳統的工作流程與分工布局。

圖11 Dialogue Match的三個調整參數
Dialogue Match 主要是解決同期聲和ADR 匹配的問題。由于ADR 的錄制失去了同期拍攝的空間條件,屏蔽了自然環境和周邊因素的干擾,所以它的聲音是最原始的毫無加工和染色的真實聲音。配音后的對白失去了同期聲的活性,無論在音色、混響還是環境背景聲等方面都很難與同期聲銜接。而Dialogue Match就是對同期聲的音色進行采樣分析,軟件會自動識別出同期聲的頻響曲線、混響特性和環境背景聲,并將其識別出的所有信息運用于配音后的對白中,最后通過手動對各參數進行微調得到滿意的結果。這個過程類似對白混錄的工作流程,這款插件未出現之前,這些工作通常是需要花很多時間通過多個插件一點點調出來,大多時候也只有混錄師才能勝任此項工作。而Dialogue Match的問世將改變這一局面,以往對白預混的工作完全可以交給有經驗的對白剪輯來承擔。
2019年底我在電影《特警隊》的對白剪輯中大量使用了Dialogue Match,完成了幾乎所有人聲匹配的工作,也就是大部分對白的EQ 和空間混響的調整工作都放在我這里來完成。這也是Dialogue Match剛剛問世幾天后的首次嘗試,結果還是令人滿意的,以前很多放在混錄階段處理的對白現在通過這款插件就可以由聲音剪輯來實現,這為混錄節省了不少時間,也為混錄師分擔了很大一部分工作量。
無論是訪談還是綜藝類節目,都離不開即興發揮的成分。像《爸爸去哪兒》《向往的生活》這些綜藝類節目,無論是人物的臺詞還是行為動作大部分都是即興發揮出來的,這對同期錄音的要求就比較高,尤其這類節目的現場拍攝本來就比較復雜,同時拍攝幾組家庭或幾組成員,有分開的不同場景也有大家聚在一起的場面,后期再配音很難實現,而且幾乎不可能模仿出同期的自然度和真實度,所以在以往的綜藝節里,當語言清晰度受到損失的時候基本就靠后期字幕了。
還有一些人物專訪和一些采訪類節目,后期配音也不太現實。當采訪受到空間環境的限制,容易出現聲音混響大,噪聲大等問題進而影響人物語言的清晰度。這些問題在過去只能通過EQ 和簡單的降噪工具進行處理,雖然能夠得到一些改善,但對比iZotope RX,處理效果還是差很多,尤其是大混響,幾乎是不可逆的。
將iZotope RX 運用在節目制作領域,它強大全面的修復工具可以解決很多復雜的人聲問題,它的使用不但可以控制節目的制作成本,并且從很大程度上提高了節目的聲音質量和觀看感受。
與節目相比,影視劇制作對聲音的要求更高。高標準的放映環境和多聲道的還音條件,讓電影聲音的制作標準更是遠遠高于其它。
iZotope RX 在電影聲音制作流程中主要應用在對白制作環節,以前對白總是受到處理手段的限制和處理結果不佳的影響,不得不舍棄同期聲而選擇ADR。現在基于神經網絡(大數據)的基礎上對聲音進行處理,算法更加精準,效果也更出眾。將聲音通過iZotope RX 可視化之后,對任何一個小細節都可以進行修復處理。
它為電影聲音后期制作帶來了明顯的優勢:提高了同期聲的使用率,減少了很大一部分配音工作,一定程度上為劇組節省了請部分演員回來配音的開支;Dialogue Match的問世將跨越傳統的制作工藝,對白剪輯即將能夠承擔很大一部分對白預混的工作,減少混錄的壓力,節省混錄時間。iZotope RX 的出現為對白剪輯打開了一扇新的大門,徹底打破了以前在對白處理上的局限性。
電視劇不同于電影,由于制作量大,同時受到時間和預算上的限制,在制作中很多聲音的問題沒有時間逐個處理,因此我們在看電視劇的時候經常遇到聲音不銜接的現象,出現這些問題是因為后期配音之后的聲音沒有經過處理,造成和同期聲銜接不上的現象。若將Dialogue match運用于電視劇制作中,將會有效改善電視劇聲音的制作質量,大大節約制作時間。它智能化的使用體驗和高精度的算法,比起以前傳統的處理方式,效果更加出眾且直觀易操作。
以前影視劇對白處理手段有限,比如有的同期聲由于信噪比太差,降噪器的采樣不夠精準導致對白音質損傷過度;同期聲因動效聲或是周圍環境聲過大而影響了對白的清晰度;同一場戲的兩個角色,一個對白質量不錯而另一人的信噪比較差,為了兩人的聲場環境和音色能夠較好銜接,最后不得不整場戲配音。如今這些問題大部分情況都可以通過iZotope RX 較好地解決。
隨著聲音處理軟件的采樣方式和精細度的不斷提高,將過去那些根本不可能保住的同期聲通過軟件處理大大提高了同期聲的使用率。這不但保留了同期錄音師辛苦的勞動成果,也保留了演員們現場表演時最真實的狀態,為后期配音工作減輕了很大一部分工作量,同時也為大部分導演實現了盡可能使用同期聲的愿望。?