吉曉東 陳建平 任 珍
摘 要:語音音效是一種人工對采集的數字語音信號進行增強、濾波、調制等再處理的過程,可以將原來干澀的聲音變得更加豐富。在詳細描述鑲邊效果一般產生模型的基礎上,提出新的鑲邊效果產生模型,并對兩種模型的鑲邊效果進行了比較。針對改進的鑲邊效果產生模型,在不同調制波形下進行了仿真實驗。結果表明,改進模型能進一步豐富諧波分量,增強鑲邊處理效果。
關鍵詞:數字語音處理;語音音效;鑲邊;諧波
中圖分類號:TP391 文獻標識碼:A
文章編號:1004-373X(2009)21-096-03
Improved Design and Implement for Digital Processing of Audio Effect Flanging
JI Xiaodong,CHEN Jianping,REN Zhen
(School of Electronic Information,Nantong University,Nantong,226019,China)
Abstract:Audio effect is a signal processing technique used to modulate or to modify an audio signal.It can make the original dry audio signal to be rich and nice.After briefly introducing the general model of flanging processor,an improved model to generate flanging effect is proposed.The performance of the two flanging processors are compared.Emulation experiments are done for the new flanging processor under different modulation signals.The results show that the new flanging processor can enrich the harmonic components and enhance the flanging effect.
Keywords:digital audio processing;audio effect;flanging;harmonic
0 引 言
語音音效是一種人工對采集的數字語音信號進行增強、濾波、調制等再處理的過程[1],通過語音音效的處理可以將原來“干澀”的聲音變得“濕潤”[2]。目前,語音音效處理都是通過數字信號處理技術來實現的,通過對原始聲音的數字處理,可以產生各種虛擬空間的特殊聲音效果,包括 Chorus(合唱)、Echo(回聲)、Pitch(變調)、Phasing(移相)、Tremolo(顫音)、Flanging(鑲邊)、Gate(閘門)等以及由上述效果疊加組合后形成具有幻覺色彩的聲音效果[3]。目前,語音音效廣泛應用于劇場擴聲的背景效果、樂隊實況演出時的聲音處理、電影錄音和演播室錄音的特殊聲效處理以及數字音響中[4]。因此研究各種特殊音效效果的產生機理有著重大的現實意義,本文著重對Flanging(鑲邊)效果進行研究。
1 鑲邊效果的產生模型
鑲邊效果是用一個超低頻信號對延遲時間進行調制后所產生的效果[5]。這種效果可以循環反復地夸張聲音中的奇次諧波或偶次諧波分量,使聲音的頻諧發生周期性的變化,從而產生“空洞聲”、“噴流聲”和“交變聲”等富有幻覺色彩的聲音效果,如同為原來的聲音鑲上一種奇特的聲音邊緣,讓人感到一種回旋、游移的聽覺效果。
1.1 一般模型
鑲邊效果的一般產生模型如圖1所示。
圖1 鑲邊效果的一般產生模型
圖1中動態延遲單元將原始數字聲音信號x(n)進行動態延時生成x,其中d(n)為動態延時調制波;然后在增益因子a2(0 y(n)=a1x(n)+a2x(1) 當動態延時調制波是一個低頻信號(頻率小于1 Hz),并且d(n)產生的最大延時小于10 ms時,輸出信號將產生鑲邊效果 [2,6]。 圖1所示的鑲邊效果產生涉及到調制波形及其頻率,以及增益因子的選擇。因此不同的調制波形、頻率和增益因子將產生不同的鑲邊效果。 1.2 改進模型 圖1所示的一般產生模型是將原始信號與動態延時信號進行簡單疊加,而原始信號與延時信號的簡單疊加會產生梳狀濾波效應。由于細微的動態延時變化會產生不同的梳狀濾波效應,這樣圖1所示兩路信號的疊加就產生了鑲邊效果[7]。為了提高鑲邊效果,應提高梳狀濾波的凹槽深度和選擇性[7]。研究表明,反饋可以提高梳狀濾波的凹槽深度[8]。為了增強鑲邊效果,對一般產生模型進行了修改,提出新的鑲邊效果產生模型,如圖2所示。 圖2 鑲邊效果的改進模型 圖2中的動態延遲單元與圖1中的作用一致,也是將輸入信號在延時調制波的作用下進行動態延時。為了提高梳狀濾波的凹槽深度,圖2中增加了反饋模塊a3,輸出鑲邊效果信號為: y(n)=a1x(n)+a2z(n)(2) z(n)=x+a3z(3) 圖2所示產生的鑲邊效果也涉及到調制波形及其頻率、以及增益因子的選擇。一般增益因子a1,a2和a3都在0~1之間,調制波的頻率也要小于1 Hz。調制信號波形的選擇一般有4種:正弦波(Sine)、三角波(Triangle)、對數波(Logarithmic)、指數波(Exponential)。 2 仿真實驗及結果分析 仿真實驗數字化采樣頻率fs=44.1 kHz,每個采樣數據編碼長度為16 b。 2.1 一般模型與改進模型比較 針對圖1和圖2兩種模型,選擇正弦波作為調制波形: d(n)=(D/2)(4) 式中:fd=0.01 cycles/sample,最大延遲D=20 samples。輸入x(n)為單一頻率正弦信號,其頻率f=0.05 cycles/sample。圖1中,a1=a2=0.5;圖2中,a1=0.5,a2=a3=0.8。設圖1和圖2的輸出分別為y1(n)和y2(n),圖3給出輸入信號x(n)和輸出信號y1(n)和y2(n)的波形。從圖3可以看出,對輸入單頻信號,改進模型輸出的時域波形幅度變化更大。圖4給出x(n),y1(n)和y2(n)的頻譜圖。從圖4可以看出,改進模型輸出信號諧波分量更加豐富,因此增強了鑲邊效果。 圖3 兩種模型輸出波形比較 圖4 兩種模型輸出波形頻譜比較 2.2 不同調制波形下的比較 針對圖2改進模型,選擇四種不同的調制波,在相同的參數和輸入信號下比較輸出鑲邊效果。 圖5給出選擇的四種調制波,它們的調制頻率fd=0.01 cycles/sample,最大延遲D=20 samples;輸入x(n)為單一頻率正弦信號,其頻率f=0.05 cycles/sample;增益因子a1=0.5,a2=a3=0.8。圖6(a)~(d)分別給出正弦波、三角波、指數波、對數波四種調制波下的輸出y1(n),y2(n),y3(n)和y4(n)??梢钥闯?正弦波作為調制波時輸出信號幅度變化較慢、平滑,三角波次之,指數波和對數波變化最快。
利用Matlab的WAVPLAY函數,可產生上述鑲邊效果處理的音頻輸出。從主觀聽覺效果看,正弦波作為調制波具有平滑的輸入和輸出的變調效果;三角波產生線性變調的鑲邊效果,在轉折點附近會產生快速升高和降低的音調;對數波和指數波鑲邊變調效果相似且最好。
圖5 四種調制波
圖6 四種調制波形下的輸出
3 結 語
針對鑲邊一般產生模型鑲邊變調效果不甚理想,提出改進的鑲邊效果模型。在輸入單頻信號下,對兩種模型的鑲邊效果進行了仿真比較。結果表明,改進模型能進一步豐富諧波分量,增強鑲邊變調效果。對改進模型,分別在調制波為正弦波、三角波、指數波和對數波的情況下進行了仿真實驗。實驗表明,正弦波的鑲邊變調效果較平滑,三角波的鑲邊變調在轉折點附近會產生快速升高和降低的音調,指數波和對數波的鑲邊效果相近,且變調效果最好。
參考文獻
[1]Verfaille V,Zolzer U,Arfib D.Adaptive Digital Audio Effects(A-DAFx): A New Class of Sound Transformations[J].IEEE Trans.on Audio,Speech and Language Processing,2006,14(5):1 817-1 831.
[2]Sophocles J O.Introduction to Signal Processing[M].北京:清華大學出版社,1998.
[3]譚少毅.雙引擎數字效果處理器的原理及其應用方法(一)[J].電聲技術,2003(9):70-74.
[4]張飛碧.數字混響效果器的原理及應用[J].音響技術,2002(4):26-29.
[5]Caputa M J.Developing Real-Time Digital Audio Effects for Electric Guitar in an Introductory Digital Signal Processing Class[J].IEEE Trans.on Education,1998,41(4):341-346.
[6]Cole J.Audio Effects-Noise Gate & Flange[EB/OL].http://www.buzzle.com/editorials/8-31-2006-107181.asp,2006-1-9/2008-8-15.
[7]Dattorro J.Effect Design:Part 1 Reverberator and Other Filters[J].Audio Engineering Society,1997,45(10):660-684.
[8]Dattorro J.Effect Design:Part 2 Delay-Line Modulation and Chorus[J].Audio Engineering Society,1997,45(10):764-788.
作者簡介
吉曉東 男,1979年出生,碩士研究生,講師。主要研究方向為語音信號處理、認知無線電技術。
陳建平 男,1960年出生,碩士研究生,教授。主要研究方向為數字信號處理、快速算法、DSP應用等。
任 珍 女,1986年出生,南通大學電子信息學院學生?,F從事語音音效處理方面的研究。