(廣州大學 機械與電氣工程學院,廣州 510006)
當今智能語音技術發展日趨成熟,給人們的生活和生產帶來了極大的方便。聲源定位,波束成形,語音增強等多種前端語音信號處理技術的應用也得到越來越多的重視和發展。但是絕大部分優秀的語音算法都在信源數目確定的前提下實現的[1-3]。然而在各種應用場合中,由于低信噪比,低運算量、低耗時、色噪聲背景和低快拍數等惡劣因素的影響下,基于傳統的信源數目估計方法無法進行準確估計,使大量語音信號算法失去作用,因此優秀的信源數目估計算法是眾多語音處理算法關鍵的第一步。
信源數目估計問題于1975后年取得較大的突破,由Akaika和Wax等人先后提出基于信息論準則(akaika information theoretic, AIC)的信源數目估計[4]和最小描述長度準則(minimum description length, MDL)的信源數目估計算法[5],很好地解決了一直以來魯棒性的問題,但算法限制在白噪聲環境下,眾多學者為此提出了很多的解決方法[6-7],但同時也引進了計算量或減少了魯棒性。基于傳統的蓋氏圓法(geschgorin disk estimator, GDE)[8]能在白噪聲和色噪聲下進行估計,但對信噪比要求過高,同時需要引入人為經驗因子,實際中往往得不到應用。此外,目前基于深度學習的信源數目估計[1]能在較低信噪比下獲得很好的效果,但是需要大量訓練數據和限制在白噪聲環境下。文獻[9-10]運用了高階矩進行信源數估計,改善了傳統方法在色噪聲下的估計準確率,但高階矩運算設計到克羅內克積乘積,運算量很大,降低了實際應用的價值。文獻[11]應用了總體最小二乘法擬合改善蓋氏圓法,使蓋氏圓算法利用比值階躍準則判斷信源數目,不需要人為設定調整因子,但擬合過程計算復雜,運算量增大。基于特征值分解方法的比值法和差值法[12-13],本身具備較小的運算量,但是由于在色噪聲下噪聲特征值發散,且受到人為調整因子影響,在實際中往往得不到應用。
在此基礎上,本文對運算量較小的差值法進行研究,對特征值離散度和差值法之間的影響進行分析,提出一種基于特征值曲線擬合的方法,改進特征值的離散度,使信源特征值之間的差值大大減少,使信源和噪聲特征值之間的差值在白噪聲和色噪聲下能正常區分,且不需要人為調整因子,并根據擬合后的特征值進行差值法處理,實現信源數目估計。仿真實驗表明該方法具有運算量低,在白噪聲、色噪聲下和低快拍數下均能實現信源數目估計的優點。
陣列信號處理的陣列分很多種,常用的有一維陣列的均勻線陣,二維陣列的圓陣和方陣,立體陣列的圓柱陣和球陣列等等。本文運用的是均勻線陣。假設一個由M個陣元組成的天線,陣元的間距d與信號波長γ滿足d<0.5γ,設N(N 圖1 均勻線陣的陣列結構示意圖 則線陣列接收信號矢量可以通過下式表示: X(t)=AS(t)+N(t) (1) 其中:X(t)=[x1(t),x2(t),…,xM(t)]T為M×1維陣元所接收的信號矢量。式中T表示矩陣的轉置。 A=[α(θ1),α(θ1),…,α(θN)]為M×N維陣列流型矢量陣,矩陣中的α(θi)(i=1,2,…,N)為導向矢量且由以下表達式所表示: α(θi)=[1,ejwi,…,ej(M-1)wi]T= [α1(θi),α2(θi)…,αM(θi) 〗T(i=1,2,…,N) (2) 其中: 〗 (3) S(t)=[s1(t),s2(t),…,sN(t)]為N×1維信源信號矢量。 N(t)=[N1(t),N2(t),…,NM(t)]為M×1維與信號不相關的加性噪聲矢量。 所以陣元接收的信號協方差矩陣為: RX=E[X(t)*X(t)H]=ARSAH+RN (4) 其中:RS和RN分別為信號的協方差矩陣和噪聲協方差矩陣,式中H表示矩陣的共軛轉置。對陣元接收的信號協方差矩陣RX進行特征值分解后有: RX=U∑UH (5) 式(5)中U是特征矢量矩陣,∑是由特征值組成的對角矩陣。且表達式如下式表示: (6) 式(6)中特征值滿足如下關系: λ1≥λ2≥…≥λN>λN+1=…=λM (7) 式(7)中前N個特征值就是信號所對應的特征值,后M-N個特征值是噪聲對應的特征值。但實際中受有限快拍數的影響,式(7)不能滿足,所以實際中特征值滿足如下關系: λ1>λ2>…>λN>λN+1>…>λM (8) 在信噪比較高時,信號對應的特征值會遠大于噪聲對應的特征值。由文獻[14]分析可知,在白噪聲時噪聲對應的特征值較為集中,且相差較小,傳統的AIC方法和MDL方法能有效估計。在色噪聲背景時,噪聲特征值發散,傳統方法無法有效的進行估計。并且傳統上的差值法和比值法也不僅受噪聲發散程度影響,同樣受信號特征值離散程度影響,所以減小特征值離散程度對估計準確率尤為關鍵。 差值法是利用特征值之間差值的最大值而確定信源數目。但是因為信源信號所對應特征值分布較為分散而且數值比較大,甚至大于信號與噪聲之間特征值的差值,所以會嚴重影響估計的性能。本文通過研究其離散程度對差值法的影響。 傳統的差值法由下式給出: D(i)=λi-λi+1(i=1,2,…,M-1) (9) =[λ1-λ2,λ2-λ3,…,λN-λN+1,…,λM-1-λM] (10) =[D(1),D(2),…,D(N-1),D(N),…,D(M-1)] (11) 式中,D是由相鄰特征值的差值組成的向量,由式(10)可看出,(11)式主要由三部分構成,即前N-1項的相鄰信源特征值之間的差值,第N項的信源特征值與最大噪聲特征值之間的差值,和后M-N-1項的噪聲特征值之間的差值組成。差值估計中,都希望第一部分和第三部分都很小,而第二部分很大,這樣就能輕易檢測出峰值并估計出信源數目。 分析第一部分,如下式所表示: DS(i)=[D(1),D(2),…,D(N-1)] (i=1,2,…,N-1)= [λ1-λ2,λ2-λ3,…,λN-1-λN] (12) 本文中定義信源信號特征值的離散度用信源信號特征值的方差表示,由下式(13)所示: (13) (14) 其中: (15) μ(i)=λi-λs(i=1,2,…,N) (16) 上式Qs表示信源信號特征值的方差,λs為信源信號特征值的平均值。將(15)式代入(16)式可得: (17) 比較式(10)和式(17)可知,信源信號特征值之間的差值同時對信號特征值方差Qs和DS造成的影響是相同的,在信源數目N一定的情況下,方差Qs越大,分子越大,即相鄰特征值的差越大,DS也越大,差值法估計信源數目效果則下降。若方差越小,則DS越小,差值法估計信源數目效果則更好。 同樣方法分析式(11)的第三部分: DN(i)=[D(N+1),D(N+2),…,D(M-1)]= [λN+1-λN+2,λN+2-λN+3,…, λM-1-λM] (18) 同理式(13),噪聲特征值的離散度由下式給出: (19) (20) 式中,Qn代表噪聲特征值的方差,λn是噪聲特征值的平均值。同理可證,方差Qn越大, 第三部分也越大,差值法估計信源數目效果就會下降。若方差Qn越小,則第三部分越小,差值法估計信源數的效果則更好。 傳統基于比值法或差值法的信源數目估計,受信源特征值離散度和噪聲特征值離散度的影響。尤其在色噪聲或高信噪比下,信源特征值離散度更大,容易使信源特征值之間的比值或差值大于信源特征值和噪聲特征值之間的比值或差值,出現誤判,估計錯誤。從而改善其離散度可改善差值法的效果。 對數函數有著單調性,平穩性等較好的特性,所以常用于進行曲線擬合。當底數大于1時,因變量隨著自變量的增加而增加,但最后趨于平穩。當自變量大于0小于1時,因變量小于0。該函數因為其具有單調和平穩性,與特征值大小變化單調性相符,并且具有平穩性,所以通過擬合后能減少特征值的離散度。 如式(21),當對數函數的自變量x小于1時,因變量y會小于0,并且急劇下降,引起估計錯誤,所以要對對數函數進行選擇。對數函數由下式給出: y=A*logB(c+x)=logB(c+x)A (21) 變換時自變量x為特征值的輸入,因變量y為新特征值的輸出。本文把式中的A稱為加載量,因為對數函數的性質,其大小直接以指數的方式影響特征值加載到的范圍。式中的B影響了其單調性,其值越小,函數遞增速度越快,其值越大函數遞增速度越慢。式中c是函數水平平移量,其值的大小影響y的大小和正負。參數的選取有以下標準: 1)能夠使變換后的新特征值依然為正數; 2)變換后的信源特征值能分布在對數函數趨于平穩的范圍內,且集中于一個較大的數附近; 3)變換后的噪聲特征值不能分布在平穩的范圍內,應集中在一個較小的數附近。 綜上所述,考慮到計算量等各種條件,本文有如下取值: 1)A=5,該值太小會讓信號特征值無法變換到平穩的范圍內,太大會讓部分噪聲特征值變換到較大的附近; 2)B=10,若該值太小會導致函數遞增速度太快,令噪聲特征值更發散。若該值太大,函數遞增性就不明顯,無法區分信號和噪聲特征值。 3)c=1,即函數向左平移一個單位,這樣既可保證變換后的特征值恒為正數,也能最大程度保證了對數函數單調遞增性和平穩性的優點; 所以代入式(21)可得擬合的對數函數如下: y=5×log10(1+x) (22) 該擬合函數參數的選取綜合考慮了計算量、對數平穩性、遞增性等多種因素,對于高信噪比或低信噪比信號,強弱信號都能夠減少信號特征值的離散度。由于在估計時不再需要選定參數,雖然一定程度上減少了魯棒性,但更大程度上減少了計算量,帶來了運算的方便。 曲線擬合時,把接收信號的特征值(λ1,λ2,…,λM)當做自變量x的輸入,輸出的因變量y當做新特征值,并記為y=(k1,k2,…,kM)為擬合后的特征值。即如下式所示: ki=5×log10(1+λi) (i=1,2,…,M) (23) 為了能更清楚顯示擬合后離散度改進的效果,本文分別在白噪聲和色噪聲下,陣元數目為8,參考了文獻[10]的四個入射信號,分別是1、符號信號sign(cos(2π(55t))),2、低頻正弦信號sin(2π90t),3、相位調制信號sin(2π300t-6 cos(2π60t)),4、復指數衰減信號exp(-j*2π200t),分別從-60°,0°,15°,25°入射,信噪比在-15 dB到5 dB變化,四個信號強度一樣。利用接受到的信號求出協方差矩陣,進行特征值分解后利用式(13)計算原本信源信號特征值和擬合后特征值的離散度Qs。實驗結果如圖2和圖3所示。 圖2 白噪聲下信號特征值離散度對比 圖3 色噪聲下信號特征值離散度對比 由圖2和圖3可知,擬合后的信源特征值無論在白噪聲還是色噪聲下,低信噪比或是高信噪比時,離散程度都很低且穩定,即信源特征值分布比較集中。但信號原來特征值的發散程度隨著信噪比的增加而增加,即越來越發散。但擬合后卻比較低且穩定,這是因為當信噪比越來越高時,信源信號特征值會越來越大,但因為對數函數的平穩性,擬合后的值增加會越來越少,導致發散程度減低。 在相同實驗條件下,同理可利用式(19)計算擬合后噪聲特征值離散度與擬合前噪聲值的離散度QN,如圖4和圖5所示。 圖4 白噪聲下噪聲特征值離散度對比 圖5 色噪聲下噪聲特征值離散度對比 由圖4和圖5可知,在白噪聲時,擬合后和擬合前的噪聲特征值離散程度相似,都穩定維持在一個很低的水平。在色噪聲下,擬合后的噪聲特征值離散程度比擬合前的稍微高了。這是因為對數函數的遞增性引起的,使噪聲特征值變得更大或更小,但因為噪聲特征值本身就比較小,所以離散度依然能維持在一個很低的水平。 由實驗可知,擬合后信源特征值的離散程度得到很大的改進,可保持在一個比較低的水平。而擬合后的噪聲特征值也能保持在一個比較低的水平。 得到擬合特征值后,可直接通過簡單的差值法求出峰值,便可知道信源數目,利用下式求出差值: E(i)=ki-ki+1(i=1,2,…,M-1) (24) 上式中E為擬合后特征值相鄰的差值,k為擬合后的特征值,求出特征值之間最大的差值便可估計信源數目: Num=i|max(E(i))) (25) 式(25)中,Num為信源數目,其結果等于令差值E取最大值時i的取值。 為了進一步證明算法的有效性,本文分別由(9)和(12)式,計算在傳統差值法和改進差值法下相鄰特征值之間的差值D和E。實驗條件為在白噪聲和色噪聲下,不同信噪比-5~5 dB變化,變化頻率為2 dB,陣元數目為8,信號參數與2.2節實驗參數相同,4個信號強度保持一致。仿真效果如圖6和圖7所示。 圖6 白噪聲傳統差值法顯示 圖7 白噪聲擬合差值法顯示 圖6和圖7中不同的線條代表不一樣的信噪比下計算出的差值。橫坐標為差值數,一共有8個特征值,所以有7個差值。如圖6所示,傳統差值法在第4個差值的時候有峰值,但是在第2個差值的時候也有小峰值,該峰值的出現由式(10)可知,是因為信源特征值之間的差距太大造成的,從圖6中可看出其嚴重影響了最大峰值的計算。由圖7可看出,在第2個差值的大小被下降了很多,使第四個差值更加明顯,在較低信噪比時效果更加明顯,所以可看出本文方法比傳統方法有了很大的改進。 相同實驗條件下,計算色噪聲下傳統差值法和改進后的差值法的效果。如圖8~圖9所示。 圖8 色噪聲傳統差值法顯示 圖9 色噪聲擬合差值法顯示 如圖8所示,在色噪聲下傳統差值法受到嚴重的影響,第1個差值,即第一個特征值和第二個特征值的差值很大,甚至超過了信號特征值和噪聲特征值的差值,所以傳統差值法在色噪聲下不能進行有效估計。經改進后如圖9所示,信源信號特征值之間的差值被削弱了很多,第4個差值更加明顯,所以能夠在色噪聲下進行有效地估計。 特征值通過擬合后,使信源特征值與噪聲特征值之間的差值更加明顯,更容易直接找出信源數目,不需要人為定義閾值。但是當空間存在相干源時,會導致較大特征值小于信源數目,所以本文方法并不適合在相干源時的估計 總結本文算法步驟如下: 步驟一:接收到信號X(t),并由式(4)計算RX; 步驟二:對RX進行特征值分解,得到特征值(λ1,λ2,…,λM); 步驟三:把求出的特征值代入式(23),求解擬合特征值(k1,k2,…,kM); 步驟四:由式(24)計算擬合特征值之間的差值; 步驟五:檢測差值峰值,由式(25)求信源數目。 為了驗證本文算法的性能,利用進行了仿真實驗。仿真條件為8陣元均勻線陣,信號參數與2.2節實驗參數相同。擬合曲線參數A=5,B=10,c=1,每次實驗均進行100蒙特卡洛仿真。 實驗一白噪聲背景下,信噪比為-15 dB~20 dB變化,每次變化1 dB,快拍數固定為150。實驗結果如圖10所示。 圖10 白噪聲下正確檢測率隨信噪比的變化 如實驗仿真結果圖10所示,AIC在-7 dB時準確率最快達到90%以上,但是是無偏估計,即其準確率無法達到100%,一直在90%~100%波動。MDL在-4 dB到達100%。GDE要在15 dB才可以到達100%。本文算法在-6 dB時候準確率就能達到90%以上,-4 dB時候達到100%。相比于MDL算法,其效果在低信噪比時效果更好,雖略差于AIC算法,但本文算法在-4 dB后能穩定達到100%,所以總體也優于AIC。GDE需要較高信噪比,所以也優于GDE算法。 實驗二白噪聲背景下,信噪比固定為15 dB,快拍數從2到160變化,變化頻率為10。實驗結果如圖11所示。 圖11 白噪聲下正確檢測率隨快拍數的變化 由圖11可知AIC因為是無偏估計,無論快拍數多少,都無法到達100%。MDL在快拍數為30的時準確率達到了100%,GDE在此信噪比下,快拍數要在100以上才能達到100%。本文算法在快拍數為10的時候,估計準確率就已經達到100%了。所以本文算法效果更優。 實驗三色噪聲背景下,信噪比在-10 dB~20 dB變化,每次變化1 dB,快拍數固定為150。其中噪聲模型引用文獻[15]提出的色噪聲模型。色噪聲的協方差矩陣元素由下式給出: N_ik=σ2ρ|i-k|exp(j-(i-k).77π) (26) 式中,σ2為噪聲功率,ρ∈[0,1]是相鄰陣元之間的空間系數。實驗中令ρ=0.6,實驗結果如圖12所示。 圖12 色噪聲下正確檢測率隨信噪比的變化 由圖12可知,在色噪聲背景下,因為噪聲特征值發散,傳統的AIC和MDL都失去了作用,無法進行正常的信源數目估計,GDE可以正常工作,但是要在信噪比在17 dB時候才可以正常估計。本文算法在-1 dB時準確率到達90%以上,0 dB時達到100%。所以本文算法效果更優。 實驗四與實驗三在同樣的色噪聲背景下,信噪比固定在15 dB,快拍數在2到160之間變化,變化頻率為10。實驗結果如圖13所示。 圖13 色噪聲下正確檢測率隨快拍數的變化 由圖13可知,傳統AIC和MDL因為色噪聲下噪聲特征值擴散同樣無法進行估計。GDE也沒法正常估計,因為傳統GDE算法正常估計需要的信噪比往往在15 dB以上,對信噪比要求比較高,但實驗中沒有到達信噪比要求,所以估計效果差。實驗中,本文算法在快拍數為10時就能正常估計,所以本文算法更優。 為了更進一步說明算法在其他條件下的可行性和效果。本文在陣元數為8,采樣數為150,分別在白噪聲和色噪聲下,信源個數分別由1到7變化,信噪比由-10 dB到20 dB變化,每次變化1 dB,7個信號信噪比保持一致。并記錄下當估計準確率穩定到90%時所需要的信噪比進行對比。實驗中7個信源信號由2.2節實驗的4個信源信號和附加的三個信號組成,分別是:復指數衰減信號exp(-j*2π300t);復指數衰減信號exp(-j*2π400t);復指數衰減信號exp(-j*2π300t),7個信號的入射角度分別為[-45°,-30°,-15°,0°,15°,30°,45°]。實驗結果如下柱形圖14和圖15所示。 圖14 白噪聲下不同信源數估計的準確率 圖15 色噪聲下不同信源數估計的準確率 圖14和圖15中縱坐標的-30僅代表在整個信噪比測試范圍內,其估計準確率都是100%,30僅表示在整個信噪比測試范圍內其估計準確率無法達到90%,其他數值代表達到90%時所需要的信噪比。圖中的柱形圖高度越高,代表性能越好,達到穩定估計所需要的信噪比就越低。 由圖14可看出,在白噪聲情況下,本文方法稍微優于MDL方法,比GDE方法更好,比AIC稍微差,但是AIC是無偏估計,所以準確率無法達到100%,即一直在90%~100%波動。圖中還可看出GDE算法在信源個數比為7無法進行估計,這是因為該算法最大估計信源數是M-2,但其他算法則是M-1,所以這也是GDE算法的一個缺點。 因此在白噪聲下本文算法優于傳統的三種算法。 圖15中,在色噪聲下,AIC方法和MDL方法皆無法進行估計,GDE算法需要的信噪比要求大于本文方法。另外在信源個數為7時,AIC和MDL能進行估計,這是因為這兩種算法在色噪聲時,在信源數目為M-1時會過估計,但其它信源數目下就無法進行估計。所以在色噪聲下,本文方法也更優。 差值法計算簡單,運算量小,但容易受信噪比和色噪聲影響,降低估計效果。本文結合特征值的方差公式,分析了特征值離散度對差值法估計信源數目的影響,并通過使用對數函數擬合減小離散度,改善差值法的效果。最后通過實驗仿真與分析,證明該算法能夠在白噪聲和色噪聲下都能夠穩定進行信源數目估計,其效果優于傳統的AIC、MDL和GDE。此外該算法有著運算量小的優點,節省了處理時間,為相應的設計提供參考。但環境中存在相干源時,本文方法并不適用。還需更進一步的研究。
2 特征值的對數函數曲線擬合
2.1 特征值的離散程度
2.2 特征值基于對數函數的擬合




3 特征值處理和檢測峰值
3.1 差值法處理




3.2 本文算法描述
4 仿真結果與實驗分析
4.1 仿真與分析一,相同強度信號下的估計




4.2 仿真與分析二,不同信源數目下的估計


5 總結