基于改進(jìn)譜聚類的雷達(dá)信號(hào)欠定盲源分離算法

2019-08-26 05:04:42余華東

無線電工程 2019年9期

國強(qiáng)，余華東

(哈爾濱工程大學(xué) 信息與通信工程學(xué)院，黑龍江哈爾濱 150001)

0 引言

通常會(huì)遇到觀測信號(hào)數(shù)目少于源信號(hào)數(shù)目的欠定盲源分離情況，因此，研究雷達(dá)信號(hào)的欠定盲源分離具有重要意義。可以將欠定盲源分離恢復(fù)源信號(hào)等效為求解線性系統(tǒng)模型的問題。目前，解決欠定盲源分離的主要方法是“兩步法”[1]，首先UBSS采用聚類算法對(duì)混合矩陣的估計(jì)，接著利用估計(jì)出的混合矩陣根據(jù)信號(hào)的稀疏性分離出源信號(hào)，通常需要信號(hào)在變換域盡可能稀疏，通過逆變換恢復(fù)源信號(hào)的時(shí)域波形。

采用“兩步法”求解欠定方程的最優(yōu)解[2]，混合矩陣的估計(jì)精度對(duì)后續(xù)重構(gòu)算法恢復(fù)源信號(hào)的精度影響較大，為此可以增強(qiáng)信號(hào)的稀疏性來提高混合矩陣的估計(jì)精度。可以采用聚類算法[3]以及張量分解[4]的方法對(duì)混合矩陣進(jìn)行估計(jì)，傳統(tǒng)的聚類方法依據(jù)“最大化類內(nèi)相似性，最小化類間相似性”原則[5]嚴(yán)格分類各研究對(duì)象，前提是各子類之間互相獨(dú)立，但在實(shí)際中各子類之間肯存在各種各樣的關(guān)聯(lián)[6]。模糊C-均值聚類算法[7]是模糊聚類算法中較成功且應(yīng)用最廣泛的算法，其算法簡單高效，但是由于此算法對(duì)初值的選擇較為敏感，迭代過程容易陷入局部均值[8]，使算法的收斂速度變慢，從而對(duì)混合矩陣估計(jì)時(shí)產(chǎn)生誤差。

本文在張量分解方法估計(jì)混合矩陣對(duì)信號(hào)的稀疏性要求低于傳統(tǒng)聚類算法的前提下，引進(jìn)機(jī)器學(xué)習(xí)中的譜聚類算法[9]，對(duì)譜聚類算法求得的特征矩陣進(jìn)行張量分解[10]以求得混合矩陣，此方法的復(fù)雜度低于傳統(tǒng)的聚類算法，通過實(shí)驗(yàn)仿真證明了該算法具有良好的估計(jì)性能。

1 欠定盲源分離系統(tǒng)模型

盲源分離(BSS)旨在研究傳輸通道和源信號(hào)參數(shù)未知的情況下，根據(jù)輸入源信號(hào)的統(tǒng)計(jì)特征，僅由觀測到的信號(hào)特征參數(shù)來恢復(fù)各源信號(hào)[11]。信號(hào)的盲源分離包含2個(gè)未知概念：未知混合矩陣和未知系統(tǒng)輸入的原始信號(hào)，盲源分離系統(tǒng)組成如圖1所示。

圖1 盲源分離系統(tǒng)組成

盲源分離根據(jù)混合系統(tǒng)的不同特點(diǎn)可以分為線性混疊和非線性混疊2類，當(dāng)研究UBSS問題時(shí)，M

x(t)=As(t)。

(1)

在稀疏域中，任何2個(gè)源都不能完全重疊，因?yàn)闆]有SSPS的2個(gè)信號(hào)來完成混合矩陣估計(jì)。在BSS環(huán)境下，多個(gè)信源的稀疏性具有新的含義，即不同的信源占用不同的稀疏域帶寬。

2 傳統(tǒng)混合矩陣估計(jì)算法

2.1 模糊C-均值聚類算法

FCM算法[12]是模糊聚類算法中較成功且應(yīng)用最廣泛的算法，F(xiàn)CM算法的主要過程是通過不斷更新隸屬度矩陣來不斷計(jì)算新的聚類中心，在更新的過程中需要設(shè)定迭代停止閾值。將此，迭代停止閾值與目標(biāo)函數(shù)的值進(jìn)行對(duì)比，在目標(biāo)函數(shù)的值較小時(shí)，停止迭代，輸出最終聚類中心以及隸屬度矩陣，否則，持續(xù)不斷迭代更新聚類中心與隸屬度矩陣[13]。

在處理過程中引入拉格朗日乘數(shù)λ，構(gòu)造新的目標(biāo)函數(shù)式：

(2)

① 初始化數(shù)據(jù)，聚類中心的數(shù)目c(2≤c≤n)，迭代停止閾值ε，迭代次數(shù)最大為Max，初始聚類中心p0，更新計(jì)數(shù)器b，b=0，加權(quán)指數(shù)m；

② 更新各個(gè)樣本點(diǎn)的隸屬度uik，從而更新劃分矩陣U；

③ 更新聚類中心pi，迭代計(jì)數(shù)器b=b+1；

④ 再次計(jì)算劃分矩陣，由式(2)計(jì)算出目標(biāo)函數(shù)的值，如果目標(biāo)函數(shù)的值小于ε或者超過Max時(shí)，算法終止并輸出結(jié)果，反之則回到步驟③。

對(duì)于大多數(shù)待聚類信號(hào)，不知道它的最優(yōu)聚類數(shù)目。FCM算法本質(zhì)上是局部搜索算法，對(duì)初始值要求較高，聚類中心是通過隨機(jī)初始化產(chǎn)生的，在聚類過程中FCM算法易遇到局部極值，它是一種梯度下降的尋優(yōu)算法；FCM算法首先需要給定聚類中心的數(shù)目c，這就使其存在一大缺陷——人們可以采用不同的聚類方法(如模糊近鄰密度聚類等)來進(jìn)行混合矩陣的估計(jì)。信號(hào)經(jīng)STFT變換結(jié)果如圖2所示。

圖2 信號(hào)經(jīng)STFT變換結(jié)果

經(jīng)FCM算法處理后，混合信號(hào)在時(shí)頻域中的散點(diǎn)如圖3所示，可以看出圖像的聚類方向變得清晰，有4條明顯的直線，混合信號(hào)的方向性得到了明顯提升。但圖中仍存在一定數(shù)量的雜點(diǎn)，需要改進(jìn)算法，降低聚類后雜點(diǎn)對(duì)源信號(hào)方向信息的影響，提高混合矩陣的估計(jì)精度。

圖3 經(jīng)FCM算法處理后混合信號(hào)在時(shí)頻域中的散點(diǎn)

2.2 傳統(tǒng)譜聚類檢測算法

譜聚類主要應(yīng)用在人工智能對(duì)信號(hào)的處理領(lǐng)域，將其引入盲源分離中對(duì)觀測信號(hào)進(jìn)行聚類分析，比起傳統(tǒng)的K-means算法，譜聚類對(duì)數(shù)據(jù)分布的適應(yīng)性更強(qiáng)，聚類效果也很優(yōu)秀，同時(shí)聚類的計(jì)算量也小很多，更加難能可貴的是實(shí)現(xiàn)起來也不復(fù)雜。譜聚類是從圖論中演化出來的算法，它可以將帶權(quán)無向圖劃分為2個(gè)或2個(gè)以上的最優(yōu)子圖，使子圖內(nèi)部盡量相似，而子圖間距離盡量遠(yuǎn)，以達(dá)到常見的聚類目的。譜聚類依據(jù)邊權(quán)重值具有一定的特性，兩點(diǎn)相距遠(yuǎn)則邊權(quán)重值低，否則，兩點(diǎn)間具有較高邊權(quán)重值。通過對(duì)所有數(shù)據(jù)點(diǎn)組成的圖進(jìn)行切圖，使切圖后不同的子圖間邊權(quán)重和盡可能低，而子圖內(nèi)的邊權(quán)重和盡可能高，從而達(dá)到聚類的目的[14]。

下面以切圖Ncut方式總結(jié)譜聚類算法流程。

輸入：樣本集D=(x1，x2，…，xn)，相似矩陣的生成方式，降維后的維度k1，傳統(tǒng)聚類方法(如K-means)，聚類后的維度k2。

① 根據(jù)輸入的相似矩陣的生成方式構(gòu)建樣本的相似矩陣；

② 根據(jù)相似矩陣構(gòu)建鄰接矩陣，構(gòu)建度矩陣D；

③ 計(jì)算出拉普拉斯矩陣L；

④ 構(gòu)建標(biāo)準(zhǔn)化后的拉普拉斯矩陣；

⑤ 計(jì)算D-1/2LD-1/2最小的k1個(gè)特征值所各自對(duì)應(yīng)的特征向量f；

⑥ 將各自對(duì)應(yīng)的特征向量f組成的矩陣按行標(biāo)準(zhǔn)化，最終組成n×k1維的特征矩陣F；

⑦ 對(duì)F中的每一行作為一個(gè)k1維的樣本，共n個(gè)樣本，用輸入的K-means聚類方法進(jìn)行聚類，聚類維數(shù)為k2；

⑧ 得到簇劃分。

輸出簇劃分。

譜聚類算法的主要優(yōu)點(diǎn)有：

① 譜聚類只需要數(shù)據(jù)之間的相似度矩陣，因此，對(duì)于處理稀疏數(shù)據(jù)的聚類很有效。傳統(tǒng)聚類算法(如K-means)很難做到這一點(diǎn)；

② 在聚類的過程中使用了降維，因此，其算法在處理高維數(shù)據(jù)聚類時(shí)的復(fù)雜度要低于傳統(tǒng)聚類算法。

譜聚類算法的主要缺點(diǎn)為聚類效果受相似矩陣的影響較大，當(dāng)處理后得到的相似矩陣不同時(shí)，得到的最終聚類效果可能具有很大的不同。信號(hào)經(jīng)STFT變換結(jié)果如圖4所示，信號(hào)經(jīng)譜聚類算法處理結(jié)果如圖5所示。

圖4 信號(hào)經(jīng)STFT變換結(jié)果

圖5 信號(hào)經(jīng)譜聚類算法處理結(jié)果

2.3 基于張量分解方法

CP分解與Tucker分解是張量分解中最常用的2種方法，CP分解的核心思想是將一個(gè)高階張量分解成若干個(gè)秩一張量之和形式，保證分解結(jié)果是唯一的，其中對(duì)秩的求解問題是研究的重點(diǎn)；Tucker分解的核心思想是將一個(gè)高階張量分解成多個(gè)因子矩陣與一個(gè)核心張量乘積的形式，其中，核張量保留了原高階張量的主要信息[15]。此外，還有其他的一些分解方法，如帶權(quán)CP分解，這種方法為了方便計(jì)算，通過引入一個(gè)權(quán)重向量并且需要假設(shè)因子矩陣的列是單位長度的，從而達(dá)到提高分解精度的目的。下面介紹基于三階張量分解的經(jīng)典算法：

① 對(duì)于三階張量，CP分解將其分解成3個(gè)秩一張量之和形式，CP分解的數(shù)學(xué)表達(dá)式為：

(3)

式中，A，B，C為分解后的矩陣；ar，br，cr為秩一張量；符號(hào)°表示向量的外積。如果分解后的矩陣A，B，C對(duì)應(yīng)的列被正則化，則分解后存在一個(gè)權(quán)重向量λ，則式(3)可以轉(zhuǎn)化為：

(4)

對(duì)于一般的N階張量，CP分解的形式為：

T≈[λ；A(1)，A(2)，…，A(N)]=

(5)

經(jīng)典的CP交叉最小二乘分解算法主要步驟為在已知原始張量T的前提下，首先初始化A(n)∈R(n=1，2，…，N)，接著循環(huán)n=1，2，…，N，當(dāng)?shù)玫揭?guī)范列A(n)和λ時(shí)迭代結(jié)束，最終輸出λ，A(1)，A(2)，…，A(N)，以此估計(jì)出混合矩陣。

② 對(duì)于三階張量，Tucker分解成3個(gè)因子矩陣與一個(gè)核心張量乘積的形式，此時(shí)Tucker分解的數(shù)學(xué)表達(dá)式為：

(6)

張量的秩定義為用秩一張量之和來精確表示所需要的秩一張量的最少個(gè)數(shù)，即為秩分解，由此可知秩分解是一種特殊的CP分解。對(duì)應(yīng)于矩陣的SVD分解，目前還沒有方法能夠直接求解一個(gè)任意給定張量的秩，張量的秩不同于矩陣的秩，高階張量的秩在實(shí)數(shù)域和復(fù)數(shù)域上不一定相同，張量的低秩近似相對(duì)于矩陣的SVD來說，高階張量的秩分解唯一性不需要正交性條件保證。

3 改進(jìn)方法的實(shí)現(xiàn)步驟

本文在譜聚類算法的基礎(chǔ)上對(duì)其進(jìn)行了改進(jìn)，將其與張量分解的方法結(jié)合起來，避免了單獨(dú)聚類算法容易陷入局部極值點(diǎn)的問題，提高了混合矩陣的估計(jì)精度。

算法的主要步驟為輸入：樣本集D=(x1，x2，…，xn)，相似矩陣的生成方式，降維后的維度k1，傳統(tǒng)聚類方法(如K-means)，聚類后的維度k2。

① 根據(jù)輸入的相似矩陣的生成方式構(gòu)建樣本的相似矩陣S；

② 根據(jù)相似矩陣S構(gòu)建鄰接矩陣W，構(gòu)建度矩陣D；

③ 計(jì)算出拉普拉斯矩陣L；

④ 構(gòu)建標(biāo)準(zhǔn)化后的拉普拉斯矩陣D-1/2LD-1/2；

⑤ 計(jì)算D-1/2LD-1/2最小的k1個(gè)特征值所各自對(duì)應(yīng)的特征向量f；

⑥ 將各自對(duì)應(yīng)的特征向量f組成的矩陣按行標(biāo)準(zhǔn)化，最終組成n×k1維的特征矩陣F；

⑦ 對(duì)特征矩陣F采用張量分解的方法進(jìn)行處理，得到估計(jì)的混合矩陣，在實(shí)際過程中，不同的雷達(dá)源信號(hào)之間是相互統(tǒng)計(jì)獨(dú)立且為非高斯信號(hào)，將特征矩陣分解成3個(gè)秩一張量之和的形式，雖然張量可以用分量的多維數(shù)組來表示，但是其處理較高維數(shù)時(shí)復(fù)雜度可能很大。如果分解后的矩陣對(duì)應(yīng)的列被正則化，則分解后存在一個(gè)權(quán)重向量λ，張量分解處理過程如下：

(7)

(8)

4 算法仿真分析

4.1 估計(jì)誤差評(píng)價(jià)準(zhǔn)則

與傳統(tǒng)方法進(jìn)行了對(duì)比實(shí)驗(yàn)，證明本文提出方法的有效性。使用Windows 10操作系統(tǒng)，處理器G3260+3.3 GHz在Matlab 2016(a)中進(jìn)行仿真。

選擇歸一化均方誤差作為混合矩陣估計(jì)的評(píng)價(jià)準(zhǔn)則，其表達(dá)式為：

(9)

4.2 實(shí)驗(yàn)仿真與分析

實(shí)驗(yàn)1：欠定盲源分離混合矩陣的估計(jì)

在該實(shí)驗(yàn)中使用4個(gè)線性調(diào)頻(LFM)雷達(dá)信號(hào)。頻率分別為50～80 MHz，60～90 MHz，40～60 MHz和10～30 MHz，采樣率為200 MHz，采樣點(diǎn)為1 000，4個(gè)源信號(hào)由3個(gè)傳感器接收，選取欠定混合矩陣A為：

(10)

欠定混合矩陣A為階的3×4矩陣，則在實(shí)際中接收端獲得3路不同的含噪聲的雷達(dá)信號(hào)。在對(duì)發(fā)射信號(hào)進(jìn)行短時(shí)傅里葉變換獲得散點(diǎn)圖時(shí)采用窗函數(shù)長度為256點(diǎn)的漢明窗完成，最終可以得到3路時(shí)頻域的觀測信號(hào)。

經(jīng)過譜聚類與張量分解方法處理，最終得到混合矩陣的估計(jì)結(jié)果為：

(11)

則混合矩陣估計(jì)的歸一化均方誤差為：

(12)

實(shí)驗(yàn)2：正定盲源分離混合矩陣的估計(jì)

4個(gè)源信號(hào)由3個(gè)傳感器接收，選取正定情形的混合矩陣A為：

(13)

正定混合矩陣A為階的3×3矩陣，則在實(shí)際中接收端獲得3路不同的含噪聲的雷達(dá)信號(hào)。在對(duì)發(fā)射信號(hào)進(jìn)行短時(shí)傅里葉變換獲得散點(diǎn)圖時(shí)采用窗函數(shù)長度為256點(diǎn)的漢明窗完成，最終可以得到3路時(shí)頻域的觀測信號(hào)。

經(jīng)過譜聚類與張量分解方法處理，最終得到混合矩陣的估計(jì)結(jié)果為：

(14)

則混合矩陣估計(jì)的歸一化均方誤差為：

(15)

實(shí)驗(yàn)3：超定盲源分離混合矩陣的估計(jì)

4個(gè)源信號(hào)由3個(gè)傳感器接收，選取超定情形的混合矩陣A為：

(16)

超定混合矩陣A為階的3×2矩陣，則在實(shí)際中接收端獲得3路不同的含噪聲的雷達(dá)信號(hào)。在對(duì)發(fā)射信號(hào)進(jìn)行短時(shí)傅里葉變換獲得散點(diǎn)圖時(shí)采用窗函數(shù)長度為256點(diǎn)的漢明窗完成，最終可以得到3路時(shí)頻域的觀測信號(hào)。

經(jīng)過譜聚類與張量分解方法處理，最終得到混合矩陣的估計(jì)結(jié)果為：

(17)

則混合矩陣估計(jì)的歸一化均方誤差為：

(18)

通過前3個(gè)分別在欠定、正定和超定條件下的仿真實(shí)驗(yàn)看出，本文所提的改進(jìn)的譜聚類算法的混合矩陣估計(jì)性能較佳，在接收天線的數(shù)目保持不變時(shí)，混合矩陣估計(jì)的歸一化均方誤差值將隨著發(fā)射天線數(shù)目的減少而增大，算法具有普適性。

實(shí)驗(yàn)4：不同信噪比條件下各算法的對(duì)比

將本文提出方法與傳統(tǒng)的混合矩陣估計(jì)精度進(jìn)行對(duì)比，圖6中給出以上各種混合矩陣估計(jì)方法在5～30 dB信噪比時(shí)，進(jìn)行100次蒙特卡羅獨(dú)立試驗(yàn)得到的歸一化均方誤差平均值。

圖6 混合矩陣估計(jì)歸一化均方誤差對(duì)比圖

5 結(jié)束語

本文引進(jìn)機(jī)器學(xué)習(xí)中的譜聚類算法，并在譜聚類方法基礎(chǔ)上采用張量分解優(yōu)化，將譜聚類得到的特征矩陣進(jìn)行正則分解從而估計(jì)出混合矩陣。仿真結(jié)果表明，本文基于譜聚類與張量分解結(jié)合的方法相較于傳統(tǒng)聚類算法混合矩陣估計(jì)精度較高，估計(jì)性能較好，信噪比增大時(shí)估計(jì)精度較高。本文提出的改進(jìn)譜聚類方法降低了算法的復(fù)雜度，在低信噪比情形中對(duì)混合矩陣的估計(jì)誤差值最小，從而能夠達(dá)到更高的混合矩陣估計(jì)精度。下一步將研究源信號(hào)恢復(fù)算法以提高其恢復(fù)性能。