劉魯濤,王璐璐,陳濤
哈爾濱工程大學 信息與通信工程學院,黑龍江 哈爾濱 150001
隨著電子信號的發展和進步,電磁環境變得越來越密集和復雜,使得雷達信號分選成為電子情報和電子戰不可或缺的部分。雷達信號分選是將隨機的雷達信號脈沖從其自身雷達信號源中分離出來[1]?,F階段主要通過預分選與主分選相結合來完成對混合雷達脈沖信號的分選,接收機接收 到 的 脈 沖 描 述 字 (pulse description word, PDW)主要有載頻、脈寬、方位角、脈幅和到達時間這5 個參數,其中脈幅受環境影響較大,通常使用載頻、脈寬和方位角這3 個參數進行預分選[2-3]。然而,給出精確預分選結果的前提是能夠正確分選,故其在整個分選過程中顯得尤為重要。
預分選算法主要分為3 大類:劃分聚類法、網格聚類法和密度聚類法[4]。劃分聚類算法中最具有代表性的是K 均值聚類(K-means) 算法[5]和模糊C 均值聚類(FCM)算法[6],其中FCM 算法本質上是對K-means 算法的改進。網格聚類法是將給定的脈沖數據集先劃分為若干類(類型數量≤數據集),然后通過迭代重定位技術重新劃分,直至找到局部最優的聚類方法。密度聚類法是以數據集在空間分布上的稠密程度為依據而進行的聚類,多以基于密度的噪聲應用空間聚類 (densitybased spatial clustering of applications with noise,DBSCAN)算法為基礎[7-8]。
盡管上述聚類算法高效準確地完成了對雷達信號脈沖的聚類,但是這些算法聚類性能嚴重依賴于聚類參數、閾值等的選取,例如聚類半徑、聚類數目等。因此,本文將使用直方圖均衡化后的DSets 算法(該算法不需要輸入任何參數就能直接給出聚類結果),然后針對DSets 原有算法的過度分割問題,提出將D-S 證據理論[9-10]應用于初始聚類結果,給出融合后的最終聚類結果。
DSets 聚類將主導集定義為主導集圖論的概念,并試圖順序提取聚類。主導集是滿足簇的高內部相似性和低外部相似性約束的數據子集,因此可以被視為簇。通過博弈動力學檢測到主導集并從輸入數據中刪除內部數據,在剩余數據中重復此過程,直到滿足停止標準為止,以此來獲得輸入數據的分區。其中,每個分區對應一個聚類,且簇的數量是自動確定的。DSets 聚類使用數據的成對相似性矩陣作為輸入,對數據的表示形式沒有要求。

下面給出DSet 定義,一個非空子集S∈V滿足以下條件可以被稱為主導集:
1)任意非空子集T∈S,均有W(T)>0;
2)任意頂點i∈S,均有wS(i)>0;
3)任意i?S, 均有wS∪{i}(i)<0。
在定義中,前2 個條件對應于DSet 的高度內部相似性,第3 個條件則指出若包含任何來自外部的數據,內部相似性將被破壞。在這些條件共同作用下,DSet 將成為數據的最大一致性子集。
文獻[11] 中給出了求解DSet 的簡單方法。集群內部相干性的自然表示方法是f(x)=xTAx,其中xT表示轉置。由此,可以將聚類問題公式化為尋找使f最大化的向量x的問題:

直方圖均衡化是一種典型的圖像增強技術。它通過應用灰度變換來增強圖像對比度,使圖像的直方圖扁平化。經過變換后,圖像的直方圖變成了原始圖像的累積直方圖的縮放版本。直方圖均衡化變換的具體方法如下:

D-S 證據理論是貝葉斯推理方法的推廣,能夠較好地描述“不確定”和“不知道”類型問題,因此可以采用D-S 證據理論對DSets 聚類結果PDW參數進行融合處理,以此消除DSets 算法的過度分割問題[12]。

D-S 證據理論計算一組證據的特征屬性與各個框架屬性的相似度,利用D-S 組合規則得出測量數據與框架的總體相似度來進行識別。計算不同信號總體的相似度,可將其中一個視為識別框架,通過計算兩者的總體相似度,并與閾值比較來判定是否關聯。
評估聚類的指標有很多,其中F-measure 即F 均值是常用的一種聚類指標。為了描述F-measure,先給出2 個概念公式。
準確率:


脈沖描述字(PDW)主要包括5 個參數:方位角(doa)、載頻(cf)、脈寬(pw)、脈幅(pa)和到達時間(toa),在進行雷達信號預分選時,通常會選擇doa,cf和pw這3 個參數。
DSets 算法在進行脈沖聚類預分選時是順序提取集群。首先,計算3 個參數的復合相似性矩陣;然后,再將處理后的相似性矩陣輸入到算法中,根據集群性質,通過進化博弈論中發展起來的復制因子動力學求解聚類結果;最后,將求解的結果進行基于D-S 證據理論的數據融合,給出最終聚類結果。圖1 所示為改進后DSets-DS 算法流程。

圖1 DSets-DS 算法流程圖Fig. 1 Flowchart of DSets-DS algorithm



從相似性度量s(pulsei,pulsej)計算公式可以看出,不同的 σ會導致不同的相似性度量,同時導致不同的相似性矩陣。盡管DSets 算法不需要明確地輸入任何參數,但實際上它也依賴于參數σ。因此,為了得到一個無參數聚類,必須消除參數σ對算法的依賴。
從文獻[11] 中可見,不同 σ得到的相似性矩陣之間的差異主要在于相似性對比,這些差異與不同灰度對比度的圖像之間的差異非常相似。因此,利用圖像增強技術可以使不同的 σ生成相同的相似性矩陣,從而得到相同的聚類結果。
s1(pulsei,pulsej)的相對大小只取決于元素之間的距離,與 σ無關。即將相似性矩陣A中的元素s1(pulsei,pulsej) 按遞增順序排列,在不同 σ條件下得到的排序相同。通過式(6) 完成直方圖均衡化,以此來消除相似性矩陣A對 參數 σ的依賴,直方圖均衡化后的相似性矩陣記為Ahisteq。為了便于表達,本文在下文使用DSets-histeq 表示DSets聚類算法,該算法在聚類之前將直方圖均衡化應用于相似性矩陣。
由直方圖均衡化處理后的相似性矩陣給出集群內部相干性的自然表示方法:f(x)=xTAhisteqx。然后,利用進化博弈論中發展起來的復制因子動力學求解 maxf(x),得到一個聚類結果DSet 并提取,如式(15)所示。

由于DSets 算法對集群內部的元素有一個強密度約束,所以會導致聚類結果存在過度分割現象,將同一個聚類結果中的元素分割成2 個或2 個以上的聚類結果,所以在進行DSets 算法后,還需要對求得的聚類結果使用D-S 證據理論技術進行相似性融合。

然后,再根據m1與方位角的相似度屬性,得到總體支持度,如式(20)所示。

5)轉到步驟3),直到完成所有脈沖聚類;
6)對分類結果進行基于D-S 證據理論的融合,給出最終聚類結果。
本節經軟件仿真對算法進行可行性驗證,通過對設定的雷達信號進行聚類來測試算法的聚類效果。由于DSets 算法完成了對雷達脈沖的無參數聚類,因此通過仿真測試本算法是否能達到目標。此外,還與現有算法的結果進行了對比,以進一步驗證本算法的聚類性能。
為了驗證直方圖均衡化能否消除對 σ的依賴,在仿真中,將直方圖均衡化前后的仿真結果進行比較。輸入為無虛假脈沖的5 部雷達信號的混合脈沖,共計400 個。為了使實驗結果更具有說服力,完成了多次蒙特卡洛仿真實驗,且取平均值作為仿真結果的輸出。本文通過式(13)計算F-measure 來評估聚類質量,并報告聚類結果。
直方圖均衡化對DSets 算法的影響如圖2 所示,其中 σ的實際值等于dˉ與橫坐標相應值的乘積,這適用于本文中水平軸為 σ的其他圖形。從圖中可以看出,在使用直方圖均衡化后大大降低了DSets 算法對參數 σ的依賴。

圖2 直方圖均衡化對DSets 算法的影響Fig. 2 Influence of histogram equalization on DSets algorithm
為了查看DSets-DS 算法是否解決了過度分割的問題,本文給出了DSets-histeq 和DSets-DS 算法在相同輸入下的聚類結果對比(圖3)。輸入設定為由3 部和4 部雷達組成的混合脈沖序列,虛假脈沖比例為0。
圖3 中同一個顏色的點代表聚類結果為同一個類別中的脈沖。從圖中可以看出,本算法已經解決了過度分割的問題。為了更直觀地給出2 種算法的實際聚類數目,在表1 中分別給出了仿真獲得的集群數量。由表可見,DSets-DS 算法的集群數量比DSets-histeq 的集群數量少得多,且更接近于實際情況,進一步驗證了改進的DSets-DS 算法在克服過度分割方面的有效性。

圖3 雷達混合脈沖聚類結果Fig. 3 Results of radar mixed pulse clustering

表1 兩種算法分選結果Table 1 The sorting number of two algorithms
圖4 所示為DSets-DS 與DSets-histeq 算法的仿真結果對比圖。從圖中可以看出,隨著虛假脈沖比例的增加,2 種算法的性能都有所下降,但是本文算法下降幅度較小,且性能始終優于DSetshisteq 算法。其原因在于,本文算法使用了D-S證據理論對聚類結果進行融合,提高了算法的準確率。可見,將D-S 證據理論應用于DSets-histeq算法是有效的。

圖4 改進算法與DSets-histeq 算法對比Fig. 4 Comparison of the improved algorithm with DSets- histeq algorithm
為了評估本文算法在高虛假脈沖比例條件下的分選性能,圖5 給出了其與K-means 算法在不同虛假脈沖比例條件下的結果對比。圖中,縱坐標為多次F-measure 平均值。從圖中可以看出,隨著虛假脈沖比例的增加,2 種算法的分選性能都有不同程度的下降,但是本文算法在不同虛假脈沖比例的條件下性能都優于K-means,這是因為DSets 聚類傾向于生成超小簇,然后使用D-S 證據理論將生成的超小簇進行融合得到最終聚類結果,所以DSets-DS 算法不會將虛假脈沖聚類,這樣得到的聚類結果受虛假脈沖比例的影響較小。此外,在虛假脈沖比例低于50%的情況下,本文算法分選正確率在93.13%以上。

圖5 改進算法與K-means 算法對比Fig. 5 Comparison of the improved algorithm with K-means algorithm
由于截獲的雷達信號沒有先驗信息,外界輸入的參數嚴重影響常規聚類算法的性能。本文使用的DSets 算法經過直方圖均衡化后不需要人為輸入任何參數就可以直接完成聚類,然后將D-S證據理論應用于DSets-histeq 聚類結果,解決了DSets-histeq 算法過度分割的問題。通過實驗仿真驗證,在沒有任何輸入參數及先驗信息的情況下,算法可以有效地完成對復雜環境中的雷達脈沖信號聚類,實現了無參數聚類,經過D-S 證據理論融合后的結果,不存在過度分割的問題。對比已有雷達脈沖聚類算法,改進的DSets 算法有更好的聚類性能,且在虛假脈沖比例低于50%的情況下,算法分選正確率在93.13%以上。
盡管算法完成了無參數聚類,但是由于得到的聚類結果中的脈沖間具有高度相似性,所以對于捷變頻等復雜調制體制雷達聚類具有局限性,這將是今后的研究方向。