馮鑫,胡曉曦,匡銀
(中國空間技術研究院西安分院陜西西安710000)
隨著現代電子對抗環境的日漸惡劣和戰場需求的不斷增加,新型綜合體制雷達不斷投入使用并逐漸占據電子戰中的主導地位。綜合體制多模雷達是指該種雷達具有多種工作模式可根據戰場需求選擇不同的模式。由于多模雷達工作模式的多樣性,如果采用傳統分選算法[1]進行分選,通常會將同一個輻射源不同模式分選為多個不同輻射源,造成“增批”現象。
聚類算法是一種無監督的分類方式,通過特征參數的類內聚集性和類間的分離性進行類別劃分,對于缺乏先驗信息的雷達信號分選領域有不錯的分選效果。國內外的學者在聚類分選領域也做出大量貢獻[2-5],但是上述文獻將聚類算法運用到雷達信號分選中時都需要事先設定聚類數,無法實現自動聚類。文獻[6-10]對K-means算法分別進行了不同的改進之后用于雷達信號分選,與傳統算法相比,這些算法收斂速度更快,且能自動確定聚類數目和初始聚類中心。
李德毅院士在傳統物理場的基礎上,提出了基于數據對象的數據場理論。數據空間中的每一個數據對象都通過數據間作用將數據能量從樣本空間輻射到整個數域空間所形成的空間場,稱為數據場。數據場能夠客觀地展示數據對象間的相互影響和相互作用。該理論認為數據空間中的數據不是孤立的,而是通過數據場這個客觀存在的媒介與其他數據相互作用[11-13]。
1)場強函數
場強函數是用來描述某數據點的輻射能量值的相對大小的量,考慮到高斯函數具有良好的普適性,而且短程場更適用于聚類算法,因此本文采用高斯勢函數描述數據場[14]。場強函數:

式中:ρ反應數據點的數據量,均可作為1來處理;d(x,y)為歐氏距離;σ為輻射因子,取值為常數。
2)勢函數
數據場的勢是指在數域空間中某一點被其他數據點輻射能量的能量和。根據場強函數可以得到數據場的勢函數:

式中:n為數據對象的數目。
根據式(2)可知,數據對象的作用距離與σ值的大小成正比。若σ值足夠小,數據域中每個數據點都相互獨立,自成一類。若σ值足夠大,整個數據點形成的勢場可以認為是只有一個勢心的數據點集合。由于上述情況不能準確反映數據點的分布情況,所以如何選擇一個合適的輻射因子值對數據場的構建十分重要。
通過改變σ的值,我們能夠從不同觀測層面上看同一組數據,從而體現人類的動態聚類特性。由實際工程經驗可知,首先需要對數據集進行標準化變換,使得各維數據都歸一到0~1之間,然后σ的取值就主要取決于數據集的大小,通常σ在數據個數小于1 000時可0.1,當數據集增加一個數量級時,σ可取0.05。本文后面的仿真數據點個數在1 000左右,因此只要σ取值在0.1左右,運算結果對σ就不是很敏感[15]。
傳統K-Means算法[16-17]應用到多模雷達信號分選中,適合處理大量數據,聚類時間短,但是容易產生“增批”現象。雷達偵察接收機偵收到的雷達信號脈沖描述字(PDW)包含以下5個參數:到達時間(TOA),脈沖頻率(RF),脈沖帶寬(PW),到達角(DOA),脈沖幅度(PA)中,選擇RF,PW,DOA進行分選。圖1為多模雷達信號分選流程示意圖。

圖1 多模雷達輻射源雷達信號分選流程
多模雷達不僅具有一種信號參數變化方式,雷達的頻域參數、時域參數與工作模式綁定,變化方也較為復雜,而空域參數中脈沖到達角(DOA)是一個與輻射源位置密切相關的特征參數,它不受雷達信號變化形式的影響,是雷達信號分選最重要、最可靠的特征。同一輻射源不同工作模式情況下的脈沖到達角是相同的。文中首先對偵察接收機截獲的PDW數據流進行數據預處理,接著通過數據場勢值計算繪制載頻和到達角等勢線二維圖來確定多模雷達信號的初始聚類中心值與聚類數目,通過KMeans算法完成最后的聚類,為后續信號特征參數與輻射源數據庫進行比較匹配,進行輻射源識別提供了前提和基礎。
數據樣本標準化變換
實際的雷達偵察接收機截獲的雷達信號參數比較復雜多樣,不同特征參數數據往往不在同一數量級上,為保證數據具有可比性,在聚類分析前,需要對數據集中所有參數維數進行極差歸一化變換(也即將數據轉換到[0,1]之間的數據),根據如下公式進行標準化處理:
式中Xi(j),i=1,2,...,M為雷達信號樣本,M為樣本個數,j=1,2,...,N,N為樣本維數,為處理后的雷達信號特征參數數據樣本。
由于數據勢場中的勢心相當于數域空間內數據集的數據重心,因此可以將數據場的勢心看做初始聚類中心,然后進行數據聚類。
等勢線的定義描述為將數據場中勢值相等的所有點用平滑的線串連起來形成的線。等勢線圍繞形成的不同中心稱為勢心。從二維等勢線圖中可以看出勢心的位置,其數學表達式為[8]:

其中,Fy(i,j)為勢心附近的勢值;(i,j)為數據點的位置;Fmax為勢心值;
從公式(4)可知,勢心就是數據勢場分布的局部極大值點,求出勢心就能確定初始聚類中心和聚類數目,而由于數據場的疊加性,勢心通常沒有和數據樣本重合,所以應該求取距離勢心最近的數據樣本作為初始聚類中心,數學描述為:

式中:data(i,j)表示數據集中的任意數據點;d代表數據點與勢心的距離;Fcenter為初始聚類中心。
為驗證本文算法的的可行性和有效性,用MATLAB仿真表1中的多模雷達信號脈沖參數數據(用高斯隨機變量模擬信號參數的測量誤差),利用上述數據樣本進行分選算法仿真實驗。其中表1中雷達2、3為普通的頻率捷變信號,雷達1與雷達4分別為具有3種工作模式的多模雷達信號。

表1 雷達仿真參數

圖2 數據場算法生成的數據場等勢線二維圖
采用基于數據場多模雷達信號分選算法對雷達信號樣本進行處理,首先進行數據預處理,然后計算信號樣本的勢值,繪制二維數據場等勢圖,如圖2所示。選擇載頻和到達角等勢線二維圖來確定初始聚類中心值與聚類數目,從DOA與RF的二維等勢線圖中可以直觀的看到雷達信號可分為4類,其它兩個二維等勢線圖由于多模雷達信號的存在而不能正確的判斷聚類數目。通過計算距這4個勢心最近的樣本數據可得到初始聚類中心,然后利用傳統kmeans聚類算法對數據進行分選得到最終聚類中心,結果如表2所示。雷達信號分選脈沖數統計結果如表3所示。
從表2、表3可以看出,聚類中心的選擇是正確的,而且本文算法針對存在多模雷達信號的輻射源電磁環境具有較高的分選準確率,分選正確率99.2%。

表2 初始聚類中心及最終聚類中心
為了比較基于數據場的聚類分選算法與傳統k-means聚類分選算法處理多模雷達信號的分選效果[2]。由于傳統k-means算法隨機選擇聚類數目和初始聚類中心,每次仿真會得到不同的聚類結果,因此這里在已知聚類數目為4,聚類中心隨機選取的情況下,仿真50次取統計平均值,和本文算法分選結果比較如表4所示。

表3 數據場多模雷達信號分選脈沖統計結果

表4 分選算法對比
從上表數據可以看出,針對多模雷達信號,基于數據場聚類算法迭代次數減少,分選正確率得到提高,有效減少了由于初始聚類中心和聚類數目選擇不合理而造成的多模雷達信號分選過程中“增批”現象的出現。
文中針傳統聚類分選算法處理多模雷達信號容易出現“增批”現象的問題,將數據場引入到多模雷達信號分選中,通過繪制載頻和到達角等勢線二維圖來確定多模雷達信號的初始聚類中心值與聚類數目。最后用傳統k-means算法進行聚類。經過本文的仿真實驗驗證,本文提出的算法能能獲取合適的初始聚類中心,確定聚類數目,對部分參數交疊的頻率的頻率捷變多模雷達有良好的分選效果,具有實際應用的價值。文中仿真實例證明了算法的有效性,但文中數據場勢值運算復雜度較高,有待減少數據場勢值的計算量。本文關于影響因子的選擇是根據經驗選擇合適的影子因子,后續需要研究改進的影響因子的選擇方法,從而能自動選擇合適的影響因子。而且最終聚類結果中仍有部分雷達信號誤分選,這是由于聚類算法類間分離能力較差的問題,所以后續需要增加對分選結果有效性評估體制,以進一步提高多模雷達信號分選準確性和可靠性。