摘 要: 針對固定網格密度聚類算法在雷達信號分選中對數(shù)據(jù)輸入的依賴性和聚類精度低的問題,提出了一種基于動態(tài)網格密度聚類的雷達信號分選算法。該算法采用動態(tài)網格生成技術大幅度地減少無效網格生成數(shù)目,移動網格技術消除對數(shù)據(jù)輸入的依賴性,用改進的雙密度閾值提高聚類精度。該算法不需要輸入任何參數(shù)就能快速對任意形狀大小的數(shù)據(jù)集進行聚類。實驗表明,該算法能有效去除噪聲,快速準確的對未知雷達信號進行聚類。
關鍵詞: 雷達信號分選; 聚類; 動態(tài)網格; 移動網格; 雙密度閾值
中圖分類號: TN957.51?34; TP311 文獻標識碼: A 文章編號: 1004?373X(2013)21?0001?04
0 引 言
雷達信號分選是現(xiàn)代雷達偵察設備的重要功能之一,在當今戰(zhàn)場上起著不可或缺的作用。然而隨著現(xiàn)代戰(zhàn)爭中各種雷達和精確制導武器的大量應用,使得雷達偵察系統(tǒng)面臨的信號環(huán)境日趨復雜多變,而且信號數(shù)量變的十分龐大[1]。因此,現(xiàn)代雷達信號的分選工作變的越來越復雜和困難。現(xiàn)在常用的信號分選方法是基于同一信號源發(fā)出的脈沖信號參數(shù)之間的相關性對雷達全脈沖序列進行去交錯[2]。但是這種分選方式的分選結果和上述過程中每一級分選的準確率都有很大關系,因此最終結果可能會出現(xiàn)很大的偏差。
聚類分析是重要的數(shù)據(jù)挖掘技術之一,近幾年被越來越多地用于雷達信號分選,且取得了很好的效果,聚類算法一般分為基于劃分的、基于層次的、基于模型的、基于網格的和基于密度的等幾種方法[3]。其中基于網格的聚類方法是將數(shù)據(jù)空間量化在有限的網格單元當中,將要分析的數(shù)據(jù)的統(tǒng)計信息匯總到其所在的單元格中,將網格中的點作為一個整體處理,處理速度快,但聚類精度低[4?5];基于密度的聚類方法[6]是將數(shù)據(jù)分成高密度和低密度的區(qū)域,該方法具有能識別任意形狀、大小的聚類等優(yōu)點,但輸入參數(shù)太多,影響聚類結果。
傳統(tǒng)的網格聚類主要是基于固定網格劃分的,分選結果對輸入順序有很大依賴性,并且會產生很多無效網格,分選速度慢,聚類精度不高。
為了解決上述的問題,本文提出一種基于動態(tài)網格密度聚類的雷達信號分選算法,融合了網格聚類和密度聚類的優(yōu)點。該算法使用動態(tài)網格劃分技術生成網格,通過移動網格技術消除對數(shù)據(jù)輸入的依賴性;并對密度閾值進行改進,采用雙密度閾值,最后通過廣度優(yōu)先搜索方法完成聚類。
1 相關概念
1.1 密度網格
式中:[k]為每一維上劃分的區(qū)間個數(shù);[xi]是點[x]的第[i]個分量;[maxx∈D{xi}]表示數(shù)據(jù)集在第[i]維上的最大值,[minx∈D{xi}]表示數(shù)據(jù)集在第[i]維上的最小值。
定義2 網格單元重心:假定網格單元[U]中包含了[m]個數(shù)據(jù)點[p1,p2,…,pm,]則[U]的重心[pu]就是一個[n]維向量[pu1,pu2,…,pun,]網格重心為:
定義3 網格單元密度:網格單元中所包含的數(shù)據(jù)點的個數(shù),用[den(C)]表示網格單元[C]的密度,圖1中網格單元密度為6。
定義4 網格單元關系:設[C1]和[C2]是兩個非空網格單元, 若[C1?C2≠?,]則稱[C1]和[C2]是相交關系, 否則為相離關系。
1.2 網格密度閾值
網格密度閾值的確定對聚類結果有著很大的影響,如果選擇的不合理很可能造成信號的多選和漏選[8]。傳統(tǒng)的網格密度聚類算法主要是采用單密度閾值判斷高低密度網格,容易將真實信號和噪聲信號相混淆。如圖1所示是某一維度空間中雷達信號的網格單元密度變化情況,區(qū)域[a、b、c、d]都是網格單元密度大于密度閾值,往往被認為是真實雷達信號進行聚類,然而[b]和[d]卻是噪聲區(qū)域網格,所以必須提高密度閾值,這樣又會造成[a]和[e]之間及[c]和[f]之間的網格漏選現(xiàn)象。為了獲取[a]和[c]的完整雷達信號,而同時去除[b]和[d]內的噪聲信號,所以在這里主要是借鑒平均密度的思想,對密度閾值進行改進,在原有密度閾值的基礎上再增加一個核心密度閾值,采用雙密度閾值的方法更加有效的聚類。
設[G]為生成的網格單元數(shù)目,[den(Ci)]為網格密度,[max(den(Ci))]為生成相交網格最高密度網格,[min(den(Ci))]為生成相交網格最低密度網格。
定義5 核心網格:網格單元密度大于核心密度閾值的網格單元;
高密度網格:網格單元密度大于密度閾值的網格單元,所以核心網格也屬于高密度網格單元;
低密度網格:網格單元密度小于密度閾值的網格單元。
在網格聚類過程中,只有含有核心網格單元的高密度網格區(qū)域才是真實的雷達信號,低密度網格區(qū)域和不含有核心網格單元的高密度網格區(qū)域都是噪聲網格,聚類只對真實雷達信號單元網格進行聚類。
2 改進的網格聚類算法
本文用脈沖描述字PDW描述雷達的信號參數(shù)。包括脈沖到達時間(TOA)、脈沖寬度(PW)、脈沖幅度(PA)、信號載頻(RF)、到達方向(DOA)和脈沖重復間隔(PRI)等參數(shù)。其中TOA不能反映雷達本身特性, 不適合作分選依據(jù);PA受多徑效應影響,是一個不確定參數(shù);而PRI的工作方式多,變化快,同樣不適合作為分選依據(jù)。所以本文使用DOA、RF 和PW三個參數(shù)進行聚類[9]。
2.1 數(shù)據(jù)的預處理
在實際的雷達信號偵察中,收到的信號往往都比較復雜,參數(shù)大小不一,并有著不同的量綱。因此為了消除原始數(shù)據(jù)對分選結果的影響,需要對數(shù)據(jù)進行預處理,使其分布在[0,1]之間[10]。由于雷達信號有未知的噪聲信號存在,所以采用Z?Score標準化算法。
其次再由此得到原始數(shù)據(jù)的標準化值:
最后因為此時得到的標準數(shù)據(jù)不一定在[0,1]閉區(qū)間內,再采用極值標準化公式:
2.2 移動網格技術
移動網格技術的原理就是將整個網格單元向高密度網格區(qū)域移動,使聚類的網格更加集中。由于生成網格單元的位置完全由生成網格的數(shù)據(jù)點決定,所以每個網格單元的中心點與重心點很可能并不在同一位置,導致相鄰的網格無法相交,聚類就可能丟失邊界[11]。因此在生成網格的過程中,如果網格的密度大于密度閾值[ε,]就根據(jù)公式(2)計算此網格單元的重心,再以重心為中心建立新的網格單元。移動網格后對移入網格的點做好標志, 并記錄新的網格單元與其周圍網格的共享信息;同時將移除網格的點做好記錄并排到數(shù)據(jù)集尾部,直到所有數(shù)據(jù)點都處理完畢。為了提高算法的效率,對每個網格只移動一次。移動網格技術消除了網格生成過程中對數(shù)據(jù)輸入順序的依賴性,大幅減少網格生成數(shù)目,提高了算法效率和聚類精度。
2.3 動態(tài)生成網格
初始網格集合為空,從數(shù)據(jù)集中讀入一個數(shù)據(jù)點,如果該點不在已生成的網格當中,則重新建立一個網格,網格單元密度為1;如果新輸入的數(shù)據(jù)在已生成的網格單元當中,則相應的網格單元密度加1,同時利用移動網格技術消除聚類的結果對數(shù)據(jù)輸入的依賴性。如果一個點屬于多個網格,說明這些網格是相交關系,則記錄這些網格的網格單元號、聚類標志和共享點信息等。重復上述步驟直到所有的點被處理。圖2為二維動態(tài)生成網格示意圖。
2.4 整個算法過程的描述
Step1:根據(jù)[N]個待分選對象的3個特征參數(shù)DOA、RF和PW形成一個三維待分選數(shù)據(jù)集,[N]為雷達脈沖數(shù)。對數(shù)據(jù)集按照2.1進行歸一化處理,得到預處理后的數(shù)據(jù)集。
Step2:網格邊長的確定,根據(jù)定義1給出的網格單元邊長的公式計算每一維網格邊長,[k]的值一般選為 [N3,][N]為待分選的樣本點數(shù)。
Step3:根據(jù)2.3節(jié)方法動態(tài)地生成網格,并用移動網格技術處理網格單元,記錄每一個網格所包含的數(shù)據(jù)點信息。
Step4:為了防止邊界點的丟失,對于移動網格過程中被移除網格的某些點,則將網格邊長擴大10%,看看該點是否處于網格內,如果是則仍將該點標記看作是該網格中的點。
Step5:計算每一網格單元的密度,并根據(jù)公式(3)和(4)算出核心密度閾值和密度閾值。
Step6:完成上述步驟后,數(shù)據(jù)點已經全部映射到網格單元當中。開始聚類,從任意一個含有核心網格的網格區(qū)間開始,按照廣度優(yōu)先原則將所有相交的高密度網格聚為一類,而不含有核心網格的噪聲網格區(qū)域被屏蔽;接著再選取另一個含有核心網格的網格區(qū)間,重復這個過程直到所有網格單元被處理。不屬于任何類的網格單元的數(shù)據(jù)點作為噪聲點處理;最后輸出聚類結果。
3 仿真實驗分析
實際在處理雷達信號數(shù)據(jù)的時候,都可以通過雷達使用的頻率分段和方位進行初步的分選,所以最后待分選的雷達信號較之最初的信號數(shù)量會大大降低[12]。
為了驗證基于移動網格技術和雙密度閾值的動態(tài)網格密度聚類分選算法在雷達信號分選方面的可行性和有效性,仿真實驗模擬了4部雷達全脈沖仿真數(shù)據(jù)對該分選方法進行了仿真實驗。同時加入了不少于雷達脈沖總數(shù)10%的干擾脈沖,具體參數(shù)見表1。
圖3為構造雷達數(shù)據(jù)的載頻和到達角的二維歸一化分布圖,從圖中可以看出,這4部雷達信號的到達角和載頻嚴重交疊在一起,所以基本是滿足了本文對復雜信號環(huán)境的要求。
固定網格密度聚類算法用于雷達信號分選效果如圖4所示。由于固定網格密度聚類算法是將數(shù)據(jù)空間每一維劃分為長度相等、互不相交的[k]個區(qū)間形成[k3]個固定網格單元,然后將數(shù)據(jù)集的每個對象映射到相應的網格當中[13],所以生成了很多無用的空網格,導致降低了算法執(zhí)行速度和由于處理不好網格邊界而造成漏選和增選現(xiàn)象,損失了很多真實信號數(shù)據(jù)。
用動態(tài)網格密度聚類算法用于雷達信號分選效果如圖5所示。通過對比圖4和圖5可以看出動態(tài)網格密度聚類分選算法取得了更好的分選效果,兩種算法分選結果比較見表2。
從表2可以看出,動態(tài)網格密度聚類算法的平均分選準確率比固定密度網格聚類有了大幅的提高,漏選和增選現(xiàn)象都有了很大的改善,所以動態(tài)網格密度聚類算法用于雷達信號分選可以取得更好的效果。
4 結 語
本文提出一種基于動態(tài)網格密度聚類的雷達信號分選算法,該算法采用改進的網格生成技術和移動網格技術將數(shù)據(jù)映射到網格當中,并改進了密度閾值,采用雙密度閾值有效解決聚類結果精度低的問題。該算法能識別任意大小形狀的雷達信號,聚類精度高,速度快,不需要任何輸入參數(shù)。仿真結果證實了該算法的有效性和先進性。
參考文獻
[1] 李合生,韓宇,蔡英武,等.雷達信號分選關鍵技術研究綜述[J].系統(tǒng)工程與電子技術,2005,27(12):2035?2040.
[2] MILOJEVIC D J, POPVIC B M. Improved algorithm for deinterleaving of radar pulses [J]. Radar and Signal Processing, 1992, 139(1): 98?104.
[3] 屠莉,陳崚,鄒凌君.數(shù)據(jù)流的網格密度聚類算法[J].小型微型計算機系統(tǒng),2009,30(7):1376?1382.
[4] 邱保志,沈均毅.基于擴展和網格的多密度算法[J].控制與決策,2006(9):1011?1014.
[5] WANG W, YANG J, MUNTZ R R. STING: a statistical information grid approach to spatial data mining [C]// Proceedings of the 23rd International Conference on Very Large Data Bases. San Francisco, CA, USA: VLDB, 1997: 186?195.
[6] JANUZAJ E, KRIECEL H P, PFEIFLE M. DBDC: density based distributed clustering [J]. Lecture Notes in Computer Science, 2004, 2992: 88?105.
[7] QIU B Z, LI X L, SHEN J Y. Grid?based clustering Algorithm based on intersecting partition and density estimation [J]. Lecture Notes in Computer Science, 2007, 4819: 368?377.
[8] 米源,楊燕,李天瑞.基于密度網格的數(shù)據(jù)流聚類算法[J].計算機科學,2011,38(12):178?181.
[9] 趙貴喜,駱魯秦,陳彬.基于蟻群算法的K?Means聚類雷達信號分選算法[J].雷達科學與技術,2009,7(2):142?146.
[10] 賀宏洲,景占榮,徐振華.雷達信號的模糊聚類分選方法[J].航空計算技術,2008,38(5):21?24.
[11] 鄭盈盈,倪志偉,吳姍,等.基于移動網格和密度的數(shù)據(jù)流聚類算法[J].計算機工程與應用,2009,45(8):129?131.
[12] 王曉峰,張國毅,戴杰.一種新的未知雷達信號聚類分選方法[J].電子信息對抗技術,2012,27(1):19?22.
[13] 向嫻,湯建龍.一種基于網格密度聚類的雷達信號分選[J].火控雷達技術,2010,39(4):67?72.