閆勝剛,田 田,張 冉,賈 然
(中國(guó)船舶集團(tuán)有限公司第八研究院,南京 211153)
輻射源編批是指將多個(gè)分選間隔內(nèi)由信號(hào)分選生成的所有輻射源描述字(Emitter Descriptor Word,EDW)按照一定的規(guī)則進(jìn)行合并、關(guān)聯(lián)及更新,以生成最終的目標(biāo)EDW,每個(gè)目標(biāo)EDW都賦予一個(gè)唯一的批號(hào)。EDW關(guān)聯(lián)的準(zhǔn)確性是決定輻射源編批效果的關(guān)鍵:一方面,現(xiàn)有編批算法通常基于預(yù)設(shè)的“信號(hào)參數(shù)容差”(載頻、重復(fù)周期、脈寬等)計(jì)算相似度,而“信號(hào)參數(shù)容差”易受到雷達(dá)發(fā)射機(jī)的工作模式、反偵察波形設(shè)置以及接收機(jī)所處的電磁環(huán)境、接收機(jī)體制、性能和工作狀態(tài)等眾多因素的影響,因此,準(zhǔn)確地分析和設(shè)置“信號(hào)參數(shù)容差”較為困難[1];另一方面,受制于輻射源天線和截獲接收機(jī)天線不同的掃描方式、掃描周期等原因,對(duì)某個(gè)輻射源的截獲可能并不是連續(xù)存在的,現(xiàn)有編批算法在編批時(shí)并沒(méi)有考慮當(dāng)前目標(biāo)與歷史編批目標(biāo)的關(guān)聯(lián)性,表現(xiàn)在對(duì)某個(gè)目標(biāo)編批時(shí),即使該目標(biāo)曾經(jīng)成功編批(但當(dāng)前已刪除),還是會(huì)賦予該目標(biāo)新批號(hào),導(dǎo)致同一個(gè)輻射源不同時(shí)刻具有不同批號(hào),影響了編批準(zhǔn)確率。
針對(duì)上述問(wèn)題,提出一種基于長(zhǎng)時(shí)聚類(lèi)關(guān)聯(lián)的輻射源編批方法,通過(guò)單個(gè)聚類(lèi)間隔內(nèi)的EDW聚類(lèi)提高EDW關(guān)聯(lián)的準(zhǔn)確度,通過(guò)多個(gè)聚類(lèi)間隔間EDW聚類(lèi)結(jié)果的關(guān)聯(lián)、合并和更新,實(shí)現(xiàn)長(zhǎng)時(shí)間維度上的輻射源信號(hào)碎片關(guān)聯(lián),提高輻射源編批準(zhǔn)確率。
已有的研究大多將聚類(lèi)算法用于對(duì)截獲的PDW數(shù)據(jù)進(jìn)行聚類(lèi)預(yù)分選或分選[1-2],缺乏利用聚類(lèi)算法對(duì)EDW數(shù)據(jù)進(jìn)行聚類(lèi)編批方面的研究。事實(shí)上,聚類(lèi)算法作為機(jī)器學(xué)習(xí)的一個(gè)重要分支,計(jì)算量通常比較大,具有較高的時(shí)間復(fù)雜度,在計(jì)算資源有限的情況下并不太適合實(shí)時(shí)性要求較高且數(shù)據(jù)量較大的處理場(chǎng)景,典型如PDW數(shù)據(jù)處理;相反,若對(duì)EDW進(jìn)行聚類(lèi),由于數(shù)據(jù)量得到了極大降低,可以保證實(shí)時(shí)性。
從聚類(lèi)觀點(diǎn)思考,每個(gè)輻射源相當(dāng)于一個(gè)信號(hào)類(lèi),每個(gè)分選生成的EDW相當(dāng)于對(duì)應(yīng)輻射源的一次觀測(cè)樣本,每個(gè)EDW的參數(shù)個(gè)數(shù)相當(dāng)于可供聚類(lèi)選擇的特征維數(shù)。由于EDW數(shù)據(jù)屬于流式數(shù)據(jù),因此對(duì)EDW進(jìn)行聚類(lèi)編批屬于流式數(shù)據(jù)處理,必須設(shè)定聚類(lèi)時(shí)間間隔TL,對(duì)各個(gè)聚類(lèi)間隔內(nèi)的EDW數(shù)據(jù)進(jìn)行實(shí)時(shí)聚類(lèi)以生成類(lèi)EDW,然后再將多個(gè)聚類(lèi)間隔間的類(lèi)EDW數(shù)據(jù)進(jìn)行關(guān)聯(lián)和更新,以實(shí)現(xiàn)目標(biāo)編批。
長(zhǎng)時(shí)聚類(lèi)關(guān)聯(lián)的輻射源編批流程如圖1所示,與原有編批流程相比,增加了EDW聚類(lèi)相關(guān)的操作:當(dāng)達(dá)到聚類(lèi)時(shí)間間隔時(shí),對(duì)當(dāng)前聚類(lèi)間隔內(nèi)的所有分選EDW進(jìn)行聚類(lèi),得到聚類(lèi)結(jié)果(用類(lèi)EDW表示);新生成的分選EDW與聚類(lèi)結(jié)果進(jìn)行關(guān)聯(lián),關(guān)聯(lián)成功打上類(lèi)標(biāo)識(shí);對(duì)于有類(lèi)號(hào)標(biāo)識(shí)的EDW直接編批輸出,未關(guān)聯(lián)成功的無(wú)類(lèi)號(hào)的分選EDW按照原有流程進(jìn)行航跡起始后編批輸出。

圖1 長(zhǎng)時(shí)聚類(lèi)關(guān)聯(lián)的輻射源編批流程圖
新增的各個(gè)模塊及其功能簡(jiǎn)述如下:
(1)分選EDW聚類(lèi):對(duì)當(dāng)前聚類(lèi)間隔TL內(nèi)的所有分選EDW進(jìn)行頻率和PRI二維聚類(lèi)。
由于實(shí)際環(huán)境中脈寬測(cè)量不準(zhǔn)的概率較大,所以沒(méi)有引入脈寬進(jìn)行三維聚類(lèi)。采用DBSCAN密度聚類(lèi)算法[3],形成當(dāng)前間隔TL的EDW聚類(lèi)結(jié)果,用ClusterNew表示。頻率以M為單位,重復(fù)周期以μs為單位,計(jì)算歐幾里得距離,以此得到聚類(lèi)時(shí)任意兩個(gè)EDW間的距離。每個(gè)EDW類(lèi)記錄的參數(shù)值包括該EDW類(lèi)的載頻最小、最大值,重復(fù)周期最小、最大值,脈寬最小、最大值,方位最小、最大值,類(lèi)中包含的EDW個(gè)數(shù)等。
(2)EDW類(lèi)關(guān)聯(lián):將當(dāng)前EDW聚類(lèi)結(jié)果ClusterNew與已有聚類(lèi)結(jié)果ClusterOld進(jìn)行關(guān)聯(lián)。
對(duì)于ClusterNew中每個(gè)EDW類(lèi)CluNewi,若其能夠與ClusterOld中的某個(gè)類(lèi)CluOldj關(guān)聯(lián)成功,則更新CluOldj;否則將CluNewi加入到ClusterOld中。其中關(guān)聯(lián)條件設(shè)置為:兩個(gè)EDW類(lèi)的載頻最小值之差、最大值之差都小于預(yù)設(shè)閾值或者兩個(gè)類(lèi)的載頻范圍存在交集,且兩個(gè)EDW類(lèi)的重復(fù)周期范圍也存在交集。
(3)EDW類(lèi)合并:關(guān)聯(lián)后的EDW類(lèi)可能存在載頻范圍或重復(fù)周期范圍參數(shù)重疊的情況,需要對(duì)EDW類(lèi)進(jìn)行合并。
(4)EDW與EDW類(lèi)關(guān)聯(lián):將單個(gè)分選EDW與當(dāng)前的EDW類(lèi)進(jìn)行關(guān)聯(lián),若關(guān)聯(lián)成功,則打上類(lèi)號(hào),否則不做處理。
算法的“長(zhǎng)時(shí)”聚類(lèi)關(guān)聯(lián)主要體現(xiàn)在兩個(gè)方面:(1)單個(gè)聚類(lèi)間隔設(shè)置為較長(zhǎng)的時(shí)間,通常為單個(gè)掃描周期的幾十倍,以積累足夠多的EDW樣本,提高聚類(lèi)結(jié)果的準(zhǔn)確率;(2)每個(gè)聚類(lèi)間隔新生成的類(lèi)EDW與已生成的類(lèi)EDW進(jìn)行關(guān)聯(lián),以實(shí)現(xiàn)更長(zhǎng)時(shí)間維度上(多個(gè)聚類(lèi)間隔)類(lèi)EDW的關(guān)聯(lián)和更新。
算法中涉及的分選EDW、目標(biāo)EDW和類(lèi)EDW的區(qū)別如表1所示。

表1 分選EDW、目標(biāo)EDW與類(lèi)EDW的區(qū)別
采用DBSCAN密度聚類(lèi)算法設(shè)置鄰域參數(shù)和密度參數(shù)。
鄰域參數(shù)epsilon的設(shè)置對(duì)聚類(lèi)結(jié)果有較大影響:設(shè)置較大會(huì)將屬于不同類(lèi)的EDW聚到同一個(gè)類(lèi)中;設(shè)置較小又會(huì)產(chǎn)生較多的類(lèi),將同屬于一個(gè)類(lèi)的EDW分割到多個(gè)類(lèi)。
基于外場(chǎng)采集數(shù)據(jù)開(kāi)展大量測(cè)試,獲取了不同參數(shù)設(shè)置情形的仿真結(jié)果,限于篇幅,此處只給出一組典型數(shù)據(jù)的聚類(lèi)結(jié)果。
圖2、圖3中每個(gè)不同顏色、不同圖例的所有點(diǎn)為一個(gè)EDW類(lèi),當(dāng)設(shè)置epsilon=20、MinPts=15時(shí),PRI為1 000 ms附近的EDW只被聚成了一個(gè)類(lèi)。圖3為圖2的放大版,可以發(fā)現(xiàn)1 000 μs附近的EDW應(yīng)該屬于兩個(gè)類(lèi),因?yàn)橐粋€(gè)真實(shí)的輻射源基本上不可能出現(xiàn)圖3這樣類(lèi)似于“直角”形狀的EDW分布情形,其更可能是由兩個(gè)輻射源所形成的EDW分布情形。為此,減小epsilon參數(shù)值,設(shè)置epsilon=10、MinPts=10,聚類(lèi)結(jié)果如圖4、圖5所示。可以看出,PRI為1 000 ms附近的EDW聚成了兩個(gè)類(lèi),更符合實(shí)際情形,表明epsilon=10的設(shè)置能夠提供更好的EDW聚類(lèi)隔離度。經(jīng)大量數(shù)據(jù)測(cè)試后,最終選定epsilon =10。

圖2 周期1聚類(lèi)結(jié)果(epsilon=20,MinPts=15)

圖3 周期1聚類(lèi)結(jié)果(epsilon=20,PRI為1 000 s附近)

圖4 周期1聚類(lèi)結(jié)果(epsilon=10,MinPts=10)

圖5 周期1聚類(lèi)結(jié)果(epsilon=10,PRI為1 000 s附近)
同樣對(duì)外場(chǎng)采集數(shù)據(jù)進(jìn)行測(cè)試,此處給出一組典型數(shù)據(jù)的測(cè)試結(jié)果,該段數(shù)據(jù)共有7 205個(gè)EDW,分別測(cè)試其在epsilon=10和不同MinPts參數(shù)下的聚類(lèi)情形,測(cè)試中不再進(jìn)行分時(shí)段的聚類(lèi),而是將所有EDW作為DBSCAN聚類(lèi)的輸入,只進(jìn)行一次聚類(lèi),以更好地驗(yàn)證MinPts參數(shù)對(duì)聚類(lèi)結(jié)果的影響。不同MinPts設(shè)置時(shí)的聚類(lèi)個(gè)數(shù)和噪點(diǎn)個(gè)數(shù)如圖6所示。

圖6 MinPts設(shè)置對(duì)聚類(lèi)個(gè)數(shù)和噪點(diǎn)個(gè)數(shù)的影響
可以看出,密度參數(shù)MinPts減小導(dǎo)致聚類(lèi)個(gè)數(shù)增加、噪點(diǎn)個(gè)數(shù)減少,這是因?yàn)殡S著密度參數(shù)的減小,有更多的噪點(diǎn)能夠被聚成類(lèi)。事實(shí)上,若聚類(lèi)間隔為T(mén)L,單個(gè)周期間隔為T(mén)S,截獲概率為α,則密度參數(shù)MinPts應(yīng)滿(mǎn)足

(1)
綜合上述考慮,經(jīng)過(guò)大量數(shù)據(jù)測(cè)試,最終選取MinPts=10。
在VxWorks環(huán)境中加入被動(dòng)數(shù)據(jù)處理程序,在此基礎(chǔ)上編程實(shí)現(xiàn)長(zhǎng)時(shí)聚類(lèi)關(guān)聯(lián)的編批算法。采用數(shù)據(jù)回放模式,導(dǎo)入12組外場(chǎng)采集的真實(shí)數(shù)據(jù)進(jìn)行輻射源編批實(shí)驗(yàn)。
圖7顯示了12組數(shù)據(jù)作為輸入時(shí),分別利用長(zhǎng)時(shí)聚類(lèi)關(guān)聯(lián)編批算法和原有編批算法的輻射源編批結(jié)果,可以看出前者極大地降低了輻射源的編批數(shù)量。為了對(duì)該結(jié)果進(jìn)行進(jìn)一步驗(yàn)證,挑選第1組數(shù)據(jù)(即圖7中的數(shù)據(jù)1)中部分輻射源的編批數(shù)據(jù)進(jìn)行詳細(xì)分析,結(jié)果如表2所示,可以看出單個(gè)輻射源的編批數(shù)量得到了降低。

表2 數(shù)據(jù)1部分輻射源編批數(shù)比較

圖7 輻射源編批結(jié)果對(duì)比
選取數(shù)據(jù)1中一個(gè)典型輻射源(標(biāo)識(shí)為輻射源A,對(duì)應(yīng)于表2中序號(hào)為3的輻射源)的編批結(jié)果進(jìn)行詳細(xì)分析。該數(shù)據(jù)時(shí)長(zhǎng)約4.5 h,共723個(gè)周期,并在第28個(gè)周期生成了第1次的聚類(lèi)編批結(jié)果,因此只分析28周期之后的輻射源編批數(shù)據(jù)。輻射源參數(shù)為載頻3 020~3 040 M,重復(fù)周期1 754 μs,采用聚類(lèi)關(guān)聯(lián)編批算法前后的編批情況如表3所示,其中采用傳統(tǒng)編批分配了17個(gè)批號(hào),采用聚類(lèi)編批只分配了一個(gè)批號(hào),與表2數(shù)據(jù)一致。

表3 輻射源A編批結(jié)果對(duì)比
對(duì)采用傳統(tǒng)編批出現(xiàn)17個(gè)批號(hào)的原因分析如下:
(1)該輻射源并不是每個(gè)周期都被截獲。例如表3中的批號(hào)3 023、3 024、3 025一直到批號(hào)3 117,都是該輻射源在不同時(shí)間段內(nèi)被賦予的批號(hào),在起始建批后,因?yàn)橐欢螘r(shí)間沒(méi)有被截獲到,從而被刪除,再次起始建批時(shí)就被分配了與之前完全不同的批號(hào),即原有編批算法在建批時(shí)并沒(méi)有考慮到當(dāng)前輻射源與歷史編批輻射源的關(guān)聯(lián)性。
(2)同一輻射源被分選成了兩批或多批目標(biāo),典型如批號(hào)3 020和3 021,兩批目標(biāo)的存在時(shí)間有很大的重疊。經(jīng)數(shù)據(jù)分析是因?yàn)閮膳繕?biāo)的載頻相差較大,超過(guò)了原有編批算法中EDW關(guān)聯(lián)計(jì)算設(shè)置的載頻容差,因而被認(rèn)定為是兩批不同的目標(biāo)。
對(duì)于第1種情況,長(zhǎng)時(shí)聚類(lèi)關(guān)聯(lián)編批算法在運(yùn)行時(shí)會(huì)存在1個(gè)EDW類(lèi)緩存,該緩存中存儲(chǔ)了算法自運(yùn)行開(kāi)始期間就存在的EDW類(lèi),且該緩存每個(gè)聚類(lèi)間隔都會(huì)更新;即使某個(gè)輻射源不是一直截獲,但其每次建批時(shí)都要與已有的EDW類(lèi)進(jìn)行關(guān)聯(lián),關(guān)聯(lián)成功則賦予該類(lèi)號(hào)對(duì)應(yīng)的初始批號(hào),避免了同一輻射源不同時(shí)間段具有不同批號(hào)的問(wèn)題。
對(duì)于第2種情況,DBSCAN算法通過(guò)密度聚類(lèi)實(shí)現(xiàn)EDW間的關(guān)聯(lián),其實(shí)質(zhì)是通過(guò)數(shù)據(jù)自身的分布情況進(jìn)行分類(lèi)識(shí)別,不再受固定“信號(hào)參數(shù)容差”的限制,能夠更好地識(shí)別屬于同一個(gè)輻射源的EDW,此例輻射源A載頻相差20 M仍能聚為一類(lèi)。這種特性也對(duì)重復(fù)周期有效,例如相控陣?yán)走_(dá)常用的反偵察波形措施之一就是在預(yù)設(shè)的PRI上進(jìn)行幾微秒左右的抖動(dòng),這種情形若采用“容差”,則EDW關(guān)聯(lián)失敗的概率較大,而采用本文的密度聚類(lèi)及參數(shù)設(shè)置仍然可以聚為一類(lèi)。
本文提出一種基于長(zhǎng)時(shí)聚類(lèi)關(guān)聯(lián)的輻射源編批方法,基于真實(shí)采集數(shù)據(jù)的回放實(shí)驗(yàn)表明其對(duì)改善信號(hào)增批率效果顯著。該算法能夠大幅降低輻射源目標(biāo)批數(shù)的原因主要是以下兩點(diǎn):
(1)長(zhǎng)時(shí)聚類(lèi)關(guān)聯(lián)編批算法在編批時(shí)考慮了與歷史編批目標(biāo)的關(guān)聯(lián),避免了同一輻射源因截獲不連續(xù)導(dǎo)致的不同時(shí)刻具有不同批號(hào)的問(wèn)題;
(2)相對(duì)于基于“信號(hào)參數(shù)容差”的EDW關(guān)聯(lián)算法,聚類(lèi)算法通過(guò)更為準(zhǔn)確的EDW密度聚類(lèi),降低了同一個(gè)目標(biāo)分配多個(gè)不同批號(hào)的概率。
對(duì)于能夠?qū)崿F(xiàn)頻率快速捷變的有源相控陣?yán)走_(dá)輻射源,長(zhǎng)時(shí)關(guān)聯(lián)聚類(lèi)編批算法在捷變頻模式作為先驗(yàn)信息輸入的情形下,能夠更好地解決此類(lèi)復(fù)雜輻射源的編批問(wèn)題,此時(shí)須結(jié)合頻率捷變的跳變幅度等信息對(duì)聚類(lèi)的鄰域參數(shù)epsilon進(jìn)行優(yōu)化設(shè)置,這也是后續(xù)研究方向。