張宗恕,路正國
(1.裝備工程技術(shù)研究實驗室,河北 石家莊 050081; 2.河北師范大學 附屬民族學院,河北 石家莊 050011)
基于粗糙集的多源通信網(wǎng)絡(luò)信息分析方法
張宗恕1,路正國2
(1.裝備工程技術(shù)研究實驗室,河北 石家莊 050081; 2.河北師范大學 附屬民族學院,河北 石家莊 050011)
針對通信對抗多源傳感器獲取的通信網(wǎng)絡(luò)信息挖掘問題,對通信信號外部技術(shù)特征和內(nèi)涵信息進行形式化表示,根據(jù)傳感器處理信息深度建立了域數(shù)據(jù)模型。深入分析了通信信息數(shù)據(jù)挖掘準備的方法,基于域數(shù)據(jù)模型和粗糙集理論,采用決策表分解知識發(fā)現(xiàn)的方法提取規(guī)則,對復(fù)雜通信網(wǎng)絡(luò)信息挖掘過程進行了基于規(guī)則的非機理指示建模,按信號體制分類對通信網(wǎng)絡(luò)信息挖掘模型進行組織,構(gòu)建了基于規(guī)則的知識系統(tǒng),應(yīng)用粗糙集理論和方法實現(xiàn)了通聯(lián)關(guān)系的挖掘,并提出了對數(shù)據(jù)挖掘模型的評價方法。
通信對抗;多源傳感器;粗糙集;域數(shù)據(jù)模型;網(wǎng)絡(luò)信息挖掘;決策表分解
通信對抗[1]是電子戰(zhàn)的重要內(nèi)容之一。及時、準確、全面地提供通信對抗情報[2],是保證有效實施通信對抗的先決條件之一。通過多種傳感器集成,是全面獲取通信設(shè)備系統(tǒng)和通信網(wǎng)臺的戰(zhàn)術(shù)技術(shù)情報,從中分析出對手通信態(tài)勢和薄弱環(huán)節(jié),掌握對手通信網(wǎng)臺的重要目標,做到知己知彼,使行動計劃有充分依據(jù)的重要途徑[3]。
多種傳感器集成面臨日益嚴峻的“數(shù)據(jù)豐富、信息缺乏”問題。考慮到通信對抗信息挖掘數(shù)據(jù)的多樣性、過程的復(fù)雜性,難以用精確模型表示,本文基于粗糙集理論[4]和域數(shù)據(jù)模型[5],構(gòu)建基于規(guī)則的知識系統(tǒng),不需要對過程進行數(shù)學描述,而是對過程進行經(jīng)驗總結(jié),依據(jù)信號分類,將操作員的日常經(jīng)驗總結(jié)形成“if…then…”的規(guī)則集合,構(gòu)造粗糙集,利用決策表對規(guī)則進行分解,提出形成知識,并給出規(guī)則有效性評價方法,利用粗糙集在分析處理不完全、不精確和不一致數(shù)據(jù)中所具有的優(yōu)勢,將粗糙集方法應(yīng)用于通聯(lián)關(guān)系的挖掘。
傳感器對通信信號能夠獲取的外部技術(shù)特征[6]和內(nèi)涵信息形式化表示可以記為s(t),一般包括:頻率參數(shù)、調(diào)制參數(shù)[7]、編碼參數(shù)、解調(diào)信息、解碼信息(包括還原信息)和時空信息等。
其形式化表示為:

(1)
其中,頻率參數(shù)記為:

(2)
式中,SF(t)=SingleFP(F,B,L,t),表示單載波頻率特性,其中F為頻率,B為帶寬,L為信號電平,t為測量時間;MF(t)=MultiFP(FNum,F,Space,SubBand,t),表示多載波頻率特性,其中FNum為子載波波數(shù),F(xiàn)為起始子載波頻率,Space為子載波間隔,SubBand為子載波帶寬,t為測量時間;HF(t)=HopFP(FNum,FSet,SubBand,t),表示跳頻頻率特性,其中FNum為跳頻點數(shù),F(xiàn)Set為跳頻頻率集,SubBand為跳頻帶寬,t為測量時間。
調(diào)制參數(shù)與解調(diào)參數(shù)一致,記為:

(3)
式中,SWM(t)=SingalWaveMP(MT,MM,MH,FOffset,R,t),表示單載波調(diào)制特性,其中MT為調(diào)制類型,MM為調(diào)制階數(shù),MH為調(diào)制指數(shù),F(xiàn)Offset為頻偏,R為符號速率,t為測量時間;MWM(t)=MultWaveMP(SubMT,MM,R,…,t),表示多載波調(diào)制特性,其中SubMT為子載波調(diào)制類型,MM為調(diào)制階數(shù),R為子載波符號速率,t為測量時間;HFM(t)=HopFreqMP(HSpeed,STime,MT,R,B,DR,t),表示跳頻調(diào)制特性,其中HSpeed為跳頻速率,STime為駐留時間,MT為調(diào)制類型,R為符號速率,B為帶寬,DR為占空比,t為測量時間。
編碼參數(shù)記為:
CP(t)=CodeParam(CL,CW,CType,CParam,IL,…,t),其中CL為碼長,CW為特征字,CType為編碼類型,CParam為編碼參數(shù),InterL為交織參數(shù),t為測量時間。
解調(diào)信息記為:

(4)式中,ADI(t)=AnalogDInfo(IDAddress,t),表示模擬調(diào)制信息,其中IDAddress為呼號地址碼等身份信息,t為測量時間;DDI(t)=DigitalDInfo(AddressCode,DCode,t),表示數(shù)字調(diào)制信息,其中AddressCode為地址碼、身份碼等信息,DCode為解調(diào)碼流,t為測量時間。
解碼結(jié)果記為:
DP(t)=DecodeInfo(Type,Te,P,V,SA,TA,t),
(5)
表示解碼信息,其中Type為信息類型,Te為文本信息,P為圖象信息,V為聲音信息,SA為源地址,TA為目標地址,t為測量時間。
時空特性記為:

(6)
表示獲取信號的時間、方位信息,其中SP為觀測點地址,Az為方位角,El為仰角,Lo為經(jīng)度,La為緯度,ST為開始時間,ET為結(jié)束時間。
對傳感器s(t)多次獲取的信號信息可以記為:
(7)
域的概念通常被用于對信息管理系統(tǒng)中的行為特點進行抽象和劃分,把具有某些共同特性或作用范圍的行為抽象成一個域。域數(shù)據(jù)模型把數(shù)據(jù)的歸屬作為共性之一,把數(shù)據(jù)的可訪問范圍作為抽象依據(jù),把一定的數(shù)據(jù)結(jié)構(gòu)作為被管理目標,那就把域的特征和數(shù)據(jù)模型的特征結(jié)合起來。
傳感器獲取的通信信號信息一般按域進行組織,即按傳感器對數(shù)據(jù)的處理深度和處理過程進行組織,充分考慮傳感器應(yīng)用領(lǐng)域的組織結(jié)構(gòu)和數(shù)據(jù)的歸屬、訪問控制等方面的特點。通信信息的域數(shù)據(jù)模型的構(gòu)建如下:
(8)
(9)
(10)
(11)
(12)
(13)
在挖掘前需要進行數(shù)據(jù)準備[8],數(shù)據(jù)準備是對相關(guān)數(shù)據(jù)的基本屬性進行傳輸、抽取、清洗、轉(zhuǎn)換和加載等處理,使得源數(shù)據(jù)滿足數(shù)據(jù)挖掘方法模型的需要。
對多次接收的信號sj,進行通信網(wǎng)絡(luò)信息挖掘數(shù)據(jù)準備,需要經(jīng)過信號關(guān)聯(lián)、信號歸并和信號野值剔除。
信號關(guān)聯(lián)是指在對信號監(jiān)視過程中,需要判斷監(jiān)視的為同一個目標信號,或者判斷本次監(jiān)視信號與以前出現(xiàn)的信號為同一個目標信號。
信號關(guān)聯(lián)可以表示為:

(14)
式中,
(1) 以頻率作為關(guān)聯(lián)條件,可以分為以下幾種情況:
① 單載波的頻率關(guān)聯(lián),其關(guān)聯(lián)條件為:

(15)
式中,ε為頻率測量誤差門限。
② 多載波的頻率關(guān)聯(lián),其關(guān)聯(lián)條件為:

(16)
即以FNum子載波波數(shù)、F起始子載波頻率、Space子載波間隔和SubBand子載波帶寬等多載波參數(shù)作為關(guān)聯(lián)判斷條件。
③ 跳頻的頻率關(guān)聯(lián)

(17)
即以FNum跳頻點數(shù)、FSet跳頻頻率集和SubBand跳頻帶寬等跳頻頻率參數(shù)作為關(guān)聯(lián)判斷條件。
(2) 以調(diào)制參數(shù)作為關(guān)聯(lián)條件:
CM=CMod(Si(t),Sj(t))=

(18)
(3) 以編碼參數(shù)作為關(guān)聯(lián)條件:
CCP=CCodeParam(Si(t),Sj(t))。
(19)
(4) 以解調(diào)信息作為關(guān)聯(lián)條件:
CDP=CDemod(Si(t),Sj(t))。
(20)
(5) 以解碼結(jié)果作為關(guān)聯(lián)條件:
CI=CDecodeInfo(Si(t),Sj(t))。
(21)
(6) 以空間方位位置作為關(guān)聯(lián)條件:
CST=CTimeSpace(Si(t),Sj(t))。
(22)
信號歸并:主要是對數(shù)據(jù)集合的合并與索引,即對各傳感器獲取的輻射源參數(shù)信息按照傳感器、通信體制和通信網(wǎng)絡(luò)進行統(tǒng)一編批;對輻射源數(shù)據(jù)進行一致性檢驗、糾錯及去重復(fù)處理;管理傳感器多次獲取的同一批號的數(shù)據(jù);根據(jù)傳感器持續(xù)獲取的同一批號數(shù)據(jù)進行處理,完善輻射源屬性信息、參數(shù)信息及位置/方位信息,并對多次分時獲取的信源信息進行拼接接續(xù)。
信號野值剔除:一般通過與觀測量均值偏差的大小來判斷野值并剔除,表示如下:

(23)
式中,Ave(S(t))為信號觀測量均值。
對不同體制的信號,其關(guān)聯(lián)判斷條件是不同的,需要根據(jù)不同的通信體制、通信網(wǎng)絡(luò)選取。
建立數(shù)據(jù)挖掘模型的目標是從海量數(shù)據(jù)中發(fā)現(xiàn)未知的有價值的新知識或規(guī)律。數(shù)據(jù)挖掘是包含多個階段的知識發(fā)現(xiàn)過程,可能包括數(shù)據(jù)預(yù)處理階段、數(shù)據(jù)挖掘算法的應(yīng)用階段、對挖掘結(jié)果的評估階段以及最終挖掘模型的可視化處理階段。
數(shù)據(jù)挖掘方法模型根據(jù)應(yīng)用場合分為:通用模型和專用模型。
通用模型是針對通用問題所建立的適用于多個應(yīng)用場合的數(shù)據(jù)挖掘方法模型。例如,上述的信號關(guān)聯(lián)、信號歸并、信號野值剔除即為常見的通用模型。
專用模型是針對特定問題所建立的只適用于特定應(yīng)用場合的數(shù)據(jù)挖掘方法模型。例如,對定頻時分雙工的話音通信組網(wǎng)的挖掘模型,圖1描述了其通信交替過程和通信檢測方法。
圖1中,電臺1與電臺2的信道交替沒有重疊,因此二者可以進行通信。

圖1 對定頻話音通信組網(wǎng)的挖掘模型
其信息關(guān)聯(lián)特征為:① 頻點的同頻;② 調(diào)制方式相同;③ 時間的交替;④ 信息內(nèi)容的相關(guān)。
針對定頻時分雙工的多個輻射源屬于同一個網(wǎng)的必要條件可以表示為:CF,CM,CST,CI取值為真,可以將其用粗糙集理論的知識表示方式[9]為:
定義:信息系統(tǒng)[10]為:
S=(U,C∪D,V,ρ)。
(24)
式中,U={s1,s2,…,sn}表示傳感器獲取通信信息的集合;C=(CF,CM,CCP,CDP,CI,CST)表示條件屬性集合;D為決策屬性集合;V為屬性值域,此種信息系統(tǒng)被稱為決策表,信息函數(shù)ρ如表1所示。

表1 對通信網(wǎng)絡(luò)數(shù)據(jù)的一個決策表
表1中,d1為定頻時分雙工的話音通聯(lián)關(guān)系;dm為ALE通信通聯(lián)關(guān)系。
在決策表中抽取規(guī)則的一般方法為:① 在決策表中將域數(shù)據(jù)的屬性信息壓縮得到壓縮后的信息表,即刪除多余域?qū)傩裕虎?對每一個對象及其信息中將多余的域刪除;③ 求出最小約簡;④ 根據(jù)最小約簡,給出邏輯規(guī)則。
文獻[11-12]給出了粗糙集理論對知識(或數(shù)據(jù))的約簡和求核的方法。對決策表抽取規(guī)則可以參考有決策情況的約簡方法[13]。
數(shù)據(jù)挖掘模型選擇[14]是在應(yīng)用領(lǐng)域業(yè)務(wù)知識及數(shù)據(jù)挖掘?qū)I(yè)知識的約束下,基于數(shù)據(jù)探索建立適應(yīng)業(yè)務(wù)數(shù)據(jù)的建模過程。對通信對抗傳感器獲取的通信網(wǎng)絡(luò)信息挖掘內(nèi)容一般包括:
① 將數(shù)據(jù)按照平臺及通信體制、通信網(wǎng)絡(luò)進行分類處理,對各傳感器獲取的信號信息按照傳感器、目標進行統(tǒng)一編批;
② 對傳感器獲取的數(shù)據(jù)進行一致性檢驗、糾錯和去重復(fù)處理,管理傳感器多次獲取的同一批號的數(shù)據(jù),根據(jù)傳感器持續(xù)獲取的同一批號數(shù)據(jù)完善目標屬性信息、參數(shù)信息及位置/方位信息,并對多次分時獲取的信源信息進行拼接接續(xù);
③ 根據(jù)目標組網(wǎng)特性挖掘通聯(lián)關(guān)系,生成通信網(wǎng)絡(luò),并根據(jù)傳感器上報的不同目標間的通聯(lián)關(guān)系,補充完善通信網(wǎng)絡(luò)成員信息。
通信網(wǎng)絡(luò)信息挖掘處理過程如圖2所示。通信對抗信息挖掘可以被認為是一種從輸入到輸出的映射,將通信對抗信息挖掘模型看作一個盒子,輸入變量經(jīng)過這個盒子的變換,成為希望的輸出。對于一些簡單的系統(tǒng),挖掘模型往往可以采用一些簡單的數(shù)學公式來表示。但對于通信網(wǎng)絡(luò)信息挖掘,難以用數(shù)學公式對系統(tǒng)加以表述,或者必須花費極大的代價才能求得精確的數(shù)學模型。此時,傳統(tǒng)的過程建模方法就失去了作用。而在現(xiàn)實中,操作員沒有精確的數(shù)學模型,但是通過經(jīng)驗積累和不斷學習,卻可以手動分析的很好,操作員的經(jīng)驗常常可以用“if…then…”的規(guī)則形式表達[15],這些規(guī)則常常是基于可以觀測的系統(tǒng)狀態(tài)和輸出信號。

圖2 通信網(wǎng)絡(luò)信息挖掘處理過程
因此,對通信對抗信息挖掘可以通過構(gòu)建粗造集,在信號分類的基礎(chǔ)上,將規(guī)則理解為對數(shù)據(jù)的分類,利用已有的知識庫,將不精確或不確定的知識用已知的知識庫中的知識來(近似)表達,用以發(fā)掘海量數(shù)據(jù)項之間的某種潛在關(guān)系。
對式(24)定義的通信對抗信息系統(tǒng),可以將決策屬性集合擴充到不同的通信系統(tǒng)D={d1,d2,…,dm},其信息函數(shù)如表1所示。
對不同通信系統(tǒng)的處理,可以利用粗糙集在分析處理不完全、不精確和不一致數(shù)據(jù)中所具有的優(yōu)勢,對復(fù)雜通信網(wǎng)絡(luò)過程進行基于規(guī)則的非基理指示建模,在規(guī)則模型的基礎(chǔ)上,將粗糙集方法應(yīng)用于通信網(wǎng)絡(luò)分析。
判斷通信網(wǎng)絡(luò)數(shù)據(jù)挖掘的有效性,可以從2個方面進行評價:① 便于控舊查新,快速識別新目標;② 便于深度分析,能夠全面掌握通信網(wǎng)絡(luò)情況。可以采用支持度和置信度對挖掘方法的有效性進行評價。
定義通聯(lián)關(guān)系為C→D,則其支持度[16]為:
(25)

置信度[17]為:

(26)
這里支持度表示規(guī)則的頻繁程度,支持度高,這種規(guī)則使用概率高,價值更大。置信度表示規(guī)則的可靠度,置信度越高,表示C→D的可能性越大。
粗糙集理論是一種通過等價關(guān)系和近似概念對數(shù)據(jù)進行約簡以獲取知識的方法。本文主要目的是利用粗糙集在分析處理不完全、不精確和不一致數(shù)據(jù)中所具有的優(yōu)勢,對通信網(wǎng)絡(luò)挖掘過程進行基于規(guī)則的非基理指示建模,在規(guī)則模型的基礎(chǔ)上,將粗糙集方法應(yīng)用于通信網(wǎng)絡(luò)信息挖掘,并給出了挖掘的有效性評價方法。在利用粗糙分析對大型數(shù)據(jù)表進行規(guī)則發(fā)現(xiàn)時,由于必要的條件屬性很多,直接進行粗糙分析效率低且難以得到最小簡約。考慮到各條件屬性相對于決策屬性的重要性有所不同,因此在對大型數(shù)據(jù)表進行規(guī)則發(fā)現(xiàn)時,可以研究對其進行分解,通過屬性集的重要程度將數(shù)據(jù)表按對象劃分,對分解得到的各個子表進行并行規(guī)則發(fā)現(xiàn),以提高運算速度和規(guī)則質(zhì)量。
[1] 高曉濱.先進的通信對抗系統(tǒng)[J].無線電工程,1997,27(6):1-3.
[2] 王海清.數(shù)據(jù)挖掘在情報偵察系統(tǒng)中的應(yīng)用[J].無線電工程,2009,39(4):20-22.
[3] 蘇春梅,何劍偉,李永剛,等.一種多傳感器空情信息融合算法[J].電訊技術(shù),2015,55(2):193-199.
[4] 張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學出版社,2001.
[5] 趙 雷.域數(shù)據(jù)模型的研究與實現(xiàn)[D].蘇州:蘇州大學,2006.
[6] 王海清.戰(zhàn)術(shù)通信網(wǎng)絡(luò)的識別方法[J].無線電通信技術(shù),2004,34(3):47-49.
[7] 陸滿君.通信輻射源個體識別與參數(shù)估計[D].哈爾濱:哈爾濱工業(yè)大學,2009.
[8] 馬 昕.粗糙集理論在數(shù)據(jù)挖掘領(lǐng)域中的應(yīng)用[D].杭州:浙江大學,2003.
[9] 張文修,吳偉志.粗糙集理論介紹和研究綜述[J].模糊系統(tǒng)與數(shù)學,2000(4):1-12.
[10] 關(guān) 欣,潘麗娜,張政超,等.基于粗糙集理論的雷達輻射源信號識別[M].北京:國防工業(yè)出版社,2015.
[11] 官禮和.基于Rough集的不完備信息處理方法研究[D].成都:西南交通大學,2012.
[12] 王永生.基于粗糙集理論的動態(tài)數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D].北京:北京科技大學,2016.
[13] 裴小兵.粗糙集的知識約簡研究[D].長沙:中南大學,2006.
[14] 高雅田.基于MAS的數(shù)據(jù)挖掘模型自動選擇方法研究[D].大慶:東北石油大學,2011.
[15] 譚天樂.基于粗糙集理論的過程建模、控制和故障診斷[D].杭州:浙江大學,2003.
[16] 王慶東.基于粗糙集的數(shù)據(jù)挖掘方法研究[D].杭州:浙江大學,2005.
[17] 王加陽.面向海量數(shù)據(jù)的粗糙集理論與方法研究[D].長沙:中南大學,2005.
張宗恕 男,(1977—),高級工程師。主要研究方向:信息處理。
路正國 男,(1980—),講師。主要研究方向:信息處理。
The Analyzing Method of Multi-source Communication Network Information Based on Rough Sets
ZHANG Zong-shu1,LU Zheng-guo2
(1.EquipmentEngineeringTechnologyResearchLaboratory,ShijiazhuangHebei050081,China; 2.InstituteforNationalities,HebeiNormalUniversity,ShijiazhuangHebei050011,China)
Aiming at the problem of the mining method of communication network information about the multi-source data of communication countermeasure,external technical features and connotation information are represented by formulae.According to the depth of the sensor processing information,the domain data model is established.The method of data mining preparation of communication information is deeply analyzed.On the basis of the domain data model and Rough Set theory,the rules are extracted by the method that decomposes the knowledge by the decision table.The information mining process of complex communication network is modeled based on non-mechanism rules.The communication network information mining model is organized according to the classification of the signal transmitting system.Knowledge system based on rule is constructed.The communication relationship is mined based on rough set theory and method.And the evaluation method of data mining model is analyzed.
communication countermeasure;multi-source sensor;rough set;domain data model;network information mining;decomposition of decision talbe
10.3969/j.issn.1003-3106.2017.05.01
張宗恕,路正國.基于粗糙集的多源通信網(wǎng)絡(luò)信息分析方法[J].無線電工程,2017,47(5):1-5.[ZHANG Zongshu,LU Zhengguo.The Analyzing Method of Multi-source Communication Network Information Based on Rough Sets[J].Radio Engineering,2017,47(5):1-5.]
2017-02-09
河北省重大科技成果轉(zhuǎn)化專項基金資助項目(14040322Z)。
TP391.4
A
1003-3106(2017)05-0001-05