曾德國,徐富元,張 君,劉 建
(中國航天科工集團8511研究所,江蘇 南京 210007)
·技術前沿·
天基海量電磁數據深度處理服務平臺
曾德國,徐富元,張 君,劉 建
(中國航天科工集團8511研究所,江蘇 南京 210007)
當前電子偵察數據呈現爆炸式增長,如何挖掘電子偵察的潛力,提升應用效能是當前電子偵察技術研究面臨的關鍵問題。海量電磁數據深度處理平臺以大數據技術為手段,利用云存儲、云計算構建海量電磁數據的大數據深度處理框架,通過數據抽取、知識圖譜構建、數據規律挖掘等關鍵技術,實現基于電磁信息的戰場目標狀態與意圖預測,可有效提高電子偵察在現代信息作戰中的重要性,提升電磁情報對戰略、戰役、戰術的支援能力。
海量電磁數據;云存儲;云計算;深度處理
隨著科技的發展以及各國對電子偵察衛星的重視,電子偵察衛星裝備數量快速增加,衛星電子偵察數據呈現爆發式增長,衛星地面應用系統的能力也不斷增強,產生的情報種類也不斷豐富,每型衛星系統生存周期內的偵察數據和情報的數據量也增長了數倍,加之衛星的數量不斷上升,總的數據量已達到了PB的規模。同時,隨著衛星電子偵察能力的提升,偵察情報質量也有了較大的提高,也助推了不同衛星之間的偵察數據/情報融合以期得到更多情報需求的進一步強化。
在電子偵察衛星快速發展的同時,上述各型衛星應用系統在以下諸多方面還存在明顯的不足:一是電子偵察數據的處理深度不夠,特別是缺乏基于多星聯合的深度挖掘能力;二是處理的層次不夠,目前基本處于數據判別、單目標簡單判別、平臺簡單判別等方面,在電子目標的行為層面情報的分析能力較弱,電子作戰意圖情報、預測情報、群目標任務情報基本處于空白狀態;三是應用系統的自適應、自學習的能力較弱,缺乏與偵察載荷或外部環境的交互、反饋能力和自適應能力;四是應用系統的戰術支援能力較弱,體現在與聯合作戰行動任務的緊密關系不足以及實時支援能力不足。
大數據技術發展到今天,許多技術已相對成熟,模型豐富、機器學習、自適應等技術特點可以較好地應用到上述問題的解決途徑中,因此,基于大數據技術的電子偵察數據挖掘和智能處理技術的研究就顯得尤為迫切。
1.1 天基海量電磁數據深度處理服務平臺的總體架構
天基信息云服務平臺的總體架構可以按照圖1進行搭建。
天基海量電磁數據深度處理服務平臺的總體架構研究主要由兩部分任務組成:天基信息融合處理技術研究和基于云技術的平臺架構。
1.2 基于云技術的平臺架構
基于云技術的平臺架構主要由云存儲、云計算和可視化圖表展現引擎組成。
云存儲通過集群應用、網絡技術和分布式文件系統等功能,將處理網絡中大量各種不同類型的存儲設備通過專用的軟件方式集合起來協同工作,共同對外提供數據存儲和業務訪問功能。云存儲的建設可以通過其強大的集成和高效訪問能力,解決天基海量偵測信息的存儲、傳輸和訪問問題,提供安全的數據接口、數據清洗和格式轉換的處理平臺。
云計算通過分布式計算、并行計算、效用計算和網絡傳輸等技術,將處理網絡中各計算節點集成起來統一調度,根據各插件軟件的需求合理分配計算資源,實現處理系統的負載均衡和高效運行,能夠解決天基海量數據的高計算量需求問題。
可視化圖表展示引擎通過圖形、圖像處理、計算機視覺等方法,根據各插件的需求提供對數字、圖片、實體關系等數據的圖形、動畫、三維的可視化展示平臺。
1.3 天基信息融合處理技術研究
天基信息融合處理技術研究主要由數據源、數據采集、知識圖譜、數據處理和應用服務組成。
天基海量電磁數據深度處理服務平臺項目主要處理的數據源由天基數據和其他數據組成。天基數據主要由偵察數據(圖像、電子偵察數據)和測繪數據組成。其他數據主要由互聯網(文本、聲像)、氣象水文、情報等數據組成。天基海量電磁數據深度處理服務平臺數據源可以統一地存儲在云存儲平臺中,并且向處理上層提供統一的調用接口,以滿足處理插件對數據靈活調用與處理。
數據采集主要的功能是數據的獲取和數據的清洗。根據各處理插件額需求,通過數據接口采集數據,同時對多源異構數據清洗,去除其中不必要的參數和特征,降低數據傳輸對網絡帶寬的要求。數據采集的工作是在云存儲平臺中的各存儲器端實現。
知識圖譜通過實體抽取,關系規則挖掘和實體關系表達等關鍵技術的研究,對天基多源異構的海量數據實現共指消歧,實體對齊等功能構建基于目標、事件、地物、區域的多維度知識圖譜,為目標行為規律分析與預測、動態監視和態勢感知提供豐富的數據特征。由于天基信息獲取能力不斷提高,天基數據量日益劇增,知識圖譜在構建和更新過程中會產生大量的計算需求,因此需要依托云計算平臺實現快速的關系規則挖掘為圖譜的及時更新提供保障。
數據處理是基于知識圖譜的基礎上,依托海量天基數據,面向情報需求,利用機器學習、規則挖掘等關鍵技術,根據天基獲取當前信息,建立實體規律和預測模型,實現對目標行為規律挖掘與預測、目標動態監視、事件預測和態勢感知。
應用服務是利用計算機圖形學和圖像處理技術,將情報數據轉化成圖形或圖像,以交互處理的理論、方法和技術面向用戶提供個性化、準確的目標行為、目標狀態、事件狀態和態勢形式的情報信息服務,增強軍委、各戰區和各武器平臺對情報數據的理解、探索和交流能力。
針對情報保障智能化、自動化需求,瞄準信息快速關聯、高效檢索以及隱含關系發現、推理預測等需求,突破多源信息的實體抽取、實體關系挖掘以及實體關系表達等關鍵技術,為面向情報任務的目標行為規律挖掘與預測,目標動態監視,重大事件預警以及戰場態勢感知提供多維度的樣本特征。
2.1 知識圖譜的構建過程
知識圖譜的構建過程如圖2所示。
知識圖譜的構建首先應以情報需求的目標為中心,從海量的天基信息數據源中進行實體抽取,通過現有的關系數據庫或規則得到一些簡單的實體之間的關系。但是有些實體關系是隱藏的、未知的,需要人工的判別或者大量數據的挖掘才能得到,因此通過實體關系挖掘可以得到更深層次的實體關系,最后通過實體關系表達構建知識圖譜。
2.2 實體抽取
針對天基多源數據以及其他引接數據對于實體的描述不一致性問題,從海量的天基信息數據中抽取參數、名稱和語義等信息通過數據關系庫和規則實現實體對齊與共指消歧,完成實體集合的建立。
實體抽取的過程如圖3所示。
天基海量電磁數據深度處理服務平臺的數據源主要由天基數據(包含圖像偵察、電子偵察和測繪數據)以及其他信息(文本、聲像、情報等數據)。天基信息中由于天基手段各異,獲得的情報產品也不相同,其他信息中更是包含了大量非結構的數據,因此各種實體間的對齊方式也是不相同的。
圖像偵察的實體對齊:現有的天基圖像偵察的方式主要包括紅外、可見光、SAR以及高光譜等手段,其作用的實體目標包括飛機、艦船、地物等。由于各種天基圖像偵察的原理不相同,因此對于實體的描述表征均不相同,在實體對齊的過程中可以借用現有的圖像識別庫,通過目標名稱和一些固定的參數實現紅外、可見光、SAR以及高光譜作用實體間的對齊。形成目標的實體集。
電子偵察的實體對齊:現有的天基電子偵察主要的情報產品包括中頻數據、全脈沖數據和輻射源信息。由于輻射源的存在脈間捷變、脈組捷變、頻率跳變等多種工作方式,因此在輻射源實體對齊過程中可以借用一些輻射源庫將多種全脈沖,中頻參數與輻射源的名稱進行對齊,形成輻射源的實體集。
其他信息的實體對齊:文本、聲像、情報等數據相比較于天基數據更加復雜,包含了多種實體(包括事件、地物、目標和區域)。很多信息數據均是非結構化的,在處理之前需要進行元數據的提取,然后由于信息中存在語義的共指和歧義,需要通過規則進行共指消歧,形成多種實體集。
2.3 實體關系挖掘
天基海量電磁數據深度處理服務平臺的實體應包括目標、事件、地物和區域等實體,天基海量信息應包含偵察、測繪和其他信息等。因此各實體之間的關系有十分明顯,也有較為隱藏的,需要去挖掘才能發現。通過信息推理、數理統計、判讀經驗積累等方法,實現各實體間關系的挖掘。
實體關系挖掘的過程如圖4所示。
軍事行動中目標的行為、事件的發展和態勢的轉變與多種因素有關,如作戰任務、地理環境、軍事形勢、指揮思想、目標性能等。因此知識圖譜中的各實體之間的關系錯綜復雜,相互影響,因此需要深入研究各實體間關系,構建完備的知識圖譜。
為了滿足天基海量電磁數據深度處理服務平臺知識圖譜的要求,可以從以下幾個方面考慮進行實體間的關聯。首先可以利用一些先驗的信息,如關聯數據庫、已有的關聯規則等,實現關系關聯;其次可以通過位置、時間、描述、數據的匹配統計實現實體關系的挖掘;最后通過對判讀員經驗積累完成實體關系建立。
2.4 實體關系表達
完備的知識圖譜可以為數據處理的規律挖掘與模型訓練提供更高維度的特征數據。因此在實體抽取與關系挖掘的基礎上,通過實體關系圖進行數據庫的建模是知識圖譜在天基海量電磁數據深度處理服務平臺中的實際應用方式。
天基海量電磁數據深度處理服務平臺中的實體關系圖(ERD)如圖5所示。
通過實體關系圖的建立可以預先精確定義數據庫的需求,但是轉向數據建模工具的時候會存在以下難題。
首先是如何使用建模符號準確地描述實體與實體關系;其次如何在不丟失任何關鍵信息的前提下,用數據建模工具描述實體關系圖;最后如何開發一個對實體關系圖全面支持的工具。
基于實體關系圖的數據模型初步如圖6所示。相對于目前傳統的數據組織
方式,有以下優勢:首先是漸增式數據模式設計:初始設計的時候,很難清楚所有的概念,而知識圖譜的動態可擴充性以及“無模式”特性使得用戶很容易增加或修改模式;其次數據集成更方便:本體的語義互操作特性以及“鏈接數據”原則,使得來自不同供應商的數據集成更為方便。再其次是現有標準支持:有RDF(S),OWL, SPARQL等標準,可以逐漸要求內容供應商支持;最后是數據和知識應用更簡單:可實現自然語言形式的語義檢索。
天基海量電磁數據深度處理服務平臺主要包括搭載平臺和工作模式分類分析服務、艦船行為的分類服務和多源數據的關聯規則挖掘服務。
3.1 基于ELM的搭載平臺和工作模式分類分析服務
ELM(extreme learning machine)極速學習器是一種深度機器學習挖掘規則的方法,對比傳統單層神經網絡,具備精度相同但速度更快的優點。ELM是由黃廣斌提出來的求解神經網絡算法,神經網絡模型如圖7所示。ELM最大的特點是對于傳統的神經網絡,尤其是單隱前饋神經網絡(SLFNs),ELM比傳統的學習算法速度更快。
通過ELM技術學習可以實現對實時電磁數據進行搭載平臺和工作模式分類的服務。
3.2 基于LSTM的艦船行為分類服務
LSTM是基于RNN的時間序列神經網絡,通過對已知時間發生時間狀態學習,判斷下一時刻的狀態。海量電磁數據深度處理服務平臺中輸入數據是一個時間與空間結合的數據類型。所有RNN 都具有一種重復神經網絡模塊的鏈式的形式。在標準的RNN中,這個重復的模塊只有一個非常簡單的結構,例如一個tanh層,如圖8所示。
LSTM同樣是這樣的結構,但是重復的模塊擁有一個不同的結構。不同于單一神經網絡成,如圖9所示,這里有四個,以一種非常特殊的方式進行交互,也是LSTM基于RNN神經網絡的改進項。
如圖9所示,每一條黑線傳輸著一整個向量,從一個節點的輸出到其它節點的輸入。中間的圈代表pointwise的操作,諸如向量的和,而陰影的矩陣就是學習到的神經網絡層。合在一起的線表示向量的連接,分開的線表示內容被復制,然后分發到不同的位置。
3.3 基于Apriori算法的多源數據的關聯規則挖掘服務
Apriori算法使用頻繁項集的先驗知識,使用一種稱作逐層搜索的迭代方法,k項集用于探索(k+1)項集。首先,通過掃描事務(交易)記錄,找出所有的頻繁1項集,該集合記做L1,然后利用L1找頻繁2項集的集合L2,L2找L3,如此下去,直到不能再找到任何頻繁k項集。最后再在所有的頻繁集中找出強規則,即產生用戶感興趣的關聯規則。
由于電磁信號與多源標注信息之間的語義關聯度不強,比起因果關聯模型,采用數據統計的Apriori算法更為合適。其次由于需要常常更新知識庫的關聯模塊信息,導致大量信息需要重復計算,Apriori算法計算代價較低,且更新后精度較高。
本文介紹了一種基于大數據處理的輻射源識別技術,具體包含了大數據處理系統的構架、知識圖譜的構建與基于無標簽電子偵察數據的聚類實例。該技術能夠依托海量的天基電子偵察數據為基礎,利用數據挖掘、智能聚類等方法實現對輻射源目標快速、準確、全面的識別與意圖預測,對于電子偵察領域的技術研究的發展具有一定的指導意義。■
[1] 莊嚴,李國良,馮建華.知識庫實體對齊技術綜述[J].計算機研究與發展,2016,53(1):165-192.
[2] 沙毅,陳曦,張立立,等.基于ELM神經網絡的FAST節點位移預測研究[J].東北大學學報(自然科學版),2017,38(5):630-633.
[3] 姚慶鍇,柳少軍,賀筱媛,等.戰場目標作戰意圖識別問題研究與展望[J].指揮與控制學報,2017,3(2):127-131.
[4] 趙月,任永功,劉洋.基于MapReduce 的改進的Apriori算法及其應用研究[J].計算機科學,2017,44(6):250-254.
Depth-processingplatformbasedonthemassspace-electromagneticdata
Zeng Deguo, Xu Fuyuan, Zhang Jun, Liu Jian
(No.8511 Research Institute of CASIC,Nanjing 210007,Jiangsu,China)
The electronic reconnaissance data has seen an explosion of mergers. How to exploit the potentialities from the electronic reconnaissance data is the key issue of the electronic reconnaissance technology. Big data as a method is used in the depth-processing platform based on the mass space-electromagnetic data. The framework of the depth-processing platform based on the mass space-electromagnetic data is built by cloud computing and storage. The target state and intention prediction is acquired by the data extraction, knowledge map and law mining.The depth-processing platform based on the mass space-electromagnetic data can enhance the significance of the electronic reconnaissance in the modern information warfare and promote the capacity of electromagnetic intelligence in the war of strategy, battle or tactics.
mass electromagnetic data;cloud computing;cloud storage;depth-processing
2017-07-20;2017-08-12修回。
曾德國(1985-),男,高工,博士,主要研究方向為電子偵察接收機。
TN97
A