蔡燁峰
(浙江越秀外國語學院,浙江紹興,312000)
隨著計算機技術的發展,各種網絡智能設備和傳感器的普及,使得計算機領域云計算硬件性能得到了進一步提升,數據的各方面應用也得到優化。多維傳感器數據融合屬于一個新的研究領域,各種先進的技術進入人們的視線,為海量數據的融合與計算提供了新的思路,同時也為大數據的發展帶來了新的希望。在大數據背景下,多維傳感器數據融合技術在我國應用到了多個領域,如農業、軍事、醫療等。與傳統的單傳感器相比,多維傳感器數據融合技術在探測、跟蹤和目標識別等方面都得到了加強,整個系統的安全可靠性提高了,得到的數據準確的更加高,同時其覆蓋率、實時性等功能也都得到了提高[1]。
多維傳感器數據融合的本質是將各種類型的傳感器進行體系化處理,將傳感器獲取的各種不同類型數據進行統一、科學、有邏輯性的分類和定義。隨著現代社會應用傳感器的場景越來越多,傳感器獲取的數據類型和數據量飛速提升,多維傳感器數據融合已經成為大數據背景下數據分析領域最常見的概念。本文認為,多維傳感器數據融合理念可以被定義為:一種采用計算機、大數據、云計算等手段對多種不同類型傳感器獲取的海量數據信息進行算法分析,將分析后結果進行制備然后被數據監測人員進行統一定義、解釋、描述的數據融合方法。對于當今數據應用領域而言,多維傳感器數據融合能夠幫助數據分析人員獲得更科學且更具實用性的信息。
多維傳感器數據融合的原理與人類大腦進行多元信息分析處理的過程類似,需要借助一定的平臺利用多種信息數據處理工具對信息進行匯總和處理。多維傳感器數據融合是在各種傳感器的基礎上對數據進行自動支配、篩選、匯總和使用,將傳感器獲取的多維數據利用網絡平臺或者計算機硬件系統進行保存、組合、描述[2]。多維傳感器數據融合過程如下:
(1)利用相應算法對傳感器所輸出的多維數據進行特征提取,得到多維傳感器數據輸出離散或連續的數據特征失量,算法會對這些矢量進行說明;
(2)將系統中N個(N≥2,具體數量取決于系統復雜程度)不同類型的多維傳感器觀測目標數據進行收集和分類;
(3)將多維數據傳感器關于收錄數據信息的目標進行說明,根據這些數據說明將有關聯的數據統一進行分組;
(4)對(1)獲得的各數據矢量進行聚類算法等識別分析,完成各類型數據關于目標的優化說明;
(5)利用融合算法將個數據適量優化目標說明結果進行合成,得到多維傳感器數據的一致性解釋和描述。
多維傳感器數據融合是依據數據的信息含量進行規劃分類的,一般分為兩種:有損融合,是在數據融合保留全部信息的基礎上,通過遞減的方式(減少數據存儲量、數據分辨率等)進行壓縮方式的傳輸;無損融合,該融合方式主要是在保留所有細節的前提下,去除冗余數據。如圖1所示,數據的融合操作步驟通常是由高到底依次為:決策級融合、特征級融合及數據級融合[3]。

圖1 數據融合的步驟
多維傳感器最底層的數據融合服務對象是最前端的數據,通過對原始數據進行分析處理。多維傳感器在進行圖像目標識別工作時,需要對底層的原始圖像像素進行融合;數據級的融合工作通常會面對海量數據,對海量數據進行融合的時間、難度通常較高,且同時進行數據級融合的抗干擾性要求較高。由于一般的傳感器數據采集穩定性有所欠缺,通常還存在不確定性。因此這就要求多維傳感器在融合數據的同時需要具備一定的糾錯能力。在該研究領域常用的數據融合算法一般為:代數法、Wavelet transform等。
大數據背景下利用多維傳感器進行的特征級數據融合的主要工作是被監測者的特征融合,該信息來源主要是傳感器采集的原始信息,從該信息中找出反映事物屬性的數據,對其加以分析和整理,該步驟屬于多維傳感器數據融合的中間步驟。特征級數據融合的一般步驟包括:首先,系統會根據2.1部分獲得的數據級預處理結果進行數據的特征提??;其次,系統算法將會根據提取特征以后的數據特征對數據快速進行特征融合;最后,系統會根據不同特征的數據級進行區別性的數據屬性描述。
多維傳感器在基礎數據和中間步驟的基礎上,再對數據進行特征提取、數據分類及邏輯運算處理,為多維傳感器的核心決策環節提供輔助[4]。決策及數據融合屬于多維傳感器中最高級別的數據融合,該過程具有容錯性、實時性好的特征,在工作中當氣體傳感器出現故障時,該部分仍能工作出決策。決策級數據的融合步驟包括:首先,對決策級數據進行預處理,剔除不屬于決策級數據的數據集、數據等;其次,對決策級數據進行特征提取,得到不同特征說明的決策級數據;再次,對不同說明下的決策級數據進行說明和融合;最后,對融合完成以后的決策級數據進行再次說明,得到完整的決策級數據融合結果。
深度置信網絡又稱DBN算法是機器學習之神經網絡的一種。深度置信網絡與傳統的神經網絡在結構方面和數據模型生成方面具有一定的相似性,都包含了隱藏層、標簽神經元、聯合記憶層等結構。深度置信網絡數據融合算法具有應用范圍廣、網絡可拓展性強等優勢,如今已經成為數據融合算法中最為常見的算法類型之一,被廣泛應用于語言識別、圖像識別等領域。
圖2所示為典型的深度置信網絡結構。在該網絡結構中,聯合記憶層包含了標簽神經元、頂層神經元以及隱含層神經元等部分,屬于整個結構的最頂層,類似于人體的大腦;兩個隱含層位于結構的中間部位,主要負責判定模型權重和生成模型權重等,相當于人體的血管等;最下層的RBM層是受限玻爾茲曼機,是一種基于數據集學習概率分布的神經網絡模型,可以對數據模型權重進行訓練,得到所有不同數據權重模型中的最佳權重[5]。

圖2 BDN結構
如圖3所示為深度置信網絡(DBN)算法訓練過程。系統工作時會首先訓練第一個RBM,通過算法確定第一個RBM的權重等參數,將這一RBM的權重等參數作為訓練第二個RBM以及后續其他RBM的依據;其次,系統會根據第一個RBM的訓練結果對第二個RBM進行訓練并將第二個RBM的訓練結果與第一個RBM的訓練結果進行疊加,得到后續第三個RBM訓練的依據;最后,系統會根據第二個和第一個RBM的訓練結果進行多次后續數據的重復訓練,如果對應的神經元打開則設置為1,如果對應的神經元關閉則設置為0。

圖3 DBN訓練過程
(1)DBN的訓練過程可以被看作是多層 RBM模型的訓練過程。DBN既可以被當做用于判別RBM模型的神經網絡,也可以被當作是一種生成多層 RBM的模型算法。DBN的訓練過程是一種非監督貪婪逐層法對多層 RBM進行預訓練從而獲得相應權值的過程。
(2)DBN的訓練過程是一種層次較為分明的過程。每一層的訓練都需要在充分的數據向量基礎上進行推斷隱層,然后將多種隱層進行串聯從而得到一個DBN。在所有不同的DBN中,上一個DBN都是下一個DBN的訓練基礎;上一個RBM的隱層都是下一個RBM的顯層。
(3)神經元是多維傳感器融合過程算法體系中的重要組成部分。DBN由若干個不同的神經元層構成,而構成不同神經元層的是DBN網絡結構的可視層和隱層,二者之間通過神經網絡連接,但層內單元間不存在網絡連接,為相互獨立層。
從非監督學習來講,其目的是盡可能地保留原始特征的特點,同時降低特征的維度。從監督學習來講,其目的在于使得分類錯誤率盡可能地小。而不論是監督學習還是非監督學習,DBN算法本質都是Feature Learning的過程,即如何得到更好的特征表達[6]。
隨著大數據的發展以及科研者的不斷研發,多維傳感器數據融合已經得到了一定的完善,數據融合的基礎理論、兼有魯棒性和準確性的融合算法都有所提高。實現技術將不斷地得到更新,實際應用將不斷地被擴展。多傳感器數據融合技術必將不斷地走向成熟。