潘偉,李新建
(湖北中煙工業有限責任公司,湖北武漢 430000)
近年來,我國全方位步入電子信息時代,電子信息便利了大眾的生活,然而每天產生的電子信息量較大,對各個領域也造成了嚴重影響。因此,為了緩解信息冗余壓力,構建信息快速集成系統,將有效信息和無效信息分開,并銷毀無效信息,增加信息空余存儲空間[1-2],成為當前研究的熱點問題。
傳統信息快速集成系統的工作原理是根據信息產生時間進行快速集成分類,以時間塊為單位進行信息集成,但該方法無法將具有關聯的信息集成在一起,每次信息集成時,均需要在信息庫中對要集成信息的關鍵字進行查詢,導致信息集成速度較慢,效率低[3]。
為了提升信息快速集成速度,解決現有信息集成系統中存在的問題,文中以深度置信網絡技術為核心,完善信息快速集成系統功能,并在此基礎上,設計了一種信息快速集成系統,以提升信息集成的速度和效率。
文中設計的基于深度置信網絡的信息快速集成系統硬件由集成器、處理器和集線器組成。系統硬件結構如圖1 所示。

圖1 信息快速集成系統硬件
集成器是系統硬件區域最關鍵的器件,其主要工作是按照處理器傳遞的信息特征和深度置信網絡模型計算相關信息,進行信息快速集成。數據集成結果以數據文檔的格式輸出。為了保證基于深度置信網絡的信息快速集成系統的處理速度,文中采用了HKS-7392 集成器[4]。集成器結構如圖2 所示。

圖2 集成器結構
HKS-7392 集成器的閉環基本放大倍數AVF 為25 倍,運行過程中輸入的失調電壓VIO 為220 V,當集成器輸入電壓為零時,輸入失調電壓會立即進行替補,保證集成器的穩定運行。統一輸出的失調電流IIO 為60 A,為了使輸出的失調電流可快速得到替補,則在集成器輸入端配置兩個補償接收線圈[5-6]。集成器開環輸入阻抗是器件偏置電壓和電流的比值,文中控制開環輸入阻抗必須小于正常系統工作電阻的5%,以平衡集成器的正常工作。HKS-7392集成器如圖3 所示。

圖3 HKS-7392集成器示意圖
HKS-7392 集成器的優點是在待機狀態時會立即自動轉換靜態功耗模式,降低了集成器本身的能耗,節約能源、預測靜態功耗PD,集成器的開環頻寬BW 設置為3 dB。
處理器的工作任務分為兩部分,一部分為驅動集成器,另一部分是將數據采集器采集到的數據信息進行特征分析,然后將特征向量同時發送到集成器和軟件區域的深度置信網絡模型中,為信息數據的集成和關鍵信息檢索提供了基礎[7]。
麒麟990 處理器是目前處理器領域性能最好的處理器之一,其采用16 核心8 線程并兼容300 系列的工作主板,處理器的單核睿頻可以達到4.9 GHz,可保證處理器的工作速度[8]。麒麟990 處理器的基本頻率為3.6 GHz,在信息快速集成系統中設置8 個頻卡卡槽,卡槽支持基本內存類型,一旦系統的信息任務處理量增大,即可以增加頻卡,提高處理器的工作速度。處理器結構如圖4 所示。

圖4 處理器結構
處理器智能緩存空間為3 GB,每處理100 GB 信息消耗的熱功率為95 W。麒麟990 處理器的光刻為14 nm,在處理器的邊緣處設置多個敏感接口,提高了數據接收和識別的速度,主要接口類型為HDMI接口、USB 接口、DP 接口以及網絡接口,在接收到數據傳輸信號時,根據數據的格式自動開啟相應的接口,完成數據接收[9-10]。處理器接口如圖5 所示。

圖5 處理器接口
數據采集器在系統硬件區域的作用是初步采集需要集成的信息,雖然任務量較少,但必須保證數據采集過程中數據信息的完整性,一旦數據采集過程中出現數據節點丟失等情況,后期信息特征分析以及在信息庫中查詢等操作均無法進行或者導致查詢結果錯誤,降低系統的工作效率。因此,為了使數據采集器具備以上功能,文中采用GJSS-97 數據采集器[11-12]。
GJSS-97 數據采集器主要由IntelZ390 芯片、電池、識別端口以及數據存儲模塊組成。為了延長數據采集器的使用周期,文中采用4 000 mAh 容量的DG 電池,該電池支持4 h 快充,并且具有高度防腐蝕、耐壓力的特點,在數據采集器待機時,不用擔心電池腐蝕儀器的情況發生[13-14]。識別端口采用8 端口模式,端口的數據傳輸速度為千兆,并且各個端口遵守WSPPT 協議,支持網絡標準為IEEE 802.2、IEEE 802.3,識別端口最突出的特點為具有存儲轉發功能,減少數據存儲的工序。識別端口如圖6 所示。

圖6 識別端口
該系統中識別端口具有較強的擴展性和網絡性,其MAC工作地址為4 K,數據包轉發率為12 Mpps。數據存儲模塊可短時間存儲數據采集器采集的信息,其存儲空間為8+264 GB,IntelZ390芯片的CPU 為STM32FJST6,芯片工作的主要頻率為72 MHz,芯片具備多個64P-LQFP 的多功能引腳,IntelZ390 芯片的FP 數據讀取速度為每秒394 字節,在一定程度上提高了數據采集的工作速度,保證系統的工作效率。IntelZ390 芯片的外形為294 mm×180 mm×44 mm,工作電源為額定電壓220 V、額定電流50 A[15]。
深度置信網絡是一個融合機器學習法和海量訓練數據方法的能量模型,機器學習法的工作是將信息進行特征分布,為信息集成奠定基礎,提高信息集成的速度和準確度。深度置信網絡的實質是神經網絡和受限玻爾茲曼機之間相互綜合分布的分析網絡,受限玻爾茲曼機用來錄入需要集成信息的特征,神經網絡存儲信息庫的所有信息及其自帶特征,有些信息可能存在多個特征,一個深度置信網絡可由多個受限玻爾茲曼機串聯而成。深度置信網絡的信息數據訓練包括監督數據訓練和無監督數據訓練[16]。
深度置信網絡分析能量模型由許多層次構成,分別為數據隱藏層、可見層、隱藏神經元層,各個層次之間均連通且具有一定關聯性,深度置信網絡的神經層之間相互獨立。需要在第一個受限玻爾茲曼機層中集成信息特征向量,判斷信息的隱藏層,然后隱藏層的信息特征向量作為下一層的數據向量,層次之間滿足的信息數據能量函數為:

其中,n、m分別為可見層和隱藏層神經元個數;ni、vi分別為可見層和隱藏層神經元的偏置;bi為可見層神經元i與隱藏層神經元j的連接權重;θ為模型參數的集合;hi表示隱藏層,其數值通常取0 或者1,服從伯努利分布;wij表示可見層;h表示輸入層神經,其取值范圍為二值變量和實數值。
根據函數計算出隱藏層和可見層信息分布概率,即:
其中,z(θ)為歸一化系數。
深度置信網絡模型中信息檢索的關鍵是關于θ的數值,其決定需要集成信息的特征分布情況,確定模型內各個層之間的分布概率,保證模型計算結果的準確性。
基于深度置信網絡的信息快速集成系統的工作流程如圖7 所示。
1)驅動系統,設置系統功能,錄入硬件區域數據采集器采集的信息,并對數據信息進行特征分析,將需要集成的信息特征傳輸到處理器中,等待處理;
2)當處理器接收到信息特征的同時,調用深度置信網絡模型,對信息特征進行識別,通過對需要集成信息的神經網絡和受限玻爾茲曼機信息進行合理分布,調用模型內隱藏層、可見層、神經層在信息庫內完成信息特征的查詢;
3)根據需要集成信息查詢結果,快速完成信息的集成。
根據系統硬件集成器、處理器和集線器的設計,軟件中采用深度置信網絡模型進行信息特征分析,完成了基于深度置信網絡的信息快速集成系統的設計。
為了驗證文中基于深度置信網絡的信息快速集成系統的有效性,與傳統的基于物聯網的信息快速集成系統和基于數據分析的信息快速集成系統進行實驗對比。
實驗在MALTAB 7.2 平臺上進行,運行操作系統為Windows XP 系統,根據系統的硬件,設計了新的信息采集系統,實驗中確定樣本信息數據為2 000個,在集成過程加入無關特征,分析3 種系統受無關特征影響的程度,并對樣本信息集成的準確率進行分析。
在集成樣本數據過程中加入無關特征,分析3 種系統受無關特征影響的程度,實驗結果如圖8 所示。

圖8 無關特征影響實驗結果
根據圖8 可知,當添加200 個不相關的特征后,基于數據分析的快速集成系統的評估準確率呈現下降趨勢,其評估準確率約為28%。這是由于數據分析是一種淺層次的學習方法,其淺層次結構對不相關特征的加入比較敏感,隨著不相關特征數目的增加,其評價精度不斷降低。而基于物聯網的信息快速集成系統評估準確率約為75%,文中系統的評估準確性約為82%;當無關特征數目不斷增加后,3 種系統的評估效果均出現變化,但文中系統的評估性能較好。這是由于文中采用的深度置信網絡是一種深層結構,能夠對原始數據樣本中的特征進行分層抽取,在特征維數變化過程中排除無關信息。當不相關特征量逐漸增加時,能保證算法的準確性。驗證了基于深度置信網絡的信息快速集成系統具有更好的評估性能。
為解決現有信息集成系統中存在的不足,文中設計了一種新的基于深度置信網絡的信息快速集成系統。該系統對硬件和軟件進行設計。在硬件中設計了集成器、處理器以及集線器,提高了信息快速集成系統的運行基礎,軟件中通過深度置信網絡模型調用硬件設備驅動系統完成信息快速集成處理,達到研究目的。深度置信網絡是一個記憶性網絡,文中設計的集成系統在該記憶網絡的作用下,不需要進行全部信息查詢,具有集成速度快、效率高的特點。