薛峪峰,田光欣,馬占海
(國網青海省電力公司信息通信公司,青海西寧 810008)
近年來,信息技術高速發展,電網建設越來越完善,電力信息資源越來越豐富,電力信息檢索的難度也隨之增大。電力公共信息是電力信息資源重要的組成部分,公共信息包含了大量電力數據,公共信息檢索在調度、調控和運行方面都面臨巨大的壓力,因此必須要研究有效的方法,完成電力信息資源信息化建設和運行。
文獻[1]提出了基于互信息的改進決策樹算法作為數據挖掘內核,并提出適用于電力系統的并行處理架構,可實現多源數據的快速、有效的信息檢索,但是計算過程過于復雜,面對海量電力公共信息的可行性較低。文獻[2]設計了基于搜索引擎的供電信息資源多用戶調度管理平臺,該平臺能夠充分發揮數據信息的優勢,根據用戶的需求設立搜索引擎,完成資源調度。數據平臺從門戶功能需求出發,確定信息數據展示報表,建立三層架構,通過中間層完成查詢語言自定義,這種方法的檢索能力很強,但是需要有強大的數據庫資源。向量空間模型VSM(Vector Space Model)作為一種統計模型,通過分析權重加以簡化,使計算過程變得更加簡單,且更易實現,從而提高統計效率。該文針對VSM 進行改進,設計了基于改進VSM 的電力公共信息快速檢索系統,并通過實驗驗證了系統的可行性。
基于改進VSM 的電力公共信息快速檢索系統硬件結構如圖1 所示。

圖1 電力公共信息快速檢索系統硬件結構
觀察圖1 可知,該文設計的電力公共信息快速檢索系統硬件內部安裝了主動控制器,內部的冗余通信總線與DCS 冗余串口連接到一起,通信模塊與COM741 基座連接,確保通信信息的可靠性[3]。通信模塊連接四個接口,利用硬件跳線組成RS485 通信接口和RS232 通信接口,使不同的電動閥能夠順利連接控制[4-5]。常規信號與I/O 模塊順利連接,硬接線與通信點數之比為1∶15。
電力公共信息快速檢索終端如圖2 所示。

圖2 電力公共信息快速檢索終端
根據圖2 可知,電力檢索終端由CDMA Modem模塊、GPS 模塊、MCU 及電源四部分組成[6]。CDMA Modem 內部的核心模塊使用的是Wavcom 公司生產的ME45,確保CDMA 模塊能夠順利通信,CDMA 模塊內部的串口不僅能夠完成數據的控制和傳輸,同時也能完成信息傳輸。系統內部的部分模擬電路能夠保證檢索系統完成通信,利用AT 命令對ME45 完成控制[7]。終端內部的GPS 能夠接收外部的GPS 信號,并將計算得到的地理信息傳遞給MCU,通過C8051F020 八位微控制器完善終端,配合C 語言完成信息調試。
存儲器結構如圖3 所示。

圖3 存儲器結構圖
觀察圖3 可知,存儲器為分層結構,同時連接網絡接口、NAND 接口、RAM 接口、CAM,通過存儲接口和外接接口配合主機接口,完成各項邏輯的運行。主機接口能夠完成信息平移,并對錯誤的信息進行檢測和修正[8-9]。系統內部具有壓縮和解壓縮功能,可以完成存儲器信息劃分管理。存儲器分別配備行解碼器和列解碼器,保證存儲器陣列得到順利運行。
在識別器內部設計了兩個硬件串口,能夠獨立產生波特率,識別器內部的定時器與串口運行不會產生沖突,因此使用過程更加靈活。GPS 和CDMA模塊通過固定的格式完成信息通信,并對數據進行解析,完成信息封裝,識別器電路圖如圖4 所示。

圖4 識別器電路圖
根據圖4 可知,識別器電路內部有一個CAPI 服務器,識別器電路內部的128 字節FLASH 能夠存放各種不同的信息參數,完成數據識別,并根據建立IP地址,確保數據的傳輸要求;識別器電路內部的SRAM 共有4 kB,能夠很好地滿足組幀和數據緩沖要求,同時確保大程序量也能夠順利進行。FLASH和SRAM 以組合的方式實現信息的加密和解密,使信息能夠在特定場合下完成使用。I/O 接口通過光電耦合器隔離拓展相應的功能,系統內部的移動設備使用低功耗器件,工作過程消耗的電壓僅為3.3 V,滿足了系統的節能要求[10-11]。識別器電路內部的芯片為C8051F020 MCU 芯片,不需要重新擴展串口,能夠很好地滿足信息的要求。
VSM 常用在記錄信息方面,具有良好的統計功能,通過向量的方法來表示文檔,表示公式為:
其中,w為系統內部文檔,i表示特征項。通過各個不同的特征項占比分析各個方法的權重。VSM的統計效率高,能夠將信息集合,在存儲過程中不會造成信息丟失[12-13]。該文在傳統的VSM 基礎上進行了改進,改進原理如圖5 所示。

圖5 改進原理
觀察圖5 可知,確定數據采集單元出現的電力數據信息,將采集到的電力數據信息進行數據存儲和管理,通過數據挖掘、決策支持和OLAP 分析表示文檔,組成向量空間模型,完成VSM 改進[14]。
在軟件操作過程中,對電力信息進行預處理,提取關鍵信息,利用改進的VSM 對信息進行統計,判斷電力信息的初始權重,抽取公共電力信息,分析初始權重值,確定關鍵電力信息,將其組合并提取信息的特征項,分析不同特征項的權重,并對電力信息進行修改:
其中,wij表示特征W修改后的信息;fij表示信息出現的頻率;N表示信息的集成次數;n表示信息數量;k表示組合權重;j表示修改次數。根據式(2)可知,如果電力信息出現的次數超過閾值,則為公共信息[15]。
將信息融合到一起,建立樣本集,以此為依據分析樣本數量,對樣本進行決策,判斷所采集的信息與樣本的相似度,計算公式如下所示:
其中,X表示最大樣本閾值;Ci表示待檢測電力信息;Sip表示樣本信息[16];m表示待檢測電力信息總數。在分類過程中將信息確定為向量,確定得到信息的所屬類型,從而完成分類過程,根據分類結果進行信息顯示,在顯示屏展示結果。
為了驗證該文提出的基于改進VSM 的電力公共信息快速檢索系統的有效性,設計對比實驗,選用的電力信息來自電力企業服務器2021 年12 月25 日8:00—12 月30 日16:50 的監控記錄。同時配置硬件環境和軟件環境,具體配置條件:實驗硬件環境由服務器硬件和客戶端硬件組成,服務器硬件的內存為8 T;VPU 為5.0 G;硬盤為2 T??蛻舳擞布膬却鏋? T;VPU 為2.0 G;硬盤為1 T。軟件測試環境服務器語言環境為C++語言,客戶端通過M5瀏覽器瀏覽。
采集樣本點共有350 個,其中共有150 個公共信息點,有45 個公共信息點以分散的方式分布,其他公共信息點以連續的方式分布。對電力信息的時間序列模型進行預測,計算基線和閾值,確定基線置信度為95%。
考慮到基于搜索引擎的供電信息資源多用戶調度管理平臺僅側重于信息調度,因此在檢索性能方面僅采用該文提出的基于改進VSM 的電力公共信息快速檢索系統和基于改進決策樹的配電網多源數據快速檢索系統進行對比實驗,實驗結果如圖6 所示。

圖6 檢索實驗結果
根據圖6 可知,基于改進決策樹的配電網多源數據快速檢索系統得到的線條與觀測線基本吻合,能夠準確地檢索出觀測線中存在的電力公共信息,尤其在檢索分散的公共信息時,能夠實時響應,具有很強的響應能力。但是在檢索過程中出現了誤報情況,將處于閾值范圍內的電力信息誤判為公共信息,對于集中信息點,檢測能力較差,同時還出現了多次誤判的情況。雖然基于改進VSM 的電力公共信息快速檢索系統與正常的電力信息預測結果之間有一定的弱化,但基于改進VSM 的電力公共信息快速檢索系統與對比檢索系統相比更加平滑,表明該文設計系統可以降低CPU 負荷的波動。且基于改進VSM的電力公共信息快速檢索系統與對比檢索系統相比,與正常的電力信息預測結果更加接近。綜上可知,該文設計的檢索系統在檢測率方面能夠及時檢測出多個公共信息點,并沒有出現誤判,證明該文設計的檢索系統具有很強的魯棒性和可靠性,能夠降低檢測失誤概率。
分別選取基于改進決策樹的配電網多源數據快速檢索系統、基于搜索引擎的供電信息資源多用戶調度管理平臺以及該文系統進行響應時間測試,實驗結果如表1 所示。

表1 響應時間實驗結果
根據表1 可知,該文系統對于公共信息的響應時間僅在第4 次實驗時超過2 s,雖然受到環境的限制,但是整體響應時間滿足了實際需求。而對比的檢索系統在檢索過程中響應時間相對該文系統更長,導致電力系統運行過程等待時間過久,但是整體響應時間較平均,系統受環境限制影響較小。
綜上所述,該文提出的基于改進VSM 的電力公共信息快速檢索系統應用后,有助于各企業探索政企合作的多種模式,發揮互聯網在電力公共信息服務領域的優勢,合理界定政企部門在電力公共信息服務領域的邊界,推動供電服務轉型。
為了更好地實現電力公共信息檢索,該文通過改進向量空間模型,設計電力公共信息快速檢索系統,在設計過程中對硬件和軟件進行了優化,同時更新檢索終端、存儲器和檢索器,利用改進的向量空間模型將電力信息轉換成分類信息文本,并與閾值對比,確定需要檢索的電力公共信息。實驗結果表明,該文設計的系統能夠很好地完成信息檢索。但是在進行信息分析時,只能通過相似度比較確定信息是否為公共信息,這樣的檢索方式局限性較強,因此未來需要進一步深入研究這一問題。