曹鑫,邱靈赟,彭小慶,王云飛,李博
(國網四川省電力公司供電服務中心,四川 成都 610041)
隨著我國電力企業的快速發展,相關部門建立獨立的電力數據處理系統,這些系統的構建通過不同平臺、不同工具等進行開發,并應用在不同領域[1]。這些電力企業數據管理系統往往依據自身需求構建,與其他部門之間相互獨立存在,很難進行訪問[2]。雖然越來越多平臺被研發和使用,人們獲取電力綜合數據也越來越輕松[3],然而,電力綜合數據并不能得到良好的利用,這些數據往往是以不同格式分散到數據庫之中,因而很難將其集成起來進行分析,有效整理工作變得十分困難,處理數據需耗費大量人力和時間,由此形成了信息孤島[4]。因此,在不同部門間建立統一規范的接口,實現不同系統間數據共享變得尤為重要[5]。
在電力綜合數據集成過程中,聚集了很多不同電力資源,并在應用過程中累積了大量異構數據,這些數據結構相對簡單,但隨著數據量快速增長,采用單一數據集成系統無法快速集成這些數據。傳統系統在進行電力綜合數據的集成時存在集成速度較慢,且集成的數據內容不能適應當前需求等。為了解決該問題,提出了基于分布式協調的電力綜合數據集成系統構建。通過數據轉換,將電力數據定時集成到同一個數據庫內,以此滿足電力用戶工作需求。實驗結果表明,文中系統可以快速實現電力綜合數據的集成,具有一定現實意義。
系統的構建是采用分布式三層體系,分別為應用層、中間層和數據層。應用層包括管理員工作站、瀏覽器;中間層包括全局本體、局部本體和查詢組件;數據層包括客戶端和共享服務器[6-7]。系統總體框架如圖1所示。

圖1 系統總體框架
該系統中間層采用全局和局部相結合的模式,通過查詢組件實現數據源到局部和全局的映射,實現即插即用[8]。
依據電力系統實際應用情況,該層次主要包括兩種用戶:一種是電力系統工作人員,其利用管理工作站實時監控現場各個系統的數據,以保證系統能夠正常運行;另一種是供其他工作人員使用的查詢組件,即為瀏覽器,以適應未來電力系統需求,用戶查詢組件的全局,無需關心系統底層數據源,實現透明訪問[9-10]。
中間層主要負責電力綜合數據集成與交換,采用中間組件方式,實現對分布式數據源的直接訪問。該層次查詢組件解析從本體映射到局部數據源,并將其從各個數據源中進行信息整合,通過XSLT轉化,傳輸給應用層[11]。
本體組件是該層的核心組件,在集成過程中,針對不同數據源通過模式映射構建相應局部本體,并以此為基礎,建立整個系統上的全局本體[12]。映射組件是連接本體組件和查詢組件的關鍵樞紐,也是在本體組件構建完成后進行的映射組件,通過計算不同本體間的相似度,可搜索相似度最大的本體[13]。通過該組件能夠在最大程度上發現局部最優映射,并以此制定映射規則。查詢組件通過查詢處理用戶指令,實現全局本體、局部本體和數據源之間的映射,將用戶全局查詢分解成多個對應的單獨數據源。XML數據源查詢語言具有功能強大、方便、易于實現的特點[14]。
數據層位于系統框架最底層,該層次主要包括客戶端和共享服務器,實現不同數據的高效共享,并通過包裝器為應用層和中間層提供數據支持[15]。
使用手機客戶端主要與服務器相對應,為客戶端提供本地服務程序。移動客戶端以手機為主,能夠運行在手機終端,通過無線互聯網進行數據傳輸。利用手機無線網絡上網,首次登錄時需要手動輸入網址,并保存標簽,為后續訪問提供便利[16]。
包裝器實現對數據源的映射,不同數據源需采用相應的包裝器,并從數據源中提取出XML Schema模式的數據,并將查詢映射指定為特定數據源,以此識別物理查詢,并將底層抽取,轉化為XML文件格式。
在該系統硬件設計的基礎上,設計系統軟件部分以完成該系統集成電力綜合數據。在該系統中實現各類數據采集之前的無縫銜接、平滑過渡,能夠較好解決信息孤島問題,矢量數據集成流程如圖2所示。
將分布式協調后的數據進行矢量集成化整理,并將矢量數據通過構建WFS文件服務,將數據庫中的數據加載到該文件中,進而達到電力綜合數據與相關數據的集成。

圖2 矢量數據集成流程
數據集成系統實現了對海量數據不同作業的區別,具體作業流程如圖3所示。

圖3 數據集成流程
首先,客戶端發送集成請求到調度Agent中;從調度Agent中獲取作業元數據信息;判斷是否需要數據劃分,如果不需要,則可直接分配該作業到最強節點上,否則,需進行下一步;然后,收集所有節點信息,按照負載信息設定具體劃分方案;依據劃分結果,選中節點發送執行信息;再次,等待節點執行的任務,并返回作業完畢信息;最后,合并作業結果,實現電力數據綜合集成。
在調試試驗環境下實現基于分布式協調的電力綜合數據集成系統,為了驗證該系統構建的合理性,需進行調試分析。
系統開發環境如表1所示。

表1 系統開發環境
系統實驗的參數設置如表2所示。

表2 電力數據資源
系統查詢界面設置如圖4所示。

圖4 系統查詢界面設置
依據上述設置的查詢界面,進行系統調試驗證分析。
3.4.1 不同系統數據集成速度對比
為了驗證文中系統的有效性,將傳統系統與文中系統的電力綜合數據集成速度進行對比分析,實驗結果如圖5所示。

圖5 不同系統集成速度對比
分析圖5可以看出,對在線數據和離線數據的集成速度,兩種系統差距較大。在線數據的集成:當集成數據量為25 dB時,采用文中系統集成速度為13 s,采用傳統系統集成速度為23 s;當集成的數據量為75 dB時,采用文中系統集成速度為12 s,采用傳統系統集成速度為24 s;當數據量為150 dB時,采用文中系統集成速度為7 s,采用傳統系統集成速度為22 s。針對離線數據的采集:當數據量為50 dB時,采用文中系統集成速度為5 s,采用傳統系統集成速度為22 s;當數據量為75 dB時,采用文中系統集成速度為7s,采用傳統系統集成速度為22 s;當數據量為150 dB時,采用文中系統集成速度為3 s,采用傳統系統集成速度為23 s。
根據上述研究結果可知,文中系統的對電力綜合數據的集成速度更快。
3.4.2 不同系統數據集成的準確性分析
為了進一步驗證文中方法的可靠性,實驗分析了傳統系統和文中系統對電力綜合數據集成的準確性,實驗結果如表3所示。

表3 不同系統數據集成準確性對比
分析表3中數據可知,隨著集成的節點數據的增加,兩種系統的準確率隨之改變。當集成的節點數據為2 000個時,文中系統集成的準確率為96%,傳統系統的集成準確率為85%;當集成的節點數據為4 000個時,文中系統集成的準確率為95%,傳統系統的集成準確率為80%;當集成的節點數據為7 000個時,文中系統集成的準確率為92%,傳統系統的集成準確率為72%。通過對比可以看出,文中系統對電子綜合數據的集成準確率高于傳統系統,且均高于92%,驗證了文中系統的可行性。
文中提出基于分布式協調的電力綜合數據集成系統構建。該系統的構建解決了電力數據孤島問題,使電力信息可以及時、有效的共享。實驗結果表明,文中系統可有效提高電力綜合數據的集成速度,且集成準確率較高,證明了該系統對電力綜合數據集成具有一定優勢。
雖然文中系統在現階段取得了一定成果,但還存在很多不足,在以后的工作中將從以下兩點進行改進:
1)組件技術在電網中的應用較為廣泛,因此,在后續研究進程中,需將組件技術應用到電網中繼續研究。
2)由于智能電網還在小規模范圍內使用,文中系統對于應用安全性考慮較少,未來將以此為重點,進行電力綜合數據安全性的探究。