國網安徽省電力有限公司合肥供電公司 程 辰 趙 曄 王 偉
在電網規模不斷擴大的同時,廣大用電戶對優質、穩定電能的需求也在逐漸提升。因此,為了確保輸配電網絡能夠在較長時間內保持正常運轉的狀態,需要提高對電網的整體監測水平。輸配電全景駕駛艙技術是指基于控制駕駛艙與3D 可視化大屏工具,對一定范圍內的監控對象構建虛擬監測模型,基于快速開發、內置圖表、三維模型、組件復用、分頁設計、多屏適應、離屏控制等技術,實現對范圍內電網的全景監測[1]。這一技術的實現基礎是電網管理數據的高效率融合,值得重點分析。
電網在運行過程中,每時每刻都會產生大量數據。若要針對這些數據做好匯總、融合、分析工作,必須探索應用數據的深度融合技術。目前,已知的數據融合技術不止一種,本文以Bayes 統計理論支持下的電網管理數據融合技術為例展開分析。
Bayes 統計理論的原理是在不忽視“可靠度”的情況下,基于傳感器測量電網運行產生各項數據時(可根據需要,確定哪些數據屬于“重點管理數據”),必須確保準確性的兩大類關鍵數值分別為“測量值”和“真值”。具體來說,隨機模擬電網運行過程并連續測量多組數據。在每一組測量過程中,都存在n(n 為自然數)個互相之間不可能存在“相容”關系的事件,分別被記為A1、A2,…,An。這些事件或者都不發生,或者有一件發生后,其他事件便不會發生。如果用P(Ai)表示事件Ai發生的概率,則適用的關系如公式(1)所示:
如果使用傳感器對事件A 的發生情況進行檢測,所得出的檢測值以B 表示,則B 便屬于Bayes統計理論下的“測量值”,Ai的值為“真值”。
在Bayes 統計理論設置的數據檢驗邏輯關系是,在不同時間、事件發生前后檢驗一件相同的事件時,檢驗人員對事件發生情況的估計存在差異,且一次檢驗結果如果不同,則對檢驗人員最終估計造成的影響也存在差異性。基于這種邏輯,有了先驗知識、后驗知識的劃分。
所謂“先驗知識”對應的邏輯原理為:以P(An)對應An,前者表示后者發生的概率。這種概率在An 事件發生前得出,故被稱為“先驗知識”。
當一次檢驗結果B 出現之后,檢驗人員對每一個事件發生概率的判斷會發生變化,此為“后驗知識”。
相對來說,完成檢驗后的事件發生概率的表達方式更加復雜,具體以P(An|B)表示。對這一表達式進行分析后,可以得出下列兩個關系式:
得到公式(2)、公式(3)之后,基于Bayes 估計進行數據融合的原理是,基于“先驗知識”對“后驗知識”進行連續性地修正。此時需要使用的公式可以是條件概率公式,也可以是全概率公式,具體如下:
上述三個公式中,公式(4)、公式(5)均為條件概率公式,公式(6)為全概率公式。其中的Ai表示對樣本空間的劃分處理值,即上文所述的Ai(包括A1、A2,…,An)彼此之間均具有“互相排斥--一件事發生后其他事件不可能發生”的關系。
當一次測量結果的值為B 時,Ai事件的真實發生率(即真值)的表達式如下:
總體來看,基于Bayes 估計進行數據的測量及匯總融合、分析處理時,必須對測量對象的“先驗信息(先驗知識)”進行充分利用,之后根據實際測量結果,對先驗概率進行修正,最終得出的后驗概率具有更高的準確性。
1.2.1 基于Bayes 統計的目標識別融合模型
基于Bayes 統計對電網運行數據進行收集、匯總、分析、融合處理時,所構建的模型要素見表1。從表1中可以看出,傳感器A、B、C 的功能都為“監測特定對象”,在獲得相應的數值之后,基于Bayes統計推斷,對目標的融合概率進行計算;在初步處理完成后,還應進行決策及判定等深層處理,最后完成身份的報告[2]。

表1 基于Bayes 統計的目標(數據)識別融合模型構成
1.2.2 基于Bayes 統計的目標識別融合步驟分析
基于Bayes 統計的目標數據識別及融合的一般步驟如下:第一,獲得每一個傳感器單元輸出的針對目標身份的說明值,即B 值(從B1到Bn)。第二,需要針對每一個傳感器單元對不同目標在“身份說明”方面的不確定性(以P(Bj|Ai)表示)進行計算(其中,i、j 的取值范圍均為1、2,…,n)。第三,對目標身份(不同類型數據)的融合概率進行計算,公式如下:
當B 的所有取值均具有相互獨立性,則對公式(8)進行變換處理后,得出的結果如下:
對公式(9)進行進一步變換之后,即可得到目標數據的識別及融合判斷依據(決策階段),表達式為:
基于上述原理,可得出的電網管理數據融合實現過程見表2。不同融合層次的性能對比結果見表3。

表2 基于Bayes 估計的傳感器監測數據融合實現過程

表3 不同融合層次對應的電網管理數據融合性能對比
基于Bayes 估計的電網管理數據融合技術應用于配電全景駕駛艙構建時,對應的倉庫硬件架構特點如下。
總體分為四個層級:最上層應該設置短信預警平臺、郵件服務器、4A 認證服務器、應用服務器等。次上層應設置數據展現服務器、數據倉庫服務器、數據集市服務器、備用數據倉庫。中層應設置FTP 服務器、文件服務器、調度服務器、文件服務器。最下層即應用層,包含諸多業務系統。通過上述方式構建配電全景駕駛艙的倉庫硬件架構之后,至少能夠得到一個中等規模的電網管理數據處理平臺,理論上每天能夠處理的最大數據量可達到20TB的規模。與這一數據對應的情況是,實時月處理電網管理數據量總共不超過10TB,這意味著配電全景駕駛艙平均每月能夠處理的電網管理數據最大值可以達到20TB×30(天)=600TB,與每月實際處理的數據總量10TB 相比,倍量關系達到60倍,差值達到59倍。此外,配電全景駕駛艙的總集群數量接近300臺,其中約有200臺搭載Hadoop 節點,總容量最大可達到8P,實際使用容量接近5P。
總體來看,配電全景駕駛艙技術下的數據倉庫具有面向主題、集成性及穩定性高、能夠清晰反映電網管理數據歷史變化的集合的優點,可以為管理決策提供強有力的支持。從數據角度來看,數據倉庫搭載傳統數據庫時,優勢更大。原因在于,“離線采集電網數據”這一功能可得到最大化發揮。此外,由于電網管理數據一般具有結構化呈現的特點,每天處理數據量不宜超過TB 集,數據倉庫一般在數十太字節到幾百太字節以內,數據倉庫一般為滿足內生的應用,可充分滿足內部決策支持分析需求[3]。
配電全景駕駛艙技術下的數據倉庫功能架構如下。第一,應用服務方面。訪問層,對應數據倉庫的門戶,涉及個性化定制、移動端、PC 端、信息交互等。應用層,主要涉及角色適配、權限管理、數據安全管理。第二,數據服務方面。數據封裝,涉及可視化工具、服務開發管理、服務運維管理等。數據層,需要分項處理中度中間層數據,包括處理后的數據融合。此外,還應處理輕度中間層、存儲層、接口層數據。完成各類數據的處理之后,將最終數據傳入“獲取層”,基于ETL 調度工具,在控制系統中的各個模塊中予以顯示,此時在全景駕駛艙大屏幕中便會呈現出監測對象的實景圖。
配電全景駕駛艙技術下的數據倉庫系統的主要功能是對電網管理數據進行運行維護管理。具體的管理分類如下。
第一,數據的質量管理。需要技術人員提前編制數據質量管理規則、基于程序控制算法對獲得的數據進行質量校驗。第二,元數據的管理。需要在系統內部設置明確的數據目錄,進而將不同類型的數據轉儲到對應的名目下,避免出現混亂。
對電力企業來說,與輸配電業務有關的數據類型可作如下分類:一是基礎類數據。包括線路桿塔臺賬、附件金具、桿塔明細、特殊區段、交叉跨越、班組、地理空間信息、運行規程。二是生產數據。包括巡檢計劃、派工單、工作票、巡檢記錄及報告、缺陷記錄、危險點記錄、隱患記錄。三是監測數據。包括電網及設備覆冰監測、大風監測、氣象監測、測溫監測、山火監測、防盜監測。四是環境數據。包括氣象預報、污染區域、覆冰區域、山火發生帶、地質災害發生帶等。五是運行數據。包括跳閘信息、負荷信息、潮流數據。六是經驗數據。包括林木生長、巡檢軌跡、專業知識庫數據等。基于配電全景駕駛艙技術完成數據倉庫技術架構構建之后,上述六大類型的數據在倉庫內會分別對應建立一個名目,且每個名目下方還會建立多個子名目。當有任何一種類型的數據得到上傳之后,智能管理系統首先會對數據類型進行甄別,之后將數據存儲至對應的名目的子名目之中,同時還應標注數據產生的時間。通過這種方式,電網數據的管理不會出現任何混亂情況,可真正實現“有序融合”。
完成數據庫架構的設置之后,除了將電網數據存儲進數據庫中之外,系統還需根據管理需要,在特定時刻完成對數據的提取及轉換。傳統的電網數據管理系統存在的問題是,從數據庫中提取的數據與之前存入的數據可能在格式、完整性方面存在偏差,以致無法滿足后續管理要求。造成這種現象的原因包括但不限于數據輸入時的格式存在錯誤、輸入錯誤或者不完整的數據等。
綜上所述,通過對海量數據進行收集、分析,可以總結出數據背后的規律。以此為基礎,當這種“規律”保持正常運轉的狀態,意味著產生數據的系統同樣保持正常工況;當“規律”出現異常,意味著相關數據偏離正常值,系統中的某些設備大概率出現故障。此時,監控系統通過對異常數據進行“逐本溯源”,便可通過“可視化”的方式,將故障發生位置和故障類型等實時呈現在監控屏幕之中,進而工作人員在第一時間進行處理,這對提高被監測系統的整體運行效率和質量均大有裨益。