馬建偉,覃 海,李穎杰,陳根軍
(1.貴州電網有限責任公司電力調度控制中心,貴州貴陽 550002;2.南京南瑞繼保電氣有限公司,江蘇南京 210000)
隨機森林是包含多個決策樹結構的分類器組織,其輸出類別由個別樹級輸出節點的所屬眾數屬性直接決定。在構建決策樹訓練集的過程中,需要不斷將原始數據集合分裂成多個子數據結構體,且所有被選中特征都必須按照既定次序進行排列,這些待選數據特征也叫備選信息集合[1-2]。
在電網應用環境中,多源數據間極易產生明顯的無故調度覆蓋行為,從而導致故障信息參量的無誤融合能力迅速下降。為避免上述情況的發生,文獻[3]基于門控循環單元網絡與模型融合,按需求靈活劃分不同規模的負荷聚合體,實現對負荷群體的預測。文獻[4]研究計數電力網絡中的數據傳輸總量,再根據相似度模型,確定與數據參量融合相關的度量匹配條件。但以上研究過程中綜合處置能力有限,很難實現對RTI、RBI 調度參量的同步提升。為此,文中在隨機森林結構器的支持下,設計新型電網調度多源故障信息的數據融合系統,并通過對比實驗的方式,突出說明該系統的實際應用價值。
電網調度多源故障信息數據融合系統的硬件執行環境由電網調度架構、信息管理模塊、多源故障分析模塊3 部分組成。
基于隨機森林的電網調度架構保持三級化連接形式,位于最上端的電網調度界面可直接控制下級融合代理程序,并可在標準融合網絡的作用下,形成完整的數據傳輸回路。在電網調度界面中,故障信息參量可實現自主化修復及多源性顯示,并可借助權限管理、數據管理等多項融合服務,實現各節點之間的信息互感。隨機型融合網絡與電網管理體系直接相連,位于整個調度架構中部,可同時負載數據通信、數據融合、信息緩沖、協議調度等多項應用處理服務,通常情況下,可按照多源故障信息的控制傳輸需求,實現對待融合數據參量的定向采集與處理。電網調度架構如圖1 所示。

圖1 電網調度架構
信息管理模塊作為電網調度架構的下級負載結構,以多源型管理中心作為核心執行元件。當電網故障信息錄入數據融合系統時,必須執行元件直接開啟對信息參量的調度轉接處理,并將未存儲的數據文件轉化為融合待存形式[5-6]。為使系統具備較強的融合處理能力,信息管理模塊可同時保持對數據參量的查詢與盤點功能,在確保多源故障信息完整傳輸的情況下,電網環境中的各項調度節點可直接執行已成型的代理應用程序,并可在隨機森林決策樹組織的作用下,建立與系統數據庫間的物理連接,從而實現已存儲信息參量的直接調度輸出,降低多源電網數據間的無故覆蓋占比水平[7-8]。
多源故障分析模塊與系統信息管理模塊屬于平級硬件結構,可在協調電網信息間輸入執行關系的同時,生成必要的信息流結構,并可借助既定處理器結構,實現對電網故障數據的傳輸與應用。在故障分析主機的作用下,調度處理器可將所有輸入信息平均分成多個等分結構體,再融合電力調度網絡中的暫存數據參量,形成束狀信息流體,以保證后續多源故障數據融合指令的順利執行[9-10]。為保證已輸入信息參量的無誤融合,電網環境中的多源故障數據不會在調度網絡中停留過長時間,且可隨著決策樹訓練子集的分配,實現對泛化誤差系數的精準調節。多源故障分析模塊結構如圖2 所示。

圖2 多源故障分析模塊結構圖
在相關硬件執行結構的支持下,按照基分類器搭建、決策樹訓練集分配、泛化誤差計算的處理流程,實現系統軟件執行環境的完善,與硬件設計兩相結合,完成基于隨機森林的電網調度多源故障信息數據融合系統設計。
基于隨機森林的融合系統基分類器采取決策樹連接形式(如圖3 所示),可按照遞歸分析的方式,實現對電網多源故障數據的傳輸與簡化處理,并最終生成倒立的樹狀結構,以縮短相鄰節點間的融合實施間距。常見的基分類器決策樹組織由頭節點、中間節點、尾節點共同組成(如圖3 中的0、1 和2),為保證多源電網故障信息數據的實時調度融合,0 節點通常代表與管理模塊相連的決策樹組織結構,1 節點作為中間傳輸單元,常與多源分析模塊相連,在尾節點保持穩定連接的情況下,2 節點可直接反映出電網故障信息數據的最終融合結果,從而提供決策樹訓練集樣本構建所需的多源參量結構[11-12]。

圖3 隨機森林基分類器結構圖
決策樹訓練集是與隨機森林相關的多源電網故障信息數據集合,能夠完全適應隨機調度指令的基本執行需求,并篩選出最符合系統融合標準的信息參量結構[13-14]。若以一個系統融合周期作為信息數據的既定判別時長,則決策樹訓練集的理論長度標準只受到電網調度權限及多源故障信息表征量的直接影響。電網調度權限常表示為q′,在整個數據融合周期內,始終保持相對穩定的波動變化趨勢。多源故障信息表征量常表示為,與其他應用指標不同,該項物理量不受除融合時長外其他信息參量的影響,具備較強的計算穩定性。設代表系統內一個數據融合周期的標準時長,聯立上述物理量,可將決策樹訓練集的理論長度標準定義為:

式中,wmax代表與多元電網故障信息相關的最大數據傳輸參量差,wmin代表多元電網故障信息相關的最小數據傳輸參量差。
泛化誤差是指電網調度多源故障信息數據融合系統中與隨機森林泛化反應能力相關的應用指標,通常情況下,泛化誤差實值越小,則代表系統所具備的學習性能越好,反之則代表性能越差。在決策樹訓練集分布樣本已定的前提下,系統融合泛化誤差數值受到決策樹節點數量、多源分布系數兩項物理量的直接影響[15-16]。決策樹節點數量可表示為,在隨機森林決策樹的作用下,該項物理量始終在上、下極值之間不斷波動。多源分布系數可表示為β,通常情況下,該項物理量的實際數值始終小于1,但對最終泛化誤差計算結果的物理作用能力始終保持為正向促進。在上述物理量的支持下,聯立公式(1),可將系統融合泛化誤差計算結果表示為:

式中,e0代表電網調度信息的下限波動極值,e1代表電網調度信息的上限波動極值,χ 代表多源故障信息數據的邊限處置量化系數。至此,完成各項軟、硬件執行條件的建立,在隨機森林決策樹的支持下,實現電網調度多源故障信息數據融合系統的順利應用。
為驗證基于隨機森林電網調度多源故障信息數據融合系統的實際應用價值,設計如下對比實驗。選取一電網調度設備作為實驗監測對象,將各階段記錄所得多源故障數據信息分別輸入實驗組、對照組融合控制主機中,其中實驗組主機搭載新型電網調度多源故障信息數據融合系統,對照組主機搭載無線多媒體融合系統。
為突出實驗結果的真實性,實驗所用多源故障信息數據均采取人工記錄的獲取方式,分別輸入實驗組、對照組監測主機后,待所獲指標系數趨于穩定后,開始后續的實驗結果分析。
RTI、RBI 調度參量均能反應多源電網數據的無故調度覆蓋能力,通常情況下,兩項指標的檢測實值越大,與之相關的數據無故調度覆蓋能力也就越低,實驗結果如表1、表2 所示。

表1 RTI參量對比表

表2 RBI參量對比表
分析表1 可知,在理想狀態下,RTI 參量指標基本一直保持穩定,僅在個別時間點處出現小幅度的波動變化狀態;實驗組RTI 參量指標在檢測前期出現小幅度上升的變化趨勢,從第40 min 開始,出現連續的下降狀態,全局最大值與理想化極值相比,上升了0.74;對照組RTI 參量指標則一直不斷下降,在達到極小值水平后,開始趨于穩定,全局最大值與與理想化極值相比,下降了0.44。
分析表2可知,在理想狀態下,RBI參量指標先上升、再下降的變化趨勢,且后期下降幅度明顯高于前期的上升幅度;實驗組RBI參量指標在整個實驗過程中始終保持不變,該數值與理想化極值相比,上升了1.31;對照組RBI 參量指標先階梯狀上升、再持續下降,全局最大值與理想化極值相比,下降了0.35。
綜上可知,隨著基于隨機森林電網調度多源故障信息數據融合系統的應用,RTI、RBI 調度參量均出現大幅上升的變化趨勢,不僅遠高于理想化數值水平,更是遠超無線多媒體融合系統的標準化數值參量狀態。
與無線多媒體融合系統相比,新型電網調度多源故障信息數據融合系統對原有電網調度架構進行初步完善,并聯合信息管理模塊與多源故障分析模塊,實現對決策樹訓練集樣本長度的準確度量。在隨機森林基分類器結構的作用下,系統融合泛化誤差的實際數值水平不斷下降,從根本上解決了RTI、RBI 參量始終不達標的問題,不僅避免了多源電網數據的無故調度覆蓋,也從根本上實現了對故障信息參量的無誤融合。