喻尋,劉寧,嚴奉軍,蒙雷,李義
(貴州電網有限責任公司畢節供電局, 貴州, 畢節 551700)
在生活水平以及工業生產越來越離不開電力的現代社會中,電網早已經成為了國民經濟發展的命脈,社會各階層都對電網的性能提出了更高的要求。電網運行狀態下如果發生事故,會直接導致整片區域的電力系統受到影響,進而造成巨大的經濟損失,因此,保障電網的供電安全,避免大規模電網事故的發生成為了電力系統的主要任務。相關的研究人員為此設計了若干面對電網運行狀態下事故發生概率預測的算法。
在現有事故發生概率預測方法研究中,有學者利用一個單調函數將所有數據特征權重串聯起來,但是由于各類權重差異化較大,導致線性回歸的預測模型所得到的結果數值準確性不高。有學者使用各項數據特征權重建立了多個數據樹,并以此構建概率數據集,但是一旦權重發生變化,就會導致整個概率預測算法需要重新運算,不僅降低了預測效率,而且預測結果準確率無法得到保障。除此之外,還有學者利用回歸分析的方式解釋變量與概率之間的因果關系,一旦事件過于復雜就無法實現特征權重的量化分析[1-3]。文獻[4]提出了一種基于溯因推理網絡的電網故障預測方法,通過溯因推理網絡對電網故障進行預測,將電網無故障運行時的數據與故障狀態下運行時的數據進行對比,計算二者差值,實現故障預測。實驗結果表明,該方法可以實現對故障的快速檢測,但是存在檢測結果準確性不高的問題。文獻[5]提出一種基于歷史故障信息的配電網設備故障概率建模方法,以實際歷史故障記錄信息為基礎,分析設備故障機理。分析設備故障影響因素,分析各個故障因素之間的耦合關系,根據分析結果構建故障概率模型。實驗結果表明,該方法同樣存在預測結果誤差較大的問題。
上述算法在高維數據融合后,在構建數據集的過程中都會出現較大的誤差,導致電網事故發生概率預測算法精度較差。為解決以上問題,對數據特征提取以及融合的過程進行優化,并設計一種新的電網運行狀態下的事故發生概率預測算法。該算法為了保證預測結果的準確性,在事故發生概率預測中充分考慮隨機數的問題,避免模型產生過度擬合,從而實現提高預測結果準確性的目的。同時,在預測中通過放棄部分復雜數據的方式降低算法的復雜性,加快算法的響應速度,實現算法優化。
電網運行狀態的數據中通常存在著較多無用以及冗余信息,因此想要得到能夠代入的信息就需要對其進行篩選與提取。在表格處理工具中將原始數據按照一定的規則合并成一張大表,然后以一定的規則對數據進行過濾篩選。為了保證特征提取的準確性,所有數據必須完全從電網運行狀態中復制下來,并經過噪音處理和異常值排查兩個步驟。通常情況下,只有數值型的數據才可以作為能夠直接進行特征提取的數據,因此需要對其中的一些文字型、符號型數據進行轉換處理,然后將這些數據統一量化。量化時需要將這些數據的均值編碼作為先驗概率和后驗概率的一個目標組合,將所有數據編制為一個訓練集,并在其中使用以下計算公式計算先驗概率。
(1)

(2)

得到了先驗概率和后驗概率的計算方法后,就可以將這兩項指標作為權重參數帶入到訓練集中。其后驗概率越高,該概率的可信度就越高。權重參數可以通過式(3)計算:
(3)
式中,λ表示數據集的權重參數,n表示該特征值在數據訓練中出現的次數,f表示該權重計算函數的參數,f越大,權重值隨n變化的速度就越慢,e表示權重參數推導的量化差。如此就能夠提取到電網運行狀態下數據的融合特征,并計算其權重值。
根據上述分析可知,所提算法通過計算得到電網運行狀態下數據融合特征的先驗概率和后驗概率,并將這兩項指標作為權重參數帶入到訓練集中,得到數據融合特征的權重值。解決了傳統方法由于不能準確計算各類差異化較大的事故權重數值,導致事故概率預測的精度較差的問題。
通過上文中的先驗概率、后驗概率以及權重值的計算,能夠得到從原因到結果的預測推理,此時應從近似推理的角度,通過一定的算法得到電網事故發生的概率,其計算的流程如圖1所示。

圖1 概率計算流程圖
如圖1所示,概率計算過程中的首要步驟是進行數據集的初始化,即構建一個聯合數據集,根據高維數據融合原理,設置CPT的分配參數,將G組織中的每一個團結點Xi作為一個覆蓋家族的基團,然后將P(Xi|π(Xi))存儲在團結點處,此時聯合數據的觀測值可以表示為xe:XE=xe。然后通過上文中的公式進行節點的數據傳遞與計算,每一個父節點都會與子節點兩兩相連,再經由子節點作為父節點向其他方向傳遞,從而形成一個樹形的網絡結構。信息傳遞主要可以分為兩個主要階段,分別是數據收集和數據分發階段,通過選定一個包含父節點的團結點作為樞紐,從距離父節點最遠處開始向父節點傳遞數據,直到將該條線路上的所有數據全部測定即可視為信息收集成功。而信息分發則正好相反,從父節點開始,向更遠處傳遞數據,直至傳遞到最后一個子節點,如此將該數據集中的每一個節點遍歷。在這個數據樹中,由三角形的環是構成電網事故的節點,每一個節點包含四個或四個以上的子節點,通過以下公式可以使其三角化。
(4)
式中,P(Xf|XA)表示電網中事故概率的計算結果,Xf表示父節點,XA表示子節點,xa表示該子節點所在的節點數。每當有新的數據信息時,就需要重新初始化數據集,并再一次計算事故概率,直至所有數據計算完畢。
根據上文中得到的概率數據,可以在設計電網事故發生概率預測算法的過程中首先構建一個基于概率數據集的訓練樣本X={(xa,ya)},且a=1,2,3,…,n。上文中由樹狀節點預測集成函數相加所得的模型可以表示為
(5)
式中,M表示訓練集數據樹的分支數量,α表示最終預測值,fk(β)表示第k個分支樣本的計算分值,且fk∈H,H表示一個由數據所組成的函數空間[6]。想要保證預測結果的準確性,就需要在該概率預測算法中考慮到隨機數的問題,為了避免模型過度擬合,可以在數據中加入代數公式作為預測模型復雜度的控制公式:
(6)
式中,?表示各概率數值的權重,λ、μ均為預測模型的參數,σ(fk)表示該數據集所得到的計算公式的復雜度,若σ(fk)>0.5,則可以放棄該部分數值,若σ(fk)<0.5,則可以將該數值作為預測算法的底層數據。通過放棄一部分復雜數據的方式降低算法的復雜性,加快算法的響應速度,對算法進行優化[7]。得到所有復雜度在0.5以下的所有數據以后,可以通過將目標函數展開為二階泰勒公式的方式,移除常數項,并進一步提高實際預測值的精度。

(7)
式中,π(t)表示第t次迭代時的實際預測值,fi表示損失函數的一階導數,gt表示預測算法中子節點的數目,yi表示預測遍歷的次數,ti表示損失函數的二階導數[8]。通過該公式,能夠得到所有事故發生概率的預測集合,然后可以通過式(8)和式(9)選出各子空間中的最優函數值。
(8)
(9)
式中,?j表示第j個數據集的最優權重,Ο表示所有預測數據中的最優函數值,J表示衡量該算法精確度的函數,函數的數值越低,表示該算法預測的準確度越高[9]。如此就可以通過對觀測數據預警的方式比較算法中各數據的準確度,最后選擇一個數值最高的概率預測結果,作為最后的輸出值,該輸出值就是電網事故發生概率預測函數。
本文通過實驗驗證高維數據特征提取與融合的方法建立的概率預測算法,是否具備實效性和實時預測的準確性。在該實驗中所使用的測試平臺為一臺具備Windows 10操作系統的計算機,其運行環境如表1所示。

表1 測試環境
將某電網系統一年內的電網運行數據作為原始資料,表2為具體的電網運行數據。

表2 電網運行數據
分別使用表格工具統計出詳細的正負樣本信息和特征分布結果,然后建立能夠應用在函數模型中的數據集,對比基于單調函數的事故發生概率預測算法、基于數據特征權重的事故發生概率預測算法和基于回歸分析的事故發生概率預測算法與所提算法的應用效果。
所提算法主要通過構建能夠平衡各高維數據特征屬性的數據集來對概率預測算法作出優化,因此可以通過對比數據集的方式判斷不同算法的性能。為了保證實驗結果的準確性,在數據集的構建中有兩項必不可少的指標,分別是權重與編碼,以下實驗主要以這兩項參數作為評價指標。權重衰減因數通常表示各項事件權重的影響參數,衰減因數越大,則該數據集的準確性越強。對編碼因數的測試,則是因為通過數據子樹節點可以將所有整條路徑進行編碼,進而實現對所有遍歷路徑的整理,因此編碼因數越小,其所需要經歷的概率數值就越小,計算結果越準確。在計算權重與編碼因數時,將默認參數設置為0.063 3,得到的對比結果如表3和表4所示。
如表3所示,四種算法的權重衰減因數存在一定的差異,所提算法的權重衰減因數明顯高于其他三種算法,其權重衰減因數最高值達到了0.87。表4中所提算法的編碼因數均小于其他三種算法,其編碼因數最低值僅為0.14。因此

表3 權重衰減因數對比

表4 編碼因數對比
可以得知,所提算法建立的數據集準確度高于其他三種算法。
根據以上數據集,可以得到概率預測的函數模型,將該函數模型帶入到原始數據中進行測試,通過前一刻的電網運行狀態預測下一刻的電網事故發生概率。與當前的三種算法對比,以電網規模為橫坐標,以預測的誤差為縱坐標,得到如圖2所示的實驗圖像。
如圖2所示,曲線所代表的誤差均在0以上,表示算法得到的概率預測數值均大于樣本數據。而傳統算法在概率預測中的誤差大于所提算法,說明所提算法的預測精確度更高,誤差最小。

圖2 不同算法預測準確度對比
上文基于電網運行狀態下事故發生概率預測精度較低的問題構建了一個新的概率預測算法,并通過實驗驗證了該算法的準確性,相較于當前算法預測誤差更小,能夠為電網運維人員提供一定的支持。所提算法可以有效避免大規模電網事故的發生,對于電網供電安全保障領域具有一定的實際應用價值。