肖一兵
(鳳凰縣供電公司,湖南鳳凰 416200)
相關數據調查顯示,引起用戶停電次數統計中,超過80%的停電為配電網故障所致,降低配電網故障,提升配電網的可靠性,對于電力公司保障用戶用電的可靠性及安全性有著重要作用[1]。因此,有必要加強配電網故障預測,并在其故障預測過程中,注重數據挖掘技術在其中的應用。所以,針對“基于數據挖掘技術的配電網故障預測”進行分析與研究,具有一定價值。
配電網故障預測是從配電網可靠性預測發展而來,目的是通過配電網故障數據分析和故障影響因素分析,了解配電網故障和有關影響因素之間的關系,構建故障預測模型,最終完成配電網一定時間區域范圍故障的預測。從現狀來看,配電網故障預測并無確切的規范可參照,通常會根據電力企業對故障預測結果的實際需求,同時結合預測模型的最優化原則,從而確保配電網故障預測的時間及范圍。在配電網故障預測過程中,有必要遵循一定的原則。
(1)可行性原則。對于配電網故障預測來說,可行性原則體現在要求配電網故障預測所需影響因素可以量化,數據具備可收集和可用性。所以,為了滿足可行性原則,有必要加強和電力企業之間的溝通交流,做好配電網信息系統調研方面的工作,盡可能掌握預測所需數據對象的實際情況[2]。
(2)合理性原則。通常情況下,配電網故障有復雜的特點,且一般由多因素所致。因此在相關影響因素分析過程中,需遵循全面合理性原則,從而為配電網故障預測提供全面有效的信息支持。
(3)科學性原則。配電網故障預測過程中,所選擇的輸入變量需確保具備一定的科學性,即確保故障影響因素的科學性,進一步選擇合理科學的分析方法,對故障的相關影響因素加以明確,在分析過程中包括理論分析方法和數據分析方法。總之,需遵循科學性的原則,為配電網故障預測提供有效憑據。
數據挖掘,指的是基于海量、存在噪聲以及不完全數據當中,通過半自動或者自動提取的方法,將相關有用的信息及知識提取出來的過程。數據挖掘步驟較多,并且每個步驟之間密切聯系,數據挖掘期間通常需以挖掘數據所獲取的知識進行迭代調整。數據挖掘技術是在多學科技術的基礎上發展形成的,涵蓋了數據庫技術、機械學習、統計學以及高性能計算等。數據挖掘不但可以將數據規則查找出來,而且還可以結合其規律,針對尚未發生的數據進行預測。以在配電網故障預測當中的應用為例,通過數據挖掘技術的應用,能夠發現配電網的一些故障,從而為進一步配電網的安全、可靠運行提供必要的數據支持[2]。
(1)對預測任務加以明確。即結合實際的預測需求,對配電網故障預測的目的和具體任務加以明確。
(2)做好數據準備工作。首先應做好數據收集工作,應明確數據準備的好壞將影響到數據挖掘的效率和準確度,而數據來源于各類檢測數據平臺,如配電自動化系統、調度自動化系統、電網氣象信息系統、電能質量檢測管理系統、生產管理系統、用電信息采集系統、配電變壓器負荷檢測系統、營銷業務管理系統、ERP(Enterprise Resource Planning,企業資源計劃)系統、95598客服系統等。其次,進行數據提取,即在分析配電網故障預測問題的基礎上,對數據挖掘的對象加以明確,進一步針對目前具備的數據做好調研分析工作,然后從當中選擇有所保障的數據源,將數據提取的標準作為基礎,確保數據提取的可靠性及有效性。再則,進行數據預處理。即對沒有處理過的原始數據,通過清理、集成、變換等方法處理、提取數據,將原始數據潛在的數據質量、可用性問題加以解決。然后,進行離群樣本分析。針對數據預處理后的數據,使用離群樣本檢測技術,剔除不需要的數據,保留有用數據[3]。最后,對數據進行探索分析。對于原始數據來說,一般通過數據預處理和離群樣本診斷,可以直接使用到數據挖掘建模當中。但是,配電網故障影響因素有復雜多變的特點,需進一步進行故障規律及趨勢分析。并且,有必要針對預處理過后的數據進行特征選擇。其中,配電網故障的某一種影響因素量化之后,稱作故障特征變量,特征的選擇和優化的基本任務便是在諸多特征當中將最為有效的特征查找出來,將冗余特征剔除,同時剔除重復特征等。
(3)做好挖掘建模作業。做好數據準備工作之后,結合數據挖掘的目標,選取合理的數據挖掘算法,構建配電網故障預測模型,并在模型評價方法中選取合適的模型。
(4)結果分析及應用。在預測數據結果分析和應用過程中,主要利用數據可視化及模型解釋等相關方法,針對配電網故障預測實施對應的解釋評估。解釋評估之后,把故障預測結果納入配電網決策及優化過程中,從而確保配電網故障預測工作的優化及完善[4]。
通過上述分析過程,對數據挖掘及在配電網故障預測當中的具體應用有了一定了解。值得注意的是,基于數據挖掘技術的算法選擇也非常重要。例如隨機森林算法。該算法主要將大量的分類樹生成,然后經投票法或算術平均值決策進行組合,再將相對公平合理的決策結果求解出來,進一步將分類或回歸問題加以解決。基于大數定律的保障之下,隨機森林算法的泛化誤差存在上限,具備非常高的分類準確率,沒有擬合的情況出現,使饋線故障結果具備更高的指導價值作用[5]。圖1為饋線月故障等級預測流程,將待預測的饋線故障特征變量作為模型輸入,然后選擇出最優的故障特征變量,并通過負荷預測明確運行影響因素,進一步由饋線故障預測模型當中的分類樹獲取出多個預測結果,最終以相對多數投票法,求解饋線故障預測結果。
配電網故障預測是保證配電網安全可靠運行的一項必要工作項目,為了確保配電網故障預測的有效性及科學性,有必要注重先進科學方法的應用。研究結果顯示,數據挖掘技術在配電網故障預測當中能起到理想的作用,為配電網故障預測提供真實有效的數據支持,因此需重視數據挖掘技術的應用,為配電網的安全可靠運行奠定基礎。

圖1 饋線月故障等級預測流程