楊旭昕
(國網信息通信產業集團有限公司 北京市 100053)
我國經濟的快速發展,使人們的生活水平追殲提高,在目前的發展情況下,我國電力行業的競爭月越來越激烈,如果電力企業不想在日益發展的情況下唄淘汰,就必要做到企業結構的統一,同時要注重創新,積極引進新設備以及新技術,增加企業發展的步伐,提高企業的效率。企業只有整合內外經濟實力,才能實現最大程度的可持續發展。電力系統是最基本的建設,所有企業都必須對信息、數據、進行全面管理。為了保證有效的數據報告,必須改變原有的統計程序,對分析方法進行改革,以保證店里處理的穩定性和安全性。
數據挖掘是高層次的過程,它從未知的人類預先發現的數據中提取有價值和潛在的知識信息,并提供人類可以通過技術手段理解的模型,從大量復雜的不完整數據和未知的新信息中發現信息的高層次過程。數據挖掘包括數據庫系統、數據可視化、自動學習和高新技術
數據挖掘技術是在機器學習的基礎上發展起來的,它的優勢包括:
(1)傳統的機器學習是為了提高學習的能力,而數據挖掘技術能夠提供有價值的信息,使其更加實用;
(2)傳統的機器學習側重于小數據源,而數據挖掘側重于大數據庫,可以有效地處理大的、不完整的和有噪聲的數據元素,這種方法可以從多個方面總結學習知識,揭示理論和基本假設不能滿足的知識[1]。
(1)數據分類是指對數據類別進行分類,利用分類技術建立模型;
(2)數據評估,與數據分類類似,主要區別是評價是連續值處理的輸出;
(3)知識預測是對數據進行分類或評價,獲得數據模型,然后對未知變量進行預測。
數據挖掘技術主要分為資料準備、勘探、評價三個階段。數據準備主要包括數據過濾、轉換和預處理,主要任務是建立數據評價模型。
對于企業來說,數據挖掘可以幫助企業發現發展趨勢,揭示已知事實,預測未知結果,分析完成任務所需的關鍵因素。數據挖掘的目的是提供數據庫中隱藏的知識,從而發現數據庫的主要功能。
1.4.1 自動預測趨勢和行為
歷史數據用于尋找規則,建立模型,預測未來數據的類型和特征,一個典型的例子是市場預測,數據挖掘利用之前的推廣數據來尋找投資回報最高的用戶,包括預測破產和確定最有可能對某一事件做出反應的情況。
1.4.2 關聯分析
數據鏈接是理解數據庫的一個重要方面,如果兩個或兩個以上變量的值具有一定的規律性,可以是簡單相關、時間相關和因果相關。在數據庫中進行隱式連接分析的目的是找到我們有時無法連接到的數據,關聯分析規則確定數據庫中數據的相關性。
1.4.3 聚類
數據庫記錄可以分為一系列重要的子集,即集合。分組有助于更好地理解客觀現實,分組技術主要包括傳統的模式識別和數學分類。概念分組技術的關鍵不僅是要考慮對象之間的距離,還要要求分類范疇具有一定的內涵,以避免傳統技術的單向性。
1.4.4 概念描述
概念描述用于描述對象類型及其相關屬性,概念描述包括特征描述和差異描述,生成的對象類描述應用于對象類的所有屬性,生成函數描述的方法包括決策樹和遺傳算法[3]。
1.4.5 偏差檢測
數據庫中的數據通常都有異常記錄,將這些記錄與數據庫進行區分是非常有用的,差異識別包括許多基本技能,如分類差異、模型觀察與預測差異、某一時期的定量變化等,確定差異的基本方法是檢測預測差異。
傳統的電力負荷測試方法很多,應用復雜,相關技術人員應考慮實際要求,結合技術特點,選擇合適的方法,下面是對各種常用方法的簡要介紹。
電力彈性系數是平均能源增長率,彈性系數法的優點是可以更好地了解能源負荷的增長趨勢和變化范圍,然而,由于近年來產業結構自適應彈性系數的重要性,該方法更適合中長期負荷預測,預測數據更可靠。
該方法是上個世紀我國第一個實驗預測方法,經過研發,取得了良好的效果。在一段時間內,所有隨機過程都被認為是灰色的。該技術具有數據小、分布和方向變化大、操作舒適、預測時間短、識別更舒適等優點。缺點是不利于多年能源系統的長期預測。
該方法基于模糊理論,首先,以規則的形式對,歷史資料進行分析,模糊預測方法能清晰地描述專家的想法和系統中的不規則現象,適用于中長期負荷預測。同時模糊預測法也存在著一定的不足,比如其容易受到外界環境的干擾。但模糊預測方法能夠把線性模型和聚類方法結合,應用于電力負荷預測中,于傳統的預測方法相比,模糊預測方法的預測精度較高,誤差較小。
數據挖掘,就是將大量隱藏的信息提取出來,并直觀地表達出來,它在處理大數據和消除冗余信息方面具有許多優點。決策樹、神經網絡、關聯規則、聚類分析、模糊統計數據集和原始數據集廣泛應用于數據挖掘的各個領域,該方法根據相似時間序列數據挖掘原理,在電力負荷預測的基礎上,具有良好的應用效果,判別聚類區間和單調約簡閾值函數應使用正確的負荷曲線和網絡時間數據;降低了數據處理速度,提高了測量速度和計算精度[4]。
回歸分析方法有兩種,分別為線性和非線性,回歸分析方法是通過對所預測的電力以往的趨勢,來預測未來邊涼去濕的過程。線性回歸又分為一維線性回歸和多維線性回歸,兩者的區別在與負荷預測過程中所受影響因素的多少,影響因素為一個時,稱為一維線性回歸,影響因素在一個以上時成為多維線性回歸,然而在實際負荷預測過程中,影響因素是不斷變化的,因此回歸分析方法不能夠精確的反映出負荷與多個因素之間的關系。
將負荷數據視為時間序列隨時間變化,如小時、日、周、季等。實際負荷數據與預測負荷數據之間的差異是一個隨機過程。在實際應用中,負荷的變化受到與荷載因素的影響。時間序列不是一個固定的隨機過程,而是一個不確定的隨機過程,因此,該方法有一定的局限性,不能準確預測。
負荷預測方法有很多,如基于實測信號頻率的波動預測,通過頻譜分析和處理,捕獲弱信號和任意分量,得到負荷預測值,波浪預報可以有效地應用于各種預報系統,功率因數法是利用平均能源增長率與增長率之比,將電網彈性系數與增長率相結合的一種有效的負荷預測方法。
當前負荷預測是基于對現有和當前數據的提取,所以即使未來的能源負荷是不確定的,也有一定的規律,基于正確軌跡的預測是評價未來發展趨勢和條件的基本原則。
(1)可見性原則。預測對象具有一定的規律性,可以把握預測對象的發展趨勢,所以可以通過總結預測對象的過去和現在來推斷預測對象的未來,可見性原理是預測活動的基本依據。
(2)概率原理。要預測一個具體指標,就要根據未來負荷發展的各種可能性,預測各種假設。
(3)追溯性原則。也就是說,預測值與實際值的差值可以用來進一步調整預測精度[5]。
影響負荷變化的因素有很多,如宏觀經濟的發展和經濟結構的調整,能源使用結構的變化,人們收入和生活水平的提高,消費觀念的變化,管理和相關政策的影響,影響短期負荷的主要因素包括負荷組成、時間變化、氣候變化和隨機波動。
傳統的負荷預測是根據已有的歷史數據對未來某一時期的負荷進行預測(即固定預測模型),在一定程度上,它忽略了大量的歷史負荷及相關數據,其中包含了許多有價值的負荷預測信息和知識。
數據挖掘,對于發現隱藏的信息是必要的,但目前數據提取技術在負荷預測系統中的應用還處于實驗階段,這方面的研究還處于起步階段,但前景廣闊。
電力系統的性能主要與系統中電氣設備的總能耗有關,供電預測主要是指社會、經濟和氣象數據。通過對電力系統歷史數據的分析,對電力系統的點能分配和利用方案進行評價和預測,對提高供電的經濟效益和社會效益具有重要意義。
5.2.1 利群數據分析
對采集到的數據進行預處理是進行電力負荷預測的前提,數據預處理主要是糾正和識別錯誤的數據,通過補充自然數據、分解影響數據或糾正不必要的數據,數據挖掘應用于電力系統負荷預測,可以準確地發現異常數據,獲取可能產生異常數據的設備故障,為決策提供信息。
5.2.2 確定負荷模式
不同工況下,負荷可能有不同的模式,但總負荷循環的趨勢是相似的,有一定的規律性。在相應的負荷條件下,可以發現類似的峰值和負荷曲線數據,在不同荷載條件下進行建模有助于發現不同荷載的相似之處。
5.2.3 電力負荷預測
目前,神經網絡主要用于負荷預測,包括變量數據的類型、歷史負荷曲線和神經網絡輸入數據。為了提高網絡計算機的速度和效率,選擇一個合理的學習對象,確定輸入對象非常重要。通過對輸入變量的處理和分析,提高了神經網絡預測的性能和準確性,提高了工作效率。
5.2.4 典型負荷預測模型
典型負荷預測模型是能源系統負荷預測的主要內容,通常包括負荷數據和氣象數據。氣象數據更加準確真實,并經過當地氣象局的驗證,能源系統負荷預測對能源系統的正常運行具有重要意義,此外,典型的負荷預測具有一定的特殊性、高效率,這也是傳統電力數據挖掘缺乏的原因。
5.2.5 數據預處理
數據預處理技術是現代能源信息綜合預測的主要技術,數據處理技術可以消除一些時間誤差數據,在一定程度上避免這些數據對系統性能的影響。如果性能數據不正確,會對性能負載預測產生很大的影響。采用數據處理技術對數據進行清理,為能源系統負荷預測的正常運行奠定了堅實的基礎。除了數據處理技術,還必須注意負荷的變化。若數據加載出現異常變化,請及時停止加載,并將測試數據與其他內容進行比較,判斷是否有疑點。因此,數據預處理在電力系統的發展中起著重要的作用,在實際負荷預測中,數據預處理是最重要的條件,只有明確數據預處理的重要性,才能更好地預測電力系統的負荷。
總之,與傳統技術相比,數據挖掘技術在電力系統中得到了廣泛的應用,并得到了企業的認可。專業供電系統科學預測的必要性是通過預測現有的市場和發展趨勢來規劃未來的市場。預測結果是電力系統規劃和建設的依據,為保證電力系統的穩定發展、科學管理和現代化,采取了重要措施。數據挖掘技術大大縮小了與原始技術的差距,提高了數據的完整性、及時性和預測結果,為電力系統行業的發展做出了突出貢獻。