劉 洋
(內蒙古電力(集團)有限責任公司內蒙古電力經濟技術研究院分公司,內蒙古 呼和浩特 010020)
黨的“十四五”規劃中提到,我國電力企業開始實現高質量發展,新時代下,要不斷優化電力需求的預測方法,更好地實現節約能源的目標,促進電力企業的健康發展。在以往傳統的電力需求預測模型中,模型的構建主要是考慮區域內的平均用電量以及最高用電負荷,這種預測模型還不能夠最大化地節約電力能源,因此需要研究出新的電力需求預測方法。
隨著科技水平的不斷提高,人們越來越離不開電力,很多行業的自動化發展也依賴于電力能源,各地區的用電量都在不斷增加,人們對于電力的需求也在不斷增長。在這種情況下,電力企業在增加了一定機遇的同時,也增加了許多壓力,電力企業為了更好地滿足不斷增長的電力需求,提出了對電力使用客戶進行電力需求測試的方法,對于電力客戶的用電總負荷量進行分析,從而完善自身的供電系統。
進行電力客戶服務預測工作也是為了滿足社會發展的需要,電力能源是當今社會發展的基礎能源,各行各業的工作都離不開電力能源,因此,電力企業的發展影響整個社會的發展。而電力客戶服務需求預測工作是電力企業發展所邁出的一大步,是電力企業適應新的社會環境以及提升自身服務水平的重要工作,也是保障電力企業節約能源、提高供電效率、提升供電質量以及實現智能化供電的重要舉措。
對傳統電力需求預測模型進行研究,發現傳統電力需求預測模型還存在2點不足:1)傳統電力需求預測模型中的一部分只是按照歷史相關資料進行判斷預測,沒有考慮經濟發展和社會變化等外界原因造成的影響。2)傳統電力需求預測模型中還有一部分只對外界原因造成的影響進行主觀判斷,沒有從大量的資料數據中選擇重要的依據。
為了能夠構建更為智能化的電力客戶服務需求預測模型,就要對電力使用客戶進行分析,首先通過構建電力客戶細分模型的方式進行分析,然后根據分析得出具體數據,最后將數據作為需求預測模型的構建基礎。電力客戶細分模型的構建以人口信息、企業法人信息、宏觀經濟信息以及其他經濟信息為依據,首先通過這些信息來搭建一個數據倉庫;然后對數據庫內的信息進行分析和抽取,在抽取出客戶的行為特征和自然特征中加入新的維度進行分析;最后得出模型的特征,電力客戶細分數據分析的過程如圖1所示。

圖1 電力客戶細分模型功能圖
數據倉庫是基于數字化技術構建的,隨著科學技術的不斷發展,數字化技術也在不斷的進步并得到了廣泛的應用。在電力客戶數據系統中,雖然有電力監控、電力自動化辦公以及財務等數據,但是隨著系統業務量的不斷增加,這些數據也處于一個不斷更新、修改和刪除的過程中。因此,在滿足電力客戶細分模型的需求的基礎上,該文構建了一種新型的數據結構模型。用該模型來搭建電力用戶需求數據倉庫有效地節省了數據的儲存空間,使得數據的刪除周期變得更長,提高了數據儲存的有效性。從個人用戶信息的方向進行分析,首先采集電力用戶的個人信息、社會保險信息以及地域特征信息,其次通過這些信息進而分析個人用戶的電力價值,最后利用采集到的信息建立起用戶個人價值的區域圖。如圖2所示,圖中包括用戶的社保信息、公民個人信息、企業信息、住房公積金信息以及生活保障信息,這些信息能夠間接反映出用戶的電力價值,并將電力價值作為依據,對用戶進行區域劃分[1]。

圖2 區域用戶電力價值組成圖
區域用戶電力價值組成圖的信息采集是以區域內的宏觀經濟和商業價值為依據。其中,區域內宏觀經濟信息的采集是通過當地的資產投資數據、貿易往來數據以及物價指數數據來進行綜合采集的;主要是對當地的貿易活動進行調查,再通過采集的信息將用戶進行劃分。區域內商業價值信息的采集主要是分析當地的商場信息、企業信息以及法人信息等,將數據進行分析抽取,以此來劃分電力用戶。
在構建數據倉庫以后,要對數據進行清洗與挖掘,開展數據清洗與挖掘工作的目的是從大量的電力用戶信息中找到構建模型所需要的數據。數據的清洗一般使用數據集成工具軟件來進行,該文使用東方通(數據倉庫技術,Extract-Transform-Load,簡稱“ETL”)工具軟件來完成數據的清洗工作,最終清洗留下的數據為性別、民族以及跟身份證號碼設置有關的一系列信息;將這些數據用于電力客戶服務需求預測的基礎[2]。
在清洗挖掘得到有用數據后,利用聚類算法對數據進行分析計算;首先隨機選取若干個質心,其次計算每一個數據樣本與這些質心的相似程度,最后選擇一個相似程度最高的數據作為該組數據樣本的類別。該文在對數據進行聚類計算的過程中,要依據上述分析得到的區域用戶電力價值組成圖,聚類計算在該文中的作用是可以有效解決信息孤島的問題,同時還能加強資源共享,將用電的企業與用電的個人用戶區分開來。首先該文在運用聚類算法對數據進行分析的的基礎上提出了不同數據樣本之間然后根據這個觀點,然后根據這個觀點再求出數據樣本之間的相關系數。根據分析可知,數據樣本之間的相關系數<0時,2個數據樣本之間成負相關;最后以數據樣本之間的相似程度為依據來劃分聚類中心。電力客戶的具體劃分過程為:1)進行數據讀取工作以及提取數據特征工作,初始的數據集合是根據居民綜述以及特征維度來構成的。2)從數據集合中選取幾個樣本,將這幾個數據樣本作為最開始的聚類中心。3)計算數據樣本的相似度指標,將每次計算的均值作為新的聚類中心。4)不斷重復聚類計算法,劃分聚類中心,以此作為構建電力客戶細分模型的依據。
電力需求的相關預測是從以往的歷史記錄中總結運行規律,并建立預計估算的相關模型對將來使用電力的具體要求進行判斷。出于外界、主觀等因素的影響,電力相關需求在正常情況下,具有連續性強、變化速度快和季節差異大等特性,使電力部門無法對用戶的具體使用電量情況進行判斷推測。從影響電力客戶服務需求的角度分析,根據時間、氣候、社會等影響因素構建電力需求的模型,其中使用的相關數據有4類:1)宏觀經濟指標。這種指標是展現當地經濟情況的一種形式,由當地內部經營生產總額、通貨膨脹、通貨緊縮、商業相關資金投入、人群消費以及支出財政等組成,這種指標對我國宏觀經濟調整控制有重要的作用。我國第一、二、三種產業的總投資額度,在制造方面、文化娛樂方面以及基本設施的建設總體投資額度等。2)每年電力總體消費數據。3)數據是已經成立的用電客戶總體數據的細化。4)3種產業的總體用電量,用戶消費及收入等數據。從上述信息可以得出,該文使用BP這種神經型互聯網絡建造有關居民電力要求的測試模型。
為了更好地對電力客戶需求進行預測分析,除了根據外界主觀因素進行預測還可以從其他方面對電力客戶需求進行預測分析。下面從網絡層、神經元數量、初始設置網絡權重和學習速度等4個方面對電力預測模型進行設計。
4.2.1 網絡層方面
雖然使用更高的網絡層能夠使電力預測模型的性能得到提升,但在一定程度上也會導致訓練效率降低。因此,設計輸入、隱藏和輸出這種3層的網絡層模型是十分必要的。
4.2.2 神經元數量
首先是輸入層次神經元節點,輸入層次的日常工作是對數據進行加載。因為超出一定數值的使用節點會吸引更多的雜音,相對較少的使用節點又會導致互聯網得到的資料數量不夠,不能很好地滿足需要。所以設置網絡的使用節點最好為65。其次是輸出層次神經元節點,同時對5個位置的電力使用情況進行評測,輸出層次的使用節點數量可以設為5,輸出層次的使用節點相當于得到5個位置的電力使用情況。最后是隱含層次神經元節點,隱含層次的使用節點公式如公式(1)所示。

式中:h為隱含層次的使用節點,0.02 m<h<4 m;m為輸入層次的使用節點;n為輸出層次的使用節點;a是1和10之間的常數,1<a<10。
由式(1)可知,該文設置的隱含層次使用節點為18。
4.2.3 初始設置的網絡權重及學習效率的制定
網絡層面的學習效率與網絡權重關系密切,如果將學習效率制定過高就會導致整體網絡權重降低和網絡出現不穩定的狀況;如果學習的效率小于一定數值又會使訓練花費的時間變多,使網絡部分出現最小數值。因此,工作人員將學習效率調到0.01,以保證網絡中的訓練相對穩定。
為了不使網絡的部分得到最佳,該文使用一種新型的附加動量方式使網絡的權重得到調整。附加的動量方法是通過用一種動量因子對網絡相關權值進行調整,減少網絡權重進入平坦地區。可以通過對動量因子的調整使網絡跳出最小的區域,對閾值進行調整;在發生較大錯誤時可以取消這次更新,減少網絡出現大范圍的錯誤,可以使用下面的公式對相關條件進行設置來確定是否對權值進行修改。
如果動量因子為0時,E(k)>1.04E(k-1);如果動量因子為0.95時,E(k) 根據某地區電力相關信息情況,建立經濟信息資料庫、地區往年使用電力的消費信息資料庫、政府相關政策的數據信息資料庫和用電客戶詳細信息資料庫等圖表。在信息資料庫建設過程中將相關的身份資料刪除,選擇其中1 446 000個用戶作為用電判斷的樣本進行模擬分析。根據這些樣本將這座城市以區域劃分不同的類型:工廠區域、購物區和住宅區,住宅區存在使用電力量大、使用電力人數多和電力信息復雜等特點,該文以居民日常和工作用電量作為研究憑證,根據企業有效資料對用戶情況加以分析;同時根據居民繳納的電費金額和實際的電力花費把使用電力客戶分為以下4類:1)常生活使用電量(A類)。2)工廠工作使用電量(B類)。3)鄉村種植使用電量(C類)。4)貿易活動使用電量(D類)。用電客戶詳細分類的成果如下,A類客戶的用戶數量為27 863,企業數量為289。B類客戶的用戶數量為111 764,企業數量為791。C類客戶用電數量為193 670,企業數量為1 650,D類客戶的數量為1 112 750,企業數量為7 706。為了使文章提出的聚類計算方法更加真實可靠,工作人員將傳統算法與聚類計算方法的相關性能進行對比,對比結果如下:1)算法中類內的距離平均值傳統算法為0.5754,聚類計算方法為0.5452。2)類內具體的系數傳統算法為0.6362,聚類計算方法為0.8164。3)類中心的相對平均數值傳統算法是1.3059,聚類計算方法為1.2516。4)類中心實際系數傳統算法為0.3919,聚類計算方法為0.3017。具體電力預測誤差見表1,從這些數據可以看出,該文提出的相關方法在距離這種屬性中表現并不突出,但是從增加樣本的相關上看成果顯著[4]。 表1 電力預測誤差的百分比 綜上所述,電力客戶服務需求的預測是為了滿足社會發展的需要以及不斷增漲的電力需求。該文研究了一種基于大數據分析的電力客戶服務需求預測方法,首先該預測方法是根據電力用戶的外在信息來構建客戶模型,并利用該模型對預測方法進行研究;然后從多個因素的角度來進行預測;最后根據仿真與測試結果的驗證表明該預測方法能夠更好的滿足客戶對于電力的需求。5 仿真與試驗結果

6 結論