鐘小強 陳程 董雨 李春生 徐冬冬
摘要:基于電力負荷特性分析,電力公司能夠為用戶提供更好的服務。以前的分析不能很好地表達用戶的用電負荷特性,因此,采用SOM神經網絡聚類方法來解決這個問題。先對獲取的數據進行歸一化處理,然后采用MATLAB仿真輸出可視化聚類結果,最后得到了一個詳細的分析結果。根據SOM神經網絡顯示的結果,不同類型公變用戶的用電行為是有差異的,因此有一個很好的聚類效果。
關鍵詞:SOM神經網絡;負荷特性曲線;聚類分析
中圖分類號:TM7 文獻標識碼:A 文章編號:1007-0079(2014)33-0204-03
在國家提出建設堅強智能電網的背景下,提高電力營銷服務水平和智能用電技術已成為電網企業關注的焦點。電力營銷服務水平與智能用電技術的提升離不開在對電力用戶用電行為特征的準確、全面、及時地掌握,而從海量負荷數據中提取用戶日負荷特征曲線并進行深入分析成為研究用戶用電行為特征的一種有效方式。
從研究對象層面來看,以往相關研究側重專線用戶(負荷數據來源為SCADA系統)和專變用戶,并以傳統意義上的行業分類作為提取負荷特征曲線時聚類的依據。從研究方法層面來看,電力用戶日負荷特征曲線的提取多使用聚類算法,主要有統計方法、機器學習方法、人工神經網絡方法和面向數據庫的方法。人工神經網絡因具有大規模的并行協同處理能力、較強的容錯能力、聯想能力、學習能力和自適應能力,故能夠較好地適應海量數據背景下的數據挖掘。應用較多的典型的神經網絡模型包括BP網絡、Hopfield網絡、ART網絡和Kohonen網絡。[1-3]BP網絡屬于有監督學習的神經網絡,需要提供聚類對象類別數量的先驗知識,而公變用戶缺乏傳統意義上類似專變用戶的行業分類,故不適合采用BP網絡。Hopfield網絡、ART網絡和Kohonen網絡都屬于無監督學習的神經網絡,在解決聚類問題上有其各自的優缺點。
本文提出采用SOM神經網絡[4-6]聚類算法提取公變用戶日負荷特征曲線,用MATLAB軟件進行仿真,輸出可視化聚類結果,并對聚類結果進行分析,驗證了采用SOM神經網絡聚類算法提取出的公變用戶日負荷特征曲線能夠較好地顯示不同類型公變用戶用電行為特征上的差異,具備良好的聚類效果,同時為電網企業優化電力營銷服務提供參考和指導。
一、SOM神經網絡
SOM(Self-Organizing Map,自組織映射)神經網絡是較為廣泛應用于聚類的神經網絡。它是由Cohonen提出的一種無監督學習的競爭型神經網絡模型,通過不斷縮小獲勝神經元的鄰域來達到聚類的目的。主要功能是將輸入的高維空間數據映射到一個較低的維度,通常是一維或者二維輸出,同時保持數據原有的拓撲邏輯關系。
SOM神經網絡由輸入層和輸出層兩層組成,輸入層中的每一個神經元通過權與輸出層中的每一個神經元相連,如圖1所示。輸入層的神經元以一維的形式排列,輸入神經元的個數由輸入矢量中的分量個數決定,輸出層的神經元一般以一維或者二維的形式排列,計輸入層的神經元數量為m,輸出層神經元數量為c。輸入的樣本總數為n,第i個輸入樣本用矢量表示為,每個輸出神經元的輸出值記為,。與第j個輸出神經元相連的權用矢量表示為:。
Kohonen算法是無教師示教的聚類方法,它能將任意維輸入模式在輸入層映射成一維或二維離散圖形,并保持其拓撲結構不變,即在無教師示教的情況下,通過對輸入模式的自組織學習,在輸出層將聚類結果表示出來。此外,網絡通過對輸入模式的反復學習,可以使連接權矢量空間分布密度與輸入模式的概率分布趨于一致,即連接權矢量空間分布能反映輸入模式的統計特性。該算法往往在完成極高維數、超大量數據和高度非線性問題的聚類,模式表征和數據壓縮,分類等任務時是一個很有效、很簡便,且快速、穩健、泛化性好的算法。
Kohonen的學習算法如下:
(1)初始化:將整個輸入向量存儲在矩陣p中,對權值w進行初始化,權值向量的每一維的取值范圍同輸入向量每一維的取值范圍。
(2)選擇一個輸入向量,提供給網絡輸入層。
(3)按照下式計算輸出層每一個神經元 j 的權值與輸入向量之差:,其中,。
(4)按照“勝者為王”的原則,對每一個神經元j,以minDist中的最小值所對應的神經元 k作為勝者,對它和它的鄰域內的神經元的權值進行調整,假設當前處于學習的第l步,權值的修正按照下式進行:
其中,lr表示學習速率,br表示鄰域調整率;表示獲勝神經元的鄰域,即:。
(5)選擇另一個輸入向量,返回(3),直到所有的輸入向量全部提供給網絡。
(6)返回(2),直到達到最大訓練步數。
二、MATLAB仿真算例
1.MATLAB仿真實現
對于日負荷特征曲線的提取,負荷曲線的采樣點越多,曲線越精細,越容易進行分類,研究數據來自于電力用戶用電信息采集系統,從中提取公變用戶每15分鐘采集一次的有功功率構成其日負荷曲線,一天共96個采樣點。從某省電力用戶用電信息采集系統中隨機抽取1000臺公用變壓器,選取其2012年7月10日(工作日,該省全年負荷最高日)作為典型日進行日負荷特征曲線提取和分析。每臺公變日負荷曲線由96個有功采樣點組成。由于每臺公變額定容量大小不等,為了有效聚類,首先需要對負荷數據進行歸一化處理。
本文采用聚類SOM神經網絡,在MATLAB環境下,對這些數據進行聚類仿真。聚類SOM神經網絡的MATLAB實現步驟如下:(1)準備數據源。首先從原始數據庫讀取相關數據(輸入樣本總數70,每一個樣本有96個采集時點)作為輸入矢量,并將其以二維數組70×96形式輸入。(2)確定參數。輸入神經元個數為采集時點的個數96;輸出神經元以二維數組3×3形式呈現。(3)運用rand( )函數產生[0,1)之間的隨機數作為權值。(4)調用SOM創建函數newsom( ),創建自組織映射網絡net=newsom( )。(5)對迭代次數net.trainParam.epochs賦值2000;對net.trainParam.show賦值20,表示每20次顯示一下誤差變化情況。(6)運用網絡訓練函數train( )訓練上述初始化后的網絡net=train( )。(7)調用plot( )畫輸入點; plotsom( )作訓練后的權值點及其與相鄰權值點的連線。
2.仿真結果分析
經MATLAB仿真運行后得到聚類結果圖2所示:
圖2所示為SOM神經網絡聚類結果,將樣本公變用戶分為7個類別,為便于后文描述,不妨按照行優先的順序為各激活的優勝神經元標識聚類編號,依次分別為為:公變用戶第一類(包含13個樣本用戶)、公變用戶第二類(包含12個樣本用戶)、公變用戶第三類(包含5個樣本用戶)、公變用戶第四類(包含10個樣本用戶)、公變用戶第五類(包含10個樣本用戶)、公變用戶第六類(包含10個樣本用戶)、公變用戶第七類(包含10個樣本用戶)。
每個競爭層神經元與各輸入神經元之間的連接權構成的向量代表了該優勝神經元所標識類別的聚類中心即日負荷特征曲線,競爭層神經元鄰域權值距離如圖3所示,顏色越深表示領域神經元間的權值距離越遠,即鄰域神經元的聚類中心距離越遠、提取的日負荷特征曲線差異越大。
圖4所示為通過SOM神經網絡聚類算法提取的七大類公變用戶日負荷特征曲線。日負荷特征曲線較為明顯地反映了不同類型公變用戶在該典型日的用電行為。
第一類公變日負荷特征曲線呈現出明顯的午高峰和晚高峰特征,且晚高峰明顯高于午高峰。推測此類為城鎮居民生活的典型日負荷特征曲線,可能由于部分居民上班因素造成晚高峰高于午高峰;第二類公變日負荷特征曲線走勢同全網負荷基本一致,呈現出明顯午高峰和晚高峰,但午高峰一枝獨秀,可能該公變下的用戶類型較多,包括居民用戶和一般工商業用戶,由于各類用電特征比例與全網比例類似,形成具有全網負荷特征的曲線;第七類公變日負荷特征曲線與前六種主要集中在白天用電不同,主要在天黑時間段內(晚上7點左右至第二天早上6點)用電,推測這類用戶主要集中在市政工程類。
三、總結與展望
本文將SOM神經網絡聚類算法應用到電力用戶日負荷特征曲線提取的研究中,選取某省公變用戶作為分析樣本,通過MATLAB仿真計算將樣本公變用戶分為七個類別,以優勝神經元與輸入神經元之間連接權向量作為聚類中心即該類別用戶的日負荷特征曲線。根據提取出的日負荷特征曲線,結合電力用戶用電信息采集系統中的營銷檔案分析了不同類別公變用戶的用電特征與習慣。分析表明,采用SOM神經網絡聚類算法提取日負荷特征曲線具有良好的效果,提取出的日負荷特征曲線能夠較好反映該類型用戶的用電行為與特征,為電力企業了解用戶用電習慣、細分電力市場、調整定價策略和實施需求側管理提供了有益參考。
下一步研究將考慮采用電力用戶全年負荷數據進行聚類分析,驗證小樣本下的聚類結果、發現新的用戶類型;同時改進SOM神經網絡算法,使其適應海量數據下的負荷曲線聚類分析,并通過調整競爭層神經元個數與抑制權值使訓練結果更加穩定,得到更好的聚類效果。
參考文獻:
[1]馬玉梅,馬志超.基于人工神經網絡的手寫阿拉伯數字識別[J].中央民族大學學報(自然科學版),2007,(4).
[2]劉小波,李亞玲,趙景濤,等.基于KOHONEN神經網絡的電壓控制分區[J].浙江電力,2007,(3).
[3]莫禮平.基于Kohonen神經網絡的故障診斷方法[J].成都大學學報(自然科學版),2007,(1).
[4]李培強,李欣然,陳輝華,等.基于模糊聚類的電力負荷特性的分類與綜合[J].中國電機工程學報,2005,(24).
[5]張紅斌,賀仁睦,劉應梅.基于KOHONEN神經網絡的電力系統負荷動特性聚類與綜合[J].中國電機工程學報,2003,(5).
[6]高琳琦,李從東.個性化產品推薦中的SOFM神經網絡模型[J].天津師范大學學報(自然科學版),2006,(2).
(責任編輯:王意琴)