魏 偉, 李永勝, 程 逍, 孫立時, 朵向陽, 吳卓青
(1. 鄭州大學 能源環境經濟研究中心, 鄭州 450001; 2. 青海省電力公司 海東供電公司, 青海 海東 810600; 3. 國家電網有限公司 國家電力調度控制中心, 北京 100031; 4. 大連理工大學 系統工程研究所, 遼寧 大連 116024)
近年來,隨著能源革命的深入推進,多行業在能源消費理念和消費方式方面發生了深刻變化,使得用能和新興負荷逐年增加[1].電網需要響應市場需求提供多樣化、個性化和互動化服務,與此同時還面臨頻率快速下跌、電能難以存儲和備用容量嚴重不足的問題[2].然而傳統電源調度提升空間越來越小,新興能源特性決定其無法為系統提供穩定的備用容量,但用戶側存在大量柔性負荷可供調度[3].
當前對于負荷特性的研究主要從兩方面展開,分別是用戶負荷特性的基本特點研究和電力用戶分類研究.在用戶負荷特性的基本特點研究方面,主要從時間、季節、政策等角度分析電力負荷特性,但尚未形成針對各類電力用戶負荷特性開展的系統性分析方法[4-5].而在電力用戶分類研究方面,主要包括三大類:基于距離的聚類算法、基于密度的聚類方法以及基于互連性的聚類算法.Li等[6]提出一種可以對智能電表端大數據進行精確處理的多分辨率聚類算法;陳建楓等[7]提出改進聚類算法,通過對需求側負荷曲線分析獲得數個典型用電特性曲線,確定負荷分類用以代替一般用戶電力特性分析;袁兆祥等[8]提出一種基于DBSCAN聚類算法的電力工程完整性分析方法,對于提高電力工程數據的完整性及分析用戶的用電情況均具有較好的參考價值;蘇適等[9]提出了一種基于密度空間聚類和引力搜索算法的用戶用電模式分類模型;胡昌斌等[10]提出了使用模糊C均值聚類將電網用戶的用電數據聚類為不同的用電模式.
目前已有研究采用多聚類融合的方法識別用電負荷模式,如林錦波[11]提出了基于聚類融合的負荷曲線聚類方法;Wang等[12]提出一種基于特征指標降維和改進熵權法的電力負荷模式識別解決方案,在運行效率和分類準確率上具有一定優勢.然而聚類融合方法是在已知采樣數據基礎上進行的多視角模型融合研究,忽略了采樣數據本身各個視角中的內部度量信息,難以克服不同特征的量綱差異及分布不一致問題.
本文基于采樣數據不同視角,從數據層融合角度提出了基于多視角網絡融合學習的典型用電負荷模式挖掘方法,并通過兩類不同行業的實際用電負荷數據論證了該方法的穩定性,識別了最具代表性用電負荷模式.
本研究中,典型用電負荷模式挖掘研究流程共包含5個關鍵過程,如圖1所示.
1) 根據電網用戶基本信息及用戶用電量數據,按照每周7天進行多視角數據獲取和預處理;
2) 根據3個層次數據,選擇合適的度量方法計算出配對的相似度矩陣;
3) 根據3個相似度矩陣的最近鄰信息,使用多視角相似度網絡融合方法計算相似度矩陣;
4) 基于多視角融合相似度矩陣分別進行每周7天的譜聚類分析;
5) 根據用戶每周7天的聚類結果,生成用戶間的共現矩陣,識別用戶典型負荷模式.
當前用電負荷采集點采樣頻率為每日96次,數據粒度較為細致,單次采樣數值變化不大,導致聚類得到的各個簇的輪廓不明顯.若每日僅采集4次,數據粒度過大,導致聚類得到的各個簇存在較大差異.本文兼顧多粒度視角,根據96次采樣數據合并出每日24次采樣數據及每日4次采樣數據.
本文分別采集教育行業與房地產行業從2017年1月1日至2017年1月31日連續一個月的用電數據.以每日96次采樣數據為例,采樣數據周期按照周一到周日的順序,其天數分別表示為:n1,n2,…,n7.按照周一到周日,將用戶采樣時間周期內的數據劃分為7個數據集data961,data962,…,data967.
合并后的全月用電采樣數據表示為
Dp={data961,data962,…,data967}
同理將每類24次采樣數據和每類4次采樣數據合并后,分別表示為Dh與Ds.
本文采用歐式距離度量用戶i采樣數據xi和用戶j采樣數據xj之間的距離,即

(1)
然后采用歸一化指數相似度方法計算用戶i和用戶j之間的相似度,即
(2)
式中:μ為一個經驗值為(0.3,0.8)的超參數,通常選取0.5;εi,j為縮放比例參數.最終輸出3個采樣視角的相似度矩陣,分別為Wp,Wh和Ws.
在對多個相似度矩陣進行融合時,可以使用線性權重加權法或者非線性融合方法.然而前者對于權重的選擇依賴專家經驗和大量實驗,而非線性融合方法在集成不同視角相似度網絡上具備優勢,對噪聲和數據異質性具有更好的魯棒性[13-15],故本文采用多視角相似度網絡融合方法將3個層次的相似度網絡融合成一個網絡.
將n個用戶之間的相似網絡定義為一個圖G=(V,E),其中頂點V表示用戶,邊E表示用戶之間的相似關系.相似度網絡融合方法的步驟為:

(3)
2) 計算k個最相似用戶的相似度.使用Ni表示用戶i在圖G中的鄰居個數,采用K近鄰方法計算用戶i與其k個最近鄰用戶間的相似度,并且保證非相鄰點之間的相似度為0.用戶i與用戶j的用電行為融合相似度S(i,j)為
(4)

(5)
譜聚類是將全部樣本點看成網絡中的結點,這些點可以用邊進行連接,通過對所有結點組成的圖進行切圖,使得不同子圖間的邊權之和較低,子圖內的邊權之和較高,從而達到聚類目的.譜聚類是基于圖的聚類,故本文使用譜聚類算法來挖掘用電負荷模式.
聚類方法的評價指標包括外部評價和內部評價.外部評價是指將聚類結果與帶有真實類別標簽的數據進行比較;內部評價則是在真實類別標簽數據未知情況下的一種評估指標,常見的評價指標為內平方和、外平方和與輪廓評分.本文使用綜合指標和輪廓評分對聚類結果進行評價,綜合指標計算公式為
(6)
式中:WSS為相同聚類內部樣本之間的不相似度,該值越小越好;BSS為不同聚類間樣本的不相似度,該值越大越好.綜合指標Φ越接近于1,表示聚類效果越好.輪廓評分s(i)用以衡量聚類的一致性,數值在[-1,1]之間,越接近于1越好,其計算公式為
(7)
式中:a(i)為樣本i的簇內不相似度;b(i)為樣本i的簇間不相似度.
按照周一到周日7類分別計算用戶的融合相似度矩陣,然后使用譜聚類得到所有用戶7類的聚類結果,即第1類(周一)的聚類結果為C11,C12,…,C1K1,第2類(周二)的聚類結果為C11,C12,…,C1K2,其中K1和K2分別為周一和周二聚類后簇的數目.用戶i和j在一周內聚類結果相同的次數可以采用共現度進行度量,形式化定義為

(8)
(9)
式中,K′為周一到周日的聚類后簇數目.
本文假定兩個用戶在一周中如果有4 d以上時間同屬于一個簇,則認為其具有相似的典型用電負荷模式,即CoP(i,j)≥4/7,然后對所有的用戶進一步劃分,并將每一類模式中入度最高的用戶作為代表進行典型用電負荷模式分析.
本文采集了江蘇省59家教育機構和41家房地產機構2017年1月份的用電負荷數據,以每日96次進行數據采樣.其中用戶基本信息包括:用戶ID、用戶名稱、供電機構、電壓等級、用戶行業類別、用戶用電目的、用戶用電量、專變數量、專變總供電量以及經緯度等數據.
教育機構容量指標中,最大值為235 880 kVA,最小值為5 260 kVA,平均值為29 853 kVA;專變數量指標中,最大值為63,最小值為2,平均值為13.7;專變總供電量指標中,最大值為71 260 kVA,最小值為2 630 kVA,平均值為14 593 kVA.
房地產機構用戶容量指標中,最大值為54 600 kVA,最小值為10 000 kVA,平均值為18 349 kVA;專變數量指標中,最大值為20,最小值為2,平均值為6.7;專變總供電量指標中,最大值為26 517 kVA,最小值為2 060 kVA,平均值為9 307.4 kVA.
對單視角96次、24次、4次采樣以及融合多視角相似度網絡得到相似度矩陣使用譜聚類算法進行簇的劃分.本文獲得了基于Wp,Wh,Ws和Pall與譜聚類算法相結合的聚類結果,以綜合指標和輪廓評分作為評價指標,其結果如表1所示.由表1可知:實驗中多視角融合聚類效果優于單視角聚類,因為使用多視角相似度網絡融合的方法能夠集成多視角互補信息,提升用電用戶的聚類效果;輪廓系數數值均大于0.7,表明多視角融合聚類的魯棒性優于單視角聚類.

表1 單視角與多視角融合的譜聚類評價結果Tab.1 Spectral clustering evaluation results based on fusion of single-view and multi-view
根據多視角相似度網絡融合的相似度矩陣譜聚類結果,計算各個采樣點在一周內被劃分為同一個簇的共現矩陣.本文定義:若一周中2個采樣點有4天及以上同時被劃分到同一個簇內,則2個采樣點具有較強的關聯性.以59個教育機構為結點,若2個教育機構之間具有較強關聯性則使用邊相連,以教育機構間的共現值作為邊權,使用Gephi軟件繪制基于共現矩陣的關聯關系圖.考慮到數據中同一教育機構具有不同的用電類別,其類別分別為教學教育用電和非居民照明,因此圖形的結點以“教育機構_用電類型”表示.
劃分后教育機構擁有5類不同的用電負荷模式,房地產機構則擁有3類不同的用電模式.入度越大的點表示該點與其他點的聯系越緊密,故選擇各個用電負荷模式中入度最高的結點作為代表點.教育機構的代表點為:江蘇省省級機關房屋建設中心、南京大學、東南大學、南京醫科大學和中國人民解放軍陸軍工程大學.房地產機構的代表點為:江蘇長江物業管理公司、南京天悅置業投資顧問公司和江蘇運通房地產開發有限公司.各個代表點的用電負荷曲線如圖2所示.

圖2 教育機構與房地產機構典型用電負荷曲線Fig.2 Typical power load curves of education and real estate institutions
利用圖2中教育機構5個代表點的用電負荷曲線探究用電負荷趨勢特征,圖2a~e展示了以每日采樣24次的5家代表性教育機構周一到周日的用電負荷曲線.5家代表性教育機構的用電負荷曲線趨勢基本一致,在12點和18點時間段附近出現兩次用電高峰,驗證了本研究識別的教育機構典型用電負荷模式具有較強的穩定性,與教育機構的作息時間大致相同.差異性分析:5家機構中除南京大學用電負荷均在周三達到峰值.而東南大學和南京大學的用電峰值和谷值差異明顯,較容易區分.南京醫科大學自12點后到第二天凌晨的用電量較為均衡,波動較小,可能與其醫科類院校性質有關.中國人民解放軍大學自晚上17點后用電量下降較快,可能與其晚上加訓、用電設備較少有關.江蘇省省級機關房屋建設中心的用電規律與行政事業單位較為類似.
圖2f~h展示了以每日采樣24次的3家代表性房地產機構周一到周日的用電負荷曲線.從周一到周日,3家代表性房地產機構的用電負荷曲線趨勢基本一致,且工作日用電量均高于休息日用電量,且周二到周四的用電量為一周中最高,注冊資本多,規模較大的公司用電峰值更高.
研究結果表明,對于教育機構,供電機構可以根據院校性質采取錯峰供電策略以緩解系統備用容量不足問題。針對985類高校可以根據其峰值和谷值的差異性進行供電,針對軍事院校晚上可以給予較少的供電,針對醫療性質院校需要持續穩定供電,針對行政事業機關則按照行政事業機關的辦公規律供電即可.對于房地產機構,可以根據公司的注冊資本和規模大小對其進行分級,進行差異化供電.
本文以多視角用電負荷采樣數據作為研究對象,提出了一種基于多視角相似度網絡融合的典型用電負荷模式挖掘方法.針對江蘇省59家教育機構和41家房地產機構的用電負荷數據進行實驗,結果表明:以簇內誤差平方和為聚類效果的評價指標,多視角融合的聚類結果優于各單視角的聚類結果.通過對各個典型機構的基本信息和用電負荷模式趨勢曲線分析,找出了各典型機構用電負荷的影響因素。對兩大行業進行穩定性與差異性分析后,為電網公司采用錯峰供電、削峰填谷及采取各種節能技術和措施來緩解系統備用容量不足問題提出決策依據.在此基礎上仍可以繼續研究,例如擴大收集的用電負荷數據時間跨度,探究該結論是否會隨著季節改變而發生變化,為電網公司在不同季節針對不同行業機構供電采取動態措施提供參考.