楊甲甲,趙俊華,文福拴,董朝陽,薛禹勝
(1.悉尼大學(xué)電氣與信息工程學(xué)院, 澳大利亞悉尼市 2006;2. 香港中文大學(xué)(深圳),廣東省深圳市 518100;3. 浙江大學(xué)電氣工程學(xué)院,杭州市 310027;4. 文萊科技大學(xué)電機與電子工程系,文萊斯里巴加灣 BE1410;5. 南方電網(wǎng)科學(xué)研究院,廣州市 510080;6. 南瑞集團公司(國網(wǎng)電力科學(xué)研究院),南京市 211106)
智能電網(wǎng)環(huán)境下基于大數(shù)據(jù)挖掘的居民負荷設(shè)備識別與負荷建模
楊甲甲1,趙俊華2,文福拴3,4,董朝陽5,薛禹勝6
(1.悉尼大學(xué)電氣與信息工程學(xué)院, 澳大利亞悉尼市 2006;2. 香港中文大學(xué)(深圳),廣東省深圳市 518100;3. 浙江大學(xué)電氣工程學(xué)院,杭州市 310027;4. 文萊科技大學(xué)電機與電子工程系,文萊斯里巴加灣 BE1410;5. 南方電網(wǎng)科學(xué)研究院,廣州市 510080;6. 南瑞集團公司(國網(wǎng)電力科學(xué)研究院),南京市 211106)
利用數(shù)據(jù)挖掘技術(shù)對用戶負荷大數(shù)據(jù)進行處理,既可以通過識別用電負荷設(shè)備來分析用戶的用電行為習(xí)慣,又可以輔助進行負荷精確建模,實現(xiàn)精確而有目標(biāo)性的需求側(cè)管理或制定具有針對性的零售商售電策略。在此背景下,基于動態(tài)時間彎曲(dynamic time warping,DTW)的時間序列匹配方法,提出了一種低頻負荷數(shù)據(jù)下的居民電器設(shè)備識別方法。首先,將負荷數(shù)據(jù)分割成單負荷設(shè)備運行和多負荷設(shè)備同時運行2種情況下的負荷子序列;然后,依據(jù)待識別子序列的時間長度,參照實測的電器設(shè)備耗電功率數(shù)據(jù),生成與其時間長度一致的電器設(shè)備耗電功率參考序列,其中包含了從電器設(shè)備啟動前一時刻至設(shè)備關(guān)閉后一時刻的功率變化情形;最后,以DTW距離作為相似性度量指標(biāo)確定識別結(jié)果。對于由多負荷設(shè)備運行產(chǎn)生的負荷序列,提出了一種剔除已識別設(shè)備后將序列再次分割,如此交替進行的識別策略。在獲得識別結(jié)果后,構(gòu)建了居民負荷統(tǒng)計模型。借助于高效數(shù)據(jù)分析軟件R語言平臺,實現(xiàn)了所提出的算法,并使用500組負荷數(shù)據(jù)進行了數(shù)據(jù)實驗。結(jié)果表明,在對負荷數(shù)據(jù)每 min采樣1次的情況下,所提出的負荷設(shè)備識別方法對單設(shè)備負荷序列識別的準(zhǔn)確率超過93%,對多設(shè)備負荷序列識別的準(zhǔn)確率接近83%。
智能電網(wǎng);數(shù)據(jù)挖掘;R語言;動態(tài)時間彎曲(DTW);負荷識別;負荷模型
在智能電網(wǎng)環(huán)境下,智能量測設(shè)備會逐步得到廣泛應(yīng)用,從而能夠得到用戶負荷準(zhǔn)確的、海量的數(shù)據(jù)。利用數(shù)據(jù)挖掘方法對用戶負荷大數(shù)據(jù)進行處理,能夠從中提取出有用信息,從而能夠?qū)﹄娏ω摵捎懈到y(tǒng)和深入的理解進而改善負荷管理水平及系統(tǒng)運行的安全性與經(jīng)濟性。負荷識別進而負荷準(zhǔn)確建模是大數(shù)據(jù)挖掘在電力系統(tǒng)中應(yīng)用的重要領(lǐng)域。
按照最終識別結(jié)果,負荷識別可以分為負荷設(shè)備識別和負荷類型識別。負荷設(shè)備識別需要識別出具體的用電設(shè)備,因此對負荷采樣數(shù)據(jù)的要求更高[1]。負荷類型識別則是首先將負荷劃分為幾個類型,如電阻性負荷、單相恒轉(zhuǎn)矩感應(yīng)電機負荷、三相恒轉(zhuǎn)矩感應(yīng)電機負荷等[2],之后確定負荷組成。本文討論負荷設(shè)備識別問題。
在現(xiàn)有研究中,常用的負荷設(shè)備識別方法包括兩大類[2],即侵入式負荷監(jiān)測[1]和非侵入式負荷監(jiān)測[3-5]。
侵入式監(jiān)測方法需要在用電設(shè)備和插座之間安裝中間監(jiān)控裝置來記錄設(shè)備操作情況。該方法通常依靠中間監(jiān)控裝置采集的負荷設(shè)備操作記錄、設(shè)備能耗數(shù)據(jù)、用戶賬單數(shù)據(jù)等,如果用戶安裝了智能電表則也可利用智能電表所獲取的數(shù)據(jù),進行負荷設(shè)備識別。非侵入式監(jiān)測方法則不需要中間裝置,主要依靠高分辨率的負荷波形測量數(shù)據(jù),如電流波形、負荷對電壓階躍的動態(tài)響應(yīng)波形、負荷有功功率變化時的波形等[6],通過分析這些負荷特征量來進行負荷識別。
國外現(xiàn)有的負荷設(shè)備識別研究,主要針對居民負荷的各種電器設(shè)備,總體上可以分成2類:(1)負荷設(shè)備電氣特征信息提取[5-6];(2)負荷設(shè)備識別方法研究[1, 7-11]。
現(xiàn)有的負荷設(shè)備識別方法主要是依據(jù)負荷設(shè)備的電氣特征信息,通過匹配方法進行設(shè)備識別,這些特征信息總體上包括電器設(shè)備的暫態(tài)和穩(wěn)態(tài)信息,例如:電流波形、設(shè)備的有功/無功功率、諧波、瞬時導(dǎo)納波形、瞬時功率波形、特征值(主要針對動態(tài)負荷,例如空調(diào)的電流波形在不同的工作循環(huán)內(nèi)是不同的,通過建立電流值的時間序列矩陣,并提取矩陣的特征值進行設(shè)備識別)以及設(shè)備開關(guān)操作的暫態(tài)波形。
負荷設(shè)備識別方法可以歸納為如下2類[6]:
(1)數(shù)學(xué)優(yōu)化方法。在給定的設(shè)備集合中,求解使得設(shè)備組合的總功率和目標(biāo)負荷值之間的偏差最小的組合結(jié)果,該組合中所包含的電器設(shè)備就是識別結(jié)果。
(2)數(shù)據(jù)挖掘算法。如決策樹[1]、支持向量機[7]以及基于人工神經(jīng)元網(wǎng)絡(luò)的算法[8-9]。后者通過訓(xùn)練人工神經(jīng)元網(wǎng)絡(luò),使其具備辨別不同電器設(shè)備的電氣特征的能力,然后進行負荷識別。
由于一些數(shù)學(xué)優(yōu)化方法的計算復(fù)雜度會隨著待識別設(shè)備數(shù)量增加而呈現(xiàn)指數(shù)增長,因此現(xiàn)有研究多集中在基于數(shù)據(jù)挖掘的負荷設(shè)備識別方法。
在依據(jù)負荷數(shù)據(jù)識別出用戶的負荷設(shè)備后,通過對識別結(jié)果進行統(tǒng)計分析,可建立更加精確的居民用戶負荷模型。這種明確了各個時刻負荷成分的精確負荷模型,既可以用來進行精確而有目標(biāo)性的需求側(cè)管理,也可以結(jié)合用戶的用電行為習(xí)慣,用來研究用戶負荷,輔助零售商制定合適的售電策略。
已經(jīng)有一些這方面的研究工作報道。例如,文獻[12]研究了居民用戶的負荷特征和房屋大小、房屋類型(公寓或者別墅等)以及居住者的社會經(jīng)濟特征 (包括屋主年齡、收入、所處的社會階層等) 之間的關(guān)系,用線性回歸方法分析了居民負荷的15種家用電器設(shè)備和用戶的總耗電量、用戶的最大負荷功率、用戶的負荷系數(shù)以及用戶大負荷的發(fā)生時間之間的關(guān)系。文獻[13]中采用將用戶行為模型和負荷設(shè)備電氣模型相結(jié)合的方法對家庭負荷建模; 基于歷史數(shù)據(jù),首先采用統(tǒng)計分析方法構(gòu)建了考慮居民有效用電人數(shù)、電器日使用概率、電器平均使用時長等特征的居民負荷行為學(xué)模型, 同時基于實測的負荷數(shù)據(jù)得到了負荷靜態(tài)模型。文獻[13]中的家用電器設(shè)備使用狀態(tài)是根據(jù)用電行為的歷史數(shù)據(jù)統(tǒng)計分析得到的,沒有涉及負荷識別問題。文獻[14]針對統(tǒng)計綜合法和總體測辨法等負荷建模方法存在數(shù)據(jù)需求量大,難以反映負荷時變性或辨識速度慢、精度低等缺點,提出了變電站綜合負荷的一種集中式建模方法。到目前為止,筆者還沒有見到通過識別負荷設(shè)備建立精確負荷模型的系統(tǒng)的研究報道。
國內(nèi)在負荷設(shè)備識別方面已經(jīng)有些研究報道。文獻[15]研究了家用電器運行時的特征量如瞬時功率波形、電流曲線波形、諧波特性、電器開關(guān)時的脈沖電流和暫態(tài)過渡時間,并討論了利用這些特征量進行負荷識別的可行性。文獻[16]和[17]以電器設(shè)備開、關(guān)過程中的暫態(tài)功率波形作為特征量,分別采用相似性匹配和聚類方法 對家用電器負荷進行識別。雖然與文獻[16]和[17]相同,也利用了電器設(shè)備開啟時的瞬時功率波形,文獻[18]和[19]則是通過求解電器設(shè)備的優(yōu)化組合問題進行家電負荷識別。利用暫態(tài)特征進行負荷識別時需要獲取電器設(shè)備投切時刻的暫態(tài)信息,文獻[20]提出一種針對暫態(tài)事件的監(jiān)測算法,能夠?qū)崿F(xiàn)對負荷投切時的暫態(tài)過程進行自動檢測和準(zhǔn)確記錄。文獻[21]和[22]則都利用了電器設(shè)備運行的暫態(tài)特征量和穩(wěn)態(tài)特征量進行負荷識別。此外,文獻[23]針對近幾年有關(guān)非侵入式負荷識別算法進行了綜述,分析了比較常用的幾種負荷識別方法的優(yōu)缺點,并討論了負荷識別技術(shù)在實際應(yīng)用中面臨的問題。
上述國內(nèi)研究都是基于高頻采樣數(shù)據(jù)(文獻[15-18]中的采樣頻率分別為2,2,5,20 Hz)進行的負荷識別。在這些高頻采樣頻率下,當(dāng)智能電網(wǎng)中的用戶規(guī)模增大時,隨之產(chǎn)生的采樣數(shù)據(jù)量也將急劇增加。因此,這些將會對系統(tǒng)硬件設(shè)備的數(shù)據(jù)采集和存儲功能,以及負荷識別方法的數(shù)據(jù)處理能力提出更高的要求。而且,這些方法還僅是針對單個家庭用戶的負荷識別,沒有考慮通過對配電網(wǎng)中的大量用戶進行負荷識別,然后建立系統(tǒng)負荷模型的問題。
在上述背景下,本文首先提出基于低頻負荷采樣數(shù)據(jù)的負荷設(shè)備識別方法。具體地,以動態(tài)時間彎曲(dynamic time warping,DTW) 距離作為待識別負荷時間序列和設(shè)備參考時間序列之間相似性的度量指標(biāo),通過將低頻采樣的負荷時間序列進行波形分割,對每個子序列進行負荷設(shè)備識別。接著,利用數(shù)據(jù)實驗分析所提出的負荷設(shè)備識別方法的準(zhǔn)確性和有效性。之后,在負荷識別的基礎(chǔ)上,提出能夠明確負荷成分的負荷統(tǒng)計模型。
DTW距離是一種時間序列相似性度量指標(biāo)[24]。采用這種相似性度量指標(biāo)時,在計算被比較的時間序列之間的距離之前,允許被度量的時間序列沿時間軸進行局部的延伸或收縮,對被匹配序列的振幅差異、噪聲和線性漂移具有更好的魯棒性。適用于度量變化趨勢相似,但時間長度可能不相等的時間序列,比其他相似性度量指標(biāo) (如Minkowski 距離、Euclidean 距離、Manhattan 距離,等) 具有更多的優(yōu)點,因而在數(shù)據(jù)挖掘領(lǐng)域得到了廣泛應(yīng)用。
給定長度分別為n和m的2個時間序列Q和C:
Q=q1,q2,…,qi,…,qn
(1)
C=c1,c2,…,cj,…,cm
(2)
為了用DTW來比較Q和C的相似性,需要構(gòu)造一個n行m列的距離矩陣D,其中的元素di,j表示點qi和點cj之間的歐式距離或者歐式距離的平方[24]。為便于討論,這里取di,j為(qi,cj)之間歐式距離的平方。
di,j=(qi-cj)2
(3)
式(3)表示當(dāng)進行相似比較時,序列Q的元素qi和序列C的元素cj之間建立起對應(yīng)關(guān)系之后,兩序列之間相似距離的計算方法。其中,i=1,2,…,n,j=1,2,…,m。
彎曲路徑W是由di,j構(gòu)成的集合,W中的全體元素表示一個以(q1,c1)為起點,以(qn,cm)為終點的Q和C之間的映射關(guān)系:
W=w1,w2,…,wk,…,wK,
max(m,n)≤K≤m+n-1
(4)
wk=(di,j)k
(5)
式中:K表示彎曲路徑W的長度,且K的取值是通過求解最優(yōu)彎曲路徑W而確定;wk表示Q和C之間的第k組中2個具有映射關(guān)系的點之間的歐式距離的平方值。
在Q和C之間滿足以(q1,c1)為起點、以(qn,cm)為終點的映射關(guān)系有很多種。通常要求構(gòu)成彎曲路徑的映射必須要滿足以下3個約束條件[25]。
(1)邊界約束。w1=d1,1,wK=dn,m;邊界約束條件用于保證彎曲路徑的始點和終點分別在距離矩陣的對角位置。
(2)連續(xù)性約束。假定wk=di,j,wk-1=di′,j′;那么需要滿足i-i′≤1,j-j′≤1;連續(xù)性約束條件用于保證彎曲路徑是由距離矩陣中是相鄰的元素構(gòu)成的。
(3)單調(diào)性約束。同樣地,假定wk=di,j,wk-1=di′,j′;那么需要滿足i-i′≥0,j-j′≥0;單調(diào)性約束條件用于保證彎曲路徑中的點在時間順序上是單調(diào)的。
在滿足約束條件的彎曲路徑中,W的全體元素累加和最小的路徑被稱為動態(tài)時間彎曲路徑,這里用DDTW表示。時間序列Q和C之間的DTW距離可表示為
(6)
對滿足約束條件的動態(tài)彎曲路徑進行搜索,是求解動態(tài)彎曲距離過程中的關(guān)鍵環(huán)節(jié),決定了序列之間相似匹配時映射關(guān)系。求解動態(tài)時間彎曲路徑和相應(yīng)彎曲距離的問題可描述為多階段決策問題。令到第k步的累計距離為r(i,j),第k步的決策變量為d(i,j),則
(7)
采用動態(tài)規(guī)劃法求解式(7),可求得時間序列Q和C之間的動態(tài)時間彎曲路徑和相應(yīng)的彎曲距離。
式(7)僅給出了當(dāng)對Q和C之間的映射不加以約束時的情況。實際上,為了防止病態(tài)映射 (例如Q的一小部分序列值映射到了C的很大一塊區(qū)域中) 的發(fā)生,同時提高求解DTW距離的速度,通常還會給動態(tài)時間彎曲路徑的搜索范圍添加全局或局部約束條件,以限定求解的搜索范圍[25]。
最常見的全局約束有2種,分別為Sakoe-Chiba帶狀約束和Itakura平行四邊形形狀約束。全局約束限制了當(dāng)沿距離矩陣D的對角線搜索最優(yōu)動態(tài)路徑時,搜索范圍的總體將是沿對角線的一個帶狀區(qū)域,亦或是一個平行四邊形區(qū)域。而局部約束則有很多種形式,除式(7)所示的情形外,另外還有式(8)、式(9)所示的約束情形。不僅如此,一些學(xué)者還在不斷地研究新的約束情形。局部約束限制了當(dāng)搜索動態(tài)彎曲路徑時,相鄰2步?jīng)Q策間的搜索范圍。有關(guān)全局和局部約束條件的更多詳細內(nèi)容可參考文獻[25]。
r(i,j)k=d(i,j)k+min{r(i-1,j-1),
r(i-1,j-2),r(i-2,j-1)}k-1
(8)
r(i,j)k=d(i,j)k+min{r(i-1,j-1),
r(i-3,j-4),r(i-4,j-3)}k-1
(9)
本文中通過選用不同的全局和局部約束條件進行多次計算,來選擇對算法執(zhí)行效果最好的約束條件。
現(xiàn)有負荷設(shè)備識別方法通常都是基于頻率為1 Hz[1]、幾十Hz (如17 Hz[7]和60 Hz[11]),甚至更高頻率[6]的負荷采樣數(shù)據(jù)進行的。在獲得了高頻負荷數(shù)據(jù)后,這些方法假定在足夠短的時間內(nèi)(例如1 s),只可能有1臺設(shè)備會被開啟或者關(guān)閉,通過比較負荷數(shù)據(jù)和前文提到的負荷設(shè)備的電氣特征信息,來進行負荷設(shè)備識別。
顯然,負荷采樣頻率越高,對數(shù)據(jù)采集系統(tǒng)硬件設(shè)備的要求也越高,同時在數(shù)據(jù)挖掘時需要存儲和處理的數(shù)據(jù)量也就越大。有鑒于此,在低頻數(shù)據(jù)下進行負荷識別就是一個值得研究的問題。文獻[9]和[10]分別研究了當(dāng)采用頻率為每1 min 1次和每2 min 1次時的負荷識別問題。需要指出,現(xiàn)有的負荷設(shè)備識別方法多數(shù)是以人工神經(jīng)元網(wǎng)絡(luò)算法為基礎(chǔ)的[6, 9-10]。
這里提出一種針對負荷數(shù)據(jù)采樣頻率低的情況下的負荷設(shè)備識別新方法。所提出的方法主要用來識別在min級別或更長的時間尺度內(nèi)連續(xù)運行的家用電器設(shè)備,正是這些設(shè)備的耗電構(gòu)成了居民負荷的主要部分。而對于那些運行時間在1 min以內(nèi)的短時負荷,其耗電對系統(tǒng)負荷的影響很小,這些電器設(shè)備對系統(tǒng)負荷建模的影響也可忽略不計。
在所提出的方法中,首先將用戶負荷時間序列按照給定的原則進行分割,然后以DTW距離為相似性度量指標(biāo),分別將分割后的用戶負荷子序列與負荷設(shè)備數(shù)據(jù)庫中的參考時間序列進行時間序列匹配,選擇匹配效果最好的參考序列所對應(yīng)的設(shè)備作為該子序列的識別結(jié)果。對于由多臺設(shè)備同時運行構(gòu)成的復(fù)雜負荷子序列,提出了如下方法:首先,在每次識別出1個負荷設(shè)備后,就從該子序列中將已識別出的該設(shè)備所對應(yīng)的功率序列剔除;然后,對子序列再次進行分割,并對分割得到的復(fù)雜度降低的子序列繼續(xù)進行負荷識別,如此反復(fù)進行,直到滿足結(jié)束條件。為便于理解,圖1給出了所提出的負荷設(shè)備識別方法的原理圖。
下面對圖1中的時間序列分割和負荷設(shè)備識別方法的具體內(nèi)容做比較詳細的闡述。
2.1 負荷時間序列分割
在給定負荷數(shù)據(jù)后,首先將其分割為由單個設(shè)備運行或者多個設(shè)備同時運行組成的一系列負荷子序列。需要處理的完整負荷數(shù)據(jù)通常是時間長度為24 h的數(shù)據(jù),在對其進行分割后,得到的各個子序列的時間長度縮短至min級別,各個子序列的功率變化特征更加明顯,能更準(zhǔn)確地和數(shù)據(jù)庫中存儲的單臺設(shè)備的時間序列進行相似性匹配。

圖1 識別負荷設(shè)備的基本流程
在對負荷數(shù)據(jù)進行分割時,根據(jù)負荷功率的躍升值確定子序列的起始點。為排除設(shè)備正常工作時的功率波動或其他干擾導(dǎo)致的負荷功率變化,需要事先設(shè)定一個功率躍變閾值ΔPset,只有當(dāng)負荷功率變化的絕對值大于ΔPset時,才認為有設(shè)備被啟動或者關(guān)閉。同時,根據(jù)負荷功率的跌落值,以及功率跌落發(fā)生后的Ts個時段內(nèi)的負荷功率變化狀態(tài)確定子序列的結(jié)束點。這是由于功率的跌落不只是發(fā)生在設(shè)備的關(guān)閉時刻,也可能發(fā)生在設(shè)備工作模式的轉(zhuǎn)換期間,因此如果功率跌落大于閾值,還需要判斷跌落后的負荷功率值P(t+1)以及在t之后的Ts個時段內(nèi)負荷功率是否進入平穩(wěn)狀態(tài)。
在Matlab環(huán)境下實現(xiàn)了負荷數(shù)據(jù)分割算法。表1給出了負荷時間序列分割算法的偽代碼。
表1 負荷數(shù)據(jù)分割算法偽代碼
Table 1 Pseudocodes for proposed load profile segmentation algorithm

注:輸入為用戶負荷時間序列;輸出為負荷數(shù)據(jù)分割結(jié)果;ΔP(t)=P(t+1)-P(t)。
上述算法中相關(guān)參數(shù)的設(shè)置對算法執(zhí)行效果有重要影響。在針對具體負荷數(shù)據(jù)進行設(shè)備識別時,算法參數(shù)與負荷數(shù)據(jù)的特點密切相關(guān),如何針對不同負荷情形確定最優(yōu)參數(shù)設(shè)置是一個值得研究的重要問題。在本文中,采用了一種啟發(fā)式方法,即通過在數(shù)據(jù)實驗中測試不同的參數(shù)設(shè)置對結(jié)果的影響來選擇最合適的參數(shù)。
2.2 基于DTW相似度量的負荷設(shè)備識別方法
在獲得了負荷數(shù)據(jù)的分割結(jié)果后,將每個子序列和已知的設(shè)備參考序列進行DTW匹配,記錄每次匹配計算所得到的DTW距離值和序列匹配的映射關(guān)系。選擇DTW距離值最小的匹配結(jié)果作為負荷設(shè)備識別結(jié)果,同時判斷DTW距離值是否大于閾值。如果小于閾值則設(shè)備識別結(jié)束;如果大于閾值,則表明此序列中同時還有其他設(shè)備,需要從含多臺設(shè)備的負荷序列中剔除已識別設(shè)備。每次將負荷子序列和設(shè)備耗電功率參考序列進行DTW匹配時,會把變化趨勢最相似的點自動匹配,并將變化最顯著的設(shè)備識別出來。因此,只需依據(jù)DTW匹配時已經(jīng)記錄的序列匹配的映射關(guān)系,將已識別出的設(shè)備耗電功率參考序列從負荷序列中減去,然后對負荷序列繼續(xù)進行分割,進而識別分割后的負荷序列直到每個子序列進行匹配后的DTW距離值小于閾值,則識別結(jié)束。圖2為一組DTW匹配時的序列映射關(guān)系示意圖。
負荷序列表示從某個未知時刻開始的時間長度為24 min的負荷耗電功率曲線。該段負荷由3臺設(shè)備構(gòu)成:在第1~6 min為空調(diào)負荷,第9~22 min為洗碗機負荷,第11~24 min為洗衣機負荷。從圖2所示的映射關(guān)系可知,此時該負荷序列的最優(yōu)DTW匹配是洗碗機的參考功率序列,且只有第9~22 min的序列值匹配到了洗碗機的參考序列上。因此洗碗機設(shè)備將首先被識別出來,然后洗碗機的耗電功率參考序列將被從負荷序列中減去,繼續(xù)進行其他電器設(shè)備的識別。

圖2 兩時間序列DTW匹配結(jié)果映射關(guān)系示意圖
R語言是一套具備數(shù)據(jù)處理、數(shù)學(xué)計算和統(tǒng)計制圖的完整軟件系統(tǒng)。由于其出色的數(shù)據(jù)分析功能,近年來在數(shù)據(jù)挖掘領(lǐng)域得到了廣泛的應(yīng)用。借助于其豐富的計算包[26],R語言可以靈活地實現(xiàn)針對不同領(lǐng)域的不同問題的數(shù)據(jù)分析。本文中,利用R語言中高效的DTW計算包來輔助實現(xiàn)所提出的負荷設(shè)備識別算法。表2 給出了利用R語言實現(xiàn)負荷設(shè)備識別算法時的偽代碼。
表2 負荷設(shè)備識別算法偽代碼
Table 2 Pseudocodes for proposed appliance identification algorithm

注:輸入為負荷時間序列的分割結(jié)果;輸出為設(shè)備識別結(jié)果列表;N為分割結(jié)果中子序列的總數(shù);M為電器設(shè)備總個數(shù)。
采用前文介紹的負荷設(shè)備識別算法,可確定構(gòu)成各個時刻用戶負荷的用電設(shè)備,并識別用戶在這些時段使用不同電器設(shè)備的行為習(xí)慣。這樣,就可利用負荷設(shè)備識別結(jié)果建立能夠明確各個時段內(nèi)系統(tǒng)負荷成分的用戶負荷模型,即明確各個時段內(nèi)構(gòu)成負荷的設(shè)備組合,并識別用戶在這些時段使用不同電器設(shè)備的行為習(xí)慣。

(10)
式中β0,t為服從特定分布的隨機變量,表示系統(tǒng)總負荷中未被識別的電器設(shè)備所構(gòu)成的負荷。由于設(shè)備識別存在誤差,該常數(shù)項也包括了識別結(jié)果和系統(tǒng)實際負荷之間存在的誤差。
式(10)給出了能夠明確各種負荷成分的系統(tǒng)負荷模型,根據(jù)各個電器設(shè)備的負荷特性,可利用該負荷模型進行精確而有目標(biāo)性的需求側(cè)管理,也可以分析用戶的用電行為特性,輔助零售商制定合適的售電策略。不過,這些內(nèi)容已經(jīng)超出了本文的研究范圍,不再贅述。
在式(10)中,β0,t和βi,t均是根據(jù)電器設(shè)備識別結(jié)果統(tǒng)計得到的隨機變量。因此,需要對這些參數(shù)的分布形態(tài)進行推斷。在實際中,用戶使用某些設(shè)備的行為可能存在關(guān)聯(lián),但研究這種行為的關(guān)聯(lián)性本身就是一個復(fù)雜的問題,本文不對此展開研究。為簡化處理,假定用戶對各個設(shè)備的使用行為之間相互獨立,這樣就可以分別對式(10)中的各個系數(shù)進行分布檢驗。由于無法事先對β0,t和βi,t的分布形態(tài)作簡單假定,故只能根據(jù)設(shè)備識別結(jié)果中的樣本數(shù)據(jù)對這些參數(shù)的分布形態(tài)進行推斷。上述問題屬于非參數(shù)檢驗的研究范疇,因此這里采用著名的統(tǒng)計分析軟件SPSS[27],并應(yīng)用單樣本非參數(shù)檢驗方法對這些隨機變量的分布形態(tài)進行分析。
SPSS軟件中包括4種單樣本非參數(shù)檢驗方法,即總體分布的卡方(Chi-square)檢驗、二項分布(Binomial) 檢驗、單樣本K-S(Kolmogorov-Smirnov)檢驗、單樣本變量值隨機性檢驗(Runs Test)。其中,總體分布的卡方檢驗適用于配合度檢驗,其根據(jù)樣本數(shù)據(jù)的實際頻數(shù)推斷總體分布與期望分布或理論分布是否具有顯著差異,常用于分析多個變量之間的關(guān)聯(lián)性; 或基于樣本數(shù)據(jù)分析多個變量之間是否滿足特定的比例關(guān)系。二項分布檢驗主要針對只有兩類取值的問題,通過分析樣本數(shù)據(jù),檢驗總體是否服從參數(shù)為P值的二項分布。單樣本K-S檢驗則利用樣本數(shù)據(jù)推斷總體是否與某一理論分布 (如正態(tài)分布、均勻分布、泊松分布、指數(shù)分布等) 有顯著差異,屬于擬合優(yōu)度的非參數(shù)檢驗方法,適用于分析連續(xù)型隨機變量的分布。單樣本變量隨機性檢驗也被稱為游程檢驗,用于檢驗?zāi)匙兞康娜≈凳欠駷殡S機過程。
本文首先使用游程檢驗排除設(shè)備數(shù)量的取值為隨機過程,然后采用單樣本K-S檢驗方法對給定時段內(nèi)各類電器設(shè)備數(shù)量的分布形態(tài)進行檢驗。
此外,如何適當(dāng)確定負荷模型中每個時段的長度,也是一個需要考慮的問題。在實際應(yīng)用中,如果時段t的長度太短,就會導(dǎo)致隨機變量的樣本數(shù)據(jù)量減少,導(dǎo)致參數(shù)估計不準(zhǔn)確,這樣時段長度的取值不能過小,可以針對具體應(yīng)用情形適當(dāng)確定。
4.1 負荷設(shè)備識別
盡管目前已有一些關(guān)于用戶負荷設(shè)備識別的文獻,但其中的數(shù)據(jù)多是非開源的。文獻[1]在實驗室環(huán)境內(nèi)以s為采樣單位測得并公開了31種家庭常用電器設(shè)備的有功功率數(shù)據(jù)。基于文獻[1]的電器設(shè)備耗電功率數(shù)據(jù),文獻[28]發(fā)展了智能電網(wǎng)環(huán)境下的負荷數(shù)據(jù)生成器,其根據(jù)事先給定的用戶用電行為參數(shù)(如工作時間、休息時間等)、家用電器列表以及各個電器的功率數(shù)據(jù)最終生成家庭用戶負荷數(shù)據(jù)。本文利用該生成器所產(chǎn)生的負荷數(shù)據(jù)進行數(shù)據(jù)實驗。
4.1.1 待識別電器設(shè)備的選取
文獻[28]利用由12種電器設(shè)備組成的備選庫來生成負荷數(shù)據(jù)。這些電器設(shè)備分別為:空調(diào)、冰箱、熱水器、洗衣機、洗碗機、微波爐、電爐灶、電視機、電熨斗、烘干機、冷藏柜、真空吸塵器。在這些電器設(shè)備中,有些具有典型特點,如:(1)常開電器,包括冰箱、冷藏柜等;(2)短時使用設(shè)備,如微波爐、電熨斗、真空吸塵器等;(3)小功率設(shè)備,如電視機等。需要指出,對上述電器設(shè)備特點的劃分主要依據(jù)其在負荷數(shù)據(jù)生成器中的能耗特性。
上述這些具有典型特點的設(shè)備都有一個共同特征:其能耗不構(gòu)成用戶負荷的主要組成部分。因此,這里選取剩余的6種電器設(shè)備進行負荷識別,即空調(diào)、熱水器、洗衣機、洗碗機、電爐灶和烘干機。在附圖A1中給出了一組采樣頻率為每30 s 1次時這6種電器設(shè)備的耗電功率參考曲線。
4.1.2 參數(shù)設(shè)置和結(jié)果統(tǒng)計分析
以500組采樣頻率為每min 1次的負荷數(shù)據(jù)作實驗樣本,對所提出的負荷識別算法進行測試。由于上述生成器產(chǎn)生的數(shù)據(jù)是以s為時間單位的,需要對負荷數(shù)據(jù)樣本進行適當(dāng)處理。首先,通過取時段內(nèi)負荷的平均值,將以s為時間單位的負荷數(shù)據(jù)轉(zhuǎn)化成以min為單位的。考慮到取時段內(nèi)負荷的平均值和實際中以min為單位采集所得的負荷數(shù)據(jù)有一定差別,算例中對取平均值和整分鐘取值2種情形進行了對比,結(jié)果見表3。然后,對負荷數(shù)據(jù)進行分割。附圖A2給出了對部分負荷數(shù)據(jù)進行分割的結(jié)果。
參數(shù)的合理設(shè)置對負荷設(shè)備的精確識別至關(guān)重要。表3給出了在不同參數(shù)設(shè)置情形下設(shè)備識別結(jié)果的統(tǒng)計數(shù)據(jù)。其中:Nsigl表示只包含單個電器設(shè)備的子序列數(shù)量;Nmult表示同時含有多臺電器設(shè)備的子序列數(shù)量;ηsigl和ηmult分別表示所提算法對單設(shè)備子序列和多設(shè)備子序列的準(zhǔn)確識別率;ηavg為ηsigl和ηmult的算術(shù)平均值。
由于實驗數(shù)據(jù)是利用文獻[28]中的居民負荷數(shù)據(jù)生成器所產(chǎn)生的數(shù)據(jù),因此通過將識別結(jié)果和原始數(shù)據(jù)中的電器狀態(tài)進行校驗來統(tǒng)計準(zhǔn)確率。具體為:對于識別結(jié)果中的每個時刻的每個電器設(shè)備,當(dāng)其被識別出的狀態(tài)與原始數(shù)據(jù)中的電器狀態(tài)相同時,則表示準(zhǔn)確識別1次,否則為錯誤識別1次,將總的準(zhǔn)確識別次數(shù)累加,其占總識別次數(shù)的百分比就是本文中的準(zhǔn)確率。將單設(shè)備和多設(shè)備子序列的識別結(jié)果分別進行統(tǒng)計即可得ηsigl和ηmult,由于居民負荷序列只包含單設(shè)備和多設(shè)備子序列,因此將ηsigl和ηmult進行算術(shù)平均,就可得總體識別準(zhǔn)確率。
4.1.3 與其他負荷識別算法的性能比較
由于目前還不存在被普遍認可和接受的測試算例,因此很難對不同的負荷識別算法直接進行性能比較。此外,盡管計算效率是負荷識別算法很重要的一個方面,但已有研究通常很少展示所提算法的計算效率而只著重在算法的識別準(zhǔn)確率。鑒于上述因素,如果要對不同的負荷識別算法進行比較,就需要重新編碼實現(xiàn)這些算法。
在文獻[29]中作者對其所提出的負荷識別算法的計算效率進行了分析,并給出了進行數(shù)據(jù)實驗時的算法執(zhí)行時間。本文在Matlab中重新編碼實現(xiàn)了文獻[29]中所提出的 PALDi (particle filter-based load disaggregation)負荷識別算法,在確保PALDi算法的執(zhí)行效果與文獻[28]中相一致的前提下,將其與本文所提出的DTWAI (dynamic time warping based appliance identification)負荷識別算法進行了對比,計算結(jié)果見表4。在對比算例中,有6種電器設(shè)備參與識別,PALDi算法中的粒子數(shù)取為100,表4中的結(jié)果為多次運行結(jié)果的平均值。從表4中的結(jié)果可以看出,識別相同的負荷數(shù)據(jù)時,本文所提出的算法在運算效率和識別準(zhǔn)確率方面都更優(yōu)。
表3 數(shù)字實驗中的參數(shù)設(shè)置和識別結(jié)果
Table 3 Parameter setting and identification results in numerical experiments

表4 所提出的負荷識別算法與 PALDi 算法的性能對比

相比于高頻率采樣時,在低采樣頻率下電器設(shè)備的功率波形特征會被削弱,將影響負荷識別的準(zhǔn)確率。但由于此時需要處理的數(shù)據(jù)量減小,負荷識別的運算速度將會大幅提高。可輔助以電器設(shè)備的其他電氣特征,如電器的使用時間、無功功率、電流和電壓波形等來提高識別的準(zhǔn)確率。在可接受的準(zhǔn)確率水平下,更高效的負荷識別算法將更有利于在智能電網(wǎng)的大數(shù)據(jù)環(huán)境下對負荷信息進行挖掘。
針對不同采樣頻率下的負荷數(shù)據(jù),采用上述方法進行了負荷識別,圖3中給出了識別準(zhǔn)確率統(tǒng)計結(jié)果。從圖3可以看出,隨著數(shù)據(jù)采樣頻率的降低,識別難度逐漸增加,識別準(zhǔn)確率隨之降低。當(dāng)采樣頻率為每3 min 1次時,多設(shè)備負荷序列識別準(zhǔn)確率下降到72.84%。

圖3 不同采樣頻率下負荷識別準(zhǔn)確率
4.2 負荷模型系數(shù)檢驗
前已述及,在建立負荷統(tǒng)計模型時,時段長度不能太短,在本算例中,選取時段長度為0.5 h。在4.1小節(jié)中已經(jīng)獲得了500組負荷數(shù)據(jù)在每個時刻的電器設(shè)備識別結(jié)果;以此為基礎(chǔ),利用式(10)所描述的負荷模型,可以方便地求得每個時刻對應(yīng)的系數(shù)值,見附表A1。由于希望得到的是式(10)所示的統(tǒng)計系數(shù)模型,因此可利用SPSS非參數(shù)檢驗對各個時刻的模型系數(shù)結(jié)果進行統(tǒng)計分析,最終即可獲得負荷模型統(tǒng)計系數(shù)的分布形態(tài),表5給出了相應(yīng)的統(tǒng)計分析結(jié)果。
表5 負荷統(tǒng)計模型系數(shù)的單樣本K-S檢驗結(jié)果
Table 5 One-sample K-S test results for all coefficients in load statistical model

表5中給出了對于第2個時段 (31~60 min) 的數(shù)據(jù),利用SPSS非參數(shù)檢驗進行分析所得到的結(jié)果。由于所選取的時段長度為0.5 h,因此在每個時段內(nèi)總共有30個樣本數(shù)據(jù)。又由于數(shù)據(jù)試驗中所使用的500組負荷數(shù)據(jù)是對500個居民用戶進行仿真所生成的數(shù)據(jù),而負荷模型是針對1個居民用戶的,因此沒有同時使用500組負荷數(shù)據(jù)做統(tǒng)計分析。在顯著性水平為0.05的條件下,β0、β1和β2的單樣本非參數(shù)檢驗結(jié)果中的顯著性水平,即表5中的P值,分別為0.229、0.369和0.462,均大于0.05,也即接受其服從均勻分布的原假設(shè)。β3、β5和β6的單樣本非參數(shù)檢驗結(jié)果中的顯著性水平分別為0.600、0.235和 0.146,都大于0.05,也接受其原假設(shè),即均服從泊松分布。對于β4,由于在所分析的時段內(nèi),該設(shè)備對應(yīng)的識別結(jié)果保持不變,即為常數(shù),因此沒有必要對此系數(shù)進行統(tǒng)計分析。
需要特別指出,在某些電器設(shè)備如電爐灶的使用過程中,由于工作模式的調(diào)整其耗電功率會發(fā)生變化。因此,本文在對此類設(shè)備求解負荷模型系數(shù)時,均采用設(shè)備的平均耗電功率。但在負荷識別時,則是以此類設(shè)備的典型波動負荷曲線作為參考序列的。
4.3 結(jié)果分析
從表3列出的數(shù)據(jù)實驗結(jié)果中可以看出,對于僅含單臺設(shè)備的負荷子序列,能夠獲得相當(dāng)滿意的識別結(jié)果。然而,對于含有多臺設(shè)備的子序列,其識別結(jié)果的準(zhǔn)確性則尚有較大的提升空間。這是因為:(1)多臺設(shè)備的同時運行會使各個設(shè)備的功率曲線特征在總功率曲線中被弱化(例如,2個功率不同的設(shè)備同時運行時,功率之和可能接近另外某一個設(shè)備的耗電功率;也有可能2臺耗電功率波動的設(shè)備同時運行,功率疊加的結(jié)果更近似于另一臺平穩(wěn)功率運行的設(shè)備)。(2)在由多臺設(shè)備組成的子序列中,其中所包含的不同設(shè)備的運行時間一般有差異,因此在生成電器設(shè)備的參考序列時,其時間長度難以適當(dāng)確定,也會導(dǎo)致識別的準(zhǔn)確率降低。
除了上述因素外,負荷設(shè)備識別算法的準(zhǔn)確性還受功率閾值ΔPset、時間閾值Ts、電器設(shè)備耗電功率參考序列等的影響。功率閾值和時間閾值直接影響負荷時間序列的分割結(jié)果,分割結(jié)果中各個子序列的復(fù)雜度相應(yīng)地決定了基于DTW設(shè)備識別方法的匹配難度。例如,在分割過程中,如果能將使用時間上鄰近的2個設(shè)備分為2個子序列,與將2個子序列分割在一起作為一個多設(shè)備負荷序列相比,在DTW匹配處理時后者增加了識別算法的復(fù)雜程度。再者,由于電器設(shè)備實際運行情況復(fù)雜多變,在有些情況下其耗電功率的典型特點表現(xiàn)的并不明顯,這也會增加其識別的難度,導(dǎo)致識別的準(zhǔn)確性降低。因此,需要建立包含更多耗電功率情形的電器設(shè)備功率參考序列集合。
表5中給出了系統(tǒng)負荷模型的相關(guān)結(jié)果,可以看出在基于設(shè)備識別結(jié)果所建立的負荷統(tǒng)計模型中,系數(shù)呈現(xiàn)出特定的分布規(guī)律。采用統(tǒng)計模型既能夠在一定程度上減小設(shè)備識別誤差的影響,又能夠借助這些參數(shù)的分布規(guī)律挖掘用戶用電行為特點。更為重要的是,所建立的負荷統(tǒng)計模型明確了系統(tǒng)負荷在各個時段內(nèi)的具體構(gòu)成,可以方便地用于需求側(cè)管理。
在智能電網(wǎng)環(huán)境下,利用智能計量設(shè)備能夠收集越來越多的用戶負荷數(shù)據(jù)。采用大數(shù)據(jù)挖掘方法對用戶負荷進行處理,既能夠分析用戶用電行為習(xí)慣又可以輔助進行負荷精確建模,進而實現(xiàn)精確而有目標(biāo)性的需求側(cè)管理,或制定具有針對性的零售商售電策略。負荷設(shè)備識別是負荷數(shù)據(jù)挖掘的基礎(chǔ)。基于這樣的考慮,本文首先采用以動態(tài)時間彎曲距離為基礎(chǔ)的時間序列匹配思想,提出了一種針對負荷低頻采樣的居民電器設(shè)備識別方法。在此基礎(chǔ)上,構(gòu)建了居民負荷統(tǒng)計模型,以便將負荷設(shè)備識別結(jié)果應(yīng)用于需求側(cè)管理和構(gòu)造電力零售策略。數(shù)據(jù)實驗結(jié)果表明,在每min采樣1次負荷數(shù)據(jù)時,所提出的負荷設(shè)備識別方法對單設(shè)備負荷序列識別的準(zhǔn)確率超過93%,而對較難識別的多設(shè)備負荷序列準(zhǔn)確率則接近83%。
如何提升對多設(shè)備負荷序列識別的準(zhǔn)確率進而對用戶用電行為進行系統(tǒng)而深入的分析是下一步研究的主要內(nèi)容。
[1]REINHARDT A,BAUMANN P,BURGSTAHLER D,et al. On the accuracy of appliance identification based on distributed load metering data [C] // Proceedings of the Sustainable Internet and ICT for Sustainability. Pisa,Italy: IEEE,2012:1-9.
[2]XU Y,MILANOVIC J V. Artificial-intelligence-based methodology for load disaggregation at bulk supply point [J]. IEEE Transactions on Power Systems,2015,30(2):795-803.
[3]余貽鑫,劉博,欒文鵬. 非侵入式居民電力負荷監(jiān)測與分解技術(shù) [J]. 南方電網(wǎng)技術(shù),2013,7(4):1-5.
YU Yixin,LIU Bo,LUAN Wenpeng. Noninstrusive residential load monitoring and decomposition technology [J]. Southern Power System Technology,2013,7(4):1-5.
[4]FIGUEIREDO M,DE-ALMEIDA A,RIBEIRO B. Home electrical signal disaggregation for non-intrusive load monitoring (NILM) systems [J]. Neurocomputing,2012(96):66-73.
[5]DONG M,MEIRA P C M,XU W,et al. Non-intrusive signature extraction for major residential loads [J]. IEEE Transactions on Smart Grid,2013,4(3):1421-1430.
[6]LIANG J,NG S K K,KENDALL G,et al. Load signature study—Part I:basic concept,structure,and methodology [J]. IEEE Transactions on Power Delivery,2010,25(2):551-560.
[7]MITTELSDORF M,HUWEL A,KLINGENBERG T,et al. Submeter based training of multi-class support vector machines for appliance recognition in home electricity consumption data [C] // Proceedings of the 2nd International Conference on Smart Grids and Green IT Systems,Aachen,Germany,2013:151-158.
[8]PARADISO F,PAGANELLI F,LUCHETTA A,et al. ANN-based appliance recognition from low-frequency energy monitoring data [C]//Proceedings of the 2013 IEEE 14th International Symposium and Workshops on a World of Wireless,Mobile and Multimedia Networks (WoWMoM). Madrid,Spain:IEEE,2013:1-6.
[9]RUZZELLI A G,NICOLAS C,SCHOOFS A,et al. Real-time recognition and profiling of appliances through a single electricity sensor [C] // Proceedings of the 2010 7th Annual IEEE Communications Society Conference on Sensor Mesh and Ad Hoc Communications and Networks (SECON). Boston,MA:IEEE,2010:1-9.
[10]PAGANELLI F,PARADISO F,TURCHI S,et al. Appliance recognition in an OSGi-based home energy management gateway [J/OL]. International Journal of Distributed Sensor Networks,2015:1-12. [2016-11-20].http://www.hindawi.com/journals/ijdsn/2015/937356.
[11]BELLEY C,GABOURY S,BOUCHARD B,et al. An efficient and inexpensive method for activity recognition within a smart home based on load signatures of appliances [J]. Pervasive and Mobile Computing,2014,12(3):58-78.
[12]MCLOUGHLIN F,DUFFY A,CONLON M. Characterising domestic electricity consumption patterns by dwelling and occupant socio-economic variables:an irish case study [J]. Energy and Buildings,2012,48(19):240-248.
[13]林順富, 黃娜娜, 趙倫加, 等. 基于用戶行為的家庭日負荷曲線模型[J]. 電力建設(shè), 2016, 37(10): 114-121.
LIN Shunfu,HUANG Nana, ZHAO Lunjia, et al. Domestic daily load curve modeling based on user behavior [J]. Electric Power Construction, 2016, 37(10): 114-121.
[14]黎靜華, 葉柳. 基于出線的變電站綜合負荷建模方法 [J]. 電力建設(shè), 2014, 35(9): 7-12.
LI Jinghua,YE Liu. Outlet-based substation comprehensive load modeling method [J]. Electric Power Construction, 2014, 35(9): 7-12.
[15]鄭小霞,劉慶強,林順富,等. 面向非干預(yù)式負荷監(jiān)測的居民負荷微觀特性研究[J]. 電力系統(tǒng)保護與控制,2014,42(10):62-71.
ZHENG Xiaoxia,LIU Qingqiang,LIN Shunfu,et al. Research of the microscopic signatures of residential loads for NILM [J]. Power System Protection and Control,2014,42(10):62-71.
[16]高云,楊洪耕. 基于暫態(tài)特征貼近度匹配的家用負荷識別 [J]. 電力系統(tǒng)自動化,2013,37(9):54-58.
GAO Yun,YANG Honggeng. Household load identification based on closeness matching of transient characteristics [J]. Automation of Electric Power Systems,2013,37(9):54-58.
[17]張紅梅,孫潔,許儀勛,等. 基于暫態(tài)特征聚類的家用負荷識別[J]. 電子技術(shù)與軟件工程,2015(6):185-186.
[18]曲朝陽,于華濤,郭曉利. 基于開啟瞬時負荷特征的家電負荷識別 [J]. 電工技術(shù)學(xué)報,2015,30(1):358-364.
QU Zhaoyang,YU Huatao,GUO Xiaoli. The recognition of appliances instantaneous load [J]. Transactions of China Electrotechnical Society,2015,30(1):358-364.
[19]林順富,趙倫加,劉慶強,等. 基于0-1 二次規(guī)劃的非干預(yù)式負荷識別算法研究 [J]. 電力系統(tǒng)保護與控制,2016,44(8):85-91.
LIN Shunfu,ZHAO Lunjia,LIU Qingqiang,et al. A nonintrusive load identification method based on quadratic 0-1 programming [J]. Power System Protection and Control,2016,44(8):85-91.
[20]牛盧璐,賈宏杰. 一種適用于非侵入式負荷監(jiān)測的暫態(tài)事件檢測算法[J]. 電力系統(tǒng)自動化,2011,35(9):30-35.
NIU Lulu,JIA Hongjie. Transient event detection algorithm for non-intrusive load monitoring [J]. Automation of Electric Power Systems,2011,35(9):30-35.
[21]趙云,錢斌,王科,等. 基于特征相似度的非侵入式用電負荷識別模型研究 [J]. 電氣應(yīng)用,2015(S):199-203.
[22]王慶玉,張青青,張高峰,等. 譜聚類算法在家用負荷識別中的應(yīng)用[J]. 電測與儀表,2015,52(1):119-123.
WANG Qingyu,ZHANG Qingqing,ZHANG Gaofeng,et al. Application of the spectral clustering algorithm to household load identification [J]. Electrical Measurement & Instrumentation,2015,52(1):119-123.
[23]李坦,楊洪耕,高云. 智能電表家用負荷識別技術(shù)綜述 [J]. 供用電,2011,28(6):39-42.
LI Tan,YANG Honggeng,GAO Yun. Overview of exploration on household load identification of intelligent metering [J]. Distribution & Utilization,2011,28(6):39-42.
[24]BERNDT D,CLIFFORD J. Using dynamic time warping to find patterns in time series [R]//AAAI-94 Workshop on Knowledge Discovery in Databases. New York: AAAI, 1994.
[25]KEOGH E,RATANAMAHATANA C A. Exact indexing of dynamic time warping [J]. Knowledge and Information Systems,2005,7(3):358-386.
[26]GIORGINO T. Computing and visualizing dynamic time warping alignments in R:the DTW package [J]. Journal of Statistical Software,2009,31(7):1-24.
[27]CORDER G W,F(xiàn)OREMAN D I. Nonparametric statistics for non-statisticians:a step-by-step approach [M]. USA:John Wiley & Sons,2009.
[28]KONG W,DONG Z Y,CHEN G,et al. A rule based domestic load profile generator for future smart grid [C] // Proceedings of the 2014 IEEE Australasian Universities Power Engineering Conference (AUPEC). Perth,WA:IEEE,2014:1-5.
[29]EGARTER D,BHUVANA V P,ELMENREICH W. PALDi:online load disaggregation via particle filtering[J]. IEEE Transactions on Instrumentation and Measurement,2014,64(2):467-477.
(編輯 張媛媛)
附錄A

圖A1 電氣設(shè)備耗電功率參考序列
注:圖A1中橫坐標(biāo)表示采樣時間間隔 (為0.5 min);縱坐標(biāo)表示電氣設(shè)備的耗電功率 ,W;Aircon / Cooking Stove/Dishwasher / Laundry Dryer / Washing Machine/Water Heater 分別表示空調(diào)/電爐灶/洗碗機/烘干機/洗衣機/熱水器。
Residential Appliance Identification and Load Modeling Based on Big Data Mining in Smart Grid Environment
YANG Jiajia1, ZHAO Junhua2, WEN Fushuan3,4, DONG Zhaoyang5, XUE Yusheng6
(1. School of Electrical and Information Engineering,University of Sydney, Sydney 2006, Australia; 2. The Chinese University of Hong Kong, Shenzhen 518100,Guangdong Province, China; 3. College of Electrical Engineering, Zhejiang University, Hangzhou 310027, China; 4. Department of Electrical and Electronic Engineering, Universiti Teknologi Brunei, Bandar Seri Begawan BE1410, Brunei; 5. Electric Power Research Institute,China Southern Power Grid, Guangzhou 510080, China; 6. NARI Group Corporation/State Grid Electric Power Research Institute, Nanjing 211106, China)
Through big data mining of residential load data, it can not only analyze the electricity consumption behaviour of residents by the identification of electrical load equipment, but also establish the load precise modeling, which can realize targeted demand-side management as well as develop customized electricity retailing strategies. Given this background, based on the dynamic time warping (DTW) time series matching method, this paper proposes a novel appliance identification algorithm for low frequency sampling load data. Firstly, the residential load sequence is segmented into subsequences composed of the single appliance load profile and multi-appliance load profile. Then, according to the time length of subsequences to be identified and measured electrical equipment power consumption data, reference load sequences of all given appliances are generated which have the same length of each query subsequence, including power change from the moment before equipment start to that after equipment shutdown. Finally, the DTW distance is taken as the similarity metric to determine recognition results. For a subsequence composed of multiple appliances, the best matched reference sequence is reduced after each DTW is matched, and then segmentation and DTW matching are carried on until all appliances are extracted. Given the status of all identified appliances, a statistical residential load model is developed. The proposed algorithm is coded in the R programming language and tested through a load dataset containing 500 households profiles. The simulation results show that the proposed algorithm could identify the single appliance load subsuquence at an accuracy above 93%, under the condition that the load data is sampled once every minute; while for the more difficult multi-appliance subsequence identification, the achieved accuracy is around 83%.
smart grid; data mining; R programming language; dynamic time warping (DTW); appliance identification; load modeling

圖A2 用戶負荷時間序列分割結(jié)果

國家自然科學(xué)基金項目 (51477151);南方電網(wǎng)公司科技項目 (WYKJ00000027)
TM 73
A
1000-7229(2016)12-0011-13
10.3969/j.issn.1000-7229.2016.12.002
2016-09-08
楊甲甲(1989),男,博士研究生,主要從事電力經(jīng)濟與電力市場、智能電網(wǎng)、可再生能源接入等方面的研究工作;
趙俊華(1980),男,“青年千人計劃”入選者,副教授,本文通信作者,主要從事電力系統(tǒng)分析與計算、智能電網(wǎng)、計算智能方法在電力系統(tǒng)中的應(yīng)用、電力經(jīng)濟與電力市場等方面的研究工作;
文福拴(1965),男,教授,博士生導(dǎo)師,主要從事電力系統(tǒng)故障診斷與系統(tǒng)恢復(fù)、電力經(jīng)濟與電力市場、智能電網(wǎng)與電動汽車等方面的研究工作;
董朝陽(1971),男,“千人計劃”特聘專家,講座教授,主要從事電力系統(tǒng)安全性、電力系統(tǒng)規(guī)劃與管理、電力市場仿真與風(fēng)險管理、數(shù)據(jù)挖掘等方面的研究工作;
薛禹勝(1941),男,中國工程院院士,博士生導(dǎo)師,名譽院長,主要從事電力系統(tǒng)自動化方面的研究工作。
Project supported by National Natural Science Foundation of China (51477151)