祁兵,韓璐
(華北電力大學 電氣與電子工程學院,北京 102206)
傳統的監測系統多采用侵入方式對家電運行狀態進行監測,并為能源管理系統提供相關數據。這種系統高昂的成本投入以及較差的擴展性使得其應用范圍受限。同時其在安裝過程中需得關閉用電設備,會影響大眾的日常生活作息,這也是其難于推廣的原因之一。非侵入式負荷監測系統(Non-Intrusive Load Monitoring,NILM)或許能夠克服這一缺陷[1]。NILM僅需要在家庭電力入口處安裝采集和識別裝置,采集負荷電流及電壓等電力數據,然后進行負荷辨識,可準確分析出所有家電的運行狀態[2-3]。集中式的數據采集技術大幅度地降低了系統成本,智能化的辨識算法讓監測系統能夠提供各種電器詳盡的用電信息。
George Hart教授早先研究了一種基于電力入口處穩態功率數據的負荷分解技術[4],根據這一理論,美國電力科學研究院設計出了一款NILM系統[5-7]。其首先完成功率變化的邊緣檢測,分析電器的開閉狀態,并將這些功率信息提取出來;然后將這些數據在復功率平面上進行聚類,得到不同的聚類區域,再進行聚類匹配,最后識別用電設備。這種方法對于單一設備的運行狀態有著較好的監測性能,但當多個電器混合使用時容易發生誤判或者漏判。為解決這一難題,文獻[8-9]根據突變信號檢測理論,給出了一種使用暫態功率信息的非侵入式監測理論;此外,文獻[10-11]提出了一種基于多處理器的暫態事件檢測系統理論,并給出了軟硬件的實現方法。NILM系統的研究工作在國內開展較晚。隨著智能電網的發展,居民用電側智能化的重要性逐漸顯露,用電的智能化已成為電網未來必然的發展方向。文獻[12]針對非侵入式電力負荷分解給出了一種最佳求解算法,建立了基于多Agent技術的系統架構;文獻[13]與文獻[14]分別利用負荷的穩態與暫態特征進行非侵入式負荷分解;文獻[15]基于非侵入式負荷監測研究了微電網電能管理方法,利用模糊C均值聚類處理負荷參數,采用貼近度方法對負荷進行識別[16];文獻[17]利用主成分分析方法對負荷樣本特征降維,結合Fisher將負荷投影為兩類實現負荷分離辨識。
針對當前非侵入監測的實際需求,本文根據采集信號的特征,利用模式識別的思想,研究了一種基于負荷空間劃分的負荷辨識算法。此算法通過對特征進行降維處理從而提取最佳有效特征,進一步利用最小平方誤差算法實現負荷空間的劃分,從而實現不同負荷在特征空間的分類辨識。本文通過實測數據實驗驗證基于負荷空間劃分的非侵入式辨識方法的可行性。
非侵入負荷監測系統是相對于侵入式方法提出的,它在居民供電入口處采集用戶用電負荷總的用電信息,圖1為非侵入式負荷監測系統結構圖。
圖1 非侵入負荷監測結構圖
NILM不需要侵入單個家電內部,僅需要在居民進戶線總開關的主電源輸入上安裝一個非侵入采集及識別裝置,用來分析測得的復合電流和電壓信號,根據一定的算法,非侵入式負荷監測便能夠將各個用電器從中分解出來。非侵入式負荷監測簡化了電力數據采集機制,節省了設備費用。由于全部負荷的特征數量多,且特征之間有重疊信息或者負荷特征接近時,辨識的難度會增加。因此,從采集的整體信號中分析提取單個負荷特征,并且在眾多特征中挑選最能代表負荷的有效特征,依據有效特征為負荷分類,準確地實現負荷辨識是本文算法的關鍵與難點。
本文算法參考模式識別系統,將非侵入式采集系統所采集的各類負荷用電數據作為基礎,通過數據篩選和去噪等數據預處理,利用算法提取最佳辨識特征,并依據負荷特征實現分類器的設計,完成負荷分類,從而實現負荷的辨識。式識別系統由四個部分組成:數據獲取,預處理,特征提取和分類決策,如圖2所示。
圖2 模式識別系統
(1)數據獲取:利用非侵入監測系統采集電力入口處負荷總的電流和電壓信息;
(2)預處理:對采集到的電流和電壓信息進行去除噪聲以及去直流處理,并依據信號時頻分析的結果,計算有功功率、無功功率、相角、諧波特征等負荷特性,組成特征矩陣;
(3)特征提取和選擇:負荷特征共同組成信號,特征之間有能量的交叉,使用算法對特征進行降維,使新的特征空間互不相關;
(4)分類決策:即給不同負荷劃分屬于自己的特征空間,并用統計方法把被識別的對象歸為相應類。確定判別準則,使按照這種判別準則對被識別的對象進行分類所造成的誤差最小。
本文基于負荷的有效特征構建特征空間,通過對特征空間進行劃分的思想,研究了一種非侵入數據采集機制下的負荷辨識算法。
在實際的非侵入負荷識別問題中,選擇的負荷特征經常彼此相關,數量很多,且大部分都是無用的。本文中將負荷設備所具有的與負荷識別相關的特征構成特征集,用特征向量來表示,特征構成了特征向量中的元素。由于負荷特征共同組成信號,它們之間有能量的交叉,因而進行特征的降維,可以減少特征空間的維數,形成新的負荷特征空間,從而使新的負荷特征空間互不相關,使非侵入負荷辨識以更少的存儲和計算復雜度獲得更好的辨識準確性。本文利用非侵入監測系統下所采集的典型負荷電壓及電流信號,計算出穩態電流、暫態電流、穩態電壓、諧波分量、電流有效值、有功功率、無功功率和功率因數等典型負荷特征,根據文獻[18]定義的電流有效值,電壓有效值以及諧波分量求解如式(1)~式(3),根據文獻[19]所定義的有功功率及無功功率的求解算法,計算公式如式(4)和式(5):
(1)
(2)
(3)
(4)
(5)
(6)
式中Irms是電流有效值;Urms是電壓有效值;ff是諧波分量;P是有功功率;Q是無功功率;angle是功率因數角;V、I分別是負荷的電壓和電流;φ是電壓和電流的相位差;i是諧波次數。由所計算出的負荷特征作為矩陣的元素得出特征矩陣F:
(7)
式中n為非侵入負荷系統的負荷個數;d為特征個數;以f1,f2,…,fn表示矩陣F某一類的向量。F的協方差矩陣為:
Rd×d=E{(F-E(F)) (F-E(F))T}
(8)
計算矩陣R的特征值矩陣Λ和其對應的特征向量Φ:
(9)
Φ=(φ1;φ2;…;φd)
(10)
為了將d維特征降到m(m A=(φ1;φ2;…;φm) (11) sm×1=Am×dfd×1 (12) 則f可表示為下式: (13) 式中sj表示m維向量s的第j個向量;φj表示第j個特征向量。則引入降維前后負荷信號的誤差Δf: (14) 均方誤差為: (15) 式中的λj越小,即誤差越小,也就是不采用的特征向量對應的特征值應盡可能小。將λd按其順序由大到小排列: λ1≥λ2≥…≥λm≥λm+1…λd (16) 特征向量個數的選擇利用主成分累積貢獻率γk為評價指標。主成分貢獻率ρd及γk的表達式如下: (17) (18) 當 時,新特征所表示的信號包含了原始數據矩陣的主要信息,即選擇前m個特征作為新的有效特征。 因此,當我們利用一種"截斷"的方式選擇矩陣 最大的前 個特征值對應的特征向量作為基向量表示原信號時,新特征所表示的信號和原負荷信號的差別最小,本文中定義均方誤差為截斷誤差[20]。 計算新的負荷特征空間 代替原來的特征空間 : F′=ATF (19) 計算截斷誤差: (20) 將特征矩陣F用n個正交基向量的加權和來表示: (21) 式中αt為加權系數;μt為正交基向量,滿足: (22) 用矩陣表示即為: (23) α=UTF (24) 將式(24)帶入式(8)中: R=E(FFT)=E(UααTUT)=UE{ααT}UT (25) 使向量F的每個分量間互不相關,即應滿足: (26) 寫成矩陣形式: (27) 則: R=UΛUT (28) 上式兩邊右乘U,得RU=UΛUTU=UΛ 即: Rμj=λjμj (29) 可看出λj是矩陣F的自相關矩陣R的特征值,μj是其對應的特征向量,即式(10)中的Φ。即此算法使負荷各信號各分量相互獨立。 經過負荷特征空間的降維,非侵入負荷用電數據形成新的負荷特征空間,降維之后的數據能較完整的代表原數據,且其特征之間互不相關,提高了負荷辨識的速率。 負荷的不同模式映射成特定的特征向量后,該特征向量即為特征空間的一個點,在特征空間中,同一類負荷的點集在某種程度上與屬于另一類負荷的點集相分離,因此,找到一個判別函數,把屬于不同類的負荷點集分開,則能完成負荷的分類辨識。判別函數通過幾何的方法使負荷特征空間分解為對應于不同類別負荷的子空間,本文使用線性判別函數劃分負荷的各個類,為了辨識每個負荷,需將多個負荷分為多個類,即通過線性判別函數為每個負荷劃分屬于自己的空間。為了簡化運算,本文將多類負荷辨識問題簡化為兩類問題。將已分離的負荷作為一類,剩下未分離的負荷作為另一類,接著將已分離的特征數據從特征矩陣中剔除,矩陣中的余下數據構成新的負荷特征空間,循環利用本文算法,對其它未完成空間劃分的負荷特征數據實現降維并得出判決函數,依次將每個負荷劃分各自的空間,實現負荷辨識。 當每類負荷有兩個特征時,負荷空間是二維的,則在空間中存在判別函數: g(y)=ω1y1+w2y2+w3 (30) 式中w是系數;y1、y2為坐標變量,即此模式的特征值。 當每類負荷有三個及以上特征時,線性判別函數的形式為: (31) 式中W0=(w1,w2,…,wm)T為線性方程組的系數矩陣。為了運算方便,在新的負荷特征空間矩陣F′的元素后再附加元素1,其空間的基本幾何性質并未發生改變[21]。則式(31)可寫成: g(y)=WTY (32) 式中W=(w1,w2,…,wm,wm+1)稱為系數矩陣;Y稱為矩陣F′的增1矩陣。 圖3為兩類模式的線性判別函數圖。 圖3 兩類模式的線性判別函數 在使用最小平方誤差算法進行負荷特征空間劃分時,我們需要找到系數矩陣W[21],使得: WTYn=bn>0 (33) 式中bn是一些任意取定的正整數,將式(32)寫成方程組的形式即為: YW=B (34) 矩陣Y如式(35): (35) 式(34)為常量B: B=[b1,b2,…,bn]T (36) 將式(34)的線性方程組用矩陣簡化,有: (37) 我們將判別函數的系數矩陣求解轉化為更易理解的線性方程組的求解。最小平方誤差方法(LMSE)以最小均方誤差作為準則,定義誤差向量: e=YW-B (38) 因此使得誤差向量長度的平方最小化,定義最小化誤差平方和的準則函數為: (39) 利用梯度搜索算法[21]求式(38)的解,計算梯度: (40) 使式(40)為0,得到系數矩陣的唯一解: W=Y+B (41) 其中:Y+為Y的偽逆矩陣。將所得系數帶入式(31)中,即可得出一條線性判別函數。 n個負荷劃分各自的特征空間需要循環使用n-1次算法,最終得到n-1條判決曲線。將待辨識負荷數據降維處理之后,描點在已劃分好的獨立負荷特征空間中,根據其坐落的區域為哪幾個獨立負荷所屬區域的交叉來實現負荷辨識。圖4所示為算法的整體實現流程圖。 圖4 算法實現流程 選取了電風扇、電水壺、電飯煲、空調、電視機5種負荷分別投入運行,利用負荷電流和電壓的實測用電數據,提取了諧波分量、有功功率、無功功率、功率因數等10個多維負荷特征。構建了5×10維特征矩陣并歸一化得到矩陣F。 表1 矩陣F特征值排列 表1為矩陣F的自相關矩陣特征值由大到小排列的結果。特征值λ1的成分貢獻率ρ1=66.14%,特征值λ2的成分貢獻率ρ2=33.30%,則前兩個特征值累積貢獻率ρ=99.44%>95%,因此將特征矩陣由10維降為2維。計算截斷誤差:ξ=0.012 7,小于5%,即降維之后的數據可以代表原數據。降維后,新的互相獨立的特征合起來表征整個信號。 新的特征矩陣如下: 矩陣Y的增1矩陣為: 矩陣YY的偽逆矩陣為: 設矩陣B為: 系數矩陣為: 即第一條判決邊界為: y1=-3304x+236.3 結果如圖5所示:紅色的判決邊界將處于區域最左邊的負荷與其余四個負荷分離。 將已分離的負荷特征數據從特征矩陣中剔除,再利用此算法對其它未完成空間劃分的四個負荷特征數據實現降維并得出判決函數。 第二條判決曲線為: y2=-9251x+4.07e7 第三條判決曲線為: y3=4535.7x+1.28e8 第四條判決曲線為: y4=-2.13e4x+8.09e8 圖5 負荷空間的判別曲線 表2 待識別混合樣本特征值 根據圖5所示4條負荷判別曲線,劃分每個負荷的特征區域。 劃分結果如圖6(a)所示,只有負荷1在紅色判別曲線左邊,即紅色判別曲線將負荷1與其余負荷分離,紅色區域代表負荷1的特征空間;去除已完成分離的負荷1,畫出第二條藍色判別曲線,如圖6(b)所示,只有負荷2在藍色判別曲線左邊,即負荷2與負荷3、4和5分離,藍色區域為負荷2的特征空間;同理,淺藍色區域代表負荷3的特征空間,黃色區域代表負荷4的特征空間,綠色區域代表負荷5的特征空間。每個負荷有不同的特征區域,從而實現混合負荷的辨識。 圖6 負荷的特征空間 5個負荷的26種混合負荷運行狀態的樣本特征值如表2所示。為了驗證此算法的有效性,本文分別選取2種負荷、3種負荷、4種負荷以及全部5種負荷同時運行時的混合降維數據為試驗樣本,其在空間中的位置如圖7所示。 四組樣本數據坐落于不同的空間位置,根據圖7各個特征空間的劃分,區域①為負荷2、負荷3和負荷4的共同特征空間區域,因此混合樣本是負荷2、負荷3和負荷4混合運行產生的;區域②為負荷1、負荷2、負荷3和負荷4的判別曲線所包圍的區域,即此樣本為此四個負荷混合運行數據;區域③為負荷3和負荷5特征空間的交叉區域,即此樣本是負荷3和負荷5混合運行產生的;同理,區域④為5種負荷同時投入運行的狀態。 圖7 基于負荷空間劃分的負荷辨識圖 由于Fisher有監督判別,是將負荷投影在相同區域,判別的時候數據重疊降低其運算效率及準確率。而本文利用數據降維及為負荷劃分不同區域的方法,降低了運算復雜度,提高了準確率。通過與Fisher辨識算法對比說明本文算法依據特征為負荷劃分空間使辨識效率及準確率更高,能夠有效判定負荷運行狀態。 圖8所示為該算法與Fisher有監督辨識算法的性能對比曲線。 圖8 算法性能對比 由圖8(a)可以看出,該算法運算效率優于Fisher辨識算法;由圖8(b)可以看出,本文算法的辨識準確率整體高于Fisher辨識,且隨著混合運行負荷數的增加,本文算法的辨識準確率降低了4%左右,而Fisher辨識算法了14%左右,所以本文算法受負荷數增加的影響較小,一定程度上可以克服由于負荷數增加辨識準確率降低的問題,且算法魯棒性較好。 提出了一種基于負荷空間劃分的非侵入式辨識算法,該算法立足于非侵入采集機制下所獲取的數據,通過計算其時頻域特征,進一步將信號分解為相互獨立的成分實現特征降維,獲取新的負荷特征空間。在此基礎上,利用最小平方誤差算法設計判別函數,為不同負荷劃分各自的空間,根據待辨識負荷所落的區域進行負荷的辨識。通過實測數據驗證了此算法的有效性,且線性判別函數使負荷空間劃分過程更為簡化快速,且能夠較準確的辨識負荷。3 實驗仿真與分析
4 結束語