牛 罡,張 凱,郭祥富,胡軍星,袁林峰,徐勇明,史建勛,張志友
(1. 河南九域騰龍信息工程有限公司,河南 鄭州 450052; 2. 國網河南省電力公司,河南 鄭州 450000;3. 國網浙江嘉善縣供電有限公司,浙江 嘉善 314100; 4. 東南大學電氣工程學院,江蘇 南京 210096)
由于環境友好的需求,近年來可再生能源發電規模不斷擴大,特別是風能和光伏。然而可再生能源在電力系統中的日益普及使得電能質量問題更加嚴重,這主要體現在兩個方面:1)在傳統擾動標簽之外又引入了新的干擾類型,如振蕩和尖峰[1];2)各種干擾源間的相互作用產生了更復雜的電能質量擾動。這些干擾會導致嚴重的危害,如繼電保護裝置失靈和敏感設備損壞。為了提高可再生能源并網的電能質量,首要任務是對電能質量進行準確分類[2-3],進而有利于后續的治理策略和評價。
電能質量擾動識別的關鍵是如何從原始信號中提取出有用的特征,目前最常用的特征算法有傅立葉變換、小波變換、Stockwell變換、經驗模態分解等,如文獻[4]針對分布式能源接入條件下的復雜電能質量擾動問題,提出了一種基于VMD初始化S變換的數據處理方法;文獻[5]針對微電網電能質量擾動信號分類,提出了一種改進LMD的信號處理方法;文獻[6]針對各類分布式設備和智能設備接入電力系統后引發的復雜電能質量擾動問題,提出了一種基于分段改進S變換和隨機森林的識別方法。
雖然上述方法取得了一定進展,但各方法的使用仍有很大的限制,如基于傅立葉變換的方法的性能受到固定窗口大小的限制;基于小波變換的方法對高頻噪聲比較敏感,計算復雜;基于Stockwell變換對信號奇異點的檢測不敏感,且計算量較大;同時這類方法也過于依賴專家經驗及先驗知識,在缺乏理論知識背景下很難推廣應用。同時由于原始信號的低維性、信息匱乏性等,限制了識別準確度與效率的提升。而由于實際故障診斷中時間緊、任務重,如何快速、準確、高效地進行電能質量故障診斷成為了工程人員最為關心的問題。
近年來,隨著深度學習在圖像識別、語音識別、語義分析等領域的成功應用,基于深度學習實現端到端的故障智能化診斷逐漸成為研究熱點。其中圖卷積神經網絡(graph convolution neural network,GCNN)作為一種無監督的深度神經網絡,可以對無標簽數據進行特征學習和提取,從高維的原始數據中獲得低維的特征表達,簡化了分類工作,并且克服了傳統神經網絡中的權重系數初始化存在隨機性的缺點。盡管上述基于深度學習的智能診斷方法與傳統方法相比在特征提取方面具有突出的優勢,但擾動信號到圖像的可視化分析仍是采用時頻方法,這樣增加了時間消耗,不利于故障的在線診斷,而且基于笛卡爾坐標系的時頻圖對故障特征也不夠直觀。與上述轉換方式不同的是,格拉米角場可以很容易地將一維時間序列轉換為二維圖像,不同圖像差異可直接反映信號幅度和頻率的變化。
據此,本文提出了一種基于格拉米角場和圖卷積神經網絡的復雜電能質量擾動識別,通過一系列的仿真和硬件實驗表明,對于復雜電能質量的擾動類型識別,文中方法具有很強的魯棒性和較高的準確度,能夠快速、準確、高效地對供電系統電能質量擾動進行分類,且優于傳統分類方法。
格拉米角場(Gramian angular field, GAF)變換可將一維時間序列數據以極坐標形式進行轉換,生成二維圖像紋理[7]。從圖像的紋理中,進一步地做出分析。在將一維數據映射到極坐標系之前,需要對數據進行規范化處理。因此,對于一維時間序列Xt=x1,x2, ···,xn,可以通過下式完成其規范化:
在映射到極坐標系時,極坐標值為角余弦的標準化時間序列值,時間值為極坐標系中的半徑。角度θi和半徑ri可通過下式進行計算:
其中ti和N分別是將極坐標的時間跨度等分的時間點和常數值。
數據映射到極坐標系中,而不是笛卡爾坐標系,它有兩個優點:1)極坐標系保持笛卡爾坐標系不存在的絕對時間關系;2)該方程能夠產生唯一的映射,因此當數據反演時,它產生的變換是無損的[8]。在將數據映射到極坐標后,可以使用兩點間的三角和或差獲得時間關系,這樣就產生兩種GAF,即Gramian和角場 (Gramian summation angular field, GASF)和Gramian差角場(Gramian difference angular field, GADF),分別由下式表示:
從式(4)和(5)中可以看出,GAF矩陣是時間序列數據的三角函數表示,矩陣中每個元素都是兩個時間點數據的三角和或差的輸出。GAF圖像主要顯示數據點對之間的時間相關性,同時保留了空間位置信息。
相比較其他的轉換方法,GAF表示方法優點如下:在GAF矩陣中的右下元素包含時間序列中的最后一個信息,左上角元素包含時間序列的第一個信息,此屬性意味著生成的可視化圖可以保留時間依賴性,從而使轉換后生成的圖像不丟失原始數據的屬性。此外,由于GAF矩陣考慮了任意兩個時間點的內積,因此GAF還包含了時間序列數據的相關性。
在CNN中,圖像的處理方式是通過將圖像像素點整齊排列為矩陣,進一步地對矩陣數據進行卷積、池化操作;而GCNN中,是通過頂點和邊建立相應關系的拓撲圖來處理圖像,進而提取拓撲圖上的空間特征[9],其與CNN的關系如圖1。
圖1 CNN與GCNN關系圖
GCNN的結構如圖2所示,與CNN結構最大的不同是:GCNN是多層堆疊的,各層間參數不同,通過迭代求解使每一層參數共享。GCNN最大的優勢就是引入可以優化的卷積參數來實現對圖結構數據特征的獲取,在GCNN中通過拉普拉斯矩陣實現這一功能[10]。
圖2 GCNN結構圖
基于圖論將得到的系數矩陣定義為一個帶節點和邊的圖,任何由多個節點和邊組成的圖都可以表示為G=(V,E,W),用于描述不同節點之間的關系,其中V是一個節點,E是兩個節點之間的邊,W是兩個頂點間連接權重的加權鄰接矩陣。通常由定義為L=D-A的拉普拉斯矩陣表示,其中D和A分別表示度矩陣和鄰接矩陣。度矩陣和鄰接矩陣的具體計算方法如圖3所示。
圖3 拉普拉斯矩陣計算
圖3中,度矩陣為對角矩陣,表示連接節點的數量,例如節點1和節點2分別有2個和4個數量的連接,因此在度矩陣中的值分別為2和4。鄰接矩陣表示節點之間的關系,用1和0來表示節點的連接,有連接的節點取值為1,無連接的節點取值為0,例如連接到節點1的節點是節點2和3,因此在矩陣第2列和第3列的第一行中元素為1,而其余元素為0。
GCNN主要分為空間域和譜域兩種形式,空間域GCNN類似于卷積在深度學習中的應用,其核心在于從相鄰節點收集信息,雖然這種網絡直觀地借用了圖像的卷積運算,但缺乏具體的理論基礎[10]。相比之下,譜域GCNN可以更容易從非線性數據中提取特征,主要包括3個步驟:
1)對輸入數據進行圖形傅里葉變換處理。
2)對變換結果進行譜域卷積。
3)對卷積結果進行圖形逆傅里葉變換處理。
拉普拉斯矩陣的公式表示如下:
式中:U——由單位特征向量組成的矩陣;
A——由拉普拉斯矩陣特征值組成的對角矩陣。
對拉普拉斯矩陣矩陣進行圖形傅里葉變換,如下式所示:
式中:f——圖形的N維分量;
f(i)——圖中節點之間的對應關系;
ul(i)——第i個特征向量的第i個分量;
u*l(i)——ul(i)的共軛。
在此基礎上,圖形傅里葉逆變換矩陣為f=UT,譜域卷積過程如圖4所示。
圖4 譜域GCNN的卷積過程
目前大多數電能質量擾動信號識別研究都是基于Matlab仿真進行的,由于實際新能源并網現場設備環境復雜,仿真信號往往無法完全反映現場采集真實信號的實際情況,具有一定的局限性,不足以說明算法的實際有效性。因此為模擬真實采樣信號,文中基于圖5所示的直驅型風力發電動態模擬實驗平臺進行信號采集。
圖5 實驗平臺
實驗平臺由主控系統、拖動裝置、并網發電裝置組成。主控系統由上位機和PLC組成,PLC負責各項數據的采集、變頻器和隔離開關的調控,上位機負責數據的存儲及可視化;拖動裝置由變頻器和三相交流變頻調速異步電機組成;并網發電裝置組成由三相永磁同步電機及整流、逆變模塊組成。通過異步電機帶動永磁同步發電機按不同轉速轉動及不同系統參數來模擬不同的電能質量擾動,其中振蕩和尖峰的產生是以實驗過程中采集的電壓信號為基礎,在系統PLC編碼中實現。
文中以示波器采集到的A、B相間電壓波形為分析對象,進行多次隨機實驗生成15種擾動信號,如表1所示,每種擾動包含500條隨機信號,每條隨機信號包含2 000個采樣點。
表1 電能質量擾動信號類別
由于電能質量擾動信號為基于時間序列的一維向量,特別是新能源并網后引發的多種類型擾動信號間相互疊加產生的復雜擾動信號,改變了原有信號的時頻域特征,增大了信號的復雜度。若直接將一維向量組導入深度學習算法,不僅增加了時間消耗,也不利于故障的在線診斷,同時上述基于笛卡爾坐標系的時頻圖對故障特征也不夠直觀。
文中基于Python 3.6對原始一維擾動信號進行處理,生成格拉米角場密度圖,圖6為基于Gramian和角場和Gramian差角場的14種電能質量擾動信號場密度分布圖,將一維擾動信號轉變為格拉米角場密度圖實現了擾動信號的可視化,更有利于深度學習算法的特征提取,同時圖像間差異更直接地反映信號幅度和頻率的變化。
圖6 格拉米角場密度圖
文中通過十折交叉驗證對實驗數據進行識別,即將實驗數據均分為10份,依次取出9份作為訓練集,其余1份作為測試集。討論了將原始數據和GAF圖像分別作為GCNN輸入時的網絡性能曲線和識別準確率。
圖7和圖8分別為不同網絡輸入時的訓練損失值和訓練識別率曲線。從圖7可以看出,將GAF圖像作為網絡輸入時,網絡損失函數值在前200步內快速下降,200~600步間有微小震蕩,損失函數值在訓練600后逐步趨于0.05左右;而將原始數據作為網絡輸入時,損失函數值在前400步逐步下降,400步后趨于穩定,穩定值在0.2左右。說明將GAF圖像作為網絡輸入提高了網絡對信號的處理能力,也增加了網絡的穩定性。從圖8可以看出,將GAF圖像作為網絡輸入能夠更快地完成網絡訓練,同時也能保證更高的訓練識別率。
圖7 不同網絡輸入時的訓練損失函數值
圖8 不同網絡輸入時的訓練識別率
圖9為采用十折交叉驗證得到的測試準確率。基于同一測試集和識別算法,將GAF圖像作為網絡輸入的平均準確率為94.87%,遠高于將原始信號作為網絡輸入的平均準確率79.77%。說明將原始信號進行GAF變換后,提高了網絡對信號的深層特征提取能力。
圖9 不同網絡輸入時的測試識別率
在同一數據集下,將GAF圖像作為網絡輸入,比較了常見的幾類深度學習方法[11-13]與文中GCNN方法的優劣。圖10和圖11為不同深度學習算法的訓練損失函數值和訓練識別率,隨著迭代的進行,各算法的損失函數值都能趨于穩定,且識別率都能收斂至95%左右,說明算法訓練穩定性在不斷增加,但采用GCNN算法能夠在更短時間內完成收斂,且保證較為穩定的識別率。
圖10 不同深度學習算法時的訓練損失函數值
圖11 不同深度學習算法時的訓練識別率
圖12為采用不同深度學習算法時的測試識別率,可以看出采用CNN方法和SAE方法的平均測試準確率為91.2%和87.47%,而采用GCNN方法的平均測試準確率為94.87%,高于傳統深度學習10%左右。說明采用GCNN算法不僅能在較短的訓練步數內完成訓練,而且還能保證較高的測試識別率。與SAE和CNN相比,GCNN在處理輸入圖像時,是根據圖像中的節點、線等拓撲信息進行特性學習。相較于SAE和CNN只考慮數據點間數值關系,圖數據既考慮了節點信息,也考慮了結構信息,能夠更加全面、系統地描述圖像特征。
圖12 不同深度學習算法時的測試識別率
在同一數據集下,與現有文獻發表的復雜電能質量擾動方法[14-16]進行對比,分別為遞歸圖+循環神經網絡(RP+RCNN)、小波變換+S變換+概率神經網絡(PNN)、S變換+遺傳優化支持向量機(S變換+GA-SVM)。表2為不同方法的結果對比,相較于其他方法,文中方法由于將一維時序信息轉變為具有時間關聯特性的二維譜圖,同時采用GCNN對二維譜圖的節點、線等結構拓撲信息特征進行挖掘,因此具有較高的識別準確率。但是文中方法的訓練時間達到了200 s左右,與其他機器算法相比,還需在算法訓練速度方面提出一定的改進。
表2 結果對比
針對可再生能源并網引起的復雜電能質量擾動識別問題,本文提出了一種基于格拉米角場和圖卷積神經網絡的復雜電能質量擾動識別方法,結論如下:
1)將原始信號進行格拉米角場密度表示,可以將抽象信號轉變為具體圖像,豐富了特征可視化能力,能夠增強深度學習算法從信號中獲取深層特征的能力,進而提高識別準確率。
2)文中所提GCNN算法能夠達到94.87%的故障識別率,高于傳統深度學習方法10%左右,同時算法訓練速度和識別準確度方面均優于傳統深度學習方法。