方駿仁,程凡永,孟獻蒙
(安徽工程大學 安徽省電氣傳動與控制重點實驗室,安徽 蕪湖 241000)
隨著現代電力電子技術的迅速發展,作為風電等新能源系統中重要的能量轉換元器件,逆變器擁有啟動快速、轉換效率高、穩定性好等優點,然而一旦發生故障就會破壞整個電力系統的正常運行,從而影響人們的生產生活,因此有許多研究人員對逆變器的各種故障進行了深入研究。
很多研究表明,大部分逆變器發生故障都是由于逆變電路中的核心部件絕緣柵雙極型晶體管(IGBT)故障引起的,所以針對IGBT的故障檢測顯得尤為重要。目前IGBT的故障主要分為3種[1]:一是在生產研發階段由于制作工藝出現了問題產生的故障,一般不做研究;二是在使用階段由于受到了外界沖擊等因素導致發生開路或短路故障等問題;三是隨著使用時間的增加都會面臨的IGBT老化失效問題。因此為了減少發電系統的故障,實現系統的安全穩定運行,必須要預測出IGBT的剩余使用壽命,當出現老化特征時第一時間更換元器件,預防出現更大的損失。
對IGBT的老化故障預測是目前的研究熱點[2],由于IGBT在逐漸老化的過程中會使得器件的某些外部參數發生變化,所以選擇一個合適的評估參數是重中之重。文獻[3]通過對IGBT進行老化實驗,發現模塊的結-殼瞬態熱阻會隨著IGBT的老化而變化,故根據這一特點選擇了結-殼瞬態熱阻值作為失效特征參數,再利用注意力機制模型預測IGBT的剩余壽命;文獻[4]指出,當IGBT工作在高結溫及高溫度梯度狀態時,老化失效主要表現為鋁鍵合引線的翹起和脫落,會出現集電極-發射極飽和電壓變大的情況,因此也可以作為IGBT故障預測的特征參數;文獻[5-7]都選擇了美國宇航局NASA研究中心發布的IGBT加速老化數據集,并選取IGBT在瞬態關斷過程中產生的集電極-發射極瞬態尖峰電壓作為失效特征參數進行故障預測。文獻[5]采用BP神經網絡構建老化故障預測模型,但由于沒有對網絡的結構和參數進行優化,還存在極小值情況,準確性有待提高。文獻[6]使用的小波神經網絡擁有小波變換的優點,避免了BP網絡設計結構的盲目性,但是隱藏層的節點數以及各層之間的權重始終難以確定,影響模型的收斂速度。文獻[7]提出了基于長短時記憶網絡(LSTM)的預測模型,LSTM可以利用歷史長期的時序信息進行預測,但傳遞信息需要等待上一個時間步的前向傳遞結束后才可以進行下一個時間步的前向傳遞,是順序執行的,無法做到并行處理,而且傳統的循環神經網絡只能默認輸入全部的歷史信息,無法做到對輸入的精準控制。所以本文利用該瞬態關斷尖峰電壓特征參數提出了一種基于時間卷積神經網絡(TCN)的IGBT老化故障預測方法,并構建LSTM及其變體GRU神經網絡模型作為對比分析,通過實驗結果驗證本文所提方法的可行性。
IGBT作為一種場控元器件,擁有控制電路簡單、開關速度快、飽和壓降低等優點,是一種由電壓驅動的電路開關,沒有機械按鈕。對封裝好的IGBT元器件進行物理電路等效得到的IGBT等效電路圖如圖1所示,其中G、C、E分別代表IGBT的柵極、集電極和發射極。當IGBT的柵極和發射極加上正電壓,并且大于導通閾值時,兼容了MOSFET的IGBT就會導通;當柵極和發射極無電壓或施加電壓小于最小閾值電壓時,IGBT就會處于關斷狀態。這僅僅只是一次簡單的IGBT導通關斷過程,但在實際復雜的工作環境中,IGBT需要頻繁進行開關,流經它的電流和電壓會對器件產生日積月累的影響,最終會導致IGBT在沒有達到預期使用壽命期限時提前發生老化失效故障。
目前,針對IGBT模塊的老化失效主要可以歸結為兩點[8]:焊料層疲勞失效和鋁鍵合引線脫落。IGBT是由多種不同類型的材料組合而成的,結構圖如圖2所示。這些材料的熱膨脹系數不同使得各材料層之間承受應力的能力也不一樣,所以當IGBT因工作而聚集大量的熱量并且散熱不及時,就有可能會導致焊料層發生疲勞失效。另外,結溫升高產生的熱應力不僅能夠作用于材料層,還會對器件的鋁鍵合引線產生沖擊,鍵合引線在IGBT中起到芯片連接芯片、材料層的作用,隨著沖擊效果的不斷累積會造成鍵合引線松動甚至脫落,這兩點都是IGBT在封裝層面上發生老化失效的重要因素。

圖1 IGBT等效電路圖 圖2 IGBT模塊結構圖
對IGBT的相關研究表明,在-55 ℃和125 ℃的溫度范圍內只需要進行300次熱循環,就會導致芯片焊料退化和焊點損壞,相當于器件幾十年的運行[9]。每一次熱循環過程,IGBT都會不斷退化,而退化伴隨著由于內部溫度升高而導致的工作期間一些外部特征參數發生變化,這些參數對于研究IGBT老化故障有著重大意義。為了推進電子元器件故障預測的研究,NASA研究中心開發了對IGBT的加速熱老化實驗平臺,實驗條件如表1所示。該實驗采用在柵極施加方波電壓的方法實現熱循環加速老化,測量的參數主要包括:集電極-發射極電壓、集電極-發射極電流、柵極電壓、包裝溫度等。在通過大量實驗后研究中心公布了IGBT加速熱老化數據集,而且在文獻[10]中對實驗期間記錄的瞬態開關信號進行了分析:在整個測試過程中,柵極信號和電流保持相對恒定,穩態電壓變化最小;導通過程中的集電極-發射極電壓特性也幾乎沒有變化;但在觀察集電極-發射極電壓關斷特性時,發現在IGBT退化過程中其集電極-發射極瞬態關斷電壓峰值顯著降低,因此可以選取該瞬態尖峰電壓值作為IGBT老化的特征參數進行故障預測。

表1 IGBT加速熱老化實驗條件

實驗參數參數設置開關頻率10kHz封裝溫度260~270℃
該加速熱老化實驗從開始進行到出現故障失效共經歷170 min左右,期間共采集了418組集電極-發射極瞬態電壓數據,每組數據共有10萬個采樣點,而且每組的分布具有相似性。研究將418組數據的集電極-發射極關斷尖峰電壓值提取出來,如圖3所示。由圖3可見,隨著IGBT逐漸退化,關斷瞬態尖峰電壓有比較明顯的下降趨勢,進一步證明了使用該參數進行預測具有足夠的合理性。
從圖3a可以看出,采集的數據波動比較大并含有異常值,故先剔除前幾個異常樣本值再采用二次指數平滑的方法對其進行平滑處理。該方法擴展了簡單指數平滑,使其可以用來預測帶有趨勢的時間序列。經過以上數據處理后可以得到圖3b,黃線代表剔除異常值和平滑處理后的數據,藍線是原始數據,從圖3b中可以發現,經過處理后的數據波動性小,且保留了數據本身的曲線趨勢。另外,在數據標準化方法的選擇上采用最大最小歸一化,可以提高模型精度和模型訓練時的收斂速度,有效避免了梯度爆炸。

圖3 IGBT集電極-發射極關斷尖峰電壓值退化過程
在以往分析時序問題時,大家通常都會選擇循環神經網絡(RNN)以及它的變體LSTM等來進行建模,這是因為RNN天生擁有循環自回歸的結構特性,這是對時間序列的很好的表示[11-12]。但隨著TCN的出現引起巨大反響后[13],一些人認為TCN會取代RNN成為時序預測領域新的王者,這歸結于RNN在處理數據時耗時太長,網絡傳輸數據時只能按照順序進行,無法做到同時大規模并行處理。TCN作為卷積神經網絡的一個變體,克服了傳統卷積神經網絡受其卷積核尺寸的限制,以及不能很好地抓取長時間的上下文依賴信息的問題,并且當給定一段輸入時,TCN可以實現大規模并行處理,取得比RNN更好的時序預測效果。
TCN的核心就是擴張因果卷積和殘差塊模塊[14],TCN模型所使用的因果卷積,就是對于上一層t時刻的值,僅與下一層t時刻元素大小及之前的輸入有關,用來確保未來的數據不存在泄漏。擴張因果卷積相比普通因果卷積,引入了擴張系數,使得有效窗口的大小隨著層數的增加呈現指數式增長,這樣用較少的層數就可以獲得比較大的感受野。擴張卷積的計算定義為
(1)
對于一個一維的輸入序列x,其中,F(s)表示經過一次擴張卷積計算后在s位置上的網絡輸出結果;d為擴張系數,且d以2的指數冪形式增長;k表示卷積核大小;f為過濾器,f(i)表示對第i個輸入進行過濾操作。d=(1,2,4)、k=2的擴張因果卷積和普通一維因果卷積的對比如圖4所示。由圖4可以發現,前者在減少網絡層數獲得穩定梯度的同時可以擁有較大的感受野。
為了防止出現網絡退化,使用Resnet殘差網絡可以有效改善網絡退化問題[15]。殘差鏈接是訓練深層神經網絡的有效方法,它使得網絡信息可以采用跨層方式直接進行傳遞,另外還加入了Dropout機制避免訓練時出現過擬合現象,由于樣本數據量適中故不需要進行WeightNorm權重歸一化。
本文使用Keras框架和Python語言構建的時間卷積網絡模型如圖5所示,TCN模型由多個殘差模塊組成,將輸入序列(x0,x1,…,xt)輸入到模型進行訓練,再把TCN的輸出輸入到一層全連接層,得到最終的輸出預測值。最下面一層的擴張系數d=1,表示輸入時每個點都采樣;中間層d=2,表示輸入時每兩個點采樣一個作為輸入;模型為了加速收斂速度,保持穩定訓練,引入殘差網絡模塊實現網絡跳層連接;一維卷積模塊用來解決輸入輸出可能出現維度不同的情況。

圖4 兩種因果卷積基本結構

圖5 基于TCN的IGBT老化故障預測模型
對于TCN模型,它的一些超參數設置也影響著最終預測的精度,如過濾器的數量,過濾器存在于任何卷積神經網絡架構中,它與模型的預測能力有關,并影響網絡的大小,一般過濾器數量越多越好,除非出現過擬合情況;卷積核大小控制一維卷積運算中數據的空間面積;擴張系數控制網絡的層數,相同大小的感受野,所需隱藏層更少,可以減少大量網絡參數;選擇Relu激活函數能有效避免深度學習訓練過程中梯度消失的問題,Dropout大小設為0.05,防止出現過度擬合;此外,選擇Adam作為TCN模型和對比實驗LSTM、GRU網絡模型的優化算法。Kingma的研究表明[16],Adam模型中的一些超參數幾乎不需要調整,因此,直接使用Kingma等測試的良好參數設置作為Adam優化器的超參數。各算法模型在表2所示的超參數設置下,均達到最佳的性能表現。

表2 各算法模型超參數設置
性能評價指標采用均方根誤差(RMSE)和平均絕對誤差(MAE)來衡量IGBT預測算法的性能,它們是機器學習中評價模型兩個重要的指標。其中,RMSE測量誤差的平均大小,是預測值和真實值之間平方差異平均值的平方根,數量級上較為直觀;MAE是絕對誤差的平均值,可以準確反應實際的預測誤差。這些指標的結果越小則證明模型預測效果越好,計算公式如下:
(2)
(3)

為了驗證本文所提出的基于TCN的IGBT老化故障預測方法的優越性,另外嘗試與LSTM、GRU模型進行了對比分析,把經過數據處理后的集電極-發射極關斷尖峰電壓時間序列的前70%用作訓練集,后30%用作測試集,3個模型在測試集上的預測結果如圖6所示。藍線代表真實數據值,黃線代表預測值。評價指標結果如表3所示。TCN模型的預測結果的RMSE為0.025 8,MAE為0.021 6,均低于LSTM及GRU模型的結果。

圖6 三種算法模型預測結果與真實值對比圖

表3 三種算法模型評價指標對比
通過圖6中預測值擬合真實值的情況和表3中能夠反映具體模型預測誤差的兩項評價指標可以看出,在這3種算法模型中,相較于循環神經網絡模型預測方法,基于TCN的IGBT老化故障預測方法取得了最好的效果,相對于LSTM模型,TCN模型兩項評價指標都提升了26%左右。
根據IGBT關斷時產生的瞬態尖峰電壓會隨著器件老化而逐漸降低的特點,本文提出了一種基于時間卷積網絡的數據驅動故障預測方法,用于預測IGBT的老化故障。以集電極-發射極關斷尖峰電壓數據為輸入,再利用TCN模型對器件的老化失效進行預測。該方法不僅可以并行處理輸入故障特征,還克服了循環神經網絡容易出現梯度消失和梯度爆炸的問題。同時TCN具有更靈活的感受野,改進了傳統卷積網絡不能有效地提取長時間序列之間相關性的缺點,增強了故障預測的魯棒性和準確性。結果表明,該方法擁有較好的故障預測性能,對IGBT老化故障的預測具有一定的應用價值。