魯 煒,顧安琪,駱昊駿,朱 煒,王火根,文 穎
1(上海電力高壓實業有限公司,上海 200062)
2(華東師范大學,上海 200062)
3(上海曦途信息科技有限公司,上海 200437)
隨著經濟社會發展,人民生活水平提高,全社會對供電可靠性的要求越來越高,政府部門、電力監管機構、媒體網絡對電網安全高度關注,對停電事件的容忍度愈發苛刻,電網安全壓力進一步加大.運維檢修作為電網企業核心業務單元之一,在保障電網設備安全健康、支撐大電網安全運行等方面發揮了重大作用,所以提高電網運維檢修高效性和便捷性對電網的安全運行具有重大的意義和價值.輸電鐵塔上的螺栓由于拆裝方便、利于檢修等諸多優點,廣泛應用于輸電鐵塔上,其連接的可靠性直接關系到輸電線路的安全運行.目前的輸電系統例如輸電桿塔由于長期處于動態風載荷中,所以容易誘發桿塔組件間的螺栓松動問題,威脅桿塔結構安全.螺栓是輸電系統中的重要組成部件,一旦出現故障隱患,將直接威脅高壓電網安全,甚至造成難以估量的損失.所以,定期針對于輸電桿塔上螺栓的檢測尤為重要.目前,輸電鐵塔螺栓的松動監測主要靠人力攀爬檢查,大大限制了運檢效率,增加人力時間成本;另有少部分通過視頻設備監測方式,該方式不僅經濟成本高,而且對處于非可視面的螺栓存在檢測盲區.基于上述問題,提出基于振動波的鐵塔螺栓松動檢測方案,用于高效、快速、可靠的檢測輸電鐵塔螺栓松動情況,進一步的擴展電網運維檢修的手段.
提取特征參數是語音識別中的基礎,一般根據不同的語音識別任務和不同的特征提取方法,可以獲得不同種類的語音特征參數,根據常見的語音識別特征參數提取有:線性預測分析(Linear Prediction Coefficients,LPC)[1]、感知線性預測系數(Perceptual Linear Predictive,PLP)[2]、Tandem 特征[3]和Bottleneck 特征[4]、基于濾波器組的Fbank 特征(Filterbank)[5]、線性預測倒譜系數(Linear Predictive Cepstral Coefficient,LPCC)[6]、梅爾頻率倒譜系數(Mel Frequency Cepstrum Coefficient,MFCC)[7]等.本文采用的是提取聲波信號的線性預測倒譜系數(Linear Predictive Cepstral Coefficient,LPCC),基于聲道模型的重要特征參數.通過線性預測分析LPC得到線性預測系數,再通過迭代算法求得LPCC.LPCC 丟棄了信號生成過程中的激勵信息,之后用十多個倒譜系數可以代表共振峰的特性,所以可以在語音識別中取得很好的性能.
針對聲波特征的分類,一些傳統的語音識別模型有矢量量化模型[8]、動態時間規整(DTW)[9]、隱馬爾可夫模型(HMM)[10]、人工神經網絡模型(ANN)[11]、高斯混合模型(Gaussian Mixture Models)結合隱馬爾可夫模型(HMM)得到的GMM-HMM 模型[12]等.隨著深度神經網絡(Deep Neural Network)[13]崛起,其較強的非線性能力已經遠遠超過以上傳統的語音識別模型,而卷積神經網絡(Convolutional Nerual Network,CNN)[14]的出現更能處理一些具有類似網絡結構的數據.但前饋網絡、CNN、對序列數據只能采用固定長度作為輸入,并且他們的信息傳遞都是單向的,他們的性能比循環神經網路(Recurrent Neural Network,RNN)[15]要差,因為傳統模型不理解輸入的上下文.但是循環神經網絡RNN 無法很好處理遠距離依賴問題并會出現梯度爆炸消失的問題,而長短時記憶網絡(Long Short-Term Memory,LSTM)[16]網絡以及他的變體門控循環控制單元(Gated Recurrent Unit,GRU)[17]網絡卻可以解決這些問題,并在保持LSTM的效果的同時又使結果更加簡單,取得了較為不錯的性能.
基于以上分析,本文提出一種基于門控循環單元網絡的輸電桿塔螺栓緊固檢測方法,首先采用振動傳感器和傳感分析儀對桿塔進行敲擊采集數據,通過提取采集的聲波數據的LPCC 特征構建特征向量,并訓練用于分類的(Gated Recurrent Unit,GRU)模型,進而實現對于螺栓緊固狀態的檢測.在現有獲得數據中,我們通過實驗驗證了提出方法的有效性和較好的分類性能,并通過與其他分類器進行對別實驗,進一步驗證了我們提出的方法的檢測準確性.
本方法的主要過程由聲波預處理、模型訓練、螺栓狀態檢測3個部分組成,如算法流程圖1.
在原始聲波信號數據采集完成后,為了過濾出采集的聲波數據的背景噪聲及不相關信息,更利于GRU模型學習對不同狀態的螺栓的分辨,本文對原始聲波信號數據進行聲波預處理;其中預處理方式包括對聲波信號進行預加重、分幀、加窗、端點檢測等.具體來說,預處理可以消除聲門效應和一些輻射的影響,進一步提升聲波信號的高頻分量,從而使得聲波信號的頻譜能趨于平坦,并且使得聲波頻譜在整個從低頻到高頻的頻帶中,能夠用相同的信噪比來獲得頻譜,這樣有利于進行頻譜分析或者聲道參數分析,通常預加重操作利用數字濾波器來進行聲波信號的濾波處理;在進行預加重后,對聲波信號進行分幀、加窗等操作,分幀就是將聲波信號分成幀長為N的短時聲波幀序列.加窗操作為了有限化數字信號,將聲波信號分成若干個短時聲波信號,常見的幾種窗函數有:矩形窗函數、漢明窗函數、漢寧窗函數,其中,漢明窗相比于前兩種窗函數更能反映出聲波幀的頻譜特性,其頻譜具有更平滑的低通特性的同時,能夠避免頻譜泄露的問題.所以本文采用漢明窗對聲波信號進行加窗操作,有效截取聲波信號.端點檢測的目的是能夠區分開聲波信號中的靜音段和有音段,通過在聲波信號中找到起始點和終止點,屏蔽掉無關的聲波信號,得到聲波信號的有效長度.常用的一些端點檢測有:短時能量[18]、短時過零率[19]、雙門限能量斷電檢測算法[20].

圖1 算法流程圖
將預處理后的聲波數據劃分為訓練樣本集合Dtrain和測試樣本集合 Dtest,選取訓練樣本數N=20,用于訓練GRU 模型.其中,訓練樣本有其對應的二分類真值向量,對應其狀態為緊固或松動.
針對于訓練樣本,對聲波數據進行特征提取,提取其LPCC 線性預測倒譜系數構成特征向量.對于每一個訓練樣本提取LPCC 特征,具體分為以下幾個步驟:首先對聲波頻譜進行預加重、分幀、加窗;通過自相關算法分析得到線性預測系數LPC;再通過德賓遞推算法求解線性預測系數,最后通過倒譜分析,獲得12 階LPCC 特征向量fi,作為每一個訓練樣本的最終的特征向量,其中i表示第i個訓練樣本.其中fi的計算可由Matlab和Python 語音工具箱完成.具體流程如圖2所示.

圖2 LPCC 特征提取流程
在對聲波信號進行預處理之后,進行訓練門控循環單元網絡(GRU)分類模型.GRU 網絡是LSTM 長短時記憶網絡的一種變體網絡,它能夠保存長期序列中的信息,且不會隨時間而清除或因為與預測不相關而移除,并且可以克服RNN 無法很好處理遠距離依賴的問題,同時也能解決標準 RNN的梯度消失問題,GRU網絡在保持了LSTM 效果的同時又使結構更加簡單.并且對于非序列數據的輸入,GRU 也可以當作分類器,其檢測準確率高于一些傳統的分類器如SVM、KNN、Naive Bayes、DT 等.如圖3所示,首先特征向量fi作為GRU 網絡的輸入,經過GRU 單元得到輸出,再連接全連接層和Softmax 層,最終輸出長度為2的向量.

圖3 GRU 訓練過程
本文對使用的基本的GRU 網絡結構定義如下:在一個GRU 單元中,特征向量fi作為GRU 單元的輸入,混合前一時間步ht?1∈Rd隱藏狀態和當前時間步隱藏狀態作為輸出,并作為下一階段的輸入,其中d為輸出向量維度.GRU 網絡主要包括兩個門:更新門(update gate)zt和重置門(reset gate)rt.更新門zt是將LSTM 網絡中的輸入門和遺忘門合并,有助于捕捉時序數據中長期依賴關系,定義了前面記憶保存到當前時刻的信息量.重置門rt決定過去有多少信息被遺忘,有助于捕捉時序數據中短期的依賴關系,決定如何將新的輸入信息與前面的記憶相結合.這兩個門控向量決定了哪些信息最終能作為門控循環單元的輸出,它們的特殊之處在于,能夠保存長期序列中的信息,且不會隨時間而清除或因為與預測不相關而移除.Wr,Wz,分別對應相應的權重.其中Xt為第t個時間步的輸入向量,即輸入序列X的第t個分量.為當前時間步候選隱藏狀態,ht?1保存的是前一個時間步t?1 隱藏狀態,ht為當前時間步最終隱藏狀態,GRU 網絡的更新狀態可由如下公式表示:

式中,[]表示兩個向量相連接,*表示矩陣元素相乘.σ表示Sigmoid 函數
門控循環單元不會隨時間而清除以前的信息,它會保留相關的信息并傳遞到下一個單元,因此它利用全部信息而避免了梯度消失問題.
在對GRU 網絡結構初始化時,設置GRU 隱藏單元的數量numHiddem=30,分類類別數量numClass=2,特征維數D=24,最大迭代次數maxEpoch=40,批大小miniBatchS ize=512,選擇隨機梯度下降(SGD)算法進行優化,損失函數選擇交叉熵損失.通過迭代過程進行訓練;每一次迭代通過前向傳播計算交叉熵損失,最小化目標函數,并通過反向傳播更新模型參數,最終得到GRU 分類模型.
實驗所采集的數據是來自上海電力公司,輸電鐵塔上測得的數據,現場的3 座輸電鐵塔上的所有配件及結構與實際輸電貼、鐵塔相同,具有非常好的實驗測試條件.實驗首先在鐵塔本體上產生標準化的振動,然后檢測振動回波,通過對螺栓在緊固時的振動波形和松動時的振動波形對比,識別判斷螺栓的松動狀態.過程如圖4所示.具體測試步驟如下.

圖4 聲波數據采集過程
1)將振動傳感器安裝在鐵塔的基柱上,距離輸電鐵塔底座約1 m 處.
2)通過軟件調試、頻譜校核,確定傳感器中心頻率參數等.
3)利用回彈儀分別在安裝振動傳感基柱、相鄰基柱和對角基柱各激振一次,所有激振的基柱相對位置相同,記錄監測數據.
4)松動安裝有傳感器基柱的上一固定位置的螺栓1個,利用回彈儀在其他基柱上各激發振動一次,記錄監測數據;松動2個螺栓,利用回彈儀在其他基柱上各激發振動一次,記錄監測數據;松動基柱斜承處1個螺栓,利用回彈儀在其他基柱上各激發振動一次,記錄監測數據.
采集的聲波波形數據如圖5.可以看到未松動螺栓敲擊的波形比較穩定,而松動的波形則有不同的顯示,這組特征可以作為訓練模型的輸入數據進行分析.

圖5 樣本波形圖
此外,實驗分析了樣本數據直方圖,如圖6所示.本實驗對此特征也進行學習.
實驗對每段音頻數據提取12 階LPCC 特征,這些特征作為模型學習樣本,訓練GRU 模型并對測試樣本進行測試.

圖6 樣本統計圖
因此,本文對3 組不同特征進行實驗對比,即:波形特征、統計特征和LPCC 特征作為輸入,采用GRU深度模型進行訓練分析,得出實驗結果.
本實驗對10個桿塔進行數據采集,每個桿塔4個基柱,每個基柱在緊固和松動螺栓狀態下各擊10 次,得到緊固和松動聲波數據分別為400 組,隨機選用600 組數據用作訓練模型,200 組數據用于測試,實驗測試5 次,取平均結果作為測試結果.通過對上述采集的數據進行訓練,對比測試GRU和4 種分類器的性能,具體為:KNN、Naive Bayes、SVM、DT 模型,以及其他4 種網絡:DNN、RNN、LSTM 進行比較.實驗中采用bootstrap 隨機抽樣的方法驗證相比于其他模型,訓練模型的準確性,其中采樣次數n=5.實驗對比結果如表1所示,可以看到GRU 模型比其他3 種分類器的準確率較高,同時準確率也高于其他4 種網絡,而采用LPCC 特征結合GRU的檢測結果達到94.54%.

表1 不同模型檢測準確率比較
上述實驗結果顯示采用LPCC+GRU 方法檢測效果最后,本實驗就此方法對桿塔中不同基柱的測試樣本進行檢測對比,其結果如表2所示.可以看出,本文所提出的檢測方法,檢測精度最高可以達到98.43%,最低可到89.39%.表2可以看出,基柱的檢測螺栓不論緊固還是松動的檢測率最高,相鄰基柱的其次,對角基柱的檢測率最低,這是因為松動實驗的螺栓在基柱上.實驗結果顯示,無論松動的螺栓在桿塔的任何位置,通過敲擊基柱的方法都可以較好地檢測螺栓的狀態.

表2 不同基柱的螺栓松動檢測結果
本文針對輸電系統螺栓緊固檢測這一問題,實現了一種基于門控循環單元網絡的輸電桿塔螺栓緊固檢測方法.首先,采用振動傳感器和傳感分析儀對桿塔進行敲擊采集數據,然后對數據進行預處理、特征提取自相關算法分析得到線性預測系數LPC,而后經過倒譜分析等獲得12 階線性預測倒譜系數LPCC.最后,訓練用于對螺栓緊固狀態分類預測的門控循環控制單元網絡GRU,對未知狀態的螺栓進行緊固與否的檢測.實驗結果表明,GRU 網絡檢測準確率高于其他傳統的分類器,本文提出的方法可以有效應用在高壓輸電鐵塔螺栓緊固狀態檢測上.