孔歷波,毛一凡,歐陽李亮,康 愷,何 超
(浙江大有實業有限公司 杭州科技發展分公司,杭州 310052)
近年來,光纖通信由于損耗小、速度快、容量大合抗干擾等特性,在電力領域得到廣泛的應用[1]。當光纖線路發生故障時,將導致電力通信中斷,進而給用戶及企業造成不可逆的損失。因光功率數據能夠在全面表征電力光纖通信線路受各種參數的影響程度,故通過預測電力光纖光功率的發展趨勢,能夠達到預測通信線路未來狀態的目的[2-4]。目前光纖維護主要通過在線實時獲取光功率數據來進行,當光功率數據超越前期設定的閥值時,系統將開啟光時域反射儀(OTDR,optical time domain reflectometer)進行測試,通過分析測試得到的曲線進行光纖故障診斷與定位,之后由現場工作人員進行維修,從而恢復電力通信。但上述方法僅能實時掌握電力通信線路的實時狀態,處理已經發生的故障,不能預測和提前分析線路狀態未來的發展趨勢,對未來故障進行有效的規避,因此基于電力光纖的光功率數據的特性,構建精準的光功率預測模型,提前掌握電力光纖線路狀態成為下一階段研究的重點[5-9]。
光功率是一種具備復雜性、時變性及非線性等特性的時間序列數據。近些年,國內外學者針對時間數據序列預測進行了大量的研究,并得到多種時間序列預測方法[10-16],例如支持向量機 (SVM,support vector machine)模型、神經網絡預測模型、自回歸滑動平均(ARMA,auto-regressive and moving-average)模型、灰色預測模型等方法。SVM預測模型中核函數的類型及參數對其泛化性能和學習能力起到決定性作用,故選用單一核函數的SVM預測模型,呈現出較低的預測精度;神經網絡預測模型處理非線性數據時,存在局部極小值和學習速度慢等問題;ARMA預測模型在對非線性時間序列數據進行處理時,首先需要進行平穩化處理,并且整體的預測精度相對較低。
針對上述的不足,學者們對預測算法進行改進和融合。文獻[17]提出一種差分自回歸移動平均模型與支持向量回歸模型融合的功率預測模型(ARIMA-SVR,autoregressive integrated moving average model-support vector regression)光伏短期功率預測模型,實現短期光伏功率預測,提升電力系統光伏消納和能源協調的整體能力;文獻[18]提出一種自適應粒子群優化ARIMA-SVM光功率預測模型,對SVM的核參數進行優化,實現光功率數據未來趨勢的預測;文獻[19]提出一種ARIMA-RVM光功率預測模型,對光纖光功率數據進行預測;文獻[20]提出一種長短記憶網絡(LSTM,long short term memory network)光纖參數預測方法,實現光纖數據的短期預測;文獻[21]提出自用自適應粒子群優化的ARIMA-GRU組合光功率趨勢預測模型,實現了光功率預測,為電力光纖故障預警監測提供理論依據。
綜上所述,在各行各業均有時間序列預測方法的成功案例,但在光纖光功率預測方面的研究和應用還處于探索階段,預測的精度有待進一步的提升。本文基于光纖光功率預測的實際需求和前人研究成果,提出一種基于改進螢火蟲算法優化的光功率預測模型(FA-ARIMA-GRU, firefly algorithm-autoregressive integrated moving average mode-gated recurrent unit),實現光功率趨勢的準確預測,進而提前掌握電力光纖的線路狀態,實現預知光纖線路故障、有效規避故障和保障電力通信傳輸通暢不間斷。
光功率是一種具備復雜性、時變性及非線性等特性額定時間序列數據,故選用ARIMA模型對高頻光功率數據進行預測;選用GRU模型對低頻光功率數據進行預測,形成ARIMA-GRU組合光功率趨勢預測模型,選用改進螢火蟲算法對組合預測模型的參數進行優化,在一定程度提升光功率預測的精度,減小預測誤差。光功率預測模型的過程如圖1所示。

圖1 電力光纖光功率預測流程圖
1.1.1 數據分解
本文選用采用小波變換Mallat算法來對原始光功率數據進行分解,從而得到高頻數據和低頻數據,分解得到的數據長度為原來數據長度的一半。分解表達式為:
Xj+1=GXj,Zj+1=HZj,j=0,1,...,J
(1)
式中,H表示低通濾波器;G表示高通濾波器;j表示小波分解的層數;Zj+1表示在分辨率2-(j+1)下原始數據分解得到的高頻分量數據;Xj+1表示在分辨率2-(j+1)下原始數據分解得到的低頻分量數據。
1.1.2 數據重構
數據分解得到的高、低頻數據利用Mallat算法進行重構,最終得到重構數據,重構數據的長度與原始數據一致。重構表達式為:
xj=H*xj+1+G*zj+1,j=0,1,...,J
(2)
式中,H*表示H的對偶算子;G*表示G的對偶算子。
ARIMA模型主要由自回歸移動平均模塊(ARMA,autoregressive moving average)、自回歸模塊(AR,autoregressive)和移動平均模塊(MA,moving average)3個模塊組成。
自回歸模塊主要采用變量的歷史數據預測當前數據,其表達式為:
(3)
式中,γi表示自相關系數;yt表示當前的信息;εt表示誤差;μ表示常數項;p表示階數。
移動平均模塊主要對預測過程當中所出現的隨機波動情況進行解決,其表達式為:
(4)
式中,θi表示相關系數。
由自回歸移動平均模塊是上述兩模塊的結合,其表達式為:
(5)
將上述3個模型與差分法結合在一起便構成差分整合移動平均自回歸模型,其通過模型解析和定階(確定p、d和q的值,其中d取1或2)、參數估計和確定、模型驗證3個階段來進行構建。
GRU神經網絡和LSTM神經網絡具十分相似的網絡結構,具體網絡結構如圖2所示。由圖2可知,GRU神經網絡主要包含重置門與更新門,其中更新門表示當前時間步長上接收上一步長狀態信息的程度;重置門表示忽略上一步長信息的程度,兩者均需要對當前時刻和前一步長時刻狀態信息進行線性轉換。
GRU模型構建步驟為:
1)更新信息確認。首先,當前輸入狀態xt和神經元上一時刻的輸出ht-1相加;其次,將相加結果與更新門權重Wz相乘;最后運用sigmoid函數對乘積結果進行運算,具體的計算表達式為:
zt=σ(Wz·[ht-1,xt])
(6)
式中,σ表示sigmoid函數;Wz表示更新門權重;xt表示當前神經元的輸入;zt表示更新門;
[]表示兩向量相連接,即相加;ht表示本次神經元的輸出,更新門輸出值越大,則代表當前狀態代入的上一神經元信息越多。

圖2 GRU神經網絡模型

rt=σ(Wr·[ht-1,xt])
(7)
(8)


(9)
yt=σ(Wo·ht)
(10)
式中,yt表示GRU神經元整體總輸出;Wo表示輸出門權重。
光纖光功率的高頻數據選用ARIMA模型來進行預測,低頻數據選用GRU模型進行預測,將高、低頻預測結果相加得到ARIMA-GRU組合預測模型。
由上節可知,ARIMA模型在構建過程中p、q的值僅是基于偏相關和自相關分析得到,GRU模型輸入長度設定也是通過經驗得到,故上述各個參數均有一定程度的優化空間,本節選用改進螢火蟲算法對ARIMA-GRU預測模型進行優化,從而提升電力光纖光率預測的準確性,更加精準的掌握電力光纖線路狀態。
2.1.1 標準螢火蟲優化算法
隨著計算機技術的不斷創新,智能技術的不斷發展,更多新型的智能算法應運而生,為了對模型優化及參數選擇等問題進行解決,Yang[22]于2008年提出一種針對模型優化及參數選擇[25]的算法,即螢火蟲算法,其(FA,firefly algorithm )是眾多智能算法中的一種。該算法通過對自然界當中螢火蟲群體行為進行模擬,進而達到對模型的優化求解的目的,具有操作簡便、參數設置少及計算效率高等優點。在光線功率預測問題當中,預測模型的求解及優化過程就是螢火蟲之間移動位置、彼此吸引及優勝劣汰的過程。在整個算法優化進程中,螢火蟲彼此之間的吸引是由吸引度和亮度決定。亮度較高的螢火蟲代表模型可行解處于優越的位置,并且此時的螢火蟲具備較強的吸引力。最亮的螢火蟲就是模型優化及參數選擇的最優解。隨著傳播介質的吸收與空間距離的增加,螢火蟲的亮度逐漸變暗,并且其位置在每次迭代計算過程中不斷地更新,進而問題的解也得到進一步的優化。
對于FA基本原理的數學表達式為:
1)相對熒光亮度:
I(r)=I0e-γr2
(11)
式中,γ表示傳播介質的光吸收系數;I0表示初始螢火蟲亮度;r表示兩螢火蟲的笛卡爾距離,其表達式為:
(12)
式中,(xi-xj)、(yi-yj)分別表示第i、j只螢火蟲在空間當中的位置。
2)吸引度:
β(r)=(β0-βmin)e-γr2
(12)
式中,β0表示r=0處,即光源處的吸引度大??;βmin表示最小吸引力值。
3)螢火蟲位置移動:
(13)
式中,α表示擾動步長因子,通常其取值范圍為[0,1];rand()表示某個隨機擾動,通常其為取值范圍[-0.5,0.5]內均勻分布或U(0,1)標準正態分布;r表示第i個和第j個螢火蟲的笛卡爾距離;[w,b]j表示亮度較第i螢火蟲更亮的螢火蟲的位置。
螢火蟲算法整體流程如圖3所示。

圖3 螢火蟲算法整體流程圖
2.1.2 改進螢火蟲優化算法
雖然標準螢火蟲算法具備操作簡便、參數設置少、計算效率高及尋優能力強等優點,但是其在解決非線性和高維度問題時,存在局部最優收斂與收斂速度慢等智能算法的通病。傳統螢火蟲算法步長因子選用固定值,設置過小會造成螢火蟲移動緩慢,從而需要較長時間才能達到收斂,甚至無法達到收斂;設置過大會造成螢火蟲反復振蕩于最優解附近。
本文參考梯度優化算法當中的Adam算法[24]和 RMSprop算法[25],對螢火蟲算法進行改進,對整體距離進行指數加權平均,并設計了迭代衰減步長因子。改進螢火蟲算法還對偏差修正進行考慮,在一定程度上改善初始誤差大和過擬合等問題。
本文采用的改進螢火蟲算法當中,各個螢火蟲的位置表示ARIMA-GRU組合模型參數的一個可行解;螢火蟲位置的適應度用螢火蟲的亮度表示。各個螢火蟲均會朝著比自己亮度高的個體進行飛行,從而搜尋到更優的位置。各螢火蟲吸引其它螢火蟲的程度與兩者距離成反比,與亮度成正比。改進螢火蟲算法優化ARIMA-GRU模型的整體流程如圖4所示。由圖4可以看出,改進螢火蟲算反對自然界中的螢火蟲行為進行模擬,通過多次迭代搜索到群里中最亮螢火蟲的位置,輸出訓練ARIMA-GRU模型的最優參數,形成FA-ARIMA-GRU復合模型。
基于改進螢火蟲算法的ARIMA-GRU模型優化流程為:
1)初始化。螢火蟲的數量假設為N,并對各個螢火蟲的位置進行隨機初始化。設置介質對光的初始吸引度β0=1.0;初始步長α=0.3;吸收系數γ=1,吸引度的表達式為:
β(r)=(βmax-βmin)e-γr2+βmin
(14)
式中,βmax=1,βmin=0.2,式(14)保證任意兩螢火蟲之間的吸引度保持在[0.2,1]區間內。
2)計算各個螢火蟲適應度值。適應度選用R2指標,其表達式為:
(15)


圖4 基于改進螢火蟲算法的ARIMA-GRU模型優化流程
3)移動。各個螢火蟲飛向比其亮度更大的螢火蟲,飛行過程中螢火蟲的位置變化可以通以下表達式進行表示:
(β0e-γr2([w,b]j+arand())2
(16)
(17)
式中,α表示擾動步長因子,通常其取值范圍為[0,1];rand()表示某個隨機擾動,通常其為取值范圍[-0.5,0.5]內均勻分布或U(0,1)標準正態分布;r表示第i個和第j個螢火蟲的笛卡爾距離;[w,b]j表示亮度較第i螢火蟲更亮的螢火蟲的位置。為了進一步提升算法的收斂性,令步長呈現迭代衰減態勢,那么第t步長的表達式為:
α=s1α+(1-s1)*(0.97)t
(18)
其中:s1表示一階矩估計的指數衰減率,s1=0.9;s2表示二階矩估計的指數衰減率,s2=0.999。
群體中亮度最大的螢火蟲不會向另外螢火蟲的位置進行移動,其位置更新基于以下表達式:
(19)
4)對移動至新位置的螢火蟲的適應度值進行計算,如移動后的位置比原有位置優越,此時位置移動生效,反之螢火蟲不發生移動,停留在原地。
5)為了防止優化后模型出現過擬合現象,該算法設定一個適應度閾值。當每次迭代完成后,對當前最優適應度值進行記錄,如果最優適應值大于等于設定的適應度閾值或者該算法已經達到最大迭代次數,此時算法輸出搜尋到的最優參數,反之跳轉至步驟2)繼續進行迭代。
6)采用改進螢火蟲算法輸出的最優參數來構建ARIMA-GRU模型。
本文采集杭州某供電公司某一路光纖復合架空地線(OPGW,optical power grounded waveguide)連續350天光功率數據來作為仿真實驗數據,取前250天數據進行模型訓練和優化;后100天數據用于測試模型預測效果。原始光功率數據如圖5所示。

圖5 光功率原始數據圖
本文預測模型效果的評價指標選用均方根誤差(RMSE,root mean square error)其數學表達式為:
(20)

本文全部的試實驗全部在表1所給出的配置下進行。

表1 實驗設置表
3.4.1 數據預處理
數據預處理第一步需要對原始光功率數據進行分解與重構操作,而小波變換中不同的小波分解層數與小波基所得到的分解結果是不同的,故確定小波分解層數和選取恰當的小波基在小波變換應用中起到決定性作用。Coiflet、Daubechies、Haar、Symlets等是常用的幾種小波基,其在不同的應用場景得到廣泛的應用。
在對小波基選取的過程中,重點對相似性、消失矩、對稱性、支撐長度和正則性這幾點進行重點考慮。dbN小波在大量實際應用過程中呈現出高消失矩和較好正則性等優點,于此同時也暴露出其不具備對稱性的缺陷,該缺陷可能致使信號在分析與重構過程當中出現相位失真的現象。symN小波在實際應用過程中較dbN小波具有較好的對稱性,能夠在一定程度減少相位失真現象的發生。對于小波分解的層數,信噪比不同的信號均有一個接近最優的分解層數,過多分級層數會導致信號嚴重失真;而分解層數過少會導致信號去噪效果較差,對后續信號的進一步分析造成一定程度的影響。
綜上所述,本文選取sym1、sym2、sym3、sym4、db1、db2、db3、db4八種不同的小波基,對各小波基進行1~4層小波分解,并對分解后的小波進行重構,將最終數據代入至本文所構建的預測模型當中,將預測數據與原始數據進行對比,并對預測RMSE值進行計算,得到如表2所示數據。

表2 不同小波基函數與分解層數預測RMSE 值
由表1可知,原始光功率隨著小波分解層數的不斷提升,損失逐漸增多,致使預測誤差不斷增大,通過上述數據的對比,得出在一層小波分解當中運用 sym4小波基函數計算所得的結果RMSE最小,故本文選用 sym4 小波基函數對原始數據進行一層小波分解。
通過sym4小波基函數對上述采集獲得的原始光功率數據進行一層分解和重構,經過分解與重構得到的光功率數據如圖6所示。

圖6 sym4小波處理后的數據圖
3.4.2 實驗結果分析
此節采用ARIMA-GRU預測模型和本文構建的FA-ARIMA-GRU預測模型在前期預留的100天電力光纖光功率測試數據集上進行預測結果和實際數據的對比,并以擬合曲線的方式來呈現不同預測模型所預測的效果,如圖7所示。由圖7可以看出,本文所構建的FA-ARIMA-GRU預測模型較ARIMA-GRU與原始更為接近,更能準確預測未來電力光纖光功率的發展趨勢,從而提前掌握電力光纖的線路狀態,為電力光纖故障定位提供可靠的參數依據,起到輔助作用。

圖7 光功率預測結果對比圖
為進一步對本文構建的FA-ARIMA-GRU預測模型的效果進行說明,本文分別列舉ARIMA-GRU、ARIMA-SVM、PSO-ARIMA-GRU、APSO-ARIMA-SVM、FA-ARIMA-GRU光功率趨勢預測模型的預測誤差,具體誤差數據如表3所示。

表3 不同光功率趨勢預測模型的預測誤差
由表3可以看出,上述所提及的6中預測模型中,本文所構建的FA-ARIMA-GRU預測模型RMSE值最小,表明該模型較其他預測模型具有較小的預測誤差和較好的擬合效果,整體的預測精度較高,是一種高效的電力光纖光功率趨勢預測模型。
3.4.3 模型性能分析
為了對FA-ARIMA-GRU預測模型的性能進行驗證,本文從算法運行時間的角度對模型的性能進行分析,以各算法運行10次的時間的平均值為基準進行運行時間的比較,具體如表4所示。

表4 不同模型性能分析結果
由表4數據可以看出本文所構建的模型具有較高的時間效率,能夠快速得到預測結果。
基于電力光纖光功率預測的實際需求和電力光纖光功率數據的特性,本文提出一種基于螢火蟲算法優化的電力光纖線路狀態預測模型,通過研究主要得到以下結論:
1)提出改進FA算法,改善算法尋優過早收斂和尋優精度低的現狀;
2)基于改進FA對ARIMA-GRU光功率組合預測模型進行改善,進而形成FA-ARIMA-GRU電力光纖光功率預測模型,進而提前掌握電力光纖的運行狀態,為故障定位提供幫助;
3)模型試驗驗證表明:本文構建預測模型較其他模型具有較高的預測精度和運行效率。
由于本文數據集中數據量有限,在大數據高速發展的背景下,凸顯出數據不足的缺陷,后續應該采集更多的數據進行模型訓練,引入適當的修正因子,再次提升模型預測的精準度。