趙 深,何 巍,辛璟燾,呂 崢
(1. 北京信息科技大學 光電測試技術及儀器教育部重點實驗室,北京 100192;2. 北京信息科技大學 光纖傳感與系統北京實驗室,北京 100192)
光纖陀螺(FOG)是一種基于薩格納克(Sagnac)效應的測量物體在慣性空間相對角速度的傳感器,因其具有可靠性高,使用壽命長及精度高等優勢,被廣泛運用在慣性導航的相關領域,擁有較好的應用前景和研究價值。
為了應對不同的工程場合,光纖陀螺的工作溫度較寬(-40~60 ℃)[1]。由于光纖陀螺的內部器件(如光纖環、電路電子元件)對溫度變化很敏感,當環境溫度改變時,光纖環內兩束反向傳播光會因溫度擾動產生非互易相移(Shupe效應),電路元件產生的熱噪聲也會使陀螺解調出現誤差,使陀螺輸出零偏漂移[2],影響光纖陀螺在高精度慣導系統領域應用的范圍。為了抑制環境溫度變化引起光纖陀螺零偏發生漂移的現象,一般通過改進光纖陀螺的結構和器件或從光纖環繞制方法上進行優化,增加溫度控制裝置,使陀螺工作在一個穩定的溫度范圍。但是由于成本和技術的限制,從硬件角度改良不僅會增加陀螺內部的體積,而且只能部分補償溫度漂移。通過建立光纖陀螺溫度模型對其進行軟件補償的方法不僅成本較小,而且不同型號的陀螺可通過修改算法參數來進行溫度補償。
目前對光纖陀螺軟件建模溫度補償主要有多項式模型[3-4]及模糊邏輯[5]等方法。上述方法能夠對光纖陀螺進行溫度補償,但是由于光纖陀螺溫度漂移呈現出復雜的非線性特征,所以這些方法的陀螺溫度補償能力受到限制。BP神經網絡因具有能逼近任意精度非線性函數的特點[6],可采用BP神經網絡建立光纖陀螺零偏溫度補償模型,但由于BP神經網絡每次訓練時權重的不確定性,易使網絡訓練時陷入局部最優的陷阱。為了改善BP神經網絡的不足,引入粒子群、混沌、模擬退火算法[7-9],提出一種基于混沌模擬退火粒子群算法優化BP神經網絡權重的溫度補償模型,并通過對比分析驗證模型的性能。
光纖陀螺作為一種慣性測量儀,其光纖環是陀螺的核心器件且對溫度非常敏感。陀螺內部器件與所處環境因溫度變化形成了熱環境,在不同環境溫度下陀螺輸出也不同。光纖環熱光效應的存在使線圈的某點產生熱漲落,導致光纖折射率變化為n。長度為L的兩束沿著順時針(CW)、逆時針(CCW)傳播的干涉光,在線圈z點產生一個相位延時,其相位分別為
(1)
(2)
式中:φcw為順時針光波沿光纖環旋轉傳輸產生的相移;φccw為逆時針光波沿光纖環旋轉傳輸產生的相移;β0=2π/λ為光在真空中的傳輸常數,λ為光的真空波長;c0=nc為真空中傳播光速,c為光纖中傳播光速;z為某一點距離端點的數值;ΔT為光纖環在z點處溫度分布變化量;?n/?T為光纖折射率的溫度系數。式(1) 減去式(2)后積分可得:
(2z-L)dz
(3)
由式(3)可知,光纖環受溫度影響產生的熱致非互易相移即為Shupe效應。溫度變化時,光纖環參數中的長度和直徑發生改變會影響陀螺零偏,同時光纖的折射率、導熱系數等參數也會變化。圖1為光纖陀螺零偏誤差機理。由圖可知,影響陀螺精度的主要因素是溫度,零偏是陀螺輸入角速度為0時相應的輸出量,陀螺零偏和溫度是一種非線性的關系。因此,建立以溫度為輸入變量的零偏溫度補償模型是改善非互易相移的有效方法。

圖1 光纖陀螺零偏誤差機理
光纖陀螺溫度補償模型分為線性和非線性,線性模型計算簡單,可高效地傳遞數據,適合工程應用。由上述分析可知,光纖陀螺輸出的零偏溫度漂移復雜且是非線性的。光纖陀螺輸出受多方面影響,包括Y波導、光源和內部電路等都會引起零偏溫度漂移,單獨的Shupe效應并不能代表光纖陀螺的零偏溫度漂移。因此,針對光纖陀螺零偏輸出的非線性特點,本文采用具有良好非線性映射能力、自適應學習能力的人工神經網絡建模方法,辨識的收斂速度僅與神經網絡自身及采用的學習算法有關。通過調節神經元間的連接權值,即可使網絡的輸出逼近系統的輸出,同時實現在線控制。
BP神經網絡是一種通過誤差逆傳播算法訓練的多層前饋神經網絡。基于在最速下降法學習規則上通過反向傳播來調整網絡的權值和閾值,使網絡的誤差平方和最小,其本質是一種輸入-輸出模式的映射關系。圖2為BP神經網絡的光纖陀螺溫度誤差補償模型。其結構關系可分為輸入層、隱藏層、輸出層。

圖2 BP神經網絡的光纖陀螺溫度誤差補償模型
BP神經網絡運算分為2個過程:初始輸入層的節點與隱藏層的節點做點對點計算,利用隱藏層計算出每個值;再利用相同的方法和輸出層進行計算,最終的輸出值和樣本值做比較,計算出誤差,這個過程為前向傳播。隱藏層用Sigmoid作為激活函數,而輸出層用Purelin函數。這是因為Purelin函數可保持之前任意范圍的數值縮放,以便與樣本值做比較,而Sigmoid函數的數值在0~1。誤差信號反向傳遞過程是利用前向傳播的最后輸出結果來計算誤差的偏導數,再用此偏導數和前面隱藏層進行加權求和,如此層層向下傳遞(隱藏層間偏導加權求和)直到傳遞到輸入層,最后利用每個節點求出的偏導數來更新權重。因此,陀螺零偏的溫度補償模型可采用3層網絡結構,溫度和溫度變化率作為輸入變量,零偏作為模型輸出。模型各層計算式如下:
輸出誤差:
(4)
輸入層到隱藏層:
yj=f(netj) (j=1,2,…,m)
(5)

(6)
隱藏層到輸出層:
Wk=f(netk) (k=1,2,…,l)
(7)

(8)
誤差定義展開至隱藏層:
(9)
誤差定義進一步展開至輸入層:
(10)
式中:ok為第k個節點的輸出值;xi為神經網絡的輸入變量;vijωjk為各層的連接權值;Wk為神經網絡輸出值;d為零偏期望值;f為隱含層和輸出層的傳遞函數。
由于BP神經網絡優化函數是通過修改或構造訓練方式改變隱藏的節點數,對應初始的權值和閾值會發生變化,隨之影響網絡的收斂效果和學習效率。由于在復雜函數模型的誤差曲面會存在數個極小點,最終算法可能陷入局部極小點而不是收斂于全局極小點。為了減少上述情況所產生的影響,采用粒子群算法優化網絡權值和閾值可提高網絡補償的性能。
粒子群中的成員為具有速度和位置信息的搜索粒子,每個粒子的位置信息代表了待求問題的候選解,求解空間中粒子的速度和位置由適應度值決定。粒子在尋找全局最優的過程中,通過跟蹤個體最優和全局最優來進行迭代更新,更新過程中速度和位置的迭代形式:

(11)
(12)

由式(11)、(12)可以看出,粒子群算法在運算過程中收斂速度雖然快,但易陷入局部最優情況。當粒子速度為0時會停止搜索,但停止位置可能是局部極值點。為了將算法運用于補償光纖陀螺溫度模型的問題中,須提高算法的全局尋優能力,解決易陷入局部最優的問題。
為了解決粒子群算法易陷入局部極值的問題,本文引入混沌理論到粒子群算法中。混沌理論是通過一種方式將混沌狀態引入到需要優化的變量中,利用混沌變量進行搜索的方法比隨機搜索更高效,同時提升了算法全局收斂的能力。再將模擬退火思想融入粒子群算法的參數選擇中,使算法可接受好的解,也有一定的幾率接收劣解。
算法的計算流程如下:
1) 確定輸入溫度、變化率和輸出零偏的數據量,劃分數據的測試集與訓練集,并對數據進行預處理。
2) 初始化參數。包括種群規模、最大進化次數、慣性權重ω、學習因子及退火因子等參數。
3) 計算粒子的適應度值。初始化退火溫度、混沌化粒子參數、初始化粒子的個體和全局極值。
4) 對粒子的適應度值進行迭代更新。更新個體極值和全局極值。
5) 更新粒子的速度和位置,并在更新中加入模擬退火因子。
6) 粒子極值更新時進行退溫處理。
7) 判斷算法的終止條件。若達到,則輸出BP神經網絡的權值和閾值;若未達到,則返回步驟3)。
經上述流程運行后完成對光纖陀螺零偏溫度補償的建模。混沌模擬退火粒子群算法優化BP神經網絡(CSAPSO-BP算法)的流程圖如圖3所示。

圖3 CSAPSO-BP算法流程圖
實驗采用某型中低精度光纖陀螺,將光纖陀螺放置在中科賽凌公司的單軸轉臺高低溫試驗箱中進行溫度實驗。陀螺內裝有溫度傳感器,通過上位機數據采集軟件測得光纖陀螺的輸出和溫度,零偏和零偏穩定性按照國軍標[10]的相關定義計算。
BP神經網絡的訓練樣本和測試樣本采用的是光纖陀螺輸出的零偏數據。通過變溫實驗采集陀螺的零偏數據,測得陀螺在常溫下零偏穩定性為0.011 (°)/h,變溫下零偏穩定性為0.09 (°)/h。實驗所用設備如圖4所示。

圖4 實驗設備
變溫實驗過程是使光纖陀螺置于溫箱中并處于靜止狀態,設定溫箱溫度使陀螺從室溫升溫至60 ℃,保溫30 min,之后進行降溫,每隔20 ℃設置1個溫度點,每個溫度點分別保溫30 min,完成降溫過程。然后由同樣的溫度區間和保溫時間完成升溫過程。保溫目的是使光纖陀螺達到熱平衡狀態,實驗過程中變溫速率均為0.4 ℃/min。上述實驗重復2次,采集兩組變溫過程的零偏數據和對應的陀螺溫度,一組數據作為測試樣本,另一組數據作為訓練樣本。實驗中光纖陀螺的數據更新速率為400 Hz,陀螺輸出采集系統采樣頻率為1 Hz。由于實驗過程持續時間長,數據量較大,1 s平滑的陀螺輸出無法體現出變溫趨勢,如圖5(a)所示。為了降低計算量,濾除陀螺零偏輸出中的噪聲,對陀螺零偏數據進行中心化和100 s平滑處理。經實驗發現,100 s平滑的零偏數據從趨勢和計算方面更適合進行溫度補償,變溫實驗采集的兩組100 s平滑零偏數據如圖5(b)所示。

圖5 光纖陀螺變溫零偏輸出曲線
運用CSAPSO-BP模型對光纖陀螺零偏進行溫度補償時需要對相關參數進行設定。陀螺輸出的零偏采樣點為49 800個,經過100 s平滑后采樣點為498個。經驗式:
(13)
式中:m為輸入層節點數;n為輸出層節點數;α為1~10的整數。訓練期間權重更新的量為學習率,會影響模型的訓練次數,故選取0.1為學習率。訓練次數和訓練精度要根據實際數據集來確定,這里選擇的訓練次數為1 000,訓練精度為0.000 01。慣性權重表示粒子過去的狀態對當前狀態產生的影響,其值的大小決定了粒子全局尋優和局部尋優的能力,這里選擇的權重為0.8。c1、c2為個體學習因子和群體學習因子,分別調節個體和群體向最優方向前進的補償,根據標準粒子群模型設定都為2。粒子種群規模根據大量實驗確定設置為40。
通過Logistic模型對模型的權重和粒子的速度進行混沌化處理[11],提高了粒子速度的隨機性,能夠遍歷需要優化的尋優空間。退火速度越慢,模型越容易尋找到全局最優,故退火速度設定為0.98。退火初始溫度高時可提高模型尋找全局最優的概率,經過實驗設置為1 000。由此完成了CSAPSO-BP模型的參數設置。
建立上述的CSAPSO-BP模型和BP模型,對測試組陀螺變溫零偏輸出在Matlab運行環境下進行溫度補償,分別得到兩種模型的預測值,并與測試組陀螺輸出零偏進行比較,如圖6所示。由圖可看出,改進后模型的預測值與真實值更接近。兩種模型的變溫陀螺零偏溫度補償效果如圖7所示。表1為兩種模型應用在光纖陀螺變溫實驗采集數據的溫度補償100 s平滑零偏穩定性效果對比。

表1 兩種方法陀螺輸出100 s平滑零偏穩定性效果對比

圖6 光纖陀螺100s平滑數據與模型預測曲線

圖7 模型補償效果
由表1對比分析可知,運用CSAPSO-BP模型進行溫度補償后的零偏穩定性比補償前精度提升了70%,與BP模型進行溫度補償后的零偏穩定性相比補償精度提升了15%。表2為兩種模型對陀螺輸出零偏預測性能指標對比[12]。由表2可知,與BP模型相比,CSAPSO-BP模型在預測指標上的平均絕對誤差(MAE)與均方誤差(MSE)值都較小,表明誤差更小。

表2 兩種方法預測指標效果對比
光纖陀螺所處環境的溫度發生變化時,其輸出零偏會產生漂移現象。本文通過對陀螺輸出零偏漂移的誤差機理分析,以及實測數據的零偏漂移與溫度變量呈非線性關系基礎上,采用BP神經網絡方法建立光纖陀螺溫度補償模型,并使用混沌模擬退火粒子群算法優化補償模型。該模型改善了粒子群易陷入局部最優的情況,加快了收斂速度,提升了算法性能。通過實驗對模型效果進行驗證,CSAPSO-BP模型能使某型陀螺補償精度較BP模型補償精度提高15%,比未補償前精度提升70%。這對于用軟件方法改善光纖陀螺溫漂現象具有重要的參考意義和實用價值。