梁 浩, 何 婕, 陳善秋, 郭 毓, 趙興法, 陸煜明
(1. 南京理工大學自動化學院,江蘇 南京 210094; 2. 北京航天時代激光導航技術有限責任公司,北京 100094;3. 空軍裝備部駐北京地區第五軍事代表室,北京 101300)
作為捷聯慣導[1-2]的代表,激光陀螺慣性導航系統(激光慣導)以其低成本、高精度、環境適應性強、數字輸出等優點在航天、航空、航海等領域得到了廣泛的應用。溫度是影響激光慣性導航系統精度和穩定性的重要因素[3]。
在激光陀螺溫度補償的研究方面,歐陽義國等[4]采用逐步回歸分析方法,建立了激光陀螺進行零偏系數多項式模型。于旭東等[5]提出了一種改進的人工魚群尋優算法,對多項式參數進行尋優,并將之用于激光陀螺的溫度零偏補償中。史震等[6]提出了一種基于自組織競爭型神經網絡和正交最小二乘算法的改進徑向基函數神經網絡方法,并將其用于單陀螺的溫度補償中。在系統級別的溫度補償方面Wei Guo等[7]針對系統零偏的非線性漂移,提出了一種基于最小二乘支持向量機的激光陀螺零偏系統級溫度補償方案。李漢舟等[8]提出了采用溫度控制與溫度補償相結合的方法,對激光陀螺進行溫度補償。以上研究多集中于單陀螺的溫度補償以及陀螺零偏參數的補償,而在實際系統中,包含多種傳感器,且影響系統輸出的參數多達十幾個。在系統溫度變化時,這些參數往往互相產生耦合,并且呈現出較復雜的非線性變化。目前,在系統級多參數溫度補償方面的研究還不夠,尤其是對于慣導系統參數耦合以及呈現非線性變化時的多參數溫度補償方法研究很少,值得進一步開展研究工作。
針對溫度影響激光陀螺慣導系統性能問題,本文建立了激光陀螺和加速度計慣導系統溫度補償模型,采用異構核相關向量機[9-11](relevance vector machine,RVM)對模型中標度因子和零偏進行擬合回歸,并采用蟻獅優化算法[12](ant lion optimizer,ALO)對相關向量機的參數進行尋優,以提高相關向量機的性能,并進行慣導實物溫度試驗以驗證算法的有效性。
溫度是影響激光慣導輸出精度和啟動時間的重要因素,其對系統的影響主要表現為三方面:1)溫度對激光陀螺的諧振腔長及共面性、抓卡系統、朗繆爾流動、放電對稱性等產生影響,從而引起激光陀螺標度因子和零偏的變化。2)加速度計溫度的波動會使加速度計中差動電容傳感器生成較大的電流波動,并對磁性材料、力矩線圈、支臂形變產生影響,從而影響加速度計標度因子和零偏的穩定性。3)激光陀螺和加速度計固定在基座上,基座的幾何結構隨溫度變換產生微小的變化,這種變化也會反應在單個傳感器儀表的參數漂移上。
總之,溫度對慣導系統的影響是多方面和復雜的,逐步分析和補償這些因素非常困難,因此采用系統級補償方法對所有影響因素進行整合,直接進行建模和補償。
典型的激光慣導系統包括3個正交的激光陀螺和3個正交的加速度計。其中激光陀螺的測量模型為[13]:
式中:Ng——3個激光陀螺在采樣周期內的輸出脈沖向量
Kg3個激光陀螺的標度因子矩陣,=diag(Kgx,Kgy,Kgz);
Dg-3個激光陀螺的零偏矩陣,
加速度計的測量方程如下:
式中:Na——3個加速度計在采樣周期內的輸出脈沖量
Ka- 3個激光陀螺的標度因子矩陣;=
對于激光慣組來說,其溫度的影響主要集中在激光陀螺以及加速度計的標度因子和零位上,因此,考慮溫度T的變化因素,式(1)和(2)可分別表示為:
式中:Kg(T)-3個陀螺的標度因子的溫度擬合回歸模型矩陣,
Ka(T)——3個陀螺零偏的溫度擬合回歸模型矩陣,
Dg(T)-3個加速度計的標度因子的溫度擬合回歸模型矩陣,
Da(T)-3個加速度計的標度因子的零偏的回歸模型矩陣,
每個陀螺和加速度計都安裝有溫度傳感器,因此對于每個傳感器的溫度變量進行區分。
假設e為需要補償到的目標溫度,通過回歸模型,可以得到陀螺、加速度計在溫度e時的標度因子陣與零位陣
將式(5)和(6)分別代入式(1)和(2),可以得到將陀螺和加速度計輸出補償到溫度e的溫度補償模型:
式(7)和(8)即為慣導系統的溫度補償模型,通過模型的計算,可以將所有溫度下的陀螺和加速度計的脈沖輸出補償至目標溫度下的輸出,從而實現系統的溫度補償。可以看到,對于慣導系統激光陀螺和加速度計的溫度補償上,起決定因素的是溫度擬合回歸模型的回歸精度,由于慣導系統內部結構復雜,部件眾多,因此其溫度環境非常復雜,會導致陀螺和加速度計的標度因子和零位隨溫度產生復雜的非線性變化,需要采用對非線性變化有較強擬合回歸能力的方法來提高系統補償能力。
3.1.1 相關向量機理論
機器學習在復雜非線性擬合回歸方面具有強大的能力。Tipping[14]提出了基于貝葉斯框架的相關向量機。相關向量機使用較少的向量,具有較強的稀疏性,能夠在訓練樣本較少的情況下,保證良好的泛化能力,且其核函數不必滿足Mercer條件,放寬了核函數的選擇范圍,其基本算法如下:
從試驗中獲得的樣本數據集[15]如下:
式中:N——數據樣本數;
考慮目標是疊加了噪聲的數據樣本,則目標可以表示為:
全部數據集的似然估計表示為:
對 P (t|α,σ)采用極大似然法得到其邊際似然函數在最大化時所對應的 αMP,σ2MP后,對于新的輸入,可以計算輸出預測分布[17]:
3.1.2 異構核函數
對于相關向量機,其核函數的構造和選擇對于模型預測精度影響很大。相關向量機只使用單核函數會造成性能單一且局限性較強,而采用異構核函數能夠提高其性能[11,18-19]。高斯核函數具有良好的非線性映射能力,但其作用是局部的,當空間中一點遠離中心點時函數取值很小,Sigmoid核函數是具有全局特性的核函數,結合二者可以同時提升學習能力和泛化能力。定義異構核函數如下:
蟻獅優化算法[20]是一種群體智能算法,通過對自然界中蟻獅的狩獵機制,不斷進行種群的迭代,從而獲得系統的最優解,其尋優效率優于傳統的遺傳算法[21-22]和粒子群算法[23]。ALO算法主要分為以下步驟[24-25]:
1)螞蟻的隨機行走
ALO算法模擬陷阱中蟻獅和螞蟻之間的相互作用。為了模擬這種相互作用,螞蟻需要在搜索空間中移動。由于螞蟻在尋找食物時會在自然界中隨機移動,因此選擇隨機行走來模擬螞蟻的移動[26],如下式所示:
式中:cumsum——累加和;
p——迭代次數。
2)構建陷阱
為了模擬蟻獅的狩獵能力,通過蟻獅的適應性使用輪盤賭方式來選擇蟻獅并構筑陷阱。
3)螞蟻進入陷阱
螞蟻進入陷阱的過程, 可以看作螞蟻圍繞修筑陷阱的蟻獅行走,行走邊界受蟻獅位置的影響:
4)螞蟻滑落
一旦蟻獅發現到陷阱里有螞蟻,它們就會從坑中心向外刨出沙子,使試圖逃跑的螞蟻圍繞蟻獅的行走半徑不斷減小。該過程的數學描述如下:
式中:p——當前迭代次數;
M——最大迭代次數。
5)陷阱重構
如果螞蟻種群中出現了適應度高于蟻獅的個體,則將該螞蟻將作為蟻獅,并在其位置修筑陷阱,即:
式中:p——當前迭代數;
f ——適應度函數。
6)蟻獅精英化
精英化允許算法在優化過程的任何階段保持獲得的最佳解。ALO算法中,每次迭代中獲得最優適應度的蟻獅被視為精英蟻獅,它能夠在迭代過程中影響所有螞蟻的運動。假設每只螞蟻同時受到輪盤賭選出的蟻獅和精英蟻獅的影響隨機行走:
為了獲得RVM模型的最佳核函數寬度參數,每個蟻獅表示一個可能的核函數寬度參數。設置搜索范圍、種群數、最大迭代次數和初始位置。
從試驗中獲得的數據集分為訓練集和測試集。訓練集用于RVM建模,測試集用于測試模型的預測精度。每個蟻獅對應模型的預測精度作為每個其適應度,定義為:
圖1為采用RVM建模及采用ALO對RVM進行優化的流程圖。首先初始化蟻獅算法參數,每一個螞蟻和蟻獅都可作為一對RVM核函數的參數,通過螞蟻的隨機行走,生成每只螞蟻和蟻獅對應參數的RVM,對所有RVM采用訓練集進行訓練,并采用測試集進行精度測試,根據測試結果,更新精英蟻獅,直到最大迭代次數位置,獲得此時的核函數參數。
圖1 建模及優化流程圖
如圖2所示,為了獲得變溫條件下激光陀螺和加速度計的溫度特性,將慣導安裝至溫箱中的轉動裝置上,并對溫箱的溫度進行控制。每個陀螺和加速度計都安裝有鉑電阻Pt1000,通過電橋電路可以測量其溫度。測試設備對慣導進行供電,并對溫度和脈沖數據進行記錄。通過轉動裝置溫箱中進行不間斷標定,以獲得3個陀螺儀和加速度計在不同溫度下的標定數據。
圖2 試驗裝置圖
1)將慣導安裝至溫箱中,將溫箱的溫度設置為-5 ℃,保溫 4 h 使慣導溫度穩定。
2)將溫度箱終止溫度設為65 ℃。在溫度變化過程中,對慣導系統連續標定,共獲得175組標定數據,于此同時記錄所有陀螺和加速度計的溫度。
3)對每組標定數據進行離線處理,分別得到3個陀螺和3個加速度計的標度因子和零偏數據集,共12個數據集。由于進行了175組標定,因此每個數據集有175組數據。
4)將12個數據集都分為訓練集和測試集,采用3.3中的建模及優化流程建立12個相關向量機模型,12個標度因子和零偏的模型可表示如下:
式(29)所示的模型,即通過RVM學習后所建立的各參數與溫度的擬合回歸模型。共有包括了三個陀螺和三個加速度計的標度因子以及零偏的12個擬合模型,即對應于式(3)和式(4)中的Kgx(Tgx),Kgy(Tgy),Kgz(Tgz),Kax(Tax),Kay(Tay),Kaz(Taz),Dgx(Tgx),Dgy(Tgy),Dgz(Tgz),Dax(Tax),Day(Tay),Daz(Taz),其中,每個模型中的和代表此模型經過ALO優化后的核函數的參數。在RVM學習的過程中,可以獲得式(15)中關于輸入樣本的與,并可通過式(20)實現數據回歸。
5)設定50 ℃作為補償的目標溫度,根據式(29)、(23)建立的模型回歸計算出此溫度下的標度因子陣,與零位陣、。
為了驗證補償效果,采用本文提出的方法將所有溫度下的標定數據補償到50 ℃。將補償后的數據用于離線標定,以獲得補償后的三個陀螺和三個加速度計的標度因子和零偏。如圖3所示,三個陀螺和三個加速度計的標度因子和零偏補償后的曲線在所有溫度下都是比較穩定的,與補償前的曲線在50 ℃下時相交,表明所有溫度下的參數都已補償到 50 ℃ 下。
圖3 三陀螺和三加速度計標度因子和零偏補償圖
為了測試在系統上的補償效果,將慣導在室溫環境下采用靜態通電4 h。
表1中列出了補償前及補償后輸出穩定性的對比數據。可以看出,輸出穩定性較補償前提高了一個數量級。
表1 慣導系統靜態輸出穩定性(1σ)
為了減小溫度對激光慣導的影響,本文提出了一種采用蟻獅優化的異構核相關向量機方法對激光慣導系統進行溫度補償,主要工作如下:
1)分析了溫度對于慣導系統帶來的影響,并根據慣導數學模型,推導了系統的溫度補償模型。
2)提出了一種采用異構核函數的相關向量機對系統的標度因數和零偏建立擬合模型的方法,采用蟻獅算法對核參數優化以提高模型的擬合回歸精度,給出了建模及優化流程。
3)通過實物溫度試驗對所提方法進行了驗證。結果表明,采用本文方法可以對系統多參數的非線性變化進行補償,補償后的各傳感器通電穩定性較補償前提高了一個數量級。
本文中采用了高斯核函數與Sigmoid核函數的線性疊加構建異構核函數,下一步將研究不同核函數組合及其構建方式對溫補性能的影響,以及進一步降低算法的計算復雜度。