陳子楠,秦文虎,姚紅權
(1.東南大學 儀器科學與工程學院,江蘇 南京 210096;2.南京先進激光技術研究院,江蘇 南京 210038)
快速反射鏡(FSM)是自適應光學系統中的關鍵執行元件,因其具有響應迅速,功耗低,精度高等優點,現已被廣泛用于自適應光學的復合軸精密跟蹤、天文望遠鏡、激光雷達等領域[1]。壓電材料自身具備的遲滯特性,在實際使用時會導致由其驅動的FSM輸入電壓與輸出角度之間存在遲滯特性,且更為復雜,在開環無控制條件下實際跟蹤誤差達到15%。因此,如何解決遲滯效應成為高精度自適應光學系統的重要問題。
針對壓電材料的遲滯建模的研究成果頗豐。常見的物理模型有Jiles-Athertan模型、Ikuta模型等;常見的現象模型有Duhem模型、Bouce-Wen模型、Preisach模型及Prandltl-Ishlinskii等。賀一丹等[2]、Rasaienia等[3]和王博文等[4]基于以上經典模型進行了改進與應用。采用神經網絡建模是針對該問題的一種新興的研究方向,BP神經網絡、深度神經網絡(DNN)[5]、徑向神經網絡(RNN)[6]等人工神經網絡模型已被證實在針對壓電材料遲滯建模的問題上具有良好的精度與性能,但也存在計算復雜,參數難求解,工程實操性差等問題。差分進化(DE)算法是Storn等[7]于1997年提出的一種元啟發式算法,作為遺傳算法的進一步擴展,具有優秀的全局尋優能力,且收斂速度更快,其思路也隨著研究的深入而不斷優化,已被運用于多種神經網絡的參數訓練中,有效提升了效率和全局性能。Teng等[8]論證了DE算法在優化BP網絡性能的可行性。
本文基于Madelung法則以最小二乘法構建了具有基本遲滯特性的對稱遲滯主環算子,并將該算子作為神經網絡的擴展空間輸入,與FSM輸入信號共同構成神經網絡訓練的數據集,以解決遲滯映射多對一時無法被神經網絡擬合的問題,且簡化了數據采集流程。采用BP神經網絡對遲滯特性實現精確建模,設計了一種改進的DE算法對網絡的權值與偏移量進行訓練。實驗結果表明,該方法能較好地擬合描述FSM的遲滯特性,具有良好的收斂能力和精度。
壓電材料的遲滯非線性曲線由輸入位移信號(電壓)與實際輸出位移構成,且輸入位移信號在一個來回運動中曲線不重合,如圖1所示。遲滯曲線的復雜之處在于輸出位移由當前輸入信號與歷史輸入信號共同決定,即存在記憶性。

圖1 遲滯曲線
本實驗采用Physik Instrumente(PI)公司型號為S330的FSM,其結構如圖2所示。該款FSM由對稱分布的4個高分辨率的壓電陶瓷作為驅動器,通過鉸鏈連接反射鏡背面,位于垂直、水平方向上的兩對壓電陶瓷串聯共享100 V固定電壓,通過改變電壓使壓電陶瓷形變,進而驅動鏡面在兩個自由度內轉動,以控制光束的指向,如圖3所示。

圖2 FSM驅動器位置示意圖

圖3 FSM結構示意圖
德國科學家Madelung于上世紀初對壓電遲滯效應進行了總結歸納,得到了包括唯一性、閉合性和擦除性的Madelung法則。該法則也是所有科研人員在遲滯模型構建時需要遵循的標準。基于Cao等[9]的啟發,本節對FSM的復雜遲滯模型進行了結構上的簡化,旨在構造一組能夠描述遲滯主環的基本遲滯算子,且易于數據處理與計算。遲滯環的兩個拐點是描述其遲滯特性的關鍵,本文從遲滯環的擦除性出發,采用相應的算法與硬件設備,具體數據的采集與處理流程如圖4所示。

圖4 基于單調棧存儲當前拐點
假設隨機輸入信號生成了一系列拐點A0,A1,…,Am,與之對應的位移x0,x1,…,xm,將所有拐點分成左、右拐點,分別存入兩個基于位移嚴格遞減的棧中。若下一次要入棧的拐點超出了當前棧頂的拐點范圍,則會對棧頂元素進行更新,直到兩棧重新滿足單調遞減。如圖4中的xm-2和xm-3被新入棧的xm和xm-2覆蓋,這體現了Madelung的擦除性。
假設一組輸入信號從點A0上升運動到A′0,用fA0A′0(x)表示其軌跡,并簡潔表示為f0(x),則有:
(1)
式中ai為需要辨識的參數。運動軌跡到達A′0后下降回到A0,即為一個完整遲滯環。因為構建的遲滯曲線是嚴格的中心對稱,故上升曲線fA0A′0(x)上的任意一點(x,fA0A′0(x))和下降曲線fA′0A0(x)上的點(xt,fA′0A0(xt))存在如下數學關系:
(2)

(3)

fA′0A0(x)=y′0+y0-f0(x0+x′0-x)
x∈[x0,x′0]
(4)
基于Cao等[9]給出的推論,對輸入信號依次生成的所有拐點A0,A1,…,Am中任意一組在點Ak-1到Ak的遲滯曲線fAk-1Ak(x),當k分別為奇數和偶數時,有:
fAk-1Ak(x)=yk+y0-f0(x0+xk-x)
(5)
fAk-1Ak(x)=yk+y0+f0(x0-xk+x)
(6)
式中k=1,2,…,m。式(5)、(6)表明,任意一條遲滯曲線fAk-1Ak(x)都由起始點Ak-1決定,符合Madelung法則。基于上述分析,適用于計算機的軌跡構造算法流程如圖5所示。

圖5 基于單調棧的拐點存儲機制
BP神經網絡(BPNN) 是一種常用的神經網絡模型,結構簡單可塑性強,但其常見的訓練算法存在收斂較慢,全局尋優能力不足等缺點。本文設計了一種改進的差分進化算法(IDE)對BPNN進行參數訓練,寫作IDE-BPNN。其整思路為:將預測值與實際值做差,并計算相應的MSE值作為訓練目標函數。當MSE最小時,權重和閾值對舊的權重與閾值進行替換,依次迭代,進而得到符合條件的權重和閾值。
BPNN方面,基于前文推論以及式(4)、 (5),對FSM的一組壓電制動軸的輸入信號x進行空間擴張,得到輸入量為(x,f(x)),整體的輸出為
(7)
式中θ代表所有需要辨識的權重與偏置。IDE方面,控制參數的選擇是決定其性能的關鍵因素。對于訓練所用種群數量NP,Stron等[7]推薦范圍為5D~10D,其中D為訓練參數維度。后續研究認為對于低維問題,NP建議設置為100,對于高緯度問題應設置為3D~5D。
對于變異算子F和交叉算子CR,其中F決定偏移向量縮放比例,Storn等[7]認為其常用選擇范圍在[0.4,1],通常設置為0.5。CR代表隨機變異向量占所有向量的比例,范圍為[0,1],其值越大,收斂越快,可先用較大的CR值(0.9以上)來驗證算法是否收斂。若種群收斂過快,則應該增加F和NP的值。
基于以上分析,重點針對變異算子F和交叉算子CR的選取進行優化,設計的IDE算法整體流程如下:
1) 初始化
在有界區域隨機初始化種群:
θi,G=[θi,1,G,θi,2,G,…,θi,D,G]
(8)
θi,j=θmin,j+randi,j[0,1](θmax,j,θmin,j)
(9)
式中:i=1,2,…,NP;j=1,2,…,D;0≤randi,j[0,1]≤1,表明生成[0,1]范圍內的一個隨機數,NP表示總體規模,D表示參數維度,本文考慮的屬于低維問題(D<30),NP可直接設置為100;θmax,θmin表示變量θ的邊界;G=0,1,2,…,Gmax,為當前進化代數。
2) 突變
末次給藥當日,每組各取小鼠10只,每只小鼠ip 2%淀粉1 mL,24 h后每只小鼠ip新鮮配置的5%雞紅細胞0.5 mL[7]。處死小鼠,剪開腹部皮膚,經腹膜注射生理鹽水2 mL,輕揉腹部1 min后,吸出腹腔洗液涂片于載玻片上。將玻片置于37℃、5%CO2培養箱溫育30 min,用生理鹽水漂洗、晾干,用丙酮‐甲醇溶液1∶1固定2 min。晾干后,涂片Giemsa染色30 min,蒸餾水漂洗,磷酸鹽緩沖液分色,晾干。油鏡下計數200個巨噬細胞,計算巨噬細胞吞噬百分率和吞噬指數。
每一代的突變向量由其中兩個向量的權重差與第3個獨立向量共同基于一種突變算子生成。常用突變算子有rand/1、best/1、best/2及current-to-best/1等, 其中rand/1、rand/2算子探索能力更好,而best/1、best/2類的算子開發能力更好。因此,為了綜合種群的探索能力與開發能力,本文綜合了rand/1和current-to-best/1算子,改進了突變策略,每次迭代時設置判決閾值為0.5,并基于此判決閾值自適應選擇算子。偽代碼如下:
突變算子修改方案:
if rand[0,1]>0.5using“rand/1”
else using“current-to-best/1”
end

3) 交叉
在變異階段后,通過交叉方式生成新的實驗向量,以增加整個種群多樣性。
(10)
式中:i=1,2,…,NP;j=1,2,…,D。為避免F過大降低了算法效率,F太小降低了種群多樣性,故采用如下自適應計算公式:
(11)
由式(11)可見,F在訓練早期值會較大,保證了種群的多樣性;隨著迭代次數G的增加,F逐漸降低,在保留了較優秀的遺傳信息,增加搜索全局最優解能力的同時,也提升了算法效率。同樣的,CR值的選取也會在偏重種群多樣性與偏重算法效率之間產生矛盾,故采用如下公式:
CR=(CRmax-CRmin)×
(12)
4) 選擇
為決定實驗向量Ui,G能否繼承到下一代,將目標向量和實驗向量進行對比,適應度更高的一方將繼承到下一代:
(13)
5) 終止條件
重復步驟2)-4),G=G+1,當迭代次數達到設定值(G>Gmax),或者均方誤差滿足設定條件時,訓練結束。
將以上IDE算法訓練流程內嵌入BPNN訓練流程,并將所得最優參數向量設為BPNN的最佳連接權值進行前向傳播,預測并計算誤差,即為完整的算法訓練流程。
實驗采用PI公司型號為S330的快速反射鏡,工作角度范圍為±1 mrad,輸入電壓范圍為0~100 V,工控機為主控單元,CCD作為測量單元,采樣頻率為1 MHz,采樣深度為16位數據采集卡。本款快速反射鏡x、y軸的工作原理以及采用的壓電陶瓷型號均相同,相互之間耦合度很低,故可固定其中一軸于水平位置(驅動電壓置為50 V),單獨對一軸(x軸)進行實驗。
在使用模型前要先進行參數辨識,首先辨識遲滯主環參數。輸入信號為30 Hz,峰值為100 V的正弦信號,得到快速反射鏡的主遲滯環。根據前文論述,采用最小二乘法擬合曲線f0(x)。相關系數R2是衡量擬合效果的重要指標,其值越接近1,代表擬合效果越好。經過對比運算,選擇采用五階最小二乘法時,其R2=0.995 96,能較好地兼顧擬合精度和運算復雜度。實際測量與最小二乘擬合的數據如圖6所示。為便于分析,對測得數據進行歸一化處理,具體表達式為
f0(x)=-0.134 7x5+0.544 4x4-
0.794 5x3+0.713 5x2+0.671 2x
(14)

圖6 遲滯主環建模
通過遲滯內環可辨識神經網絡參數。向快速反射鏡輸入一組幅值遞減的三角信號x(t),得到輸出角度信號y(t),并將同樣的輸出加入上文構建的遲滯算子中得到輸出為f(x(t))。實際采集到600組數據,其中300組用于訓練,剩下300組用于模型驗證。IDE-BPNN的參數辨識框圖如圖7所示,將上述輸入、輸出數據離散化,得到集合{(xk,f(xk))}和{yk},分別作為訓練網絡的輸入、輸出數據。其中k=1,2,…,N,N為輸入數據個數,即N=300。

圖7 IDE-BPNN參數辨識框圖
基于1.2小節中介紹的方法進行IDE-BPNN訓練,加入經典DE算法[7]作為對照,設置參數NP=100,F=0.6,CR=0.6;IDE基本參數保持不變:Fmax=0.9,Fmin=0.2,CRmax=0.6,CRmin=0.1,迭代次數為200,訓練結果如表1所示。由表可見,兩種方法均表現出較好的性能,IDE的精度相對更高。

表1 IDE與DE算法結果對比
將剩余300組30Hz的的數據集如圖8所示輸入到訓練好的IDE-BPNN模型中進行驗證,并與文獻[10]介紹的最小二乘建模法進行比較,對比完整遲滯模型和實際輸出之間的誤差。為了更好地量化與評估性能,采用歸一化的思想對輸出結果進行處理。歸一化最大誤差(NME)eN和歸一化均方根誤差(NRMSE)eR的計算公式分別為
(15)
(16)
式中yai和yi分別為實際角度與預測角度。輸入電壓信號如圖8所示。

圖8 30 Hz模型驗證所用的輸入信號
兩組輸出數據集誤差對比如圖9所示。由圖可見,最小二乘擬合模型的最大誤差為6.63 μm,eN=2.86%,eR=2.47%。IDE-BPNN模型的最大誤差為0.745 μm,eN=0.87%,eR=0.36%,與最小二乘建模相比,誤差明顯減小,且分布更均勻合理。

圖9 IDE-BPNN與最小二乘擬合的誤差對比
本文針對PI公司的S330壓電驅動FSM的遲滯效應,構建了相應的對稱遲滯算子,并基于IDE-BPNN訓練所得的遲滯模型進行精確擬合。訓練過程中,IDE相對于經典DE算法性能更優;建模性能上,IDE-BPNN的最大誤差。eN和eR相對于最小二乘法建模有顯著減小。實驗結果表明,將IDE-BPNN應用于該類FSM的遲滯擬合中是可行且有效的,可進一步在有著相同工作機理的FSM中進行研究與推廣。