時夢想,胡 泓,吳 浩,徐希瀟
(1. 哈爾濱工業大學(深圳)機電工程與自動化學院,廣東 深圳 518000;2. 深圳市西渥智控科技有限公司,廣東 深圳 518000)
LED芯片生產過程中,在經過前道加工步驟后,晶圓片(Wafer)上芯片的數目從幾千到數萬不等。為了控制質量和降低后續工序生產成本,需要對每顆芯片通電后進行光電參數測試。在半導體測試領域,生產線上大多采用探針結構通電。目前工業上探針與芯片電極的接觸和脫離一般通過傳統步進或伺服電機帶動。壓電執行器作為一種新型的執行機構,具有工作精度高,響應速度快及驅動力大的優點,使其適用于各種應用場景[1]。本文研究的壓電執行器主要應用于LED芯片測試過程中。使用末端帶有探針的壓電陶瓷執行器實現探針和芯片電極接觸并進行測量。提高芯片測試效率和探針位移精度。但壓電執行器位移與驅動電壓存在非線性關系,主要源于壓電陶瓷的遲滯效應。遲滯效應導致壓電執行器的輸出位移不僅與當前驅動電壓有關,還與之前的驅動電壓有關。一般遲滯效應會隨著驅動電壓的頻率改變而改變,這給精確控制壓電執行器的位移帶來了挑戰。為了解決這個問題。一方面使用閉環控制方法,可以達到較理想的位移控制效果,但閉環控制需要為壓電執行器額外配置位移傳感器,增加了使用成本和系統復雜度。另一方面使用基于位移遲滯模型的開環控制方法,但此方法的遲滯模型對于位移預測需要有足夠精度。因此,研究者提出各種模型用于遲滯效應的建模。其中數學解析模型一般具有大量的參數,識別過程較難。靜態的遲滯模型包括Preisach模型、Prandtl-lshliskii(PI)模型及Maxwell模型等[2]。
深度學習可模擬非線性映射關系[3],已有很多研究者使用神經網絡對壓電遲滯效應進行建模[4]。郭岱宗等[5]使用循環神經網絡(GRU)對壓電執行器位移遲滯進行建模,與傳統的數學模型相比,該模型具有較好的模擬遲滯效果。鄒守睿等[4]設計了一種循環神經網絡對壓電驅動器的遲滯特性進行建模,進而得到能夠準確模擬輸出位移和輸入電壓之間關系的逆模型,并據此對壓電驅動器進行前饋補償。本文研究了使用長短期記憶(LSTM)神經網絡模擬遲滯的可行性。
本研究基于一種杠桿式壓電執行器[6],使用3層LSTM神經網絡對執行器位移遲滯進行建模,并將所提出的基于LSTM神經網絡遲滯補償模型與傳統Prandtl-Ishlinskii補償模型進行對比,證明了神經網絡模型具有更好的模擬壓電執行器壓電位移遲滯的效果。
壓電遲滯現象主要由于壓電執行器當前時刻的位移輸出不僅受當前時刻電壓輸入的影響,還與過去時刻的電壓輸入有關。LSTM是一種特殊的循環神經網絡(RNN),LSTM的提出主要是為了解決序列預測的問題,在預測當前時間點輸出時考慮以往時間點的輸入,這種預測方法與遲滯現象發生的本質吻合。
LSTM由一系列的LSTM細胞(Cell)組成,每個細胞含有若干個LSTM單元(Unit)。每個時間步的細胞狀態ct存儲了經過本時間步及之前的時間步篩選處理后所留存的信息,從而長記憶得以建立。


圖1 LSTM神經元
ft=σ(Wfxt+Ufht-1+bf)
(1)
it=σ(Wixt+Uiht-1+bi)
(2)
ot=σ(Woxt+Uoht-1+bo)
(3)
(4)
(5)
ht=ot⊙tanh(ct)
(6)
式中:σ(·)為sigmoid激活函數,值域[0,1];tanh(·)為雙曲正切激活函數,值域[-1,1];⊙為矩陣的哈達瑪積(Hadamard product,按元素相乘);W,U為權重矩陣;b為偏置向量sigmoid函數和雙曲正切函數的定義如下:
(7)
(8)
假設每次訓練的樣本數(batch size)為b,每個樣本的維度為d,每個LSTM Cell隱藏神經元數(hidden size)為h。xt∈d,W,U∈h×d,ht∈h,b∈h。
本文所設計神經網絡由3層LSTM層和1層全連接層組成,如圖2所示。

圖2 神經網絡結構
由于壓電執行器非線性遲滯由多方面因素決定,故選取3層LSTM網絡。對于多層神經網絡,上一層每個Cell的輸入為下面一層對應Cell的隱藏狀態ht,根據實驗和訓練經驗選取層數,更多的層數不僅可能導致較差的擬合效果,還會增加計算時間。
根據其他研究者對壓電遲滯的研究,LSTM窗口大小選取為50個,隱藏單元數為64個[8],可以獲得較好的擬合效果及較小的計算要求。窗口大小表示由ti時刻及其之前49個采樣時刻所組成的激勵電壓序列ut-49,ut-48,…,ut輸入到神經網絡中預測ti時刻的位移yi。
由于LSTM層最終輸出為ht維度(h維)的意義與實際所要預測的位移輸出有差別,因此,在最后增加一層全連接層進行必要的變換。神經網絡超參數如表1所示。

表1 神經網絡超參數
經典PI遲滯模型是一種數學解析模型,該模型采用雙邊Play算子Frj(t)和權重系數pj加權疊加來描述壓電陶瓷遲滯非線性特性[2]。經典PI模型在離散處理后的表達式為
(9)
式中:rj為離散閾值(r0=0);pj為每個遲滯算子對應的權重系數,兩者通過遲滯實驗數據識別得出。
對每個離散的rj值,相應的遲滯算子具體計算方法為
(10)
式中z0j為各個遲滯算子初值。
為獲得模型,繼續對時間進行離散,每個rj值對應的遲滯算子計算方法為
(11)
式中:k=0,1,…,Ns;t0=0;tE=NsTs;Ts為采樣間隔,共使用Ns+1個采用數據。
將離散后的遲滯算子和權重系數疊加,計算出壓電執行器的位移輸出為
(12)
為了收集數據進行LSTM神經網絡的訓練和測試,整體的實驗框圖如圖3所示。

圖3 實驗系統
圖3包含一個用于研究位移遲滯的壓電執行器,其功能原理如圖4所示。該執行器由杠桿機構將壓電疊堆的唯一輸出放大輸出到末端,該壓電疊堆型號為P-885.91,最大工作電壓為110 V,壓電執行器組裝時,通過彈簧對壓電疊堆施加一定的預緊力,以保證其穩定運行。

圖4 壓電執行器功能原理圖
上位機使用Labview軟件結合數據采集卡廠商的驅動程序,編寫數據采集和電壓控制信號發出的程序。電壓控制信號通過與上位機相連的USB-5621A數據采集卡發出,輸出采樣頻率為10 kHz。
ATG-2042型號的功率放大器將數據采集卡輸出的控制信號電壓進行放大,輸出給壓電執行器,驅動其產生位移。
位移傳感器探測壓電執行器的位移量,傳感器選取型號為米朗LVDT8筆式傳感器,該位移傳感器精度為2.5 μm。最后USB-5621A將傳感器位移信號的采集輸入到上位機保存,位移信號和電壓控制信號同步采集,采樣頻率均為10 kHz,最終獲取壓電執行器的位移遲滯信息。
為了提供訓練LSTM神經網絡所需的多種遲滯數據,一方面使用多頻率的正弦信號作為激勵電壓,另一方面使用多頻率的衰減正弦信號作為激勵電壓。得到壓電執行器的多個遲滯環數據,即:
(13)
(14)
式中:τ=0.15為衰減正弦波的時間常數;f為正弦波的頻率;Vmax,Vmin分別為最大、最小激勵電壓。
由于功率放大器只能輸出正電壓,為防止之后的補償電壓為負值,Vmin=30 V,由于壓電疊堆限制,Vmax=110 V。兩種波形在1~60 Hz內各采樣60組數據,傳感器采樣頻率為10 kHz,每種信號持續20 s,共120組電壓-位移數據,每種信號進行降采樣后共40 000個采樣點用于訓練和驗證神經網絡模型。通過兩種激勵信號產生了多種遲滯環。圖5為正弦波激勵信號所產生的遲滯環。圖6為衰減正弦波產生的遲滯環。

圖5 正弦波激勵信號產生的遲滯環

圖6 衰減正弦波產生的遲滯環
由圖5、6可看出,壓電執行器的遲滯環與頻率相關,驅動頻率越高,遲滯非線性越明顯,且是非對稱的。這是由于壓電執行器的非線性特性不僅由壓電疊堆本身決定,還與機械零件之間的摩擦(如在杠桿與支點間的摩擦,頂針和頂針套間的摩擦)及零件的彈性形變有關。
訓練過程中,為提高學習效率,所有訓練數據被歸一化到[-1,1]區間內,與神經網絡中的激活函數相匹配。使用Pytorch開源機器學習框架實現神經網絡。訓練迭代次數選取為80。本研究選用均方損失函數(MSE),并選擇Adam算法作為反向傳播優化算法,學習率設定為0.001。使用前述的神經網絡及超參數訓練神經網絡模型。將訓練集和驗證集按7∶3劃分。本文選取正弦波和衰減正弦波的頻率為2 Hz、10 Hz、20 Hz、30 Hz、50 Hz,以此作為模型訓練集和驗證集數據,其他數據作為測試集數據。
訓練使用計算機配置:中央處理器為Intel Xeon E5-2680 v4 CPU,主頻2.4 GHz;圖形處理器(GPU)為:NVIDIA Tesla P40(12TFLOPS 單精度浮點計算,47INT8 TOPS);內存為:DDR4,內存帶寬達2 666 MT/s。網絡需要訓練的參數共有83 777個。共完成訓練所需時間為30 min。訓練集損失函數和驗證集準確率值隨迭代次數的變化曲線如圖7所示。

圖7 損失曲線
為驗證LSTM神經網絡的有效性,以傳統PI模型作為對照組。由于經典PI模型為靜態模型,當研究分析遲滯靜態特性時,輸入信號頻率不高,頻率過高將導致模型誤差過大。使用5 Hz正弦波遲滯數據進行模型參數識別。
識別PI模型首先確定遲滯算子的數量。選用遲滯算子數量越多時,模型擬合精度越高,計算量越大。本文選擇遲滯算子個數為9個,閾值和遲滯算子初始值[2]為
(15)
式中電壓最大值max{|v(k·Ts)|}為實際輸入電壓最大值110 V減去基值電壓30 V,即80 V。
遲滯算子的初值均設置為0,即:
z0j=0
(16)
使用Matlab編寫PI遲滯模型的識別和驗證程序。權重系數計算使用最小二乘法,即通過最小化PI模型計算位移和實際位移間的誤差來辨識9個權重系數q值。模型辨識結果如表2所示。

表2 PI模型辨識結果
本文使用3種準確性的指標來對模型預測結果進行評估,分別是均方根誤差(ERMS)、ERMS在觀測值范圍內的位置(ENRMS)和最大絕對誤差(EMA)。
EMA表示預測值和觀測值之間絕對誤差的最大值。計算方法如下:
(i=1,2,…,N)
(17)
ERMS表示預測值和觀測值之間差異(稱為殘差)的樣本標準差。計算方法如下:
(i=1,2,…,N)
(18)
ENRMS表示ERMS在觀測值范圍內的位置:
(19)
由實驗結果可知:
1) 由PI模型的預測誤差結果(見表3)可知,經典PI模型對于該執行器的遲滯仍具有較好的靜態建模能力。雖然最大絕對誤差(EMA)值仍有6.50 μm,但是誤差保證在[-5,+5]內,誤差對稱,ENRMS僅為2.15%。圖8為對用于模型識別的5 Hz正弦波所對應的位移遲滯預測結果。

表3 PI模型的位移預測誤差

圖8 PI模型5 Hz正弦波位移預測
2) PI模型動態預測能力很差,對于9 Hz信號ENRMS已達2.34%。對于1 Hz信號預測(見圖9)ENRMS誤差已超過3%,很難達到工業上的精度要求。對于同頻率衰減正弦波預測誤差更大,EMA已達10.95 μm,模型預測基本失效。

圖9 PI模型1 Hz正弦波位移預測
將上述的經典PI模型作為對照組,由LSTM正弦波和衰減正弦波實驗預測誤差(見表4、5)可知,LSTM神經網絡模型具有廣泛的動態預測能力。

表4 LSTM神經網絡正弦波預測誤差

表5 LSTM神經網絡衰減正弦波預測誤差
3) 對于多頻率正弦波信號,神經網絡的最大絕對誤差可以保證在±5 μm內基本上可滿足LED測試要求。ENRMS可控制在2%內,精度較高。LSTM模型對5 Hz正弦波激勵位移預測如圖10所示。

圖10 LSTM模型5 Hz正弦波位移預測
4) 對于衰減系數τ=0.15的各頻率衰減正弦波遲滯,ENRMS基本保證在3%內,說明神經網絡不僅對正弦波具有動態建模能力,對于其他波形同樣具有良好的預測能力。LSTM模型對5 Hz衰減正弦波激勵位移預測如圖11所示。

圖11 LSTM模型5 Hz衰減正弦波位移預測
本文為了提高壓電執行器的定位精度,分別使用經典PI模型和LSTM神經網絡對其靜態和動態遲滯進行建模。使用數據采集卡同時采集壓電執行器的驅動電壓控制信號和位移信號,從而獲取壓電執行器的多頻率正弦波和衰減正弦波的遲滯數據。設計了一種由3層LSTM層和1層全連接層構成LSTM神經網絡遲滯模型,使用GPU加速,通過80輪迭代,通過已獲取的遲滯數據計算神經網絡參數,并對經典PI模型參數進行識別。最后分別考察兩種遲滯模型的位移預測效果,發現傳統PI模型對于靜態遲滯有較好的建模效果,動態效果較差,對于衰減正弦波的建模基本失效。以PI模型作對照組,LSTM模型不僅在動態遲滯建模方面具有優良的性能,整體誤差保證在2%內,而且對于衰減正弦波同樣可獲得較良好的建模效果,基本上可達到工業應用要求。通過對壓電執行器的遲滯效應進行有效建模,可以為LED晶圓檢測提供一種更加高效的方法。