陳昭暉, 倪一清
(1.福州大學 土木工程學院,福州 350116; 2.香港理工大學 土木及環境工程學系,香港)
磁流變阻尼器非參數化模型泛化能力的提高
陳昭暉1, 倪一清2
(1.福州大學 土木工程學院,福州 350116; 2.香港理工大學 土木及環境工程學系,香港)
建立磁流變阻尼器的動態模型以描述其強非線性動力學行為是智能磁流變控制系統設計及應用的關鍵環節之一。泛化能力是衡量基于人工神經網絡技術的磁流變阻尼器非參數化模型性能的重要指標,也是保證控制系統穩定性和可靠性的重要因素。基于磁流變阻尼器的動力學試驗數據,提出貝葉斯推理分析框架下的非線性自回歸(non-linear autoregressive with exogenous inputs,NARX)神經網絡技術建立磁流變阻尼器的動態模型,通過網絡結構優化和正則化學習算法的結合以有效地提高模型的預測精度和泛化能力。研究結果表明,基于貝葉斯推理的NARX網絡模型能夠準確地預測磁流變阻尼器在周期和隨機激勵下的非線性動態行為,同時驗證了該模型相比于非正則化模型在泛化性能方面的優越性,因此,有利于實現磁流變控制系統的實時、魯棒智能化控制。
磁流變阻尼器;非參數化模型;NARX神經網絡;貝葉斯正則化;泛化能力
智能材料的發展為結構振動控制開辟了新天地,推動著結構控制往智能化方向發展。磁流變液是智能材料研究較為活躍的一個分支,它在磁場作用下可從自由或粘性流動的液體在毫秒級時間范圍內轉變為具有一定屈服強度的類固體[1]。以磁流變液為工作介質制成的磁流變阻尼器屬于半主動控制裝置,可通過調節阻尼器內電磁線圈中的電流強度控制磁場強度,從而改變磁流變液的工作狀態,實現阻尼力的智能控制。
采用磁流變阻尼器進行結構半主動控制時,為實現高效的控制效果需要在控制系統設計中充分考慮磁流變阻尼器的動力學特性,因此,建立準確、適于實時控制的磁流變阻尼器動力學模型是關鍵環節之一。但是,磁流變阻尼器的動力學行為由于磁流變液的復雜流變特性而呈現強非線性,增加了阻尼器建模的困難。目前,對于此問題的研究主要采用參數化建模和非參數化建模的方法。參數化模型利用物理元件(如質量、線性/非線性彈簧、線性/非線性阻尼等)和滯回模塊(Bingham、Bouc-Wen、Dahl、LuGre等)的串并聯組合來模擬阻尼器的力學行為[2-6]。參數化模型通常表達為強非線性方程,雖然在一定范圍內能夠準確描述磁流變阻尼器的力學行為,但其多參數的優化識別不可避免地受制于初始值、約束條件、收斂性等因素而產生難度。實際控制應用時,對強非線性方程的數值處理可能造成控制滯后,影響控制效果。
非參數化模型主要采用人工神經網絡、模糊邏輯、神經模糊推理等技術基于足夠豐富的試驗數據建立磁流變阻尼器輸入、輸出的非線性映射關系以表征其動力學行為[7-10]。其中,神經網絡具有很強的自學習能力能夠獲得精確的預測模型。實際應用中,神經網絡模型的泛化能力,即網絡識別訓練數據以外樣本的能力,被認為是衡量神經網絡性能的重要指標。但以往的研究卻很少對磁流變阻尼器的神經網絡模型進行泛化能力方面的深入探討。用于神經網絡訓練的試驗數據不可避免地包含噪聲,如果網絡結構冗余,這些噪聲會影響到整個網絡訓練后期的收斂,導致訓練偏離全局最優點,并造成網絡過擬合(overfitting)而記憶了噪聲細節,降低泛化能力。過擬合的神經網絡模型將無法保障磁流變阻尼器控制系統的穩定性和可靠性。
本文基于磁流變阻尼器的動態性能試驗數據,從網絡結構和學習算法相結合的角度來研究磁流變阻尼器神經網絡模型泛化能力的提高。提出采用NARX模型與神經網絡技術相結合的NARX網絡建模方法表征磁流變阻尼器的非線性動力學行為,并利用基于貝葉斯推理的學習算法來有效地提高磁流變阻尼器模型在不同輸入激勵條件下的泛化能力。
以美國LORD公司的RD-8040磁流變阻尼器為試驗對象,采用MTS材料試驗機進行磁流變阻尼器的動態力學性能測試。試驗時,控制MTS作動器輸出不同頻率和幅值的諧波位移激勵信號施加于磁流變阻尼器,同時對阻尼器輸入不同的直流電流。圖1顯示了其中在幅值為5 mm、頻率為2.5 Hz的正弦激勵以及不同直流輸入下的實測位移-阻尼力和速度-阻尼力滯回曲線。由圖可見,在無輸入電流(0 A)的情況下,磁流變阻尼器的出力由磁流變液的黏性行為及活塞與密封圈間的摩擦主導。隨著電流的增大,磁流變阻尼力及耗能能力增大,其增幅隨著磁流變液趨于磁飽和狀態而減小。當活塞速度較小時,阻尼器呈現出滯回現象,阻尼力隨著速度的增加而增大,當速度增大到一定幅值后,阻尼力的增加減緩,阻尼器表現出屈服現象。因此,磁流變阻尼器具有很強的非線性動力特性。

圖1 不同電流下的滯回特性曲線(5 mm, 2.5 Hz)Fig.1 Measured hysteresis loops under differentcurrent levels (5 mm, 2.5 Hz)
2.1 NARX網絡
NARX模型具有很好的表征非線性動態行為的能力,理論上可以描述任意有限自由度的非線性動態系統[11]。NARX模型用離散時間的輸入-輸出方程表達為

(1)
多層感知器(multilayer perceptron,MLP)是一種前饋神經網絡模型,能夠反映輸入與輸出之間的映射關系。它包含多層神經元,各層神經元之間通過連接權以前饋方式傳遞信息。含有單隱層的MLP已經理論上被證明具有全局逼近能力,即只要其隱層神經元數目足夠,通過優化其連接權就能以任意精度逼近非線性連續函數[12]。因此,可以采用MLP網絡辨識式(1)的NARX模型f(·;θ),其參數向量θ則由神經網絡參數(連接權和閾值)組成,由此構成的方法為NARX網絡,它具有強大的表征復雜非線性行為(如遲滯、飽和、混沌等)的能力[13]。
多輸入單輸出的NARX網絡可表達為
(2)
2.2 貝葉斯學習算法
MLP網絡模型的學習訓練通常采用最大似然法(如反向傳播算法)進行模型參數估計。基于ND個訓練數據樣本D,通過最小化模型預測值與真實值間的誤差平方和指標式(3)確定網絡參數
(3)
然而,采用最大似然法訓練的MLP網絡結構容易過于冗余,導致對訓練樣本的過擬合現象,即網絡模型僅記憶樣本數據,而沒有學習到數據間的真實映射關系,從而導致網絡泛化能力降低,無法對未經訓練的輸入給出正確的輸出預測。
正則化方法是改善網絡泛化能力的有效方法之一,其將反應網絡結構復雜性的正則懲罰項引入式(3)中改進誤差函數形式為
S(θ)=βED+αEθ
2.2.1 網絡訓練的貝葉斯推理
貝葉斯方法著眼于網絡參數在整個權空間中的概率分布,將網絡參數視為隨機變量。在網絡結構確定的情況下,沒有樣本數據時網絡參數的先驗分布為P(θ|α)。有了樣本數據D后,根據貝葉斯理論,可得網絡參數的后驗條件概率為
(5)
式中,P(D|θ,β)為似然函數,P(D|α,β)為歸一化因子。
假設訓練數據D含有零均值高斯噪聲,且網絡參數θ服從高斯先驗分布,則有
P(D|θ,β)=exp(-βED)/ZD(β)
(6)
P(θ|α)=exp(-αEθ)/Zθ(α)
(7)
式中:ZD(β)=(π/β)ND /2,ZD(β)=(π/β)Nθ/2。把式(6)和式(7)代入式(5)可得參數的后驗概率分布為
P(θ|D,α,β)=exp(-S(θ))/ZS(α,β)

2.2.2 正則化參數的貝葉斯優化
貝葉斯推理學習算法的另一個優勢是網絡訓練過程中可以同步優化正則化參數α和β。根據貝葉斯理論,給定訓練數據D后,正則化參數的后驗概率為
(9)
假設先驗分布P(α,β)滿足一種很寬的分布函數,即對α和β不敏感,且歸一化因子P(D)與α、β無關,因此,求取正則化參數的最大后驗概率分布的問題轉化為求解最大似然函數P(D|α,β)。由式(5)~(8)可得,
(10)
當樣本數據量較多時,網絡參數的后驗分布趨于高斯分布,通過簡化可求出ZS(α,β),再將其代入式(10)并取對數后分別對α和β求偏導,可得到
(11a)
(11b)
式中:γeff=Nθ-2αMPtrace((S(θMP))-1)表示實際參與正則化學習的網絡參數的數量。由于γeff與α有關,α和β值在網絡訓練過程中由式(11)進行循環估計。
NARX網絡的訓練采用具有快速和穩定收斂優勢的Levenberg-Marquardt (LM)算法[15]優化網絡參數θMP以最小化目標函數(4)。在進行正則化參數優化過程中,需要計算S(θ)在其最小點θMP處的Hessian陣S(θMP),為減小計算量、提高計算速度,可以利用LM算法對其做近似計算,即
S(θ)MP≈2βMPJTJ+2αMPI
(12)

采用貝葉斯學習算法進行網絡訓練時,輸入和輸出數據都歸一化為[-1, 1]之間。為避免網絡陷入局部最優解,對網絡參數隨機初始化進行重復訓練后取最優。
根據式(1),磁流變阻尼器的動力學模型可表示為
(13)

(14a)
g2(a)=a
(14b)
式中:隱層激勵函數g1(·)賦予NARX網絡表征非線性行為的運算能力,這樣的網絡形式已被證明具有全局逼近能力。式(13)包含了磁流變阻尼器輸入輸出的多階時延信息,因此可以反映其動態行為。
基于磁流變阻尼器的性能試驗數據,建立其NARX網絡模型分為兩階段:①利用訓練樣本進行網絡的貝葉斯學習訓練,同時利用驗證樣本進行網絡結構設計;②利用未經訓練的測試樣本檢驗優化訓練后的網絡模型的泛化性能。獲取訓練、驗證和測試數據的實驗工況如表1所示,輸入激勵為各種頻率和幅值的諧波位移信號以及不同水平的直流電流。磁流變阻尼器活塞的速度采用有限差分法對位移求導得到。模型的預測性能采用實測阻尼力和模型預測輸出之間的均方根(RMS)誤差進行評價,即
(15)


表1 NARX網絡訓練、驗證及測試的實測數據樣本Tab.1 Measurement data sets for NARX network training, validation and testing

圖2 不同輸入變量組合下的模型誤差分析Fig.2 RMSE analysis for different input combinations(nx=n=nI=0,nF=1,nh=15)

圖3 不同輸入變量時延階數下的模型誤差分析Fig.3 RMSE analysis for different numbers of input lags
模型輸入層結構確定之后,需要進行隱層神經元數目nh的優化選擇。圖4顯示了單隱層NARX網絡模型分別設計有5~25個隱層神經元時的訓練和驗證統計誤差。隨著nh值的增大,網絡參數數量也隨之增加,因此,網絡具有更強的學習能力,減小了訓練誤差。但是,過于冗余的網絡模型將可能導致過擬合現象。通過貝葉斯正則化對于模型參數大小和數量增長的控制,則可有效地降低驗證誤差的過度增長。通過權衡圖4中訓練和驗證誤差結果,隱層神經元個數選為18。
綜上,通過對模型結構和預測精度的比較和權衡,優化后的磁流變阻尼器NARX網絡模型具有8個輸入神經元、18個隱層神經元和1個輸出神經元的結構。

圖4 不同隱層神經元數目下的模型誤差分析(L=2)Fig. 4 RMSE analysis for different numbers of hidden neurons
4.1 周期激勵下的泛化能力
采用表1的3組周期激勵下的測試數據對優化設計的貝葉斯正則化NARX網絡模型進行泛化性能檢驗。表2給出了該模型在測試數據下的預測結果,同時與采用非正則化的普通LM算法得到的NARX網絡模型誤差進行比較。模型預測誤差由式(15)計算得到。由表2可見,貝葉斯NARX網絡模型的均方根誤差值基本上低于相應的實測阻尼力均方根值(表1)的5%;同時,相比LM算法,采用貝葉斯學習算法可提高模型的預測精度至30%~75%,驗證了貝葉斯正則化的NARX網絡模型具有很好的泛化能力。由圖5可知,貝葉斯NARX網絡模型預測的位移-阻尼力和速度-阻尼力滯回曲線與實測結果吻合很好,表明了NARX網絡模型對非訓練樣本的準確預測能力。
4.2 隨機激勵下的泛化能力
為保證磁流變阻尼器模型在控制應用中的準確預測能力,需獲得覆蓋磁流變阻尼器工作范圍的豐富動態響應信息進行建模。為此,將磁流變阻尼器安裝到置于振動臺上的鋼框架結構上,由振動臺產生有限帶寬的白噪聲基礎振動加速度信號,使磁流變阻尼器在隨機振動狀態下工作,同時對其施加帶限白噪聲的隨機電流,以獲取其動態響應。圖6顯示了在幅值為0.2 g、頻率范圍為0.8~10 Hz的基礎加速度激勵以及輸入電流幅值為0~2 A、頻率范圍為0~10 Hz的情況下,磁流變阻尼器的活塞位移、速度、電流和阻尼力時程。利用該組數據分別對上述貝葉斯正則化模型和非正則化模型進行重新學習訓練,并采用表3的3組不同輸入工況下的測試數據進行泛化性能比較和檢驗。

表2 周期激勵下NARX網絡模型泛化能力Tab.2 Generalization performance of NARX networkmodels in harmonic excitation scenarios

圖5 周期測試樣本3下預測和實測滯回特性曲線的比較Fig.5 Comparison between predicted and measuredhysteresis loops for harmonic testing data set 3
表4比較了隨機激勵下貝葉斯正則化模型和非正則化模型對測試數據的預測誤差。可見,貝葉斯正則化模型對各組測試數據的阻尼力的均方根預測誤差均小于相應的實測阻尼力均方根值(表3)的5%。圖7顯示了貝葉斯正則化NARX網絡模型對測試樣本3的磁流變阻尼力的預測結果及誤差時程,圖8比較了相應的預測和實測位移-阻尼力、速度-阻尼力滯回特性曲線,可見模型預測值與測量值吻合很好。此外,與非正則化模型相比,貝葉斯正則化模型的預測誤差減小了60%以上,大大提高了磁流變阻尼器模型的泛化能力。

圖6 磁流變阻尼器在隨機激勵下的動態響應Fig.6 Random responses of MR damper

序號輸入激勵幅值/g頻率/Hz輸入電流類型幅值/A頻率/Hz阻尼力RMS/N10.200.5-10直流1.25-939.420.120.5-10Chirp0-20.1-5671.030.150.5-10隨機0-20-10741.3

表4 隨機激勵下NARX網絡模型泛化能力Tab. 4 Generalization performance of NARX network models in random excitation scenarios

圖7 隨機測試樣本3下磁流變阻尼力預測和實測時程的比較Fig.7 Comparison between predicted and measureddamper forces for random testing data set 3

圖8 隨機測試樣本3下預測和實測滯回特性曲線的比較Fig.8 Comparison between predicted and measuredhysteresis loops for random testing data set 3
本文利用磁流變阻尼器的動態測試數據,建立基于貝葉斯推理的NARX網絡技術的磁流變阻尼器非參數化模型。為保證磁流變阻尼器模型在控制應用中的有效性和可靠性,從網絡結構優化和學習算法相結合的角度來提高NARX網絡的泛化性能。研究結果表明:
(1)NARX網絡結構的合理設計及選取有利于獲得結構簡單、泛化性能高、計算速度快的動態模型;
(2)基于貝葉斯推理的NARX網絡模型能夠準確描述磁流變阻尼器在周期激勵下的非線性動力學行為,以及準確預測其在隨機激勵下的阻尼力輸出;
(3)由于貝葉斯正則化能有效控制網絡的復雜度、減少過擬合,由此得到的NARX網絡模型相比非正則化模型具有很好的泛化能力,有利于保持和改善智能磁流變控制系統的有效性、穩定性和魯棒性。
[ 1 ] CATERINO N, SPIZZUOCO M, OCCHIUZZI A. Promptness and dissipative capacity of MR dampers: experimental investigations [J]. Structural Control and Health Monitoring, 2013, 20(12): 1424-1440.
[ 2 ] SPENCER B F, DYKE S J, SAIN M K, et al. Phenomenological model for magnetorheological dampers [J]. Journal of Engineering Mechanics, 1997, 123(3): 230-238.
[ 4 ] AGUIRRE N, IKHOUANE F, RODELLAR J, et al. Parametric identification of the Dahl model for large scale MR dampers [J]. Structural Control and Health Monitoring, 2011, 19(3): 332-347.
[ 5 ] YANG F, SEDAGHATI R, ESMAILZADEH E. Development of LuGre friction model for large-scale magneto-rheological fluid damper [J]. Journal of Intelligent Material Systems and Structures, 2009, 20(8): 923-937.
[ 6 ] WANG D H, LIAO W H. Magnetorheological fluid dampers: a review of parametric modelling [J]. Smart Materials and Structures, 2011, 20(2): 023001.
[ 7 ] 王修勇, 宋璨, 陳政清, 等. 磁流變阻尼器的性能試驗與神經網絡建模[J]. 振動與沖擊, 2009, 28(4): 42-46. WANG Xiuyong, SONG Can, Chen Zhengqing, et al. Test of a MR damper and its modeling using neural network [J]. Journal of Vibration and Shock, 2009, 28(4): 42-46.
[ 8 ] 王戡, 鄭玲, 劉非. 基于廣義回歸神經網絡的磁流變減振器模型辨識[J]. 汽車工程, 2013, 35(7): 619-623. WANG Kan, ZHENG Ling, LIU Fei. Model identification of MR damper based on generalized regression neural network [J]. Automotive Engineering, 2013, 35(7): 619-623.
[ 9 ] ASKARI M, LI J, SAMALI B, et al. Experimental forward and inverse modelling of magnetorheological dampers using an optimal Takagi-Sugeno-Kang fuzzy scheme [J]. Journal of Intelligent Material Systems and Structures, 2016, 27(7): 904-914.
[10] 潘公宇, 楊海, 徐騰躍, 等. 磁流變阻尼器試驗與建模研究[J]. 振動與沖擊, 2015, 34(6): 36-40. PAN Gongyu, YANG Hai, XU Tengyue, et al. Tests and modeling for magneto-rheological (MR) dampers[J]. Journal of Vibration and Shock, 2015, 34(6): 36-40.
[11] CHEN S, BILLINGS S A, GRANT P M. Non-linear system identification using neural networks [J]. International Journal of Control, 1990, 51(6): 1191-1214.
[12] HORNIK K. Approximation capabilities of multilayer feedforward networks [J]. Neural Networks, 1991, 4(2): 251-257.
[13] SUYKENS J A K, VANDEWALLE J P L, DE MOOR B L R. Artificial neural networks for modeling and control of non-linear systems [M]. Boston: Kluwer Academic, 1996.
[14] MACKAY D J C. A practical Bayesian framework for backprop networks [J]. Neural Computation, 1992, 4(3): 448-472.
[15] HAGAN M T, MENHAJ M B. Training feedforward networks with the Marquardt algorithm [J]. IEEE Transactions on Neural Networks, 1994, 6(5): 989-993.
Enhanced generalization of nonparametric model for magnetorheological dampers
CHEN Zhaohui1, NI Yiqing2
(1. College of Civil Engineering, Fuzhou University, Fuzhou 350116, China;2. Department of Civil and Environmental Engineering, The Hong Kong Polytechnic University, Hong Kong, China)
The dynamic modeling for magnetorheological (MR) dampers to describe their highly nonlinear dynamic characteristics is essential for the design and implementation of a smart MR control system. One critical concern in constructing a nonparametric MR damper model by employing the artificial neural network technique is its generalization capability, which is also significant to guarantee the stability and reliability of the MR control system. The paper presents the modeling of MR dampers with the employment of the NARX (nonlinear autoregressive with exogenous inputs) network technique within a Bayesian inference framework, and addresses the enhancement of model prediction accuracy and generalization capability in terms of the network architecture optimization and regularized network learning algorithm. The Bayesian regularized NARX network model for the MR damper is demonstrated to outperform the non-regularized network model with the superior prediction and generalization performance in the scenarios of harmonic and random excitations. Therefore, the proposed model with enhanced generalization is beneficial to realize the real-time and robust smart control of MR systems.
magnetorheological damper; nonparametric model; NARX network; Bayesian regularization; generalization
國家自然科學基金(51608128);福州大學科研啟動基金(510110);福建省教育廳科技項目(JA15098);福建省自然科學基金資助項目(2016J05123)
2016-01-05 修改稿收到日期: 2016-07-04
陳昭暉 男,博士,助理研究員,1982年10月生
TU352;TB535
A
10.13465/j.cnki.jvs.2017.06.022