楊毅,王湘江,曾慶生
(南華大學(xué) 機(jī)械工程學(xué)院,湖南 衡陽(yáng),421001)
導(dǎo)電聚合物是一種新興的電致聚合物(也叫人工肌肉),可用作驅(qū)動(dòng)器和傳感器的智能材料,它在生物機(jī)器人和生物醫(yī)學(xué)設(shè)備中有廣闊的應(yīng)用前景[1-6]。聚吡咯(PPy)和聚苯胺是2 種最常用的導(dǎo)電聚合物。導(dǎo)電聚合物與電解液接觸,在正電壓作用下會(huì)發(fā)生氧化反應(yīng)。在氧化過(guò)程中,負(fù)離子進(jìn)入或正離子離開(kāi)導(dǎo)電聚合物,以保持電勢(shì)平衡,在負(fù)電壓作用下會(huì)發(fā)生與氧化反應(yīng)相反的還原反應(yīng)。負(fù)離子遷移的導(dǎo)電聚合物在氧化反應(yīng)作用下會(huì)發(fā)生體積膨脹,在還原反應(yīng)作用下會(huì)發(fā)生體積收縮。正離子遷移的導(dǎo)電聚合物則完全相反。不同配置的導(dǎo)電聚合物驅(qū)動(dòng)器有雙層彎曲型、多層彎曲型、直動(dòng)型。多層聚吡咯彎曲型驅(qū)動(dòng)器的中間層為非晶、多孔隙的聚偏二氟乙烯(PVDF)層,它不僅是聚吡咯聚合物的基體材料,而且是電解液的容器。驅(qū)動(dòng)器的兩邊為聚吡咯層。當(dāng)驅(qū)動(dòng)器兩側(cè)加上電壓時(shí),正極被氧化負(fù)極被還原。被氧化的聚吡咯層吸收負(fù)離子而膨脹,被還原的聚吡咯層釋放負(fù)離子而收縮,最終導(dǎo)致驅(qū)動(dòng)器彎曲。導(dǎo)電聚合物驅(qū)動(dòng)器只需要很低的驅(qū)動(dòng)電壓(2 V 以下),就可產(chǎn)生相當(dāng)大的應(yīng)力和應(yīng)變輸出,并且同時(shí)具有質(zhì)量小和生物相容性好等優(yōu)點(diǎn),可廣泛應(yīng)用于機(jī)器人和生物醫(yī)學(xué)領(lǐng)域,例如生物微操作系統(tǒng)、仿生系統(tǒng)和生物醫(yī)學(xué)設(shè)備[7-9]。根據(jù)驅(qū)動(dòng)器的靜態(tài)和動(dòng)態(tài)行為建立精確的數(shù)學(xué)模型對(duì)驅(qū)動(dòng)器的可行性研究、優(yōu)化設(shè)計(jì)和控制都是十分有用的[10-12],但模型的精度、適應(yīng)性和基于有效數(shù)學(xué)模型控制其彎曲運(yùn)動(dòng)的控制方法還有待進(jìn)一步研究[13-15]。在此,本文作者通過(guò)制作3 層膜聚吡咯驅(qū)動(dòng)器的實(shí)驗(yàn)裝置,采用離線和在線辨識(shí)方法建立新的系統(tǒng)模型來(lái)實(shí)現(xiàn)對(duì)驅(qū)動(dòng)器控制,再通過(guò)離線和在線辨識(shí)方法證明模型辨識(shí)的有效性。設(shè)計(jì)包括基于逆模前饋控制、PID 控制和逆模前饋PID控制等多種方法對(duì)辨識(shí)模型進(jìn)行控制,實(shí)驗(yàn)結(jié)果證明逆模前饋PID 控制器能提供準(zhǔn)確的運(yùn)動(dòng)控制精度。
圖1 所示為彎曲型聚合物驅(qū)動(dòng)器的結(jié)構(gòu)。它由3個(gè)主要層組成:2 個(gè)聚吡咯(PPy)層和1 個(gè)可儲(chǔ)存電解液的PVDF 夾層。PPy 層可以在液體電解質(zhì)中進(jìn)行電解,PVDF 層兩面鍍很薄的金層,以提高導(dǎo)電性。彎曲驅(qū)動(dòng)器所需的長(zhǎng)度和寬度從大塊的結(jié)構(gòu)中剪切得到,這種復(fù)合結(jié)構(gòu)呈現(xiàn)出像雙層懸臂那樣的簡(jiǎn)單彎曲運(yùn)動(dòng)。當(dāng)電位差或電流通過(guò)夾緊的聚合物(PPy)兩電極時(shí),聚合物驅(qū)動(dòng)器產(chǎn)生電化學(xué)反應(yīng)將在其頂端輸出彎曲機(jī)械運(yùn)動(dòng)。

圖1 導(dǎo)電聚合物驅(qū)動(dòng)器的幾何形狀Fig.1 Geometry of conducting polymer actuator

圖2 實(shí)驗(yàn)裝置示意圖Fig.2 Schematic representation of experimental setup
圖2 所示為模型辨識(shí)和系統(tǒng)控制的實(shí)驗(yàn)裝置。利用MATLAB 的實(shí)時(shí)工具箱RTW 對(duì)硬件在回路中進(jìn)行實(shí)時(shí)控制,選用的工作方式為單機(jī)型 Real-time windows target 方案,通過(guò)目標(biāo)鏈接的方式和Simulink聯(lián)系在一起,按照單獨(dú)的實(shí)時(shí)內(nèi)核方式驅(qū)動(dòng)外部硬件設(shè)備,完成系統(tǒng)實(shí)時(shí)控制。
為了建立驅(qū)動(dòng)器的辨識(shí)模型,通過(guò)實(shí)驗(yàn)得到系統(tǒng)模型參數(shù)。實(shí)驗(yàn)中用于模型辨識(shí)和系統(tǒng)控制的是1 個(gè)長(zhǎng)約5 mm、寬約2 mm 的PPy 驅(qū)動(dòng)器,輸入電壓信號(hào)u(t),u(t)=2sin(πt),輸出結(jié)果y(t)由激光傳感器測(cè)量。系統(tǒng)被視為1 個(gè)黑箱,系統(tǒng)模型參數(shù)通過(guò)輸入電壓u(t)和輸出y(t)確定。
驅(qū)動(dòng)器離散系統(tǒng)的動(dòng)力學(xué)方程可由多項(xiàng)式表示:

其中:A( z)= 1+a1z-1+…+anz-n;B (z )=b0z-1+…+bmz-(m-1);ai和bi分別為線性系統(tǒng)參數(shù);z-1為向后移位運(yùn)算符號(hào),z-1y(t)=y(t-1)。
由文獻(xiàn)[9]可知驅(qū)動(dòng)器可近似為二階系統(tǒng),采用最小二乘法來(lái)確定模型參數(shù)。待估參數(shù)向量θ 為

數(shù)據(jù)向量為

式(1)可以改寫(xiě)成

其中:

系統(tǒng)參數(shù)的最小二乘估計(jì)θ 為

在圖2 所示的系統(tǒng)中,輸入u(t)=2sin(πt),由激光位移傳感器測(cè)量得到輸出y(t),由Simulink 對(duì)輸入輸出結(jié)果進(jìn)行記錄,其采樣時(shí)間設(shè)定為0.002 s。將測(cè)量結(jié)果代入由式(5)編寫(xiě)的程序中,得到離散傳遞函數(shù)的二階模型為

圖3 所示為辨識(shí)過(guò)程示意圖,其中P 表示驅(qū)動(dòng)器,v(t)為干擾信號(hào)。圖4 所示為驅(qū)動(dòng)器實(shí)際輸出和模型預(yù)測(cè)輸出以及輸出誤差比較。從圖4 可以看出:驅(qū)動(dòng)器輸出信號(hào)y(t)和辨識(shí)系統(tǒng)輸出信號(hào)yG(t)之間誤差e(t)非常小,說(shuō)明式(6)所表示的二階模型有效。

圖3 模型辨識(shí)過(guò)程示意圖Fig.3 Schematic of model validation procedure

圖4 驅(qū)動(dòng)器實(shí)際輸出和模型預(yù)測(cè)輸出以及輸出誤差比較Fig.4 Comparison of real actuator output and output predicted by model and associated modeling error
為了進(jìn)一步驗(yàn)證式(6)的準(zhǔn)確性,采用神經(jīng)網(wǎng)絡(luò)辨識(shí),辨識(shí)方法如圖5 所示。式(1)可以寫(xiě)成


圖5 神經(jīng)網(wǎng)絡(luò)在線辨識(shí)方法示意圖Fig.5 Schematic of neural network identification method


式(4)可以表示為

神經(jīng)網(wǎng)絡(luò)的訓(xùn)練規(guī)則為
其中:

ci為權(quán)重因子,0<ci<1,ci=μi;0<μ<1。
使用上述離線辨識(shí)二階模型估計(jì)參數(shù)作為神經(jīng)網(wǎng)絡(luò)在線辨識(shí)加權(quán)系數(shù)的初始值,可減少在線辨識(shí)的計(jì)算時(shí)間。根據(jù)式(9)和(10),得到驅(qū)動(dòng)器的神經(jīng)網(wǎng)絡(luò)辨識(shí)模型。在圖2 所示系統(tǒng)中,輸入u(t)=2sin(πt),由激光位移傳感器測(cè)量得到位移輸出y(t),在Simulink 中構(gòu)建神經(jīng)網(wǎng)絡(luò)辨識(shí)模型,可在線實(shí)現(xiàn)參數(shù)辨識(shí)。
圖6 所示為二階收斂模型參數(shù)的收斂結(jié)果,各參數(shù)逐漸趨近于常數(shù),說(shuō)明系統(tǒng)神經(jīng)網(wǎng)絡(luò)算法正確,且系統(tǒng)的二階性質(zhì)明顯。另外,各參數(shù)最后圍繞著1 個(gè)固定常數(shù)上下波動(dòng),說(shuō)明在線調(diào)整是不斷進(jìn)行的,同時(shí)也說(shuō)明系統(tǒng)不完全是一個(gè)二階定常系統(tǒng),存在著非線性和隨機(jī)干擾。但是,當(dāng)要求精度不是特別高時(shí),完全可以將系統(tǒng)視為二階定常系統(tǒng)。圖7 所示為在線辨識(shí)模型輸出y1(t)和驅(qū)動(dòng)器實(shí)際產(chǎn)出的輸出y(t)以及輸出誤差e(t)。因?yàn)閰?shù)的在線調(diào)整使得誤差很小,所以,曲線y(t)和y1(t)幾乎重疊。

圖6 模型參數(shù)的收斂性Fig.6 Convergence of model parameters

圖7 驅(qū)動(dòng)器實(shí)際輸出和在線辨識(shí)模型預(yù)測(cè)輸出以及輸出誤差比較Fig.7 Comparison of real actuator output and output predicted by model and associated modeling error from on-line identification
運(yùn)用在線辨識(shí)方法得到的模型,采用3 個(gè)控制方法:逆模型控制、逆模前饋PID 控制和PID 控制。逆模型控制是一種完全的開(kāi)環(huán)控制系統(tǒng),不需要任何反饋數(shù)據(jù)的控制器。式(5)所示離散傳遞函數(shù)不是最小相位系統(tǒng),其零點(diǎn)不在z 平面的單位圓里面,因此,傳遞函數(shù)的倒數(shù)是不穩(wěn)定的,故式(5)不能直接用作建立逆模型控制系統(tǒng),需要構(gòu)建逆模型G-1(z)。逆模型滯后于驅(qū)動(dòng)器,可通過(guò)函數(shù)模型G1(z)和最優(yōu)函數(shù)模型G2(z)來(lái)設(shè)計(jì)逆模型。函數(shù)模型為

最優(yōu)函數(shù)模型為

其中:Δ 為大于等于1 的整數(shù)。最優(yōu)函數(shù)模型是不穩(wěn)定的,因?yàn)樗臉O點(diǎn)不在z 平面單位圓里面,G2(z)可以擴(kuò)展為

由于|b0|≈|b1|,可知式(16)中多項(xiàng)式系數(shù)ri非常小,可忽略不計(jì),因此,得到的彎曲驅(qū)動(dòng)器的近似逆模型為

圖8 所示為逆模型控制系統(tǒng)示意圖,輸出為

在圖2 所示系統(tǒng)中,輸入yd(t)=0.5sin(πt)的期望輸出,在Simulink 中構(gòu)建逆模型G-1(z)作為驅(qū)動(dòng)器的前饋控制器。圖9 所示為驅(qū)動(dòng)器的實(shí)際輸出、期望輸出和跟蹤誤差e(t)。
為了便于比較,式(19)給出了離散PID 控制器,如圖10 所示。

其中:

在圖2 所示系統(tǒng)中,由Simulink 中現(xiàn)有模塊構(gòu)建離散PID 控制器,通過(guò)反復(fù)試驗(yàn),PID 控制器參數(shù)比例系數(shù)、積分系數(shù)和微分系數(shù)分別選定為kp=250,ki=30,kd=30。圖11 所示為PID 控制輸出與期望輸出的比較結(jié)果。盡管PID 控制器是魯棒控制方法,但軌跡跟蹤誤差還是比較大。

圖8 逆模型控制器示意圖Fig.8 Schematic of inversion-based feedforward controller

圖9 驅(qū)動(dòng)器實(shí)際輸出和逆模型控制系統(tǒng)期望輸出比較以及跟蹤誤差Fig.9 Comparison of real actuator output and desired output under inversion-based feedforward controller and associated tracking error

圖10 PID 控制方法示意圖Fig.10 Schematic of PID control strategy

圖11 驅(qū)動(dòng)器實(shí)際輸出和PID 控制系統(tǒng)期望輸出比較以及跟蹤誤差Fig.11 Comparison of real actuator output and desired output under PID controller and associated tracking error
設(shè)計(jì)一種逆模前饋PID 控制方法來(lái)提高系統(tǒng)的魯棒性,以便更好地適應(yīng)驅(qū)動(dòng)器參數(shù)變化和操作參數(shù)變化。其原理如圖12 所示。
其輸出可描述為


圖12 逆模前饋PID 控制器示意圖Fig.12 Schematic of feedforward controller with PID controller
在圖2 所示系統(tǒng)中,由Simulink 構(gòu)建如圖12 所示的RTW 系統(tǒng)進(jìn)行控制實(shí)驗(yàn)。圖13 所示為逆模前饋PID 控制的實(shí)驗(yàn)結(jié)果。必須指出的是,跟蹤誤差e(t)遠(yuǎn)比逆模型控制和經(jīng)典的PID 控制的小。這是因?yàn)橄到y(tǒng)中逆模前饋控制起關(guān)鍵作用, PID 控制是在出現(xiàn)誤差時(shí)再進(jìn)行調(diào)整,經(jīng)典的PID 所需要調(diào)整的誤差較大,而逆模前饋PID 控制由于只需要調(diào)整逆模前饋控制后的誤差,所需要調(diào)整的誤差要小得多,所以,控制效果要比經(jīng)典PID 控制的效果好。為定量反映3 種控制方法的效果,由式(22)可得表1 所示的3 種控制方法均方根誤差SRM。

表1 3 種控制方法的均方根(RMS)誤差Table 1 RMS of tracking errors under three control strategies

圖13 驅(qū)動(dòng)器實(shí)際輸出和前饋PID 控制系統(tǒng)期望輸出比較以及跟蹤誤差Fig.13 Comparison of real actuator output and desired output under feedforward PID controller and associated tracking error

本研究用3 種不同的控制方法對(duì)系統(tǒng)進(jìn)行運(yùn)動(dòng)控制,其中PID 控制為傳統(tǒng)的控制方法,將圖9 和圖11與圖13 進(jìn)行比較發(fā)現(xiàn):本文所提出的開(kāi)環(huán)逆模控制方法比PID 控制有更高的控制精度,輸出均方根誤差減小近50%,而開(kāi)環(huán)逆模控制的硬件結(jié)構(gòu)更加簡(jiǎn)單,若在實(shí)際系統(tǒng)中采用,將大幅度降低控制系統(tǒng)成本。從圖13 可以看出:采用帶逆模前饋的PID 控制方法,最大位移輸出大幅度減小,信號(hào)跟蹤精度較前2 種提高了1 個(gè)數(shù)量級(jí),并且其主要誤差是由傳感器帶來(lái)的高頻誤差。綜合來(lái)看,在工作環(huán)境穩(wěn)定且要求不太高時(shí)可采用開(kāi)環(huán)逆模控制;當(dāng)工作要求較高時(shí),采用加前饋逆模的PID 控制。此2 種方法都比傳統(tǒng)的PID 控制方法有明顯優(yōu)勢(shì)。需要指出的是:當(dāng)采用加逆模前饋的PID 控制方法時(shí),要注意PID 參數(shù)的選取,避免出現(xiàn)飽和、振蕩等情況發(fā)生。
(1) 運(yùn)用離線和在線辨識(shí)方法建立了導(dǎo)電聚合物驅(qū)動(dòng)器中典型3 層共軛PPy 驅(qū)動(dòng)器的二階離散傳遞函數(shù)。通過(guò)神經(jīng)網(wǎng)絡(luò)在線辨識(shí),進(jìn)一步驗(yàn)證了模型的準(zhǔn)確性。
(2) 針對(duì)高度敏感的智能驅(qū)動(dòng)器出現(xiàn)的系統(tǒng)參數(shù)不穩(wěn)定性和受干擾性,逆模前饋PID 控制系統(tǒng)是最優(yōu)的控制方法。但必須注意的是,它的執(zhí)行是基于反饋控制器(需要1 個(gè)外部傳感器)。當(dāng)不方便安傳感器時(shí),可以使用基于準(zhǔn)確傳遞函數(shù)的逆模型,這樣的模型可以通過(guò)在線辨識(shí)方法確定。
[1] Vidal F, Plesse C, Palaprat G, et al. Conducting IPN actuators:From polymer chemistry to actuator with linear actuation[J].Synthetic Metals, 2006, 156: 1299-1304.
[2] 賀曦敏. 以導(dǎo)電聚合物構(gòu)建的驅(qū)動(dòng)器的制備與性能研究[D].北京: 清華大學(xué)化學(xué)系, 2006: 4-20.HE Ximin. Fabrication and properties research of actuators based on conducting polymer[D]. Beijing: Tsinghua University.Department of Chemistry, 2006: 4-20.
[3] 徐巖, 趙剛, 楊立明, 等. IPMC 人工肌肉的制備工藝研究[J].功能材料, 2013, 44(11): 1646-1650.XU Yan, ZHAO Gang, YANG Liming, et al. Research on preparation technique of IPMC artificial muscle[J]. Journal of Functional Materials, 2013, 44(11): 1646-1650.
[4] Han G, Shi G. Conducting polymer electrochemical actuator made of high-strength three-layered composite films of polythiophene and polypyrrole[J]. Sensors and Actuators B,2004, 99: 525-531.
[5] Gaihre B, Alici G, Spinks G M, et al. Synthesis and performance evaluation of thin film PPy-PVDF multilayer electroactive polymer actuators[J]. Sensors and Actuators A, 2011, 165:321-328.
[6] Hiraoka M, Fiorini P, O’Callaghan J, et al. Miniature conductive polymer actuators for high pressure generation in lab onchip systems[J]. Sensors and Actuators A, 2012, 177: 23-29.
[7] Fuchiwaki M, Tanaka K, Kaneto K. Planate conducting polymer actuator based on polypyrrole and its application[J]. Sensors and Actuators A, 2009, 150: 272-276.
[8] Alici G, Devaud V, Renaud P, et al. Conducting polymer microactuators operating in air[J]. Journal of Micromechanics and Microengineering, 2009, 19: 1-9.
[9] Nguyen C H, Alici G, Wallace G G. Modelling trilayer conjugated polymer actuators for their sensorless position control[J]. Sensors and Actuators A, 2012, 185: 82-91.
[10] Shoa T, Yoo D S, Walus K, et al. A dynamic electromechanical model for electrochemically driven conducting polymer actuators[J]. IEEE/ASME Transactions on Mechatronics, 2011,16(1): 42-49.
[11] Alici G. An effective modelling approach to estimate nonlinear bending behaviour of cantilever type conducting polymer actuators[J]. Sensors and Actuators B, 2009, 141: 284-292.
[12] Du P, Lin X, Zhang X. A multilayer bending model for conducting polymer actuators[J]. Sensors and Actuators A, 2010,163: 240-246.
[13] John S W, Alici G, Cook C D. Inversion-based feedforward control of polypyrrole trilayer bender actuators[J]. IEEE/ASME Transactions on Mechatronics, 2010, 15(1): 149-156.
[14] Yao Q, Alici G, Spinks G M. Feedback control of tri-layer polymer actuators to improve their positioning ability and speed of response[J]. Sensors and Actuators A, 2008, 144: 176-184.
[15] Fang Y, Tan X, Alici G. Robust adaptive control of conjugated polymer actuators[J]. IEEE Transactions on Control Systems Technology, 2008, 16(4): 600-612.