陳 情,薛方正
(重慶大學 自動化學院,重慶 400044)
工業機器人是多變量、非線性、強耦合和時變的系統[1-3],因而在高速、高精度的要求下僅僅使用傳統的PID控制不能達到期望的效果。為了提高工業機器人運行時的穩定性、精確性和快速性,一系列更先進、更具智能的控制算法被提出,并在實際控制過程中得到廣泛應用。
神經網絡控制具有很強的容錯性和逼近非線性函數的能力[4-5];模糊控制在設計中不需要建立被控對象的精確數學模型,便于應用[6-7];自適應控制能夠在線改變控制器的參數和結構,調整控制作用以保證系統達到滿意的控制品質[8-9];滑模變結構控制具有較強的魯棒性[10-11];遺傳算法有很好的收斂性和魯棒性,可以快速處理非光滑甚至是離散的問題[12];迭代學習控制用于工業機器人能夠實現完全跟蹤[13]。然而以上算法也存在控制器結構復雜、規則難以建立、在線計算量大或者泛化能力有限等缺點,從而難以兼顧穩定性、精確性和快速性3方面性能指標。
針對上述問題,考慮到仿人智能控制 (HISC)采用基于特征模型的多模態控制策略能有效地實現穩定性、精確性和快速性3方面性能指標的優化和兼顧,本文設計了三自由度串聯工業機器人末端軌跡跟蹤的仿人智能控制器。在仿真平臺下,通過同傳統的PD控制器進行比較,證明了仿人智能控制器能夠獲得更好的控制效果,更容易兼顧穩定性、精確性和快速性3方面性能指標。
工業機器人的動力學方程為

鑒于工業機器人動力學方程中反映出的強耦合、非線性等特性,采用傳統控制難以兼顧系統快速性、精確性和穩定性3方面性能指標。事實上,對于一個控制系統來說,盡管在整體層面上要求兼顧快速性、精確性和穩定性,但不同的具體狀態下,對快速性、精確性和穩定性的要求是不一樣的。例如在偏差較大的過程中要求系統具有較快的響應速度,而在偏差較小時則主要考慮系統的穩定性和穩態精度。
根據這一現象,在HISC中,針對系統當前所處的不同狀態采用不同的控制率,從而實現控制。這一過程類似于人的直覺推理中的“認識-判斷-操作”過程,故稱作仿人智能控制。在HISC的各個具體狀態下,由于控制率是根據該狀態下著重要求的性能指標來設計的,因而在各個具體狀態下著重要求的性能指標能得到很好的實現,從而在整體層面上實現對控制系統快速性、精確性和穩定性3方面性能指標的優化和兼顧。在控制器設計過程中,為了直觀地體現對快速性、精確性和穩定性3方面性能指標的兼顧,仿人智能控制器采用一條理想的誤差時相軌跡(本文稱為特征軌跡)作為控制系統的瞬態性能指標。
在HISC中,特征模型Φ是對控制系統動態信息空間的一種劃分,劃分出的每一區域分別表示系統的一種特征狀態φi,特征模型為所有特征狀態的集合。特征辨識是確定系統當前處于什么特征狀態的過程[14]。
根據上述定義,得到仿人智能控制系統的運行過程:首先對系統動態信息空間進行劃分,得到系統的特征模型,通過特征辨識確定當前系統處于特征模型中的何種特征狀態,根據不同特征狀態采取相應的控制模態(即控制率),從而實現基于特征模型的多模態控制。將HISC引入工業機器人的控制中,得到工業機器人的仿人智能控制系統框圖,如圖1所示。

圖1 工業機器人控制系統框圖
在控制過程中,將反饋的關節角度同給定的關節角度進行比較,得到角度偏差Δθ,通過控制器輸出力矩信號τ,τ經過幅值限制后加在各個關節上。
本文針對工業機器人這一對象,在誤差-誤差導數(e-˙e)平面上對系統的動態信息空間進行劃分,得到不同特征狀態,進而獲得系統的特征模型。針對特征模型中不同的特征狀態,采取不同控制模態(控制率)來設計仿人智能控制器。特征模型如圖2所示,其中:區域1~7對應了特征模型中不同的特征狀態,特征狀態2又細分為2-1,2-2,2-3 等子狀態;fde,˙( e)為理想誤差時的相軌跡(特征軌跡),即仿人智能控制器設計中的瞬態性能指標。

圖2 仿人智能控制的特征模型
對于一個設計良好的控制策略來說:在偏差大的區域,采用較強的比例作用或者直接使控制器輸出極值,能盡快減小偏差;而在偏差變化率較大的情況下,則采用較強的微分作用,或者采用基于偏差變化率的磅-磅控制,可降低超調;在偏差和偏差的變化率均不是很大的情況下,通過比例作用使相軌跡向相平面圖中的縱坐標軸靠近(即偏差減小的方向),通過微分作用使相軌跡向相平面圖中的橫坐標軸靠近(即偏差變化率減小的方向)。根據以上規則,即可設計出HISC各個特征狀態下具體采用的控制模態。
1)特征狀態1采用基于偏差的磅-磅控制模態。
2)特征狀態2采用比例控制模態。
3)特征狀態3、5、6、7采用比例微分控制模態。
4)特征狀態4采用基于偏差變化率的磅-磅控制模態。
令qi表示e-平面上某一具體區域(狀態),稱為特征基元,Q為特征基元的集合。通過Q中1個或多個qi元素的組合即可表示出HISC特征模型中的各個特征狀態。上述特征模型可用符號語言表示為

特征模型Φ中的各種特征狀態Φi如下:

各種特征狀態下的控制模態為:

其中:U為控制器的輸出;Umax為控制器輸出的最大值;e為偏差值;為偏差的變化率;Kp為比例系數;Kd為微分系數;e1、e2、e3、e4為偏差的閾值;、為偏差變化率的閾值。
對于一個具體的對象,為了能自動設計仿人智能控制器,需要對特征模型中的閾值進行自動校正。而為了實現良好的跟蹤,又需要對各個特征狀態中具體的控制器參數進行校正。本節中參數校正分為2個階段,第1個階段校正閾值參數,第2個階段校正各個區域的控制器參數。
無論閾值參數的校正還是控制器參數的校正,均通過對特征軌跡的“走向”進行判斷,從而采取相應的措施改善實際的特征軌跡。為了便于說明,本節主要對e-˙e平面中第1象限和第4象限中的特征軌跡走向進行分析。當特征軌跡位于第2、3象限時,其期望的“走向”分別與第4、1象限中特征軌跡的期望走向相反(沿著e-˙e平面坐標原點對稱),采用的控制器參數校正規則相同。
2.2.1 閾值參數的校正
運行控制器過程中,會出現一些邊界情況,如:偏差達到極值;特征軌跡在特征模型中從某一特征狀態切換到另一特征狀態;特征軌跡在相平面中從某一象限切換到另一象限等。閾值的校正就是通過對邊界情況下的特征軌跡進行分析,從而決定是否采取、何時采取相應的規則對初始設定的閾值進行調整。
經分析,區域1、2、6、7的主要功能是盡快減小偏差,區域3、4、5的主要功能是盡可能地抑制偏差變化率,防止出現較大的反向偏差。因此,在閾值校正之前,先對各個區域作如下預處理:在區域1、2、6、7根據偏差的正負采用磅 -磅控制,而在區域3、4、5根據偏差變化率的正負采用磅-磅控制。通過這樣的處理,就可在尚未對控制器參數進行校正的情況下大致實現各個分區的功能,從而使得控制器能夠運行,進而通過判斷特征軌跡的走向來校正閾值。
閾值校正的具體步驟:
1)初始化所有閾值為零,此時的特征模型中只有特征狀態1,見圖3。運行控制器,記錄下最大偏差的絕對值AbsMaxE。

圖3 特征模型1
2)根據經驗,設定e1=e2=ke1·AbsMaxE,其中0<ke1<1。此時在圖2的特征模型中存在的特征狀態有1、4,如圖4所示。運行控制器,當特征軌跡離開第2、4象限進入第1、3象限時進行1次判斷:如果偏差反向(圖4中X1所示),則說明閾值e1過小,導致區域4中對偏差變化率的抑制時間過短,需要增加e1;如果偏差變化率反向(圖4中X2所示),且此時偏差絕對值差較大,則需要減小e1。

圖4 特征模型2
3)完成e1的校正之后運行控制器,在2、4象限中判斷偏差是否達到e1,記錄下偏差達到e1時偏差變化率的絕對值,將其作為˙e1,令e2=ke2·e1,其中0<ke2<1。此時在特征模型中存在的特征狀態有1、2、3、4,如圖5 所示。運行控制器,采用2)中的方法對e2進行校正。

圖5 特征模型3
4)完成e2的校正后,令,運行控制器,其中0<ke2<1。在2、4象限中,記錄下特征軌跡上偏差變化率達到偏差的絕對值,將其作為e3,如圖6所示。此時特征模型中的特征狀態有 1、2、3、4、5、7。

圖6 特征模型4
2.2.2 控制器參數的校正
本文需要校正的控制器參數有:特征狀態2中的比例系數KP21(特征狀態2-1)、KP22(特征狀態2-2)、KP23(特征狀態2-3),特征狀態3、5、6、7 中的比例系數 KP3、KP5、KP6、KP7 和微分系數 KD3、KD5、KD6、KD7。類似于閾值的校正,控制器參數的校正也是基于特征軌跡的走向來設計參數調節規則的。
在控制器參數校正前先初始化所有參數為一個較小值,并在特征模型中定義幾個期望的特征區域 Δ、Δde1、Δde2、Δde3,如圖 7 所示。

圖7 基于參數校正的特征模型
Δde1:特征狀態2-1和特征狀態3中偏差變化率絕對值接近的部分組成的區域。在該區域內可近似看作偏差變化率絕對值
Δde2:特征狀態2-2和特征狀態4中偏差變化率絕對值接近的部分組成的區域。在該區域內可近似看作偏差變化率絕對值
Δde3:特征狀態2-3和特征狀態5中偏差變化率絕對值接近,偏差接近零的部分組成的區域。在該區域內可近似看作偏差變化率絕對值,偏差e=0。
Δ:特征狀態7中變化率的絕對值大于˙e4的一個三角形區域。
Δ、Δde1、Δde2、Δde3這 4 個區域即反映了在相應的偏差范圍內期望的特征軌跡所處的區域。
本文將實際的特征軌跡分為3部分:起始段、中間段和穩態段。起始段特征軌跡指的是特征軌跡首次離開其起始象限之前的部分。特征軌跡首次離開其起始象限,直至進入特征狀態6這一過程中的那部分特征軌跡稱作中間段特征軌跡。特征軌跡從其他特征進入特征狀態6之后的那部分特征軌跡稱作穩態段特征軌跡。起始段和中間段共同反映了系統響應的動態性能,穩態段反映了系統的穩態性能。
1)起始段
分析可知,系統實際的特征軌跡總是起始于第1、3象限,相應的特征狀態為1、4、7。如果起始段特征軌跡處于特征狀態7的時間可以忽略,則在起始段不需要進行控制器的參數調整,否則需要對特征狀態7下的控制器參數KP7和KD7進行調整。
調整目標:運行控制器,使得特征軌跡在離開起始段時相應的偏差絕對值AbsMaxE'與本文2.2.1節中進行閾值校正時最大偏差的絕對值AbsMaxE滿足如下關系:

α為一設定的較小系數,通過逐步倍增KD7的值,使得這一條件得到滿足。如果對KD7的調整次數達到設定的次數后,這一條件仍不能滿足,則采用相同的方法對KP7進行調整,直到這一條件得到滿足。采用上述方法對KP7和KD7的調整并不是特征狀態7下控制器參數的最終值,只是為了獲得較好的初始段特征軌跡而初步采用的控制器值。
2)中間段
當特征軌跡離開初始段進入中間段時,在特征模型中特征軌跡仍然會有一段時間處于特征狀態1。其后,特征軌跡從特征狀態1進入特征狀態2(具體應為特征狀態2-1)或者特征狀態3。
在特征狀態2-1中,期望特征軌跡能夠以較快的速度進入圖7中定義的Δde1區域。如果在特征狀態2-1中大部分特征軌跡不處于Δde1,則說明KP21的值過小,不斷增大KP21,直到特征狀態2-1中大部分特征軌跡能夠處于Δde1或者對KP21的校正次數達到設定的最大次數。
在特征狀態3中,期望特征軌跡能以較快的速度進入圖7中定義的Δde1區域。如果在特征狀態3中,大部分特征軌跡不處于Δde1,則說明KD3的值過小,不斷增大KD3,直到特征狀態3中大部分特征軌跡能夠處于Δde1或者對KD3的校正次數達到設定的最大次數。在本狀態下,不需要對KP3進行校正。
在特征狀態2-2中,如果大部分特征軌跡不處于 Δde2,則說明 KP22的值過小,需要增大KP22,直到特征狀態2-2中大部分特征軌跡能夠處于Δde2或者對KP22的校正次數達到設定的最大次數。
在特征狀態2-3中,如果特征軌跡不能進入Δde3,則說明 KP23的值過小,需要增大 KP23,直到特征狀態2-3中大部分特征軌跡能處于Δde3或者對KP23的校正次數達到設定的最大次數。
在特征狀態5中,先校正KD5,后校正KP5。如果特征軌跡不能進入Δde3,分2種情況進行分析:如果特征軌跡離開特征狀態5之后進入特征狀態7或者特征狀態4,則說明 KD5過小,增大KD5直到特征軌跡能夠進入Δde3或者離開特征狀態5之后進入特征狀態2-3;如果特征軌跡離開特征狀態5之后進入特征狀態2-3,則說明KP5過小,需要增大KP5直到特征軌跡能夠進入Δde3。完成了對KD5的校正之后,開始校正KP5。如果在某次進行了KP5校正之后,特征軌跡又出現了離開特征狀態5并立即進入了特征狀態7或者特征狀態4的情況,則說明KP5過大,需要反向進行校正,即開始減小KP5的值。
當特征軌跡離開區域Δde3時,其后的特征軌跡走向分為3種:通過特征狀態2-3進入特征狀態6,直接進入特征狀態6,進入特征狀態7。對于前2種情況,已不需要對中間段所處狀態的控制器參數進行校正。如果特征軌跡離開Δde3之后進入特征狀態7,并很快進入Δ區域,也不需要對中間段所處特征狀態下的控制器參數進行校正。否則,需要先校正KD7(增大),再校正KP7(增大),直到特征軌跡能進入Δ區域或者對KD7和KP7的校正次數均達到了設定的次數為止。
3)穩態段
特征軌跡進入穩態段之后,系統并不一定處于穩定的狀態,還需繼續對特征軌跡的走向進行判斷和改善才能保證系統真正進入穩態。
完成 KD7和 KP7的校正之后,令 KD6=KD7,KP6=KP7。當特征軌跡自其他特征狀態進入特征狀態6之后,如果仍然存在某一時刻,使得偏差絕對值大于e4,則逐步增大KP6直到不再出現這樣的情況或者對KP6的校正次數超過某一設定值為止。
通過以上閾值和控制器參數的校正,可以在不同的給定軌跡下進行仿人智能控制器的自動設計,從而得到良好的跟蹤效果。
穩定性分析一直是智能控制的難點。一方面是因為被控對象的復雜性,另一方面則是智能控制算法自身的模糊性和非解析性。鑒于此,在HSIC中,從對系統不穩定趨勢監控的角度去研究智能控制的穩定性問題。根據動態系統輸出的穩定性等價原理,對于仿人智能控制系統,如果輸出信息空間中具有與穩定的線性定常系統相同的穩定特征,那么,可認為該系統也一定是穩定的,否則,認為系統出現了不穩定的趨勢,并根據這一趨勢對設計的控制器進行相應調整[14]。
通過在在線運行仿人智能控制器的過程中對穩態段的特征軌跡“走向”的分析來判斷控制系統的穩定性。當外部環境發生突變或者由于控制器自身的不完善導致穩態段的特征軌跡離開特征狀態6時,如果相軌跡在較少的次數之內離開區域6之后,能在設定的較短時間范圍內再次進入區域6并不再離開,則認為系統是穩定的。否則,根據出現的不穩定“走向”,對不穩定的特征軌跡所經過特征狀態的閾值和控制器的參數重新進行校正。如果還不能保證穩定性,則對整個特征模型中的參數重新校正,以保證系統的穩定性。
本文以3自由度串聯工業機器人為研究對象。該對象由基座和3個桿件組成。其中,第1個桿件通過旋轉關節與基座相連,第2個桿件與第1個桿件通過轉動關節相連,第3個桿件與第2個桿件通過轉動關節相連。
在仿真平臺中設定桿件的密度為5 000 kg/m3,重力系數為9.81 N/kg,采樣時間為0.2 ms。各個關節給定的角度信號均為2*sin(t*PI/4 000),t為采樣次數。設計驗證實驗:三關節聯動,對靠近基座一側的2個關節采用PD控制獲得較好的控制效果,針對第3個關節,先分別設計仿人智能控制器和PD控制器,然后對第3個關節的2種控制器進行比較和分析。第3個關節在2種控制器的控制下對給定正弦信號進行跟蹤,獲得的相軌跡如圖8、9所示,跟蹤過程中的特征如圖10、11所示。
從圖8、9可以看出,采用仿人智能控制器時,相軌跡進入特征狀態6之后能夠停留在其中不再離開,即滿足lime<α,lim˙e<β,α、β為很小的閾值(此處為分別e4、˙e4)。根據智能控制理論中動態系統輸出的穩定性等價原理[14],可知仿人智能控制器是穩定的。從圖10可看出,采用PD控制時系統的反向偏差很大,而采用仿人智能控制器則能有效地抑制反向偏差。從圖11可看出,采用仿人智能控制器時系統的穩態偏差比采用PD控制時小得多。
綜上所述,采用仿人智能控制器對機器人進行控制,在保證穩定性的同時,系統的超調比采用PD控制時小得多,而穩態精度則比采用PD控制器時高得多,從而能綜合考慮穩定性、快速性和精確性3方面的性能指標。

圖8 全局特征軌跡

圖9 穩態段特征軌跡

圖10 全局誤差曲線

圖11 穩態時的誤差曲線
針對3自由度的工業機器人,通過特征模型的建立和相應參數的校正設計了仿人智能控制器,并在仿真平臺下同傳統的PD控制器進行了對比,驗證了仿人智能控制器能兼顧系統的穩定性、快速性和精確性3方面的性能指標。
[1]方浩,周冰,馮祖仁.基于層迭CMAC網絡的6DOF機器人自適應控制[J].機器人,2001,23(4):294-299.
[2]孫煒,王耀南.模糊CMAC及其在機器人軌跡跟蹤控制中的應用[J].控制理論與應用,2006,23(1):38-42.
[3]羅璟,趙克定,陶湘廳,等.工業機器人的控制策略探討[J].機床與液壓,2008,36(10):95-97.
[4]王學林,周俊,姬長英,等.基于卡爾曼濾波的RBF神經網絡和PD復合控制研究[J].計算機測量與控制,2009,23:1551-1553.
[5]Wang L,Chai T,Yang C.Neural-Network-Based Contouring Control for Robotic Manipulators in Operational Space[J].Control Systems Technology,2011,99:1-8.
[6]Mohammad Hossein Kazemi,Soheil Ahangarian,Alireza Hashempour.et al.Fuzzy Path Tracking Control of a 5-DOF Experimental Robot[C]//2008 IEEE International Conference on Information and Automation.USA:[s.n.],2008:436-440.
[7]Ahmad M A,Suid M H,Ramli M S,et al.PD fuzzy logic with non-collocated PID approach for vibration control of flexible joint manipulator[C]//2010 6th International Colloquium on Signal Processing& Its Applications(CSPA).USA:[s.n.],2010:53-57.
[8]Nahapetian N,Jahed Motlagh M R,Analoui M,et al.A-daptive Robot Manipulator Control Based on Plant-Controller Model Reference using Soft Computing and Performance Index Analyzer[C]//2009 IEEE Symposium on Computational Intelligence in Control and Automation(CICA 2009).USA:[s.n.],2009:15-20.
[9]Tang L,Landers R G.Predictive Contour Control With A-daptive Feed Rate[J].Mechatronics,2011,99:1-11.
[10]鐘金明,張海波,徐剛,等.基于滑模變結構控制的機器人視覺伺服系統研究[J].組合機床與自動化加工技術,2005(8):3-6.
[11]Negash D S,Mitra R.Integral sliding mode controller for trajectory tracking control of Stewart platform manipulator[C]//Industrial and Information Systems(ICIIS).USA:[s.n.],2010:650-654.
[12]丁度坤,謝存禧,張鐵,等.遺傳算法在工業機器人控制中應用研究[J].機械設計與制造,2009(3):168-170.
[13]呂文菲.自適應迭代學習控制在機器人中的應用[D].沈陽:東北大學,2006.
[14]李祖樞,涂亞慶.仿人智能控制[M].北京:國防工業出版社,2003.
[15]查智.水下機器人運動控制中的仿人智能控制策略[J].重慶理工大學學報:自然科學版,2010(3):85-90.