劉經緯,趙輝,周瑞,朱敏玲,王普
2015年,谷歌公司研究人員在“Nature”雜志發表了一篇關于將人工智能方法應用于49個不同的游戲控制系統的研究報告[1],報告中展示了在這49個智能系統中,計算機經過反復地學習與控制過程,不但可以學會上述系統的運行規則,還在絕大多數比賽中達到了人類的操控水平,甚至還在少數項目中超越了人類。2012年以來微軟、蘋果公司也相繼在人工智能領域進行大量研發,Cortana、Siri等智能操控系統相繼上市。上述研究成果標志著人工智能研究領域已經突破了瓶頸期,成為了前沿領域的研究熱點和世界一線企業進行市場競爭的焦點。
早在1997年,作為基于推理機制人工智能系統的里程碑,IBM公司研制的基于龐大規則庫推理機制深藍計算機,輸入了一百多年來優秀棋手的對局兩百多萬局,戰勝了國際象棋世界冠軍卡斯帕羅夫。而在隨后的10年中,人工智能卻進入了一個緩慢的發展階段。直到2007年前后,“深度神經網絡”的概念[2-3]開始受到關注,Geoffrey Hinton等[4]提出了一種在前饋神經網絡中進行有效訓練的算法。這一算法將網絡中的每一層視為無監督的受限玻爾茲曼機,再使用有監督的反向傳播算法進行調優[5]。此后,神經計算科學迎來了一個跨越式的發展階段[6-7]。
如上所述,現有的最具代表性的人工智能方法有以下兩類:1)以數理邏輯、模糊推理為代表的基于規則與推理技術的人工智能方法與技術;2)以模擬人腦生物學特征構建的神經網絡為特征的神經計算方法與技術。前者的特點在于:1)整個推理過程具有嚴格的公式定義,推理規則(先驗知識)必須十分精確地描述,推理系統才可以很好地工作;2)如果推理規則不合理,系統往往無法對推理規則進行修正;3)推理模型的機理原型是數學推理機制。后者的特點在于:1)整個推理過程和規則是在系統運行過程中根據控制目標、系統狀態以及輸出動態修正的,因此系統可以在先驗知識不足的情況下運行;2)系統運行過程中,推理機制本身可以得到優化;3)神經網絡模型的機理原型是人腦生物系統的學習與思維機制。
由于神經計算科學在原理上更加接近人腦智能的生理學原理,在對于知識學習的容量與深度方面具有無限的擴展能力,因此在更為復雜的知識系統與智能的學習及表達方面具有更廣闊的發展空間。
人工智能復合(改進)經典控制(AI-CC)方法在經典控制方法的基礎上采用智能算法對關鍵參數進行整定,相對于預測控制、自適應控制等其他類型的智能控制算法具有以下優點:1)理論研究方面可以借助大量非常成熟的經典控制理論;2)大量經典控制的實際應用案例為研究工作帶來了大量的實驗環境和市場價值;3)在經典控制基礎上,引入預測、優化、推理等經典的人工智能算法建模的難度大幅降低,無需構建新型系統模型。常見的AI-CC方法有:專家復合經典控制(E-PID)[8]、模糊復合經典控制(F-PID)[9-10]、神經網絡復合經典控制(NN-PID)在線整定方法[11-12]等。上述現有方法待解決的問題如下:1)系統特性有待進行理論論證,例如普適特征與穩定性等;2)很多應用對工藝有特殊要求,例如超調量;3)系統特性有待進一步提升,例如響應速度、穩態誤差、抗干擾能力等。
經典控制系統如圖1(a)所示,基于規則推理與經典控制相結合的智能控制系統如圖1(b)所示。如果控制參數在線整定的規則為根據系統輸出及其變化率一一映射推理出控制參數,稱為專家規則在線整定方法,采用E-PID表示;如果是根據系統輸出及其變化率通過模糊計算出控制參數整定值,稱為模糊推理在線整定方法,采用F-PID表示[13-14]。

圖1 現有的經典控制和智能控制方法的系統結構Fig. 1 Existing AI-CC method and system structure
本研究在實現F-PID和E-PID的基礎上,改變推理規則在線整定控制參數算法實現改進,改進的核心步驟是:E-PID和F-PID根據系統誤差及變化率直接推力產生控制量,本研究提出根據系統誤差及變化率產生控制量的修正量,提出EA-PID和FA-PID方法,如圖2所示。

圖2 改進智能控制方法的系統結構圖Fig. 2 Improved AI-CC method and system structure
F-PID方法經過模糊化計算直接得到控制參數的計算公式如式(1)~(3):


本研究提出改進的FA-PID方法經過模糊化計算得到的結果則是控制參數的修正量,最終控制參數的計算公式如式(4)~(6):


本研究提出改進的EA-PID同樣通過查詢專家經驗規則表如表1所示。

表1 專家經驗規則表Table 1 The table of expert experiences

現有的F-PID和E-PID與本研究提出改進的FA-PID和EA-PID方法對比如表2所示。

表2 多種規則推理與經典控制相結合方法對比Table 2 Table of increase adaptive fuzzy PID ptimization rule
設計F-PID與FA-PID算例的模糊控制器及其關鍵參數分別如圖3與圖4所示。

設計EA-PID算法的規則表如表3所示,E-PID算法的規則表同理。
為F-PID、FA-PID、E-PID、EA-PID智能控制系統設計相同的控制系統和實驗參數:1)每個仿真周期運行一次控制參數的整定計算;2)采用增量式數字PID算法作為PID控制器算法;3)本研究采用最常見的帶有延遲環節的二階離散化模型作為被控對象模型進行研究,本研究方法可以推廣到其他更多被控對象模型的情況,即;4)采樣周期ts=0.001;5)控制參數初值為、、;6)仿真持續時間為 k=2 000;7)系統輸入信號為常量,即單位階躍信號;8)干擾策略如下:干擾起始時刻d_k=1 000,干擾持續時間I_k=10,干擾強度為。
F-PID、FA-PID、E-PID、EA-PID 4中算法的仿真結果如圖5所示。
各算法的結果指標如表4所示,實驗表明:1)從系統響應的快速性角度看,基于規則表的算法快于模糊計算的算法,E-PID具有最快的起始上升速度,而EA-PID具有最快的穩定速度,FA-PID算法在上升和穩定速度方面快于F-PID算法,EA-PID算法存在超調量,其他各算法均不存在超調;2)從穩態誤差的角度看,EA-PID具有最小的穩態誤差,FA-PID算法在穩態誤差方面低于F-PID算法;3)從抗干擾能力角度看,EA-PID算法具有最好的抗干擾能力。綜上所述,EA-PID和FA-PID算法的很多控制指標都優于改進前的E-PID和FA-PID算法。

圖3 F-PID模糊控制器參數設置Fig. 3 Parameters setting of fuzzy controller in F-PID

圖4 FA-PID模糊控制器參數設置Fig. 4 Parameters setting of fuzzy controller in FA-PID

表3 增量式自適應專家PID優化器規則表Table 3 Rule of increase expert PID optimizer

表4 控制系統輸出和誤差的仿真結果對比Table 4 The comparison of simulation results of control system output and error

圖5 各系統計算機仿真結果Fig. 5 Simulation results of each system
基于神經網絡與經典控制相結合的智能控制方法如圖6所示,神經網絡輸出即為更新的控制參數,從而影響經典控制器更新對被控對象的控制量。

圖6 神經網絡智能控制系統的結構圖Fig. 6 System diagram of neural network intelligent control system
令神經網絡的訓練目標為使系統均方誤差達極小,即定義目標函數為均方誤差,如式(14):

本研究提出采用改進的自適應小波神經網絡[15]與經典控制相結合構成智能控制系統,即實現AWNN-PID控制,并同時實現BPNN-PID、RBFNNPID作為對比算法[16-17],驗證新方法的控制效果有所提升。


式中,各項的表達式如式(20)~(25):


為BPNN-PID、RBFNN-PID、AWNN-PID仿真系統設計與F-PID、FA-PID、E-PID、EA-PID仿真系統相同的控制系統和實驗參數:1)每個仿真周期運行一次控制參數的整定計算;2)采用增量式數字PID算法;3)同樣采用最常見的帶有延遲環節的二階離散化模型作為被控對象模型進行研究,本方法可以推廣到其他更多被控對象模型的情況,即;4)采樣周期 ts=0.001;5)仿真持續時間為k=2 000;6)系統輸入信號單位階躍信號。
BPNN-PID、RBFNN-PID和AWNN-PID 3種算法各連續10次計算機仿真的結果如圖7所示。
BPNN-PID、RBFNN-PID和AWNN-PID 3種算法各連續30次計算機仿真的結果如表5所示。


圖7 每算法各10次計算機仿真結果Fig. 7 10 simulations of each method
實驗表明:1)從算法可行性角度看,各算法都可以實現控制參數實時在線智能整定和優化的設想;2)從可靠性(穩定性)角度看,RBFNN-PID方法存在不穩定的情況,在下一節將通過理論分析的方法進一步論證出保障穩定性的修正方法,而AWNNPID則具有很好的穩定性;3)從算法動態和穩態特性方面看,AWNN-PID較之BPNN-PID具有更快的響應速度,BPNN-PID則具有最小的穩態誤差。

表5 每種算法各30次計算機仿真結果的上升時間、穩定時間、靜態誤差統計Table 5 Rise time, settling time, steady-state error statistics of 30 simulations per method
本研究聚焦兩類人工智能方法與經典的PID控制方法相結合構成兩種AI-CC方法與系統,可以基于非常成熟的PID理論體系[20]進行研究,避免了非線性控制在理論分析方面遇到的難題。
本研究給出了對于高階系統和帶有延時環節的系統的穩定性分析方法,并以二階延遲系統為例給出了理論分析和推導案例。該理論分析方法對于更加普遍的多階系統與延時系統同樣適用。

根據式(26)和勞斯判據(Routh Criterion)方法,可以得到勞斯表為

當勞斯表第一列系數均為正數,系統穩定,即可以推導出系統穩定條件如式(27):

本研究的重點是對F-PID、FA-PID、E-PID、EAPID、BPNN-PID、RBFNN-PID、AWNN-PID智能控制方法及系統的穩定性在理論上得出保證算法。特別是將上述算法中最不穩定的RBFNN-PID算法作為重點研究案例,給出系統穩定性保障機制,對于加入穩定性保證機制的RBFNN-PID算法記作RBFNN-S-PID。
針對生產實踐中最常見的具有延時環節的多階被控對象進行理論推導,令系統中關鍵環節的傳遞函數為,。則閉環系統的傳遞函數為 ,開環系統頻率特性為。令,則。

圖8 控制參數在線整定系統伯德圖Fig. 8 Bode diagram of AI-CC
未采用穩定性保證算法的RBFNN-PID控制系統的計算機仿真結果如圖9(a)所示;采用了上述穩定性保證算法的RBFNN-S-PID控制系統的計算機仿真結果如圖9(b)所示。
從圖9可以看出,RBFNN-S-PID系統克服了RBFNN-PID系統輸出的普遍震蕩、大量超調、發散不穩定的情況,輸出更加平穩和穩定。驗證了理論推導出的穩定性保障方法可行。
從實驗結果的角度看:將F-PID、FA-PID、EPID、EA-PID、BPNN-PID、RBFNN-PID、AWNNPID各方法的性能指標進行匯總,從而進一步對各智能控制系統的智能化程度、快速性、穩態誤差、抗干擾、穩定性進行對比分析,為該領域的研究者提供參考,如表6所示。
表6中的對比結果顯示:1)基于規則推理的智能控制方法E-PID與EA-PID具有最好的動態性能和穩態性能,即響應速度快、穩態誤差小;2)基于模糊推理的智能控制方法F-PID與FA-PID動態和穩態性能略差于前者;3)基于神經網絡的智能控制方法BPNN-PID、RBFNN-PID與AWNN-PID動態和穩態性能相對最差。
從實際應用便利性和算法智能程度的角度看:1)基于神經網絡優化的智能控制方法,對工程師的要求最低,即在系統運行前只需要憑經驗設置一個初始參數,或者使用默認初始參數,系統在運行過程中會實時整定優化,得到最佳的控制參數;2)基于規則推理的智能控制方法的配置過程則需要工程師對規則表進行精確的配置,這個過程需要經過多次系統運行調試驗證;3)基于模糊推理的智能控制方法需要配置隸屬度函數的多個配置項,還需要多次系統運行調試驗證,生產實踐中需要對工程師進行培訓才可以實施。綜上所述,智能系統的智能程度和性能特征之間存在著此消彼長的辯證關系,即系統的智能程度提高,往往伴隨著性能的降低,因此智能與性能之間如何取舍是需要進一步研究的重點。

圖9 RBFNN-PID和RBFNN-S-PID系統仿真結果對比Fig. 9 Simulation result of RBFNN-PID and RBFNN-SPID
對兩類多種AI-CC智能控制方法及系統的性能與實用性進行總結,如表7所示。實驗結果表明:AI-CC智能控制方法隨著人工智能程度的提升,在控制參數的智能能力方面具有一些優勢,但是在性能方面會有所損失,與不具備智能功能的經典控制相比,個別性能會略有下降。

表6 多種AI-CC智能控制系統仿真結果對比Table 6 Comparison of different intelligent control systems

表7 多種AI-CC智能控制系統的對比結果綜合Table 7 Comparison results between different intelligent control systems
研究表明:控制系統的智能化程度的提升會犧牲系統所能達到的最高性能指標;系統通過精確設置,使得某項控制指標達到了極高,同時會使得系統喪失自適應能力與智能能力。
從智能控制系統的可行性角度看,基于推理規則與神經計算的人工智能方法及經典控制系統相結合構建的AI-CC智能控制系統具有可行性。此類方法基于經典控制,是對經典控制的升級改造,因此具有堅實的理論基礎和廣泛的實際應用空間。
從提出的算法改進的效果看,本研究提出的EA-PID、FA-PID、AWNN-PID三項改進分別在系統的動態性能和穩態性能方面較之已有的方法有所提升。
從提出的算法穩定性和工程應用可靠性理論分析的角度看,本研究從理論上分析了上述系統的穩定性,給出了對 E-PID、EA-PID、F-PID、FA-PID、BPNN-PID、RBFNN-PID、AWNN-PID多種方法保證穩定性的保證算法,使得各算法具有工程應用的可靠性保障。
本研究通過對比研究的方法,將多種AI-CC人工智能方法構建的智能控制系統進行全面對比研究,發現了智能系統的智能化程度與性能之間此消彼長的辯證統一關系。為該領域的學術研究者提供了理論推導、分析方法和仿真對比實例,為工程應用領域提供了可以基于經典系統升級改造的、可靠的智能控制系統解決方案。
[1]VOLODYMYR M, KORAY K, DAVID S. Human-level control through deep reinforcement learning[J]. Nature,2015, 518: 529–533.
[2]RIEDMILLER M, GABEL T, HAFNER R, LANGE S. Reinforcement learning for robot soccer[J]. Robots, 2009, 27:55–73.
[3]DIUK C, COHENA, LITTMAN, M L. An object-oriented representation for efficient reinforcement learning[J]. Mach learn, 2008(1): 240–247.
[4]LECUN Y, BENGIO Y, HINTON G. Deep learning[J].Nature, 2016, 12(21): 436–444.
[5]HINTON G. Learning multiple layers of representation[J].Trends in cognitive sciences, 2007, 11(5): 428–434.
[6]KRIZHEVSKY A, SUTSKEVER I, HINTON GE. Imagenet classification with deep convolutional neural networks[J]. Neural information processing systems foundation,2012, 47: 777–780.
[7]FARABET C, COUPRIE C, NAJMAN L, LECUN Y.Learning hierarchical features for scene labeling[J]. IEEE transactions on pattern analysis and machine intelligence,2013, 35(8): 1915–1929.
[8]SUSANTO-LEE R, FERNANDO T, SREERAM V. Simulation of fuzzy-modified expert PID algorithms for blood glucose control[C]//10th International Conference on Control, Automation, Robotics and Vision. Hanoi, Vietnam,2008: 1583–1589.
[9]XUE Ping, WANG Haichao, HOU Juanjuan. Based on the fuzzy PID brushless DC motor control system design[C]//International Conference on Measurement, Information and Control. Harbin, China, 2012: 703–706.
[10]OU Kai, WANG Yaxiong, LI Zhenzhe. Feedforward fuzzy-PID control for air flow regulation of PEM fuel cell system [J]. International journal of hydrogen energy, 2015,40(35): 11686–11695.
[11]SHI Hongbo, HUANG Chuang. A BP wavelet neural network structure for process monitoring and fault detection[C]//The Sixth World Congress on Intelligent Control and Automation. Dalian, China, 2006(2): 5675–5681.
[12]SHARIFIAN M B B; MIRLO A, TAVOOSI J, SABAHI M. Self-adaptive RBF neural network PID controller in linear elevator[C]//International Conference on Electrical Machines and Systems. Beijing, China, 2011: 1–4.
[13]趙新華, 王璞, 陳曉紅. 智能投球機器人模糊PID控制[J]. 智能系統學報, 2015, 10(3): 399–406.ZHAO Xinhua, WANG Pu, CHEN Xiaohong. Intelligent pitching robot based on fuzzy PID control[J]. CAAI transactions on intelligent systems, 2015, 10(3): 399–406.
[14]劉經緯, 王普, 等. 專家模糊增量式自適應的參數在線整定優化系統及方法[P]. 201110023946.6, 2012-11-07.
[15]王普, 劉經緯, 等. 自適應小波神經網絡異常檢測故障診斷分類系統及方法[P]. 201110023943.2, 2012-08-30.
[16]SHARIFIAN M B B, MIRLO A, TAVOOSI J, SABAHI M. Self-adaptive RBF neural network PID controller in linear elevator[C]//International Conference on Electrical Machines and Systems. Beijing, China, 2011: 1–4.
[17]NIE Yanmin, HE Zhiqiang. Optimization of the main steam temperature PID parameters based on improve BP neural network[C]//International Conference on Simulation and Modeling Methodologies, Technologies and Applications. Rome, Italy, 2015: 113–116.
[18]CHEN Zhe, FENG Tianjin, et al. The application of wavelet neural network for time series predictionand system modeling based on multiresolution learning[C]//International Conference on System, Man and Cybernetics.Tokyo, Japan, 1999(1): 425–430.
[19]LOUSSIFI H, NOURI K, BRAIEK N B. A new efficient hybrid intelligent method for nonlinear dynamical systems identification: the wavelet kernel fuzzy neural network[J].Communications in nonlinear science and numerical simulation, 2016, 32: 10–30.
[20]SILVA G J, DATTA A, BHATTACHARYYA S P. New results on the synthesis of PID controllers[J]. IEEE trans on automatic sontrol, 2002, 47(2): 241–252.