楚彭子,虞 翊,林 輝,袁建軍,姜 西
1.同濟大學 道路與交通工程教育部重點實驗室,上海201804
2.同濟大學 磁浮交通工程技術研究中心,上海201804
3.同濟大學 上海市磁浮與軌道交通協同創新中心,上海201804
4.中鐵第四勘察設計院集團有限公司,武漢430063
列車的運行控制屬于閉環控制。作為列車運行自動控制系統(Automatic Train Control,ATC)的關鍵子系統,列車自動運行(Automatic Train Operation,ATO)系統不間斷地接收來自列車自動防護(Automatic Train Protection,ATP)系統以及列車自動監控(Automatic Train Supervision,ATS)系統的信息,實施列車自動運行。ATO系統是實現列車無人駕駛及全自動運行的關鍵,對于ATO系統速度控制算法的研究逐步豐富。
傳統PID 控制算法用于ATO 系統存在著響應速度慢、適應性差、能耗大等缺點[1-4]。PID 算法對控制參數的依賴性強,當控制對象出現偏差或者控制過程受到干擾,容易導致振蕩甚至失穩。由于智能算法能夠通過增強PID算法自適應能力達到更好的控制效果,此類智能控制技術被廣泛討論。針對列車速度控制,劉浩[2]和Utomo[5]等探討了模糊自適應PID 控制算法的適用性。借助遺傳算法對控制參數的優化,任林杰等[3]分析了模糊PID 控制算法的應用效果?;诹熊囘\行目標曲線的跟蹤測試,孟建軍等[4]討論了模糊預測PID 控制算法的可行性。張馳等[6]將分數階PID算法用于ATO系統速度控制,顯示出比傳統PID 控制算法更好的控制效果。馬曉娜等[7]研究了一種結合灰色預測和模糊PID的控制算法。Chen 等[8]檢驗了單神經元PID 算法在ATO 系統中的應用效果。針對ATO 系統的智能控制,Fu[9]設計了一種基于B 樣條神經網絡和粒子群(Particle Swarm Optimization,PSO)算法的PSO-B-BP-PID 控制算法。此外,部分研究還關注了其他控制算法和控制策略。陸小紅等[1]基于模型預測控制技術提出了預測型灰色控制的列車運行速度控制算法。冷勇林等[10]結合優秀司機駕駛經驗,探討了應用數據驅動推理控制算法的可行性。胡震等[11]研究了隨機驅動的全局粒子群(Randomnessdriven Global Particle Swarm Optimization,R-dPSO)算法在列車控制策略中的應用。
PID算法的優化途徑多樣,采用模糊數學理論優化是一種可靠的途徑[2-3,5,7],但常規的模糊PID算法依賴專家經驗且模糊規則較多。相比之下,模糊免疫PID(Fuzzy Immune PID,FIPID)算法能夠基于少量模糊規則達到可觀的控制效果[12-14],且該算法在ATO系統中的應用尚未得到充分討論。同時,采用固定的控制參數通常難以應對復雜情形[3-4],而FIPID有多個固定的控制參數?;诖?,本文探討了FIPID算法應用于ATO系統速度控制的可行性,并將BP 神經網絡算法用于FIPID 算法控制參數的在線自整定,對比了原始算法與拓展算法的控制效果。
當抗原侵入機體時,淋巴細胞中的輔助細胞TH、抑制細胞Ts以及B 細胞相互協作,使得免疫反饋系統趨于平衡?;谠摍C理,令ε(k)代表第k 代抗原數量,p1代表TH細胞的促進因子,p2代表Ts細胞的抑制因子,f(·)為細胞抑制刺激能力的非線性函數,則TH細胞的輸出TH(k)為p1ε(k),Ts細胞對B 細胞的影響Ts(k)為p2f(S(k)-ΔS(k))ε(k),B 細胞接受的總刺激為S(k)=TH(k)-Ts(k)[14]。進一步將抗原數量ε(k) 抽象為誤差e(k),將系數p1視為控制反應速度K ,作為控制穩定效果η,S(k)抽象為控制輸入u(k),進一步結合增量式PID 算法和模糊數學原理,形成了模糊免疫PID 控制算法[12-14]。模糊免疫PID控制器結構如圖1所示,其反饋控制律u(k)為:

其中,f(·)為模糊邏輯函數,ki′ 和kd′ 分別為積分和微分系數。

圖1 模糊免疫PID控制器結構
對于模糊邏輯函數,將輸入變量模糊化為“正”(P)和“負”(N),輸出變量模糊化為“正”(P)、“零”(Z)和“負”(N),并將隸屬度函數定義在整個(-∞,+∞)區間。其中,f(u,Δu)所采用的規則為:如果u 為正,且Δu 為正,則f(·)為負;如果u 為正,且Δu 為負,則f(·)為零;如果u 為負,且Δu 為正,則f(·)為零;如果u 為負,且Δu 為負,則f(·)為正。此時,對各規則使用Zadeh的模糊邏輯AND操作,進一步采用mon反模糊化方法即可得到f(·)[12,14]。
模糊免疫PID 控制算法的四個主要控制參數為反應速度K ,穩定效果η,積分和微分系數ki′ 和kd′ 。其中K 和η 是實施控制的關鍵參數,且ki′和kd′在控制律中與這兩項參數相互耦合。基于預實驗發現同時在線整定這四項參數的效果并不理想。對此,以免疫參數促進因子p1和抑制因子p2為著眼點,對這兩項參數的自適應調整進行研究。
BP 神經網絡是一種應用廣泛的人工神經網絡,具有任意非線性表達能力,對于處理因果關系復雜的非確定性推理、判斷、識別及分類等問題有著較強的適用性?;诖耍疚慕柚鶥P 神經網絡實時調整FIPID 中的p1和p2,記為BP-FIPID。
參考文獻[12,15],設置BP 神經網絡結構如圖2 所示,即4個輸入、2個輸出和5個隱含層節點的網絡。同時,引入輸入x=[r,y,e,1]、權重,并令j 取1至4,i 取1 至5,l 取1 至2,令上標(1)、(2)、(3)分別代表網絡的輸入層、隱含層與輸出層,則有網絡輸入為:

隱含層的輸入與輸出為:

隱含層神經元的活化函數?。?/p>

同時,輸出層的輸入與輸出為:


圖2 BP神經網絡結構

網絡權重的優化是獲取理想控制參數的前提,取性能指標函數為:

根據梯度下降法優化網絡的權重,即根據E(k)對權重系數的負梯度方向搜索調整。為使搜索快速收斂全局極小,引入學習速率β 和慣性系數α。

采用BP神經網絡拓展FIPID算法時,根據式(2)和式(5)有:


同理,網絡隱含層權重系數的學習算法可表示為:
結合圖1 所示的模糊免疫PID 控制器和BP 神經網絡可知,BP-FIPID 控制器包括增量式PID 控制器、免疫控制器、模糊控制器、BP 神經網絡控制器以及數據單元,如圖3 所示。其中K、η 由BP 神經網絡在線輸出的p1和p2整定,而ki′ 和kd′ 與原始模糊免疫PID 控制器一樣,并非在線整定。

圖3 BP-FIPID控制器結構
此時,BP-FIPID算法的流程可概述為:
步驟1 初始化。設置初始誤差、輸入、輸出與控制律(均取0)、模糊規則,以及BP 神經網絡的層數、節點數、初始權重、學習速率和慣性系數等。
步驟2 采樣得到輸入、輸出以及誤差。計算該時刻的輸入輸出偏差,得到誤差數據。
步驟3 執行神經網絡的計算。根據輸入、輸出、誤差、權重等,計算隱含層的輸入輸出以及輸出層的輸入輸出,得到所需的兩個免疫參數。
步驟4 計算當前控制律。
步驟5 執行神經網絡的學習。在線調整神經網絡的權重系數。
步驟6 判斷是否結束。若是任務結束,則停止。否則,更新各個參數,返回步驟2。
為了檢驗所設計算法的可行性,將列車運行控制模型作為控制對象,將階躍信號和列車運行速度-時間曲線分別作為輸入信號,分析與對比傳統FIPID控制算法及BP-FIPID控制算法的輸出效果。列車運行控制模型采用已辨識的具有延遲特性的傳遞函數模型[3]:

其中,σ 為傳輸延時,牽引工況取1,制動工況取0.8。
在控制性能指標方面,對于階躍信號,分析不同控制算法輸出的上升時間、調節時間、峰值時間以及超調量。同時,涉及的評價指標還包括一系列誤差性能指標:平方誤差積分性能指標(Integral of Square Error,ISE)、絕對誤差積分性能指標(Integral of Absolute Error,IAE)、時間乘平方誤差積分性能指標(Integral of Time Multiplied by Squared Error,ITSE)以及時間與絕對誤差乘積的積分性能指標(Integral of Time Multiplied by Absolute Error,ITAE)[6,16]。

對于ATO 系統性能指標,現有研究多從運行速度不超過緊急制動防護曲線、運行準點率、停車精準度、運行舒適度、節能性、牽引及制動切換頻繁度、追溯性等方面進行討論[2,17-19]。
運行速度不超過緊急制動防護曲線的要求與ATO系統控制器關聯較大。列車運行的目標速度曲線位于緊急制動防護曲線之下,但列車實際運行曲線的波動范圍可能會超出緊急制動防護曲線而觸發ATP 緊急制動。這種性能決定著目標速度曲線的冗余空間和列車運行效率,對ATO 系統控制器的目標速度曲線跟蹤性能要求較高。實質上是要求列車實際運行速度盡可能貼近目標速度,即良好的追溯性[2,19]。兩者內涵接近,均可由誤差指標進行度量。追溯性反映出的復雜工況適應能力與抗干擾特性,也是列車速度控制算法穩定性與智能性的體現。
牽引及制動切換頻繁度、運行準點率與停車精準度由目標速度曲線與ATO系統控制器共同決定。節能性與運行舒適度也同樣由目標速度曲線與ATO系統共同決定??捎赡芎闹笜薑e[17]和最大沖擊率Kj分別評估。沖擊率代表加速度的變化率,應小于0.75 m/s3[18]。

其中,v 和a 分別為速度和加速度,S~ 代表列車運行距離。
仿真中,使用Win10 系統、Intel i7 處理器和16 GB內存的筆記本電腦,以Matlab 為仿真平臺,以階躍信號為輸入,將式(12)列車運行控制模型作為被控對象,取列車運行控制傳輸延時σ 為1。采樣時間為0.2 s,仿真時間為40 s,即200 個采樣周期,并在第100 個和第110個周期設置干擾(對控制律u(k)加0.1)以觀察不同控制算法的抗干擾能力。在控制參數設置方面,FIPID中ki′和kd′ 均取0.3,K 取0.3,η 取0.8[12],即p1和p2分別取0.3和0.24。BP-FIPID中ki′和kd′與FIPID取值一致,學習速率β 和慣性系數α 均取0.001,大小為5×4 的隱含層初始權重和大小為5×2 的輸出層初始權重均于[-0.5,0.5]之間[12,15],取值見表1。

表1 初始權重
FIPID 和BP-FIPID 的階躍響應曲線如圖4 所示。可見,FIPID和BP-FIPID均能取得較好的響應結果。其中,BP-FIPID 的超調量較大,FIPID 相對更小。在上升時間與峰值時間方面,FIPID 較長,BP-FIPID 則相對更短。兩者的調節時間較為接近。同時,在抗干擾方面,BP-FIPID能更好更快地應對干擾,而FIPID的抗干擾能力相對較弱。
圖4 過程中的誤差性能指標ISE、IAE、ITSE 以及ITAE如表2所示。FIPID的四項指標均大于BP-FIPID,BP-FIPID 的各項指標均較優,即該算法在整體上能夠較好地跟蹤階躍信號,抵抗干擾信號。

圖4 階躍信號響應和抗干擾情況

表2 階躍信號跟蹤性能指標
在具有先進ATC系統功能的列車運行控制系統中,ATO系統能夠根據目標速度曲線不斷地執行牽引、惰行與制動等任務[2-4,7]。以目標速度曲線為輸入的仿真測試相對于階躍響應更為復雜,面臨的工況更多,對控制算法的魯棒性要求更高。借鑒文獻[4,7],同樣采用跟蹤測試的方式分析上述兩種控制算法在ATO系統中的應用效果。
在目標曲線跟蹤的仿真過程中,采用與階躍響應測試中相同的控制參數,輸入為具有2 175 個采樣周期的速度-時間曲線(采樣時間為0.2 s)。在1 470~1 560 和1 810及其之后的采樣時段內,列車運行控制傳輸延時σ取0.8,其他時段均統一取1。將FIPID和BP-FIPID分別作為列車運行控制模型的控制算法,從追溯性、舒適性和節能性三方面進行性能分析。運用同樣的仿真環境,FIPID 和BP-FIPID 的仿真時間消耗分別為33.571 s 和36.017 s,這與BP-FIPID相比FIPID增設了BP神經網絡控制器有關。
(1)追溯性
仿真輸出的速度-時間曲線如圖5所示。可見,FIPID算法和BP-FIPID算法均能較好地跟蹤目標曲線。根據圖5 中的子圖,在初始階段和工況切換階段,FIPID 和BP-FIPID 的跟蹤效果較為接近,但BP-FIPID 較FIPID的響應速度更快,且更貼近目標速度曲線。
表3 進一步展示了誤差性能指標,以及最大誤差、最小誤差與相應的采樣周期k。可見,不同控制算法輸出的最大跟蹤偏差集中在起始階段和臨近終止階段,表現為起始階段的輸出小于輸入,終止階段的輸出大于輸入,這與被控對象本身為延遲系統有關。同時,與FIPID相比,BP-FIPID的誤差性能指標均相對更小。這表明,針對更復雜的輸入信號,BP-FIPID 算法的跟蹤性能在整體上明顯更優,即追溯性更好。

圖5 目標曲線的跟蹤情況

表3 速度-時間曲線追溯性指標
(2)舒適性與節能性
圖6 展示了控制算法跟蹤曲線及目標曲線的最大沖擊率和能耗指標。結果顯示,不同曲線的沖擊率均小于0.75 m/s3,滿足軌道交通列車運行的舒適性要求。其中,基于FIPID輸出的最大沖擊率相對更?。?.065 62 m/s3),但該數值與目標曲線的最大沖擊率(0.091 82 m/s3)偏差較大,而BP-FIPID 的偏差更小。盡管沖擊率越小代表舒適性越好,但與目標曲線的偏差也反映了跟蹤性能的優良程度。同時,在能耗方面,目標能耗指標為0.074 73,BP-FIPID 能耗指標為0.077 96,FIPID 能耗指標為0.068 96。即BP-FIPID能耗指標相對較大,但該數據與目標值的偏差為0.003 23,而FIPID 能耗數值與目標值的偏差為0.005 77。需要說明的是,盡管不同控制算法輸出的舒適性與節能性指標存在差異,但均較為接近。這兩項性能指標與不同算法較好的追溯性和目標曲線自身的平穩性有關。

圖6 舒適性和節能性指標
采用階躍信號和速度-時間曲線對兩種控制算法進行仿真測試,結果顯示FIPID和BP-FIPID均能夠有效地跟蹤目標曲線,BP-FIPID在FIPID的基礎上表現出更好的跟蹤性能,反應速度相對較快,抗干擾性能也相對較好。需要說明的是,BP 神經網絡對于初始權重較為敏感[9],但其抗干擾能力和良好的跟蹤性能也是BP-FIPID的優點。免疫參數的自適應變化有助于提高FIPID 的魯棒性。
FIPID 和BP-FIPID 算法均可用于列車ATO 系統的運行測試。FIPID 和BP-FIPID 在追溯性和舒適性等方面均十分理想,且BP-FIPID 的大部分指標顯著優于FIPID,尤其在追溯性方面有明顯的改進?;诖?,列車的運行準點率與停車精度有了更大的保障。同時,追溯性的提高也使得列車運行的目標速度曲線與防護曲線之間的冗余需求進一步降低,這有助于提高列車的運行效率。此外,在控制算法方面,BP-FIPID的初始權重與學習算法的優化也有待進一步分析。
為了分析傳統模糊免疫PID算法以及基于BP神經網絡自適應調整免疫參數的模糊免疫PID 拓展算法(BP-FIPID)在ATO 系統速度控制中的適用性,結合列車運行控制模型、階躍信號和目標速度曲線進行了仿真測試,對比分析了不同算法的穩態特性、抗干擾特性、追溯性與舒適性等性能?;贐P神經網絡自適應調整免疫參數是優化模糊免疫PID 的一種有效方法,能夠為ATO系統速度控制提供參考。