基于灰狼優化算法的PID控制器設計

2022-12-01 08:42:18馮嚴冰

傳感器世界 2022年8期

關鍵詞：優化

馮嚴冰

江蘇城市職業學院，江蘇常州 232001

0 前言

在過去幾十年里，基于自然和生物學概念的種群優化算法被廣泛地應用于科學領域的搜索和優化問題。常用的種群優化算法有粒子群優化算法（particle swarm optimization algorithm，PSO）[1]、布谷鳥搜索算法（cuckoo search，CS）[2]、螢火蟲群優化算法（glowworm swarm optimization，GSO）[3]、引力搜索算法（gravity search algorithm，GSA）[4]和灰狼優化算法（gray wolf optimization algorithm，GWO）等[5-7]。其中，GWO算法的靈感主要是基于狼群的結構和內部的層次組織，組織使用4個層次，α代表最高級別，其次是β和δ，而ω代表種群的最低級別。PID控制器設計所涉及主要問題是對與比例、積分和微分分量相關的最優增益因子的選擇[8]。本文提出了基于GWO算法進行比例、積分和微分（PID）控制器的設計，并與GSA和PSO算法進行了性能比較。

1 灰狼優化算法

灰狼優化算法于2013年提出，該算法模擬了野生環境中灰狼的社會等級分層和狩獵機制。GWO算法使用了4個層次：

（1）α狼作為領導者是占主導地位的狼，是主要的決策者；

（2）β狼在社會等級中排名第二，在決策過程中幫助α狼，并在α狼和較低層次狼之間建立橋梁；

（3）δ狼在社會等級中排名第三，被α狼和β狼領導，同時也領導著最低等級的ω狼；

（4）ω狼是這個群體中排名最低的狼，它必須服從于其他3個等級的狼。

該算法中，灰狼社會等級的數學模型及其包圍、狩獵和攻擊獵物的具體策略如下：GWO根據適應度確定了3個最佳的種群解決方案，第一適者的是α狼，第二適者是β狼，第三適者是δ狼，所有其余的種群成員都被認為是ω狼。3個等級較高的狼對獵物的包圍由公式（1）來模擬[9]：

從式（3）、式（4）中可知，獵物的位置代表了對α、β和δ狼所獲得的最佳適應度函數。所有狼的位置都使用以下平均公式進行更新：

為了便于對比，GWO算法、GSA[10]算法和PSO算法的流程如表1所示。

2 PID控制器數學模型

經典的單輸入單輸出反饋PID控制系統框圖如圖1所示。其中，r表示參考輸入（設定值），u表示控制器輸出，y表示系統輸出，d表示負載擾動，Gc表示控制器，Gp表示控制系統或進程。控制設計2個主要目標是設定值跟蹤SPT和負載干擾抑制LDR。SPT即找到最佳的PID控制器增益因子，使系統輸出盡可能接近參考輸入信號的變化，使控制系統的時間加權絕對誤差積分（ITAE）最小。LDR在本研究中沒有涉及。

本研究中考慮的控制器傳遞函數表示為：

其中，Kp、Ki和Kd分別表示比例、積分和微分增益；Tf表示濾波器的時間常數。

3 算法的實現

為了便于對GWO、GSA和PSO三種算法進行比較，需要說明在一些文獻中被忽視的關鍵問題：

（1）種群初始化通常使用隨機生成的PID控制器增益因子，這樣會導致控制系統的不穩定。為了克服這一問題，本研究中先從穩定性的角度來檢驗解決方案，如果得到的控制系統是穩定的，才允許它們在初始種群中使用。在本文中，初始化時，3種算法GWO、GSA和PSO都使用相同的初始群體，每運行10次后將使用不同的個體補充。

（2）在表1中，GWO算法中的在迭代過程中隨著迭代次數由2線性減小至0；PSO中的ω隨著迭代次數增加，從0.9線性減少到0.2；通過實驗發現，GSA算法中最初提出的用來更新G的[11]表達式在這個設計中不起作用，易導致過早收斂。因此，本研究中用式（8）中所示的線性衰減表達式來更新G：

其中，G0表示初始值，考慮到迭代次數較少，這里G0取0.9。

4 仿真結果與討論

本研究使用了3種相關的工廠數學模型[11]來測試PID控制器，具有時滯的雙滯后極點系統Gp1、非最小相位系統Gp2和具有多等極點的四階系統Gp3，分別表示為：

在MATLAB/Simulink環境中進行仿真，3種算法的種群大小均取為m=15，步長間隔為0.1 s，每個算法運行10次，每次運行時迭代150次。PID控制器的增益因子Kp、Ki和Kd在時間間隔[0.1, 5]中發生變化。濾波器的時間常數Tf取決于系統噪聲、過程時間常數和控制器采樣時間，但是在實踐中，它應取不會顯著降低控制性能的最高值。本研究中，濾波器的時間常數Tf都設置為0.1 s。

每個仿真系統獲得的結果如表2所示，其中粗體值表示所獲得的最佳值。對于每個被測試算法（GWO、GSA和PSO）均給出了ITAE最優結果對應的PID增益因子。

表2還給出了10次運行中最終獲得的ITAE的平均值，以及所有最佳結果的相應標準差。仿真結果表明，3個算法收斂于相同的控制器增益因子，每個系統均獲得相同的ITAE值。這些結果顯示其平均值與所獲得的最佳值相同，所以可知，通過150次迭代足以使所有算法收斂。同時，表2的結果顯示，對于PID控制器設計，雖然3種算法的收斂結果增益相同，性能相似，但3種算法在收斂速度方面有很大的不同。通過分析圖2、3和4中所示的仿真結果可以看出收斂速度的差異。其中，圖（a）表示10次運行中最佳值的平均值變化，圖（b）表示10次運行中平均值的平均值變化圖。在最佳值方面，這3種算法的仿真結果非常接近，但就平均值而言，仿真結果表明，收斂速度最快的算法是GWO，其次是GSA，最慢的是PSO算法。

表2 PID控制器增益因子和ITAE仿真結果

5 結束語

本文提出了針對設定點跟蹤設計目標的基于GWO算法的PID控制器設計方法。將該方法應用于一組基準線性數學模型，并與粒子群優化和引力搜索算法得到的仿真結果進行了比較。在小種群規模和低迭代次數的測試條件下，這3種算法得到了結果相近的ITAE。因此，GWO的性能和PSO、GSA算法一樣好。然而，在收斂性方面，3種測試算法仿真結果不同，GWO算法的最佳值總體略優于GSA和PSO；GWO算法是平均值收斂最快的，其次是GSA，最后是PSO。仿真結果表明，GWO算法的總體性能最優，但在其他PID控制器設計標準下，灰狼優化算法還需進一步探索。