基于Metropolis準(zhǔn)則的自適應(yīng)模擬退火粒子群優(yōu)化

2022-06-28 02:56:04鄧紹強郭宗建湯可宗

軟件導(dǎo)刊 2022年6期

鄧紹強，郭宗建，李芳，湯可宗，劉康

（景德鎮(zhèn)陶瓷大學(xué)信息工程學(xué)院，江西景德鎮(zhèn) 333403）

0 引言

粒子群優(yōu)化（Particle Swarm Optimization，PSO）算法是一種受鳥群覓食行為啟發(fā)而提出的群體智能優(yōu)化算法［1-3］。PSO 原理簡單、易于理解且參數(shù)較少，面向最優(yōu)化問題求解過程具有搜索能力強、收斂速度較快等優(yōu)點，現(xiàn)已廣泛應(yīng)用于模式識別［4］、路徑規(guī)劃［5］、圖像處理［6-7］等理論研究及工程應(yīng)用領(lǐng)域。

然而，PSO 應(yīng)用于多模態(tài)優(yōu)化問題求解往往存在易早熟、收斂精度較低等問題。為有效提高PSO 搜索最優(yōu)解的求解效率，避免PSO 易陷入局部區(qū)域而發(fā)生早熟收斂現(xiàn)象，本文提出一種新的基于Metropolis 準(zhǔn)則的自適應(yīng)模擬退火粒子群優(yōu)化（Adaptive Simulated Annealing Particle Swarm Optimization，ASAPSO）算法。首先，ASAPSO 采用一種新的自適應(yīng)極值慣性權(quán)重設(shè)置方式，該方式將增強粒子種群全局搜索和局部搜索的有序轉(zhuǎn)換；其次，以粒子經(jīng)歷的局部最優(yōu)解為交流學(xué)習(xí)對象，構(gòu)建粒子間學(xué)習(xí)交流的中心粒子，從而增強粒子個體的社會學(xué)習(xí)能力；最后，粒子群體搜索過程根據(jù)所設(shè)計的模擬退火選擇概率變換粒子飛行方向，由中心粒子引領(lǐng)粒子的飛行搜索，避免搜索過程陷入局部最優(yōu)區(qū)域，從而提高最優(yōu)解的搜索效率和精度。

1 相關(guān)研究

針對PSO 易早熟收斂且精度低等問題，諸多學(xué)者從如下方面對PSO 進行研究并提出有效的改進策略：

（1）慣性權(quán)重控制。例如，Shi 等［8］描述了一種慣性權(quán)重的設(shè)置方式并采用線性遞減策略改進PSO 算法，提高了粒子群體搜索最優(yōu)解的效率；閆群民等［9］使用一種雙曲正切策略自適應(yīng)控制慣性權(quán)重變化，并引入模擬退火思想對全局最優(yōu)粒子進行擾動，提升算法收斂精度和穩(wěn)定性；徐浩天等［10］以正態(tài)分布曲線作為慣性權(quán)重的衰減策略曲線，通過引入控制因子對粒子位置進行改進，使得所提出的改進PSO 算法能很好地在優(yōu)化過程中平衡全局搜索和局部搜索能力。

（2）粒子演化進程中對粒子行為的改善。例如，Zhan等［11］將粒子尋優(yōu)分成4 個階段，根據(jù)階段的不同，通過模糊控制自適應(yīng)確定組合參數(shù)，從而提升PSO 算法的收斂速度和精度；湯可宗等［12］引入廣義中心粒子和狹義中心粒子，提出雙中心粒子群優(yōu)化，提升了PSO 算法的收斂速度和精度；朱經(jīng)緯等［13］針對陷入局部最優(yōu)的粒子，給予一個較大的速度將其彈射出去，增強了算法的全局搜索能力。此外，在PSO 中融入其他啟發(fā)示搜索算法特性以進一步增強算法多樣性及搜索能力。

（3）融合其他啟發(fā)式搜索算法特性。例如，高鷹等［14］將模擬退火思想引入具有雜交和高斯變異的粒子群優(yōu)化算法中，改善了算法跳出局部最優(yōu)的能力；劉玉敏等［15］在算法中引入選擇、變異算子保持種群多樣性，使其具有跳出局部最優(yōu)的能力；李瀟等［16］采用自然選擇策略，將適應(yīng)度好的一半粒子速度位置覆蓋至較差的一半粒子，使種群一直以較好的全局最優(yōu)進行搜索，從而加快改進PSO 的收斂速度；Enireddy 等［17］將布谷鳥搜索和粒子群優(yōu)化結(jié)合，提升了神經(jīng)網(wǎng)絡(luò)對圖像分類的學(xué)習(xí)效率；周蓉等［18］在PSO中融合灰狼算法思想進一步提高算法收斂精度。

上述研究側(cè)重于粒子跳出局部最優(yōu)解區(qū)域的改進策略。然而，當(dāng)個別陷入局部最優(yōu)區(qū)域的粒子引領(lǐng)整個種群飛行時，其他粒子將快速聚集在局部最優(yōu)區(qū)域從而加快算法早熟。本文提出的ASAPSO 算法中，模擬退火策略不僅作為一種擾動準(zhǔn)則對全局最優(yōu)粒子進行小范圍局部擾動，也作為一種接受準(zhǔn)則用于計算新粒子引領(lǐng)整個種群飛行的概率。此外，所構(gòu)建的自適應(yīng)極值慣性權(quán)重調(diào)整策略能有效控制粒子的慣性權(quán)重隨迭代過程的自適應(yīng)變化，并在粒子演化進程中由粒子個體間的學(xué)習(xí)交流定義新的飛行方向，并由中心粒子引導(dǎo)粒子飛行。

2 相關(guān)概念

2.1 Metropolis準(zhǔn)則

模擬退火思想源于固體材質(zhì)的物理退火原理，固體在高溫情況下冷卻至常溫狀態(tài)，其固體內(nèi)部的粒子會隨著溫度的逐漸降低而釋放自身內(nèi)能，逐漸使粒子趨于有序狀態(tài)，最后在常溫狀態(tài)下達到穩(wěn)定基態(tài)。在某個特定溫度T下，由于粒子的運動，固體內(nèi)部系統(tǒng)的內(nèi)能會發(fā)生改變，如果系統(tǒng)內(nèi)能朝著減少的方向進行，就接受該變化；反之，則以一定概率決定是否接受這種狀態(tài)變化。基于這種粒子狀態(tài)變化過程，Metropolis 準(zhǔn)則按式（1）定義物體在溫度T下固體由i狀態(tài)轉(zhuǎn)化至j狀態(tài)的概率。

其中，e為自然對數(shù)，E（i）和E（j）表示物體在i狀態(tài)和j狀態(tài)下的內(nèi)能，K是玻爾茲曼常數(shù)。

2.2 基本PSO算法

基本PSO 是模擬鳥群覓食過程在給定搜索空間內(nèi)搜索全局最優(yōu)解的重復(fù)迭代過程。該迭代過程中，每個粒子模擬一只鳥兒，具有速度和位置兩個特征量。粒子在搜索空間中的位置表示問題的一個潛在可行解，而速度表示粒子在搜索空間內(nèi)一次迭代搜索飛躍的距離。每個粒子通過評價自身的適應(yīng)度值并跟蹤兩個極值不斷更新自身飛行方向和位置，兩個極值分別是：個體粒子在尋優(yōu)過程中經(jīng)歷的歷史最優(yōu)值Pbest，以及粒子群體在尋優(yōu)過程中經(jīng)歷的種群最優(yōu)值Gbest。每個粒子按式（2）和式（3）更新自身速度和位置。

其中，k是迭代次數(shù)，分別表示第i個粒子在第k次迭代時的速度和位置。r1和r2是介于［0，1］區(qū)間的隨機數(shù)；c1和c2是兩個學(xué)習(xí)因子，分別控制個體極值Pbest和全局極值Gbest對粒子飛行速度的權(quán)重影響，取c1=c2=2；粒子群搜索過程還需判斷自身速度及位置是否越界，常使用兩種越界行為處理方法［10］：一是將粒子越界對應(yīng)的維度設(shè)置為相應(yīng)維度的邊界值；二是在可行解空間范圍內(nèi)隨機生成一個新的位置。w為慣性因子，使粒子保持運動慣性，控制著粒子的搜索范圍。當(dāng)w值較大時，粒子全局搜索能力加強；反之，局部搜索能力加強。PSO 搜索過程中，w常采用線性遞減慣性權(quán)重設(shè)置方式［12］，即隨著迭代的進行，以線性遞減方式逐代減少慣性權(quán)重至一個預(yù)先設(shè)定的最低值。

3 自適應(yīng)模擬退火粒子群（ASAPSO）算法

伴隨著迭代過程，粒子種群搜索區(qū)域逐漸由全局搜索范圍轉(zhuǎn)入局部搜索區(qū)域，粒子種群在Gbest引領(lǐng)下飛行至局部最優(yōu)解區(qū)域，整個粒子種群將收斂至局部最優(yōu)解或其鄰近區(qū)域。此時，Gbest繼續(xù)引導(dǎo)粒子飛行往往不利于粒子種群的全局搜索，若無局部遷移策略，整個粒子種群搜索將陷入局部最優(yōu)區(qū)域。為此，結(jié)合粒子真實的自然狀態(tài)飛行方式，可在粒子局部最優(yōu)解之間引入一種新的飛行方式以重新引領(lǐng)粒子種群的集體飛行過程。以Griewank函數(shù)為例，如圖1 所示，Pi（i=1，2，3，4）表示粒子i某一次迭代過程所處位置，該次迭代搜索對應(yīng)的種群最優(yōu)位置為Gbest_1，五角星標(biāo)記為所求問題的全局最優(yōu)解Gbest_e，菱形標(biāo)記是粒子i經(jīng)歷的局部最優(yōu)解，即粒子i的個體極值Pbest_i（i=1，2，3，4），十字形標(biāo)記是基于個體極值Pbest_2 和Pbest_3交流構(gòu)建的中心粒子Gbest2，3，該中心粒子除不具有速度外，與其它粒子屬性保持一致，如，粒子位置更新、全局極值競爭、適應(yīng)度評價等信息操作，分析觀察發(fā)現(xiàn)，如果考慮粒子在多個局部最優(yōu)解之間方向飛行，粒子飛行方向有可能指向全局最優(yōu)解Gbest_e或其鄰近區(qū)域，例如，在中心粒子Gbest2，3的引領(lǐng)下，粒子群體將更快地向全局最優(yōu)解靠近。因此，從粒子真實的自然飛行狀態(tài)反映出：在粒子群體之間進行局部最優(yōu)解的信息交流，以此構(gòu)建新的中心粒子，由中心粒子引領(lǐng)整個粒子種群的飛行，將有利于避免粒子群體陷入局部最優(yōu)區(qū)域。粒子種群將更加快速地趨向于所求解問題的全局最優(yōu)解。

3.1 中心粒子

Fig.1 Individual extreme value information exchange圖1 個體極值信息交流

在粒子群體飛行過程中，為加強個體粒子之間的信息交流，以粒子經(jīng)歷的局部最優(yōu)解為交流學(xué)習(xí)對象，每個粒子均可從粒子種群中任選其他粒子的局部最優(yōu)解進行交流學(xué)習(xí)并構(gòu)建新的中心粒子，中心粒子將增強粒子個體的社會學(xué)習(xí)能力。在此，定義粒子i向粒子j進行學(xué)習(xí)交流而構(gòu)建的中心粒子如式（4）所示。

其中，rand為介于0 和1 之間的隨機數(shù)，Pbesti和Pbestj分別是粒子i和j的個體極值。粒子迭代飛行過程中，以中心粒子引領(lǐng)粒子群體飛行，粒子速度更新公式如式（5）所示。

3.2 模擬退火選擇概率

粒子群體搜索過程中，中心粒子的作用是增強PSO 的搜索能力，擴大粒子的搜索范圍，在粒子陷入局部最優(yōu)時跳出局部區(qū)域。在此，基于Metropolis 準(zhǔn)則和中心粒子，給出以下模擬退火選擇概率以確定粒子搜索過程的飛行速度更新方式。在模擬退火算法中，初溫設(shè)置極其重要，初溫越大，算法搜索范圍越廣，獲得解的質(zhì)量越高。結(jié)合文獻［9］的初溫設(shè)置，模擬退火選擇概率其計算步驟如下：

Step1：初始化溫度T，PSO 迭代搜索過程的對應(yīng)溫度Tk按式（6）設(shè)置。

其中，Kmax為算法最大迭代次數(shù)，u為溫度衰減系數(shù)，取u=0.95，k是迭代次數(shù)。

Step2：按式（7）計算粒子i使用中心粒子Cbesti，j引領(lǐng)飛行搜索的模擬退火選擇概率。

其中，fit（Pbesti）為i粒子局部最優(yōu)解的適應(yīng)度值，j為種群中除i粒子外任一隨機粒子，k為迭代次數(shù)。

Step3：均勻生成一個0 到1 之間的隨機數(shù)ri，j，若式（7）中模擬退火選擇概率小于ri，j，粒子按照式（5）更新速度，否則按照式（2）更新。

3.3 自適應(yīng)極值慣性權(quán)重

通常情況下，PSO 慣性權(quán)重w采用線性變換方式，其隨搜索迭代過程逐漸減小。在粒子群體搜索前期，w取值較大則有利于粒子種群在廣域空間內(nèi)開展大范圍搜索，在后期迭代搜索過程中，w隨迭代次數(shù)增加而逐漸變小，整個搜索過程伴隨著全局搜索和局部搜索之間的多次環(huán)境轉(zhuǎn)換，粒子種群搜索區(qū)域也會發(fā)生多次變換。因此，單純地使用線性變換方式改變w值將不利于全局搜索和局部搜索之間的環(huán)境變換。在此，使用式（8）定義的自適應(yīng)極值慣性權(quán)重設(shè)置方式控制w隨迭代過程自適應(yīng)線性變化：

其中，wk為第k次迭代的慣性權(quán)重；wmax、wmin為慣性權(quán)重w的最大和最小值；Kmax為最大迭代次數(shù)；fit（Gbest）和fitmean分別為全局最優(yōu)粒子適應(yīng)度和粒子種群的平均適應(yīng)度值。不同于以往w線性變換方式，上述公式表明：伴隨著持續(xù)的粒子種群搜索過程，粒子群體隨迭代過程逐漸趨近于全局最優(yōu)極值Gbest的鄰近區(qū)域。此時，粒子種群平均適應(yīng)度值fitmean逐漸趨近于fit（Gbest），fit（Gbest）與fitmean間的比值逐漸變大，粒子種群逐漸轉(zhuǎn)入局部搜索區(qū)域。為此，隨著局部搜索過程的推移，逐漸增大的wk會增強粒子種群跳出局部搜索區(qū)域的能力，轉(zhuǎn)入全局搜索狀態(tài)，且隨著搜索過程的持續(xù)進行，wk值會逐漸減少，這種搜索狀態(tài)又逐漸進入局部搜索狀態(tài)。

3.4 算法流程

ASAPSO 算法流程如圖2所示。

Fig.2 Flow of ASAPSO algorithm圖2 ASAPSO算法流程

ASAPSO 算法執(zhí)行步驟如下：

Step1：種群初始化，分別設(shè)置c1、c2、wmax、wmin、T、u。

Step2：初始化全局極值Gbest和每個粒子的個體極值Pbest。

Step3：根據(jù)式（8）設(shè)置粒子飛行過程的自適應(yīng)極值慣性權(quán)重w。

Step4：對于每個粒子i，在粒子種群中確定一個學(xué)習(xí)交流粒子j，并根據(jù)式（4）構(gòu)建粒子i的學(xué)習(xí)交流中心粒子Cbesti，j。

Step5：根據(jù)上文描述的模擬退火選擇概率計算粒子的飛行速度，并根據(jù)式（3）計算粒子的飛行位置。

Step6：更新粒子群體的Gbest和每個粒子的個體極值Pbest。

Step7：判斷是否達到最大迭代次數(shù)或滿足精度，若滿足條件則輸出算法求解結(jié)果，若未達到則轉(zhuǎn)至Step3。

4 仿真實驗及結(jié)果分析

4.1 參數(shù)設(shè)置及測試函數(shù)

為驗證本文所提出ASAPSO 算法的有效性，選取DCP?SO［12］、IIWPSO［19］、DACPSO［20］、和TSAPSO［21］這4 種算法，面向6 個典型測試函數(shù)（見表1）測試各比較算法的性能。為增強算法的可比較性，各比較算法設(shè)置相同的初始參數(shù)，其種群規(guī)模N=40，c1=c2=2，慣性權(quán)重wmax=0.9、wmin=0.4，最大迭代次數(shù)Kmax=1 000，測試函數(shù)維度d=30。實驗所采用的軟硬件環(huán)境為：Windows 10 Professional 21H1；In?tel（R）Xeon（R）CPU E3-1231 v3 處理器，內(nèi)存16GB，在Matlab2019a語言環(huán)境下測試。

4.2 實驗數(shù)據(jù)分析

為評價算法性能，采用以下評價指標(biāo)評價算法性能：最優(yōu)解適應(yīng)值（Min）、種群均值（Mean）、種群適應(yīng)值標(biāo)準(zhǔn)差（SD）、收斂率（CR）。CR 表示100 次迭代內(nèi)滿足所需精度的收斂次數(shù)，反映算法可收斂性；平均收斂迭代次數(shù)（ACIT）用于測試算法成功收斂所需的平均迭代次數(shù)，該性能反映算法收斂速度。每種比較算法求解測試函數(shù)，各獨立運行100次，其測試統(tǒng)計結(jié)果如表2所示。

表2 中數(shù)據(jù)顯示，在多模態(tài)函數(shù)f1和f2的測試中，無論從Min 和Mean 還是SD 而言，ASAPSO 算法相對其他比較算法均有明顯優(yōu)勢，其計算數(shù)值的精度也遠高于其他比較算法。并且各比較算法獨立運行100 次，ASAPSO 的CR 能夠達到94%，其收斂率遠高于其他比較算法。在非對稱多模態(tài)函數(shù)f3測試中，ASAPSO 與DCPSO 在Min 測試性能較為接近，但前者收斂穩(wěn)定性要低于DCPSO。ASAPSO 在算法迭代前期時，由于模擬退火選擇概率的作用，種群能夠快速地尋找到可能存在的最優(yōu)解鄰近區(qū)域，在Min、Mean和SD 等測試性能的精度要優(yōu)于IIWPSO 與DACPSO。在f4的測試過程中，TSAPSO 與DCPSO 均無法尋找到滿足條件的解。IIWPSO 與DACPSO 雖能夠得到較好的Min，但就Mean、SD、CR 和ACIT 性能而言，其測試性能要劣于ASAP?SO。在f5的函數(shù)求解中，ASAPSO 與DCPSO 性能測試上較為接近，兩種算法都能100%收斂至最優(yōu)值，優(yōu)于其他比較算法。在單模態(tài)圓形函數(shù)f6中，ASAPSO 各項測試性能數(shù)據(jù)均與DCPSO 相接近，兩種算法的收斂率均為100%。然而，從表2 數(shù)據(jù)可見，ASAPSO 收斂精度明顯優(yōu)于DCPSO 與TSAPSO，相比IIWSO 和DACPSO 兩種比較算法，雖然在測試函數(shù)也能夠收斂到最優(yōu)值0，但就CR 和SD 而言，其可收

斂性和收斂穩(wěn)定性均劣于ASAPSO。

Table 1 Typical test function表1 典型測試函數(shù)

Table 2 Test results of five comparison algorithms表2 5種比較算法測試結(jié)果

為了更直觀地說明ASAPSO 在以上6 個模態(tài)函數(shù)中的測試性能，各比較算法在粒子群體尋優(yōu)過程中種群最小適應(yīng)度值隨迭代次數(shù)變化曲線如圖3所示。

Fig.3 Variation curve of optimal solution of five comparison algorithms in the solution of test function圖3 5種比較算法求解測試函數(shù)的最優(yōu)解變化曲線

由圖3 可以看出，ASAPSO 的軌跡與DACPSO 軌跡較為接近，在曲線趨于平緩時其軌跡有跳躍式下降的情形。因此，ASAPSO 精度相較于DACPSO 顯示出較好的全局最優(yōu)值，但其收斂速度要略慢于DACPSO。而TSAPSO 要明顯劣于其他比較算法，DCPSO 的尋優(yōu)軌跡呈緩慢下降趨勢，其收斂到所需精度的全局最優(yōu)值需較長時間，往往在600 次迭代之后才能搜尋到最優(yōu)值。相較于DCPSO，ASAPSO 能夠在較短時間內(nèi)找到全局最優(yōu)解。

4 結(jié)語

針對PSO 搜索過程中易陷入局部最優(yōu)區(qū)域的問題，本文提出了一種新的自適應(yīng)模擬退火粒子群算法。所提出的ASAPSO 算法構(gòu)建了粒子間學(xué)習(xí)交流的中心粒子，中心粒子將增強粒子個體的社會學(xué)習(xí)能力。種群中每個粒子根據(jù)模擬退火選擇概率確定是否向中心粒子學(xué)習(xí)，并由中心粒子引領(lǐng)粒子向著全局最優(yōu)解區(qū)域飛行。ASAPSO 能夠增強粒子跳出局部最優(yōu)區(qū)域的能力，提高粒子種群搜尋全局最優(yōu)解的效率。仿真測試表明，ASAPSO 在收斂速度和收斂精度上均優(yōu)于其他比較算法，能夠在較短時間內(nèi)搜尋到全局最優(yōu)解。后續(xù)工作中，將基于ASAPSO 進一步分析粒子的飛行真實狀態(tài)，將粒子按飛行方向劃分為不同類別的粒子群體，針對每種類別的粒子給出不同的慣性權(quán)重設(shè)置方式，使得粒子種群不再以式（8）表現(xiàn)的單一方式向著全局最優(yōu)解區(qū)域靠近，并在實際工程應(yīng)用案例中進一步驗證所提出ASAPSO 改進算法的測試性能。

軟件導(dǎo)刊2022年6期

軟件導(dǎo)刊的其它文章: 幸福心理與抗逆力培養(yǎng)的工控系統(tǒng)安全實驗課程研究; 基于問題驅(qū)動法的計算機組成原理教學(xué)研究; 國內(nèi)近五年人工智能教育的研究熱點及趨勢
——基于多維尺度和社會網(wǎng)絡(luò)分析的方法; 大學(xué)生線上學(xué)習(xí)行為的聚類、成因與對策研究; 面向計算思維培養(yǎng)的PBL教學(xué)模式設(shè)計
——以模式識別課程為例; 密文域可分離彩色圖像雙信息隱藏