(中國人民解放軍92771部隊 青島 266000)
艦船備件配置可以看作一個復雜的多約束、非線性組合優化問題,其優化過程復雜,計算量大,收斂速度較慢,且容易陷入局部最優解。
可靠度是指裝備在一定的條件下,在規定的時間內,完成要求功能的概率。裝備可靠度是時間的函數,通常記為R(t)。設T為裝備壽命的隨機變量,則可靠度函數為

裝備失去本該具有的功能就是失效。裝備從開始工作到失效前為正常工作時間T,稱為裝備壽命[4]。用F(t)表示壽命T的分布函數,則:

系統裝備整體可靠度由所有基本單元可靠度決定,本文將整個系統視作串聯。設系統裝備由m個部分組成,第i部分有n個備件,則該裝備系統的第i個部件的可靠度:

只有串聯系統所有相對獨立部分均工作正常時,整個系統才能正常工作,所以可用下式對系統可靠度進行表達:

系統備件的供應受到資金的影響,所以備件優化問題必然受到費用的約束。尤其是在戰時,費用問題更為突出明顯,有限的資金如何發揮最大的作用對任何一樣物資的供應都有著極其嚴格的要求。
記M為備件種類,xi為第i種備件的存儲數量,向量V=[xi x2…xM]即表示了一個儲備方案;ci為第i種備件的單價,C0為可用于備件儲備的總費用,R0為武器系統任務可靠度最低門限值。C=f1(V)為最終用于備件儲存的總費用,R=f2(V)為裝備系統任務可靠度優化結果值,依部件之間結構關系運算求得[5]。一般備件優化模型可分以下幾類。
在新時代機遇與挑戰并存背景下,廣東瑞豐生態環境科技股份有限公司專注土壤修護事業,走出了屬于自己的發展之路。為了共商土壤修護大計,構建基層土壤修護服務模式,共同推進綠色生態文明建設,11月18日,“千秋偉業激昂前行”中國首屆基層土壤修護服務體系發展論壇暨2018瑞豐生態(集團)第五屆“未來之星”VIP客戶聯盟財富峰會在安徽黃山召開。
模型1:目標函數是任務可靠度,約束條件是備件的經濟指標,也就是滿足費用約束情況下,將任務可靠度最大化。

模型2:目標函數是費用,約束條件為系統任務可靠度,也就是達到任務可靠度約束條件下,將所需費用降到最少。

模型3:目標函數是任務可靠度與費用之間比值,約束條件為系統任務可靠度與費用,也就是資金有限的情況下,實現對可靠度最基本的要求[6~7]。

粒子群算法(PSO)是Kennedy和Ebernart博士在1995年時所提出的隨機尋優算法[8]。PSO算法在求解優化函數時,具有較好的尋優能力,但基本的PSO算法非常容易陷入局部最優,產生較大的誤差,所以對PSO算法進行一定的改進就顯得非常重要。PSO算法的具體參數主要有微粒群個數、慣性權重ω、學習因子等。
慣性權重ω作用是可以實現粒子全局與局部搜索能力之間的平衡。迭代初期,全局搜索能力是粒子必須具備的,把慣性權重的值設置高點可以保證在全局范圍內大步長搜索。在迭代后期,粒子需要在小范圍內集中搜索,所以為使局部的搜索能力得到提升,可以調低慣性權重值。顯然,在進化公式中,慣性權重是非常重要的因素。1998年,慣性權重線性減少這一概念由Y.shi等學者提出,也就是線性遞減策略,慣性權重用下式表示:

其中,ωmax、ωmin分別表示最大、最小慣性權重值[9]。
學習因子c1和c2的值在PSO算法中起到反映粒子向個體歷史、全局最優位置學習能力的作用,其設置的合理性對粒子之間的學習交流和尋優能力影響較大,過高設置會使粒子脫離搜索區域,偏低設置導致粒子搜索范圍減小。1999年,M.Clerc給出學習因子值為2.5的想法,基于此,Suganthan等在考慮線性遞減策略后改進更新公式:

其中,cmax表示最大的學習因子;cmin表示最小的學習因子[10~12]。
在基本粒子群優化算法研究中,粒子會同時向個體最優值pbest和全局最優值gbest學習。但gbest并不能保證是最優的,這導致粒子可能始終無法再靠近最優解的范圍內尋優,最終產生粒子陷入局部最優的問題。文獻[13]提出一種Comprehensive Learning Particle Swarm Optimizer(CLPSO),它使用了一種新的學習策略,可以提高種群的多樣性,并能有效解決粒子在多峰上問題。在該學習策略中,粒子的速度公式被定義為

其中fi=[fi(1),fi(2),fi(3)…fi(D)]表明個體最優值所對應的粒i,pbestfi(j)j表示任何一個粒子的pbest。在每一維中,設定一個隨機數rand,根據rand值的大小判定粒子的pebst的值。若rand值大于概率pci,那么其相應的維度將會遵循自己的pbest,若小于概率pci,那么維度值將會學習其他粒子的pbest。其中,概率pci有如下定義:

艦船某系統有四個類型的重要構件[13],其單價與故障率如表1所示。

表1 系統備件參數表
其中,費用限制為99000元,工作時間為1450h,系統可靠度至少達到0.85。采用模型3,即備件優化模型為

s.t.R≥0.85,C≤99000,xi≥0,為整數
設定改進粒子群算法參數如下:群規模選擇30個粒子,精度為10-5,進行10次仿真試驗,c1=c2=2.5,慣性權重ω=0.5,迭代數取100,學習概率取式(11)。CLPSO算法執行程序如下。
1)對粒子群進行初始化,隨機將各粒子散布在搜索空間、對粒子初速度進行設定,且明確所有粒子適應值和最佳群體gbest。
2)任意取m維粒子朝著gbest進行學習,根據學習概率P,明確剩余D-m維學習粒子,Flag(i)=0,End Fori。
3)For i=1to S,如果Flag(i)不小于最佳粒子更新閾值,則任取m維粒子朝著gbest進行學習,根據學習概率pci。明確剩余D-m維學習粒子,Flag(i)=0,End。
4)根據式(10)和粒子最大速度求得所有粒子速度,對粒子當前位置進行更新,明確pbest,If pbest不變,則Flag(i)=Flag(i)+1,End If 。
5)End Fori,明確gbest最佳群體,到滿足設定終止條件為止[14~16]。
統計數值測試結果與進化代數后分析可得如表2。不難看出,盡管CLPSO算法與Mx-MIMIC都能確定最優配置,同時實現系統可靠度最基本的要求,但相較于Mx-MIMIC算法,CLPSO算法求取的最優配置可以省4000元。在進化代數上,CLPSO算法為25,Mx-MIMIC算法為64,表明CLPSO算法進化速度更快,仿真試驗效率得到了很大的提高。

表2 測試結果對比
在上述實驗中,發現可靠度R0的增大,能盡可能地提高費用利用率。設系統約束可靠度R0從0.9開始,按0.01遞增,直到0.99,共10組參數。分析得出,系統可靠度越大,費用利用率也就越高,由于可靠度無法不限制地增大,最大到0.9561為止,結果如表3所示。

表3 可靠度約束條件對結果的影響
本文采用將系統任務可靠度與費用之間比值作為研究問題的目標函數,可靠度、費用作約束條件的模型研究艦船備件配置優化問題,采用改進粒子群算法CLPSO對該問題進行求解,驗證其可行性,并與Mx-MIMIC算法進行對比證明其優越性。在下一步研究中,可基于對各備件保障效能參數的分析研究,探索納入各方面保障效能參數,以綜合效能度量為目標構建備件優化配置模型。