戴嘉偉,羅偉林
(福州大學 機械工程及自動化學院,福建 福州 350108)
多學科設計優化(MDO)在眾多工程領域已得到廣泛運用。復雜非線性系統的優化設計通常具有子學科多、學科之間耦合關系強等特點,進行數值仿真計算需要較高成本,且模擬時間長。為解決多學科設計優化中數值模擬時間長、效率低的問題,研究人員迫切希望有一種計算效率高,且精度又有保證的設計方法。
在該背景下,基于代理模型的優化技術得到越來越多的關注[1]。代理模型的基本思想為通過從樣本中采集大量的有特征的樣本點,構造出一個計算量小、可替代高精度數值模型的模型。目前,常用的代理模型類型包括:多項式響應面模型(PRS)、Kriging模型、徑向基函數(RBF)模型、人工神經網絡(ANN)模型等。
與其他幾類模型相比,徑向基函數模型具有更優越的非線性映射能力。徑向基函數代理模型在工程設計優化領域有著廣泛的應用,如復雜機械系統的可靠性評價[2]、翼型氣動隱身優化[3]、火炮多柔體動力學結構優化[4]、圖像的噪聲抑制與細節保存[5]等。JIN R等[6]通過優化效率、優化精度等方面的比較,指出徑向基代理模型是較可靠的一種代理模型。韓鼎和鄭建榮[7]通過對多種代理模型的研究,從擬合精度、魯棒性、實現難度等多個方面比較,認為徑向基函數代理模型有較為突出的擬合能力,并具有很高的魯棒性。BABAEI M和PAN I[8]通過對多種代理模型進行評估發現,三次徑向基函數代理模型是其中最可信賴的。CHENG K等人[9]在基于方差的全局敏感性研究中,對多種代理模型進行了測試,指出徑向基函數幾乎為所有光滑測試算例提供了理想逼近,且只需要調整一個參數,就能有效處理大量的訓練樣本。
按照優化過程中代理模型的樣本特點和使用方法,代理模型技術可分為靜態代理模型與動態代理模型[10]:(1)靜態代理模型的樣本點數在優化算法迭代開始之前就已經采集好,在優化過程中保持不變。若想要保證代理模型的精度,就需要在初始時采集足夠多的樣本點,但這樣降低了優化效率;(2)動態代理模型在優化過程中會根據給定的規則不斷地更新樣本點,并重新構造代理模型,整個優化過程中代理模型和樣本點都是變化的。與靜態代理模型相比,動態代理模型在優化效率與優化精度上都有著明顯的優勢。
但信賴域方法容易陷入局部最優解。為此,基于最小化置信下限準則的動態代理模型方法[14]被提出,但該方法受限于平衡常數的不確定性[15]。將置信下限與信賴域相結合為提高動態代理模型的優化效率和全局最優解提供了一種有效途徑[16]。
筆者提出一種基于徑向基函數,聯合自適應置信下限與信賴域的動態代理模型優化策略(self-adaptive lower confidence bound and trust region-dynamic radial basis function, ALCBTR-DRBF)。在優化迭代的過程中,以代理模型預測值與真實模型響應值之間的誤差作為確定置信下限公式中的動態平衡常數的依據,應用遺傳算法對置信下限進行優化,然后根據代理模型與真實模型的擬合程度更新信賴域信息,在新的信賴域內選取并新增樣本點更新徑向基代理模型,最后將該優化策略用于數學測試算例與NASA減速器優化設計中,以證明該優化策略的有效性。
徑向基函數具有結構簡單、計算效率高的優點,可適用于復雜的高維非線性問題[17]。應用該函數,基本計算思路為:在d維空間中抽取n個初始樣本點x1,x2,…,xn∈Rd,目標或約束的真實響應值為y(x1),y(x2),…,y(xn),徑向基函數基本形式為:
(1)

若滿足:
(2)
則式(1)可寫為:
Y=Φ·W
(3)
(4)
式中:W—權系數向量,W=(w1,w2,…,wn)T;Y—樣本點的真實響應值,Y=(y1,y2,…,yn)T;Φ—徑向基函數。
常用的徑向基函數包括高斯函數、三次函數、逆多二次函數以及多二次函數等。筆者使用逆多二次函數,其數學表達式為:
(5)
式中:r—預測點與樣本點之間的歐氏距離;c—形狀參數,c為正常實數,通常取值范圍為(0,10)。
1.2.1 樣本更新
在動態代理模型的優化過程中,常用的樣本點更新方法有:期望改進(expected improvement,EI)準則和最小化置信下限準則。此外,SBESTER A等人[18]提出了一種并行加點的方法,并結合徑向基函數驗證了其有效性。
進行樣本點更新時,傳統的EI準則每次迭代更新都會計算任意點相對代理模型當前預測最優值的改善期望,添加可被改善期望值最大的點,能較好地平衡搜尋的全局性與效率。當預測標準差較小時,搜尋將在當前預測值附近,強化局部搜索能力;當預測標準值較大時,搜尋重點將轉移到預測精度低的區域,從而提高全局搜尋能力。傳統的EI準則要根據期望函數計算空間中每個樣本點的期望值,在復雜問題中計算量偏大、效率降低。因此,置信下限準則被提了出來。
置信下限準則一般表示為[19]:
(6)

假設徑向基函數每個確定性響應值y(x)是某個隨機過程Y(x)的實現,利用n個響應的分布Y=(y(1),y(2),…,y(n)),可求出假設的隨機過程在xn+1處的方差為:
(7)
當平衡常數w=0時,置信下限準則與預測值等價,此時搜索重心將放在當前預測值周邊,提高局部搜索能力;當w→+∞時,預測值對整體表達幾乎不產生影響,置信下限準則將等價于最大化預測標準差,搜索重心從預測值周邊轉移到預測精度較低的部分,搜索范圍從局部過渡到全局并加強全局搜索能力,且使問題變為最小化問題。
為減少置信下限準則中平衡常數w因人為經驗確定所帶來的誤差與波動,常采用一種自適應平衡常數置信下限方法。
1.2.2 平衡常數的自動確定
通過代理模型預測值與真實模型響應值之間的誤差與預測標準差的比較,可確定平衡常數為:
(8)


信賴域方法常被用來解決非線性規劃問題,其核心思想是在每次迭代時,在一個選定的可信賴區域內,利用近似模型在當前中心點擬合真實模型,通過優化算法尋優得到當前近似模型最優解,將其作為下一次優化迭代時信賴域區域更新的起始點。該方法通過近似模型與真實模型的擬合程度,判斷是否需要縮放信賴域空間。若當前近似模型滿足精度要求,則擴大信賴域搜索范圍;否則縮小信賴域搜索范圍,保證下次優化結果的精度。如此反復迭代更新直至獲得真實模型最優解。
對于任意非線性目標函數f(x),假設近似模型mk(p)=f(xk+p),在第k次迭代中的增量p為:
(9)
式中:Δk—信賴域半徑。
假定在優化過程的第k步增量為pk,則目標函數在第k步的實際下降量記為:
Aredk=f(xk)-f(xk+pk)
(10)
近似模型的下降量記為:
Predk=mk(0)-mk(pk)
(11)
參數Δk的選定一般根據下式進行調整:
(12)
式中:rι—近似模型與目標函數的近似程度。
rι越接近于1表示近似程度越高,此時可以適當擴大信賴域半徑;反之,則需對Δk適當縮小。信賴域方法通常使用Taylor展開式逼近原函數,涉及到復雜的Hessian矩陣計算,使整體計算量偏大。因此,筆者使用徑向基代理模型替代Taylor展開式來逼近原函數。
基于所采用的最小化置信下限方法,優化問題可用如下模型表示:
(13)
s.t.hj(x)=0j=1,2,…,J
gk(x)≤0k=1,2,…,K
xL,i≤xi≤xU,ii=1,2,…,nv

約束條件為真實模型所具有的約束,其優化流程如圖1所示。

圖1 優化流程圖
具體步驟如下:
(1)確定設計變量與設計空間D,建立分析模型;令迭代計數參數k=1,通過最優拉丁超立方采樣方法[20]選取初始樣本點(循環中為新增樣本點)。在選取初始樣本點時,樣本點數量通常為設計變量數的3到6倍,筆者選取初始樣本點數為:
(14)
(2)當k=1時,初始信賴域采樣空間S1為整個設計空間,即S1=D。當k>1時,信賴域空間是已更新的采樣空間;計算真實模型對應初始樣本點(循環中為新增樣本點對應的響應值),然后將樣本點和響應值儲存到相應數據庫中;
(3)根據所獲得樣本構建徑向基函數模型。依照已知信息和公式(13)獲得平衡常數w,根據式(6)確定置信下限;

(5)將第k次優化所得到的可能最優解xk代入真實模型,得到對應真實響應值f(xk),并將xk和f(xk)存入數據庫;
(6)判斷是否滿足收斂標準。當k=1時,直接轉入步驟7;當k>1時,計算優化過程中第k次與第k+1次所對應最優解的真實響應值之間的相對誤差,判斷該誤差是否滿足收斂判定條件。若滿足,循環停止,優化流程結束,步驟(4)中所得最優解即為真實模型最優解。若不滿足,則轉入步驟(7);
(7)根據已知信息更新信賴域采樣空間。令迭代參數k=k+1,轉至步驟(2)。
信賴域更新方法使用目標函數值的下降程度作為更新準則,能夠對采樣空間進行合理縮放,提高局部優化的精度與效率。筆者以最小化問題為例,信賴域更新的目的是使優化迭代時,基于當前代理模型的優化,實現目標函數的真實值的顯著下降。具體的更新步驟如下:
(1)確定信賴域采樣空間新的中心點xc。若目標函數的真實值下降,即y(xk-1)-y(xk)>0,則將當前可能最優解xk作為更新的中心點,否則使用上一次的可能最優解xk-1作為信賴域采樣空間更新的中心點;
(2)根據參數rι來調整信賴域半徑Δk,依據如下:
(15)
式中:c1,c2,r1,r2—常數;δ—最大信賴域半徑。
δ可取為初始設計空間半徑R。利用信賴域準則更新樣本空間,為避免數次迭代后出現信賴域半徑過小或信賴域半徑過大的問題,此時可使用文獻[21]的方法進行處理,得到更新之后的信賴域區域:
(16)
式中:xlbc—信賴域采樣空間的下邊界;xubc—信賴域采樣空間的上邊界;λR—最小信賴域半徑。
為了使優化策略更好地跳出局部最優解,給定最小信賴域半徑λR。其中,λ為常數,可根據不同的優化問題取不同的值。
首先,選用SC函數和GN函數作為測試函數。
(1)SC函數表達式為:
(17)
該函數是兩變量、單峰函數,又稱六背駝峰函數,有2個全局最優解和4個局部最優解,全局理論極小值為-1.031 6。
(2)GN函數表達式為:

(18)
可見該函數是兩變量函數,全局理論極小值為0。
筆者使用所提出的ALCBTR-DRBF優化策略,與動態徑向基函數代理模型(DRBF)策略、基于信賴域的動態徑向基函數代理模型(TR-DRBF)策略、基于傳統置信下限(w=1)的動態徑向基函數代理模型(LCB-DRBF)策略、基于最小化置信下限與信賴域的Kriging動態代理模型策略(IMLCB-TR),分別對SC函數和GN函數進行優化,對優化性能進行比較。
信賴域方法參數取值如下:c1=0.75,c2=1.25,r1=0.1,r2=0.75,λ=0.05。取10次優化結果的中位數作為最優解,模型調用次數取10次優化調用次數的平均值。
優化結果對比如表1所示。

表1 優化結果對比
模型調用次數對比如表2所示。

表2 模型調用次數對比
由表1和表2可知:(1)針對SC函數,筆者所提出的ALCBTR-DRBF策略擁有最高的精度,且有著最少的模型調用次數;(2)針對GN函數,ALCBTR-DRBF策略所得的最優解中間值與全局最優解非常接近,在精度和效率方面都明顯優于其他4種方法;(3)在優化效率方面,DRBF調用模型次數最少,僅為133次,但該方法明顯陷入了局部最優的情況。
綜上所述,ALCBTR-DRBF優化策略在全局性和收斂性上有著更好的表現。
為了驗證該優化策略在工程優化領域的有效性,筆者選用了MDO領域經典算例—NASA齒輪減速器[22]。該優化問題可概括為:在滿足齒輪彎曲應力、接觸應力和扭轉變形的前提下,使減速器的體積(質量)最小。
減速器結構如圖2所示。

圖2 齒輪減速器結構
該算例的數學模型如下[23]:
(19)
式中:x1—齒面寬度,2.6≤x1≤3.6;x2—齒輪模數,0.3≤x2≤1.0;x3—小齒輪齒數,17≤x3≤28;x4,x5—兩齒輪軸承間距,7.3≤x4≤8.3,7.3≤x5≤8.3;x6,x7—兩齒輪軸軸徑,2.9≤x6≤3.9,5≤x7≤5.5。
該優化設計問題的約束為非線性,筆者假設目標函數是一個高精度分析模型,真實模型約束為約束條件;分別比較ALCBTR-DRBF策略與DRBF策略、TR-DRBF策略和MLCB-DRBF策略的優化結果,如表3所示。

表3 優化結果
由表3知:(1)該算例理論最優解為2 994,ALCBTR-DRBF策略所得優化結果與理論最優解誤差僅為0.006%,而DRBF策略、TR-DRBF策略、LCB-DRBF策略、IMLCB-TR策略與最優解的誤差分別為6.5%、1.4%、9.0%、0.05%;(2)筆者提出的優化策略調用分析模型的次數分別是DRBF策略、TR-DRBF策略、LCB-DRBF策略、IMLCB-TR策略分析模型調用次數的26.3%、62.4%、39.7%和43.0%。
由此可見,從優化精度與優化效率來看,筆者所提ALCBTR-DRBF策略均優于DRBF策略、TR-DRBF策略、LCB-DRBF策略和IMLCB-TR策略。
(1)針對多學科優化設計的需求,筆者在現有動態徑向基函數代理模型方法的基礎上,提出了集合信賴域和置信下限準則的動態徑向基函數代理模型優化方法;
(2)筆者提出的ALCBTR-DRBF策略整合了信賴域方法和置信下限準則的優點,置信下限準則中的平衡常數,利用代理模型預測值與真實模型響應值之間的誤差與預測標準差的比較來確定,并在優化迭代更新的過程中不斷自適應變化,能有效減少因為試驗確定最佳平衡常數帶來的工作量;
(3)筆者選用減速器設計優化問題,驗證了該優化策略在工程優化領域的有效性;并與其他幾種方法進行了對比,證明ALCBTR-DRBF在優化精度與效率上有一定的優勢。
接下來,筆者需要做的工作是進一步驗證ALCBTR-DRBF策略在對更復雜的工程問題進行求解的有效性,進一步完善采用該策略在處理更高維問題時的性能;同時,還要研究初始樣本點的選取對該方法的影響,以便得到一個合理的初始樣本點挑選方法,更好地指導復雜的工程實際問題。