周曉劍,高云龍
(南京郵電大學(xué) 管理學(xué)院,南京 210023)
穩(wěn)健參數(shù)設(shè)計(jì)(Robust Parameter Design,RPD)是基于試驗(yàn)設(shè)計(jì),結(jié)合統(tǒng)計(jì)知識(shí)和工程技術(shù)發(fā)展起來的一種質(zhì)量改進(jìn)方法[1]。其基本原理為選擇最佳的組合參數(shù)水平以使產(chǎn)品及過程對(duì)環(huán)境噪聲等不確定因素帶來的變化不敏感,從而降低產(chǎn)品質(zhì)量波動(dòng),提高產(chǎn)品及過程設(shè)計(jì)的穩(wěn)健性,使產(chǎn)品性能更加穩(wěn)定可靠[2]。計(jì)算機(jī)試驗(yàn)通過構(gòu)建元模型近似模擬物理試驗(yàn),在保證仿真優(yōu)化精度的同時(shí)大大降低了試驗(yàn)成本。對(duì)于元模型,人們進(jìn)行了大量的研究,其中,多項(xiàng)式模型由于其簡單高效的優(yōu)勢(shì)在模型擬合的使用中最為廣泛,但模型本身的局限性也很明顯,僅適用于低階問題仿真場景[3]。機(jī)器學(xué)習(xí)的蓬勃發(fā)展也推動(dòng)了對(duì)元模型的探索,如支持向量機(jī)(SVM)[4]、徑向基模型(RBF)[5]、神經(jīng)網(wǎng)絡(luò)模型(NN)[6]等。然而在實(shí)際工業(yè)生產(chǎn)中,相關(guān)數(shù)據(jù)的輸入輸出越趨復(fù)雜,越來越表現(xiàn)出高維性、非線性等特點(diǎn),以上提到的元模型很容易因數(shù)據(jù)的高維性造成計(jì)算困難,甚至?xí)萑刖S數(shù)災(zāi)難。高斯過程(Gaussian Process,GP)模型是一種基于貝葉斯推斷的機(jī)器學(xué)習(xí)方法,適用于處理高維性、非線性等復(fù)雜回歸問題[7]。基于以上優(yōu)良特性,GP模型被廣泛應(yīng)用于復(fù)雜工業(yè)過程建模領(lǐng)域,且在穩(wěn)健參數(shù)設(shè)計(jì)研究中具有優(yōu)良表現(xiàn)[8,9]。
傳統(tǒng)的穩(wěn)健參數(shù)設(shè)計(jì)是離線設(shè)計(jì),即在生產(chǎn)之前就確定好可控因子的最優(yōu)水平,且該水平在整個(gè)生產(chǎn)過程中并不改變。但在實(shí)際的工業(yè)生產(chǎn)中,環(huán)境因素(噪聲因子)實(shí)時(shí)變化會(huì)給參數(shù)設(shè)計(jì)帶來影響,導(dǎo)致可控因子最優(yōu)設(shè)置水平的準(zhǔn)確性往往得不到保證。為了提高生產(chǎn)設(shè)計(jì)中參數(shù)設(shè)計(jì)的可靠性,希望新的觀測數(shù)據(jù)能夠更新響應(yīng)面模型,從而實(shí)現(xiàn)穩(wěn)健參數(shù)設(shè)計(jì)的在線調(diào)整。對(duì)此,Zhou 等(2021)[10]提出了一種序貫SVR的在線穩(wěn)健參數(shù)設(shè)計(jì)方法,他將先前得到的可控因子最優(yōu)設(shè)置水平以及現(xiàn)階段觀測到的噪聲因子水平作為新的數(shù)據(jù)樣本更新響應(yīng)面模型,進(jìn)而在下一階段得到更可靠的參數(shù)設(shè)置水平。然而其研究仍存在一些不足,主要表現(xiàn)在精度和效率二者不能兼顧。
基于上述問題,本文將采用在線學(xué)習(xí)策略改進(jìn)的OGP模型作為元模型構(gòu)建響應(yīng)面,在實(shí)現(xiàn)穩(wěn)健參數(shù)設(shè)計(jì)實(shí)時(shí)調(diào)整的同時(shí)進(jìn)一步提高了建模效率,進(jìn)而提出了一種在線穩(wěn)健參數(shù)設(shè)計(jì)方法(OGP-RPD)。
GP 模型是一種基于貝葉斯框架的非參數(shù)建模方法,它可以用未知的先驗(yàn)信息來探索輸入變量和輸出響應(yīng)之間的復(fù)雜關(guān)系[11]。
給定數(shù)據(jù)樣本集合D={(xi,yi)|i=1,…,n},xi∈Rm,其中,xi為輸入,yi為輸出。假設(shè)輸入x與輸出y之間的函數(shù)關(guān)系為:
其中,ε是與f(x)獨(dú)立同分布的隨機(jī)噪聲,即高斯噪聲(ε~N(0,))。f(x)是預(yù)測函數(shù),其值為預(yù)測輸出,服從高斯過程分布:
其中:μ(x)表示高斯過程的均值函數(shù),為簡化計(jì)算,通常取值為0;k(x,x')表示高斯過程的協(xié)方差函數(shù),本文選取靜態(tài)平穩(wěn)高斯過程中最常用的平方指數(shù)協(xié)方差函數(shù)。樣本xi和樣本xj之間的協(xié)方差函數(shù)定義如下:
其中:wd為模型的測度函數(shù),用于衡量不同輸入維度的權(quán)重;為幅度參數(shù),表示局部相關(guān)性的程度;為服從高斯分布的噪聲方差。以上參數(shù)組合成為協(xié)方差函數(shù)的超參數(shù)集合,表示為,Dim是輸入數(shù)據(jù)樣本的維數(shù),δij為Kronecker 算子(δij=1 ifi=jand 0 otherwise)。
基于以上模型假設(shè),對(duì)于給定訓(xùn)練集X,可以得到測試樣本x*處的預(yù)測輸出和預(yù)測方差:
其中:K是K(X,X)的縮寫,表示訓(xùn)練數(shù)據(jù)集的協(xié)方差矩陣;K*是K(X,x*)的縮寫,表示訓(xùn)練集X與測試樣本x*之間協(xié)方差的向量;k*是k(x*,x*)的縮寫,表示測試樣本本身的協(xié)方差。
在確定協(xié)方差函數(shù)類型后,需要對(duì)其超參數(shù)集合Θ進(jìn)行優(yōu)化調(diào)整。本文根據(jù)ARD原理[12],選擇極大似然法來優(yōu)化超參數(shù)。模型超參數(shù)的對(duì)數(shù)邊際似然表示如下:
其中,Ky=K+I。將求解上述對(duì)數(shù)邊際似然的最大值轉(zhuǎn)換為其負(fù)對(duì)數(shù)邊際似然的最小值,即可得到:
接下來利用梯度信息求解,得到超參數(shù)Θ的導(dǎo)數(shù):
其中,α=K-1y。一般情況下采用梯度下降的共軛梯度法搜索超參數(shù)的最優(yōu)解。
本文采用在線學(xué)習(xí)策略改進(jìn)現(xiàn)有的GP 模型,使其具備處理流式數(shù)據(jù)的能力。隨著樣本數(shù)據(jù)的不斷增加,增量算法會(huì)面臨存儲(chǔ)空間飽和、歷史樣本價(jià)值降低等問題。尤其是當(dāng)協(xié)方差矩陣K的規(guī)模不斷增大時(shí),矩陣處理的計(jì)算成本呈指數(shù)級(jí)增長,甚至?xí)萑刖S數(shù)災(zāi)難,因此,設(shè)置數(shù)據(jù)集的容量上限是有必要的。當(dāng)樣本數(shù)量增加至數(shù)據(jù)集容量上限時(shí),需要在新增樣本的同時(shí)刪去一個(gè)對(duì)模型影響程度最小的舊數(shù)據(jù),也就是減量算法。這樣一來,在增量算法和減量算法的共同作用下,可以始終保持訓(xùn)練數(shù)據(jù)的規(guī)模不變,能夠在保證合理的計(jì)算復(fù)雜度的基礎(chǔ)上實(shí)現(xiàn)GP模型的在線更新以及對(duì)新樣本的預(yù)測。在線高斯過程(Online Gaussian Process,OGP)模型的基本原理如圖1 所示。

圖1 OGP模型原理
從圖1可以看出,OGP模型主要需要解決兩個(gè)關(guān)鍵問題:(1)篩選出舊樣本;(2)更新模型與超參數(shù)。
針對(duì)第一個(gè)問題,由于需要從訓(xùn)練數(shù)據(jù)集中刪除一個(gè)對(duì)模型影響程度最小的樣本,因此引入信息論中信息增益的概念(數(shù)據(jù)樣本間的信息增益反映影響模型的程度)。利用式(6)中的對(duì)數(shù)邊際似然來表示數(shù)據(jù)樣本間的信息增益。當(dāng)從含有n個(gè)樣本的訓(xùn)練數(shù)據(jù)集中刪除一個(gè)數(shù)據(jù)樣本時(shí),需要計(jì)算n-1 個(gè)數(shù)據(jù)樣本的對(duì)數(shù)邊際似然。對(duì)數(shù)邊際似然越高意味著n-1 個(gè)數(shù)據(jù)樣本的信息增益越高,同時(shí)也就意味著剩余的那個(gè)數(shù)據(jù)對(duì)模型的影響越小。這樣一來,數(shù)據(jù)樣本的信息增益可以通過式(7)來計(jì)算。此外,本文引入一種遺忘機(jī)制來調(diào)整減量規(guī)則,從時(shí)間序列的角度分析,越晚加入訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)對(duì)模型的影響程度越大,所以刪除較早加入的數(shù)據(jù)是合理的?;谏鲜鏊枷?,本文給出減量算法的準(zhǔn)則:
其中,λ為遺忘因子,n為當(dāng)前數(shù)據(jù)樣本的序列號(hào),c為當(dāng)前加入訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)樣本的序列號(hào)。利用式(9)計(jì)算得到舊數(shù)據(jù)的信息增益,并從中找到信息增益最小的舊數(shù)據(jù)樣本,將其從訓(xùn)練數(shù)據(jù)集中刪除。
針對(duì)第二個(gè)問題,在線算法基于前一階段的計(jì)算結(jié)果進(jìn)行更新迭代,以最小的計(jì)算代價(jià)實(shí)現(xiàn)模型的更新。所以無論是增加樣本還是刪除樣本,更新GP 模型實(shí)質(zhì)上體現(xiàn)在協(xié)方差矩陣的更新。本文的在線迭代策略是一種基于貝葉斯方法的近似技術(shù)[13,14]。
根據(jù)GP 模型的定義,當(dāng)加入新樣本xn+1時(shí),均值μn與協(xié)方差函數(shù)kn(x,x')增量更新的近似值可以由式(10)迭代計(jì)算:
其中,系數(shù)qn+1和rn+1分別是對(duì)數(shù)似然的一、二階導(dǎo)數(shù):
其中,Z=E{P(yn+1|fn+1(x))}n是已知的完全數(shù)據(jù)似然函數(shù)。
展開式(11)中的更新遞歸步驟得到GP模型后驗(yàn)概率的近似值:
其中:kn+1=kxn+1;en+1是n+1 階單位向量;Tn+1和Un+1是增加樣本后擴(kuò)展矩陣的n+1 維算子,是通過在向量的末尾和矩陣的最后一行和一列添0得到的。
利用上述遞歸方式可以實(shí)現(xiàn)增量過程的迭代更新,系數(shù)規(guī)模也將隨著新數(shù)據(jù)樣本的到來不斷增加。當(dāng)數(shù)據(jù)樣本增加至訓(xùn)練數(shù)據(jù)集容量上限時(shí),需要進(jìn)行減量操作,系數(shù)更新如下:
對(duì)于模型的超參數(shù)來說,本文沿用前文提到的GP 模型的超參數(shù)尋優(yōu)方法,利用式(7)求取最大似然,之后采用共軛梯度法尋優(yōu)超參數(shù)。
以上闡述了OGP模型的兩個(gè)關(guān)鍵性問題。由此根據(jù)圖1所示的OGP模型原理圖總結(jié)OGP模型具體步驟如下:
步驟1:加入新數(shù)據(jù)樣本。
步驟2:判斷訓(xùn)練數(shù)據(jù)集是否達(dá)到規(guī)模上限。若未達(dá)到則轉(zhuǎn)步驟4;若已達(dá)到則轉(zhuǎn)步驟3。
步驟3:計(jì)算數(shù)據(jù)樣本iGain,刪除信息增益最小的舊數(shù)據(jù)樣本。
步驟4:更新OGP模型。
步驟5:更新OGP模型超參數(shù)。
重復(fù)步驟1至步驟5,直至沒有新樣本用于更新模型。
在響應(yīng)面方法(Response Surface Methodology,RSM)的理論指導(dǎo)下,發(fā)展出兩種RPD建模策略:一種是雙響應(yīng)模型方法,分別對(duì)響應(yīng)值的均值和方差建模;另一種是單響應(yīng)模型方法,控制變量和噪聲變量共同作用于同一模型。其中方差響應(yīng)面是由均值模型來確定的[15]。本文擬采用單響應(yīng)模型方法構(gòu)建優(yōu)化模型。
構(gòu)建優(yōu)化模型的方法同樣有很多,大致思想為在保持均值的同時(shí)最小化方差或者在保持方差小于一定閾值的同時(shí)最小化均值和目標(biāo)值的偏差。
不同于以上兩種思想,Lin 和Tu(1995)[16]提出了一個(gè)更簡單的解決方案:
該方法不是圍繞特定響應(yīng)(均值或方差)進(jìn)行優(yōu)化,而是圍繞目標(biāo)值進(jìn)行優(yōu)化。本文將式(15)作為RPD優(yōu)化模型的目標(biāo)函數(shù)。其中,y^ 表示響應(yīng)面模型的預(yù)測輸出,T表示相應(yīng)質(zhì)量特征的目標(biāo)值。
在OGP-RPD 方法中,將OGP 模型用于構(gòu)建響應(yīng)面,其輸入是可控因子和噪聲因子的組合(xc,xe),輸出則是與生產(chǎn)過程/產(chǎn)品質(zhì)量相關(guān)的屬性值y(xc,xe),其理想目標(biāo)值為T。在線RPD的思想為利用上一階段獲得的可控因子設(shè)置水平,將由當(dāng)前階段觀察到的噪聲因子以及對(duì)應(yīng)的響應(yīng)值組成的數(shù)據(jù)樣本{(xc,xe),y(xc,xe)}作為新樣本更新RPD 過程,即通過新樣本更新OGP 模型進(jìn)而得到下一階段的可控因子設(shè)置水平。按照上述規(guī)則不斷對(duì)生產(chǎn)過程/產(chǎn)品質(zhì)量進(jìn)行在線調(diào)整,直至獲得可控因子的最優(yōu)設(shè)置水平。下面詳細(xì)闡述OGP-RPD方法的具體實(shí)現(xiàn)步驟:
步驟1:選擇初始數(shù)據(jù)樣本。利用拉丁超立方抽樣(Latin Hypercube Sampling,LHS),同時(shí)基于maxmin 準(zhǔn)則抽取初始樣本點(diǎn)Sn={ }s1,s2,…,sn,每個(gè)樣本輸入均包含可控因子和噪聲因子兩個(gè)部分,即表示為si=(xci,xei),樣本輸入對(duì)應(yīng)的響應(yīng)輸出為y(·) 。
步驟2:構(gòu)建響應(yīng)面模型。利用OGP模型擬合抽取的初始數(shù)據(jù)樣本,構(gòu)建響應(yīng)面模型,探索樣本輸入與輸出之間的函數(shù)關(guān)系
步驟3:構(gòu)建噪聲樣本分布簇。采用蒙特卡洛方法模擬高斯噪聲因子的分布,隨機(jī)生成ne個(gè)噪聲樣本。
步驟4:求解可控因子最優(yōu)設(shè)置水平。利用優(yōu)化策略式(15)中最小化偏差的思想構(gòu)建RPD 優(yōu)化模型,求解可獲得當(dāng)前階段的可控因子最優(yōu)設(shè)置水平。優(yōu)化模型的目標(biāo)函數(shù)如下:
其中,預(yù)測方差參見式(5),可得:
步驟6:更新OGP 模型,重復(fù)RPD 流程。用步驟5 中獲得的新樣本更新響應(yīng)面模型(OGP),重復(fù)步驟3至步驟5,在線更新RPD 流程,直至得到滿足優(yōu)化終止條件的可控因子最優(yōu)設(shè)置水平,算法終止,在線RPD結(jié)束。
在步驟6 中,主要從以下兩個(gè)方面衡量RPD 是否有效:一方面,當(dāng)獲得的參數(shù)最優(yōu)設(shè)置水平與真實(shí)值(產(chǎn)品或過程潛在的真實(shí)參數(shù)最優(yōu)設(shè)置,在生產(chǎn)實(shí)踐中往往可以根據(jù)大量實(shí)驗(yàn)獲得)之間的偏差很小時(shí),可認(rèn)為已經(jīng)達(dá)到了好的RPD 效果,算法可以終止;另一方面,當(dāng)獲得的參數(shù)最優(yōu)設(shè)置水平維持在一定水平且相對(duì)波動(dòng)較小時(shí),算法也可以終止。
在生產(chǎn)實(shí)踐中,當(dāng)工程師們獲得推薦的參數(shù)最優(yōu)設(shè)置水平時(shí),并非直接將其應(yīng)用于產(chǎn)品生產(chǎn)或過程控制中,而是需要在該參數(shù)水平下進(jìn)行數(shù)次驗(yàn)證試驗(yàn)。由于噪聲因子的影響,可能會(huì)得出多個(gè)不同的輸出響應(yīng)值,這時(shí)可以計(jì)算這些響應(yīng)的均值和方差,進(jìn)而計(jì)算當(dāng)前參數(shù)水平下的均方誤差(MSE)。可以將MSE作為一種有效的評(píng)估指標(biāo),如果算法推薦的參數(shù)水平不夠理想,那么可以選擇在整個(gè)在線RPD過程中MSE值最小的參數(shù)設(shè)計(jì)水平作為參數(shù)最優(yōu)設(shè)置水平。
本文選取了一個(gè)仿真算例和一個(gè)實(shí)證算例,均屬于研究復(fù)雜產(chǎn)品質(zhì)量設(shè)計(jì)問題的經(jīng)典案例。通過與Zhou 等(2021)[10]提出的在線穩(wěn)健參數(shù)設(shè)計(jì)方法(SSVR-RPD)進(jìn)行對(duì)比,從而驗(yàn)證本文所提方法(OGP-RPD)在穩(wěn)健參數(shù)設(shè)計(jì)問題上的有效性和優(yōu)越性。
本實(shí)驗(yàn)采用Branin函數(shù)[17]作為仿真測試函數(shù),Branin函數(shù)被廣泛應(yīng)用于計(jì)算機(jī)實(shí)驗(yàn)。其函數(shù)定義在χ=[-5,10]×[0,15]范圍內(nèi),表示如下:
假設(shè)上述定義式中變量x1是可控因子,x2是噪聲因子且服從高斯分布(x2~N(0.5,1)),y(·) 表示在可控因子和噪聲因子共同作用下的真實(shí)系統(tǒng)的響應(yīng)值。
為了驗(yàn)證所提方法(OGP-RPD)是否能夠有效地找到可控因子的最優(yōu)設(shè)置水平,需要先知道仿真系統(tǒng)可控因子潛在的真實(shí)最優(yōu)水平。本文將式(15)中的響應(yīng)面替換為本實(shí)驗(yàn)中的Branin函數(shù),然后通過求解優(yōu)化問題即可得到仿真系統(tǒng)潛在的真實(shí)可控因子最優(yōu)設(shè)置水平。式(15)中T表示函數(shù)系統(tǒng)的響應(yīng)目標(biāo)值,在本次實(shí)驗(yàn)中是根據(jù)Branin函數(shù)的真實(shí)分布情況來設(shè)置的。然而從數(shù)學(xué)的角度精準(zhǔn)計(jì)算是比較困難的,尤其在不可積的情況下更是難以完成。因此本文統(tǒng)一采用蒙特卡洛近似方法進(jìn)行積分近似求解,為此隨機(jī)產(chǎn)生1×105個(gè)高斯白噪聲樣本。在得到的近似解后,利用MATLAB工具箱中的fmincon函數(shù)求解式(15)表示的最優(yōu)化問題,得出Branin函數(shù)仿真系統(tǒng)的可控因子最優(yōu)設(shè)置水平??煽匾蜃幼顑?yōu)設(shè)置水平被確定后,即可以根據(jù)生成的1×105個(gè)噪聲樣本計(jì)算對(duì)應(yīng)響應(yīng)值y(·) 及其波動(dòng)情況,將其記為MeanY和VarY。由于本文采用的是近似求解,而且每次生成的噪聲因子樣本是不同的,因此為了降低不確定性,重復(fù)上述優(yōu)化求解過程10次并求取平均值,最終得到Branin函數(shù)仿真系統(tǒng)的數(shù)據(jù)結(jié)果(如表1所示)。從表1中可以看出,Branin函數(shù)仿真系統(tǒng)的可控因子潛在真實(shí)最優(yōu)設(shè)置水平為5.1808,其MeanY的值穩(wěn)定在57.8268左右,且波動(dòng)較小。

表1 仿真算例可控因子真實(shí)最優(yōu)設(shè)置水平
為了驗(yàn)證OGP-RPD是否能夠準(zhǔn)確有效地找到可控因子的真實(shí)最優(yōu)設(shè)置水平,基于高斯過程的在線穩(wěn)健參數(shù)設(shè)計(jì)(OGP-RPD)的過程如下:
第一步:確定初始數(shù)據(jù)集。在實(shí)際生產(chǎn)中,工程師們根據(jù)生產(chǎn)過程中生成的樣本構(gòu)建模型。而在本文的仿真實(shí)驗(yàn)中,生產(chǎn)過程由式(19)表示。本文采用LHS方法,遵循maxmin準(zhǔn)則隨機(jī)從系統(tǒng)中抽取20個(gè)樣本點(diǎn),并獲得其對(duì)應(yīng)響應(yīng)值。每個(gè)數(shù)據(jù)樣本由影響因子(可控因子與噪聲因子的組合)及其對(duì)應(yīng)響應(yīng)值組成,記為{(x1,x2),y(·) }。
第二步:構(gòu)建響應(yīng)面模型。將上述抽取的20個(gè)數(shù)據(jù)樣本作為初始訓(xùn)練數(shù)據(jù)集,采用OGP模型構(gòu)建響應(yīng)面。
第三步:求解優(yōu)化策略。用得到的OGP模型替換優(yōu)化策略(見式(15))中的響應(yīng)面,當(dāng)前狀態(tài)下的優(yōu)化策略變成式(16),求解式(16)中的優(yōu)化問題需要計(jì)算期望值,考慮到所建模型的函數(shù)可能不可積,因此依舊采用蒙特卡洛方法來近似求解,為此隨機(jī)生成了ne個(gè)噪聲樣本(ne=1×104),其服從的分布為N(0,0.5)。然后可以通過MATLAB工具箱中的fmincon 函數(shù)進(jìn)行求解,進(jìn)而可以得到當(dāng)前的可控因子最優(yōu)設(shè)置水平,如表2所示。

表2 OGP-RPD仿真算例實(shí)驗(yàn)結(jié)果
第四步:判斷當(dāng)前可控因子的最優(yōu)設(shè)置水平是否達(dá)到優(yōu)化終止條件。通過當(dāng)前可控因子的最優(yōu)設(shè)置水平處ne個(gè)噪聲樣本可以計(jì)算MeanY和VarY,結(jié)果如表2 所示。可以看到,第一次參數(shù)設(shè)計(jì)得到的可控因子最優(yōu)設(shè)置水平為-3.0343,對(duì)應(yīng)的MeanY值為24.6524。很顯然與表1中的真實(shí)數(shù)據(jù)相比,二者都相差甚遠(yuǎn)。得到的可控因子設(shè)置水平不理想,其中一個(gè)重要原因是噪聲因子的影響導(dǎo)致構(gòu)建的OGP 模型不夠準(zhǔn)確,這時(shí)就需要增加新樣本更新OGP模型。
第五步:確定新樣本并更新響應(yīng)面模型。根據(jù)OGP-RPD 方法原理,在當(dāng)前階段獲得的可控因子最優(yōu)設(shè)置水平下,利用式(17)找出影響波動(dòng)最大的噪聲因子并將其作為新樣本噪聲因子的觀測值。同時(shí)可以根據(jù)式(19)求得當(dāng)前的輸出響應(yīng)值。由此得到新樣本,將其加入訓(xùn)練數(shù)據(jù)集更新響應(yīng)面模型y^OGP。
重復(fù)第三步到第五步的實(shí)驗(yàn)流程,直至找到滿足優(yōu)化終止條件的可控因子最優(yōu)設(shè)置水平。從表2 展示的實(shí)驗(yàn)結(jié)果來看,當(dāng)更新迭代到第9 次時(shí),可控因子的最優(yōu)設(shè)置水平為5.1768,其對(duì)應(yīng)的MeanY值為57.8564,這與表1中Branin 函數(shù)仿真系統(tǒng)的可控因子真實(shí)最優(yōu)設(shè)置水平極為接近,且MSE值也相對(duì)較低。由此可以證明OGP-RPD方法能夠有效找到理想的可控因子最優(yōu)設(shè)置水平。
為了證明本文所提OGP-RPD 方法的先進(jìn)性,采用目前在線RPD 研究中表現(xiàn)較為優(yōu)異的SSVR-RPD 方法[7]進(jìn)行對(duì)比分析,實(shí)驗(yàn)結(jié)果如表3所示。可以看到,SSVR-RPD方法更新迭代至第18到20次時(shí)才得到了較為理想的可控因子最優(yōu)設(shè)置水平。由此可以得出結(jié)論:OGP-RPD 方法可以更精準(zhǔn)地得到可控因子的最優(yōu)設(shè)置水平,且效率遠(yuǎn)高于SSVR-RPD方法。

表3 SSVR-RPD仿真算例實(shí)驗(yàn)結(jié)果
某個(gè)半導(dǎo)體零件加工過程實(shí)驗(yàn)[18]共包含5 個(gè)影響因子,其中包括2 個(gè)可控因子(x1,x2)和3 個(gè)噪聲因子(z1,z2,z3) 。此實(shí)驗(yàn)以5 個(gè)影響因子的標(biāo)準(zhǔn)CCD 設(shè)計(jì)為基礎(chǔ),刪去了與3個(gè)噪聲因子有關(guān)的軸向試驗(yàn)點(diǎn)的中心復(fù)合設(shè)計(jì),共進(jìn)行23次實(shí)驗(yàn)。最后得出在可控因子、三個(gè)噪聲因子與響應(yīng)輸出之間具有二階模型,擬合的響應(yīng)模型為:
在生產(chǎn)過程中,質(zhì)量特性的目標(biāo)值為T=30。噪聲因子服從均值為0、方差為1 的正態(tài)分布,即z1~N(0,1),z2~N(0,1) 和z3~N(0,1) 。
與之前仿真算例的流程類似,利用式(20)所表示的真實(shí)響應(yīng)模型確定半導(dǎo)體零件加工過程中可控因子的真實(shí)最優(yōu)設(shè)置水平,相關(guān)結(jié)果見表4。

表4 實(shí)證研究算例可控因子真實(shí)最優(yōu)設(shè)置水平
就OGP-RPD方法的有效性而言,整個(gè)在線RPD過程與仿真實(shí)驗(yàn)程序一致。實(shí)驗(yàn)的最終結(jié)果如表5所示。

表5 OGP-RPD實(shí)證研究算例實(shí)驗(yàn)結(jié)果
當(dāng)更新迭代至第10次時(shí),可以看到MeanY已趨于平穩(wěn)且非常接近表4中真實(shí)的響應(yīng)輸出值,此外MSE值也達(dá)到了相對(duì)較低的水平,因此能夠判定達(dá)到了優(yōu)化終止條件。下頁表6展示了SSVR-RPD方法的實(shí)驗(yàn)結(jié)果,可以看到更新迭代至第20 至25 次時(shí),MeanY值趨于穩(wěn)定,且MSE 值已達(dá)到全局最低水平。通過對(duì)比兩個(gè)方法的實(shí)驗(yàn)結(jié)果,很顯然OGP-RPD 方法尋找到的可控因子最優(yōu)水平更理想,輸出響應(yīng)更接近真實(shí)響應(yīng)目標(biāo)值,且效率更高。

表6 SSVR-RPD實(shí)證研究算例實(shí)驗(yàn)結(jié)果
綜合上述兩組實(shí)驗(yàn)結(jié)果可知,OGP-RPD 方法能夠有效找到可控因子的最優(yōu)設(shè)置水平,且較好地兼顧了輸出響應(yīng)的最優(yōu)性和穩(wěn)健性。
傳統(tǒng)的RPD方法是離線設(shè)計(jì),受環(huán)境因素的影響,通過一次性建模獲得的可控因子設(shè)置水平可能并不理想。對(duì)此本文提出了一種基于GP 模型的在線RPD 方法(OGP-RPD)。本文采用滑動(dòng)窗口的在線策略改進(jìn)傳統(tǒng)GP模型,使其具備處理流式數(shù)據(jù)的能力,將其稱為OGP模型。利用OGP 模型構(gòu)建響應(yīng)面,并基于響應(yīng)面理論中的單響應(yīng)優(yōu)化策略提出了一套完整的在線RPD流程。通過仿真算例與實(shí)證研究,將OGP-RPD 方法與現(xiàn)有的SSVR-RPD 方法進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明,OGP-RPD 方法在尋找可控因子的最優(yōu)設(shè)置水平方面準(zhǔn)確度更高,能夠更好地兼顧輸出響應(yīng)的最優(yōu)性和穩(wěn)健性,且效率更高。由此可以得出結(jié)論,OGP-RPD 方法可以有效解決RPD 離線設(shè)計(jì)帶來的問題,能夠更好地應(yīng)用于產(chǎn)品或過程的在線質(zhì)量設(shè)計(jì),對(duì)于提高產(chǎn)品質(zhì)量具有重要理論和實(shí)踐意義。