張 正
(溫州職業技術學院 電氣電子工程系,浙江 溫州 325035)
傳統的過程能力指數(CPK)方法[1]假設前提是數據樣本獨立,且分布相同,然而,這在現實應用中較難保障,在日益多維化的數據沖擊下已顯得力不從心。鑒于CPK方法的局限性,其在高精度、高相關性的過程能力控制環境中并不完全適用。
調整樣本熵AdSEn(Adjusted Sample Entropy)源于樣本熵,由香農信息熵發展而來,用于檢測數據的復雜度和混亂度,有應用于過程能力監測的前景[2-3]。AdSEn能通過可控數據段熵值與目標數據段熵值相除的商作為量化指標,且已被證實在理想的等權重多變量環境下,可得到較好的結果[4],但考慮到多變量環境中每個變量的真實影響并非全都一樣[5],其在應用中完全取代CPK的優勢尚未形成。本文針對AdSEn的算法原理,輔以魯棒性實驗設計,尋找最適合AdSEn方法的魯棒性實驗設計方案,提高AdSEn在過程能力控制上的實用性。
樣本熵值測量原有數列與新數列中,超過閾值的事件發生概率的比值負對數記為:

作為CPK的應用,可假設d [ui-uj]為樣本與目標值之差的絕對值。若目標為期望值,可單個數據為對比對象,也可取一段數據的平均值為對比對象;標準差為目標,則需求一定量樣本的標準差與目標標準差的距離。從樣本熵算法中可發現,一條公式、一個指數無法同時反應期望值與標準差的變化。
AdSEn算法對樣本熵的輸入進行調整,旨在將標準差和期望值的變化都融入到一個變量中去[6]。設樣本熵的元輸入為xij,調整變換后的輸入為yij。記第i樣本組為xi,xij為xi中第j個樣本, 為xi的均值。通過變換可將元樣本x中的變量變化添加到yij的均值變化上,且不改變元樣本分布。
田口方法是一種基于響應面的方法,將變化的誘因歸為可控因子和難控因子(即噪聲因子)兩類,旨在通過探究可控變量組合以削弱噪聲對實驗結果影響的研究,比想辦法改變或者消除難以控制的噪聲因子更簡單有效,且成本更低[7]。田口方法建立了一組交叉數列,并分析信號-噪聲比SNR(Signal-to-Noise Ratio),SNR比值越低,對應的參數組合所得的實驗結果越穩定。然而,田口方法并不能真正反饋連續性參數實驗情況下的最優解,且這種高低組合的2k實驗設計可能會導致模型匹配過程中的誤差,實驗契合度值得商榷。在應用過程中上述困難亟待解決。
由于田口方法的局限性,相關研究并未得到更多關注。然而,在參數健壯性設計RPD(Robust Parameter Design)領域的探索并沒有停止。通過定量實驗方法探索諸如PerMIA方法、Derringer方法和雙響應(Dual Res)方法等類似田口方法的手段與AdSEn結合,可降低不可控噪聲因子對實驗響應結果的影響,尋找提高AdSEn魯棒性的最佳實驗設計方案。
結合多變量環境,在田口方法的多變量應用的基礎上,通過量化的對比研究,探索AdSEn與類似田口方法的PerMIA方法、Derringer方法和雙響應方法的結合,對三種設計方案進行實驗比較。通過量化結果尋找AdSEn在過程能力控制上的最佳實驗設計方案,論證與AdSEn結合的適用場景,從而使AdSEn能更加適應高密度數據采集的工業環境。
以美國某煉鋼廠一套煉鋼工藝為例,該工藝含有5個變量,包括最高加熱溫度、加熱時間、轉運時間、軋鋼時間及不可控噪音變量,僅以煺火油溫為例加以說明。為確保數據的充分性和實驗的可重復性,利用微軟Access軟件模擬生成生產環境隨機數據,以人工隨機算法數據模擬不可控噪音,以可控參數作為輸入變量,通過對高、低實驗參數的設置,得到模擬的最終結果。其實驗設計參數見表1。

表1 實驗設計參數
軋鋼工藝的田口交叉數列[8]見表2。在田口方法中,需要找到SNR值最小的對應組合,即組合設計ABCD=(-, -, +, +),使實驗受到的噪音影響最小。
PerMIA方法是一種與田口方法類似基于響應面實驗設計的方法,也采用交叉數列的設計,不同之處在于PerMIA是建立兩組分開的模型:一組實驗模型針對實驗響應的期望值y的變化,另一組實驗模型針對實驗響應的變化因子S(如方差、標準差等),旨在將影響因子歸類為噪音相關因子和調整相關因子。通過實驗設計可找到兩種因子,選擇其中對變量影響最小和最接近標準期望值的參數配置,以獲得最優實驗參數設置。實驗采用類似2k實驗設計,記錄高、低噪聲情況下的輸出。高噪聲組記為“+”,計3次實驗:(+1, +2, +3);低噪聲組記為“-”,計3次重復實驗:(-1, -2, -3),如圖1所示。

表2 田口交叉數列

圖1 PerMIA方法的交叉矩陣
線性模型由統計軟件Minitab生成,Minitab能輸出線性模型分析結果(見表3)。

表3 線性模型S的主要成分
R-Sq(adj)為調整后的R2,即其比值越接近1,意味著模型的SSerror越小。調整后的R2,即R-Sq(adj)為旨在 消除新增變量對交叉模型的影響。當R-Sq(adj)越小,模型與響應面的匹配越弱。因此,需要進行一系列假設檢驗以估算噪聲相關因子S,這里S即為標準差。
由于此例只有8個標準差或中點,無足夠的自由度來運行全模型或交點測試,因而只能依次測試6個不同的交點和4個不同的均值測試。PerMIA方法測試顯示,AD和BC的交叉組合的R2值非常高,據此可判定在D=ABC模型中,AD和BC是有相關性的兩對變量。由于B, C的顯著性(P值結果)比A, D的顯著性更高,可選擇BC為模型中的交叉因子,得到模型:

用同樣的方法可得到均值Y的模型:

其結果見表4。
由(1)式可得,當(B, C)被設計為(-1, 1)時,變化最小,將B, C的參數設置值代入(2)式時,期望目標值為8, (2)式可變形為:Min(Y-8)2。由上述實驗結果,以Min(Y-8)2為目標方程,求最優解。通過線性運算模型在Excel Solver中的結果,可得到結論:當(A, D)=(0, -1)時,均值最接近Y=8。

表4 MINITAB關于y-均值的ANOVA輸出
Derringer方法與PerMIA類似,它將響應面模型的結果轉換為若干條獨立的渴望度目標方程(Individual Desirability目標為di),各條獨立的渴望度方程都有自己的渴望度di,然后將各di整合為一條總渴望度目標方程D,D的取值范圍為D∈[0, 1],越高的總渴望值說明其結果更理想。
當總渴望值最大值為理想值時:

當總渴望值最小值為理想值時:

當總渴望值(趨近)目標值為理想值時:

運用Minitab解例中的Derringer最優方程,可得最優解x*’=(0.1875, -1, 1, -0.8588),綜合渴望度(1*0.667)1/2=0.817。由圖2可知,S最小值(波動的最小值)S*=0.561,因而最接近的D值為:D=(dy*ds*)1/2=0.848。

圖2 PerMIA方法的Derringer’s解決方案
雙響應方法能通過實驗設計生成統計模型,在該模型中作出定義,如圖3所示。

圖3 雙響應方法的實驗設計
當去除不顯著交叉因子之后,該模型可達到非常高的匹配度。通過P值可看出,影響因子B,交叉因子OA, OD, AB, AC對響應y的影響較低;交叉因子OB具有相當高的P值,對模型影響較為明顯。因此,選取B為主要影響因子,并刪除模型中的OA, OD, AB,AC交叉因子。同時,DB與CD交叉因子的影響也非常小。
通過對y-均值的回歸系數估值(見表5)可得出如下結論:
響應面模型:

y-均值的ANOVA分析見表6。
通過上述模型可列出如下兩條目標方程:


表5 y-均值的回歸系數估值

表6 y-均值的ANOVA分析
將上述兩條方程聯列為線性規劃求最小值模型,以變化波動最小化為目標,以期望值=m的目標函數為限制條件的公式:

通過二進制搜索法,設噪聲O=0,期望值m=7至9(上下限),然后進行搜索,其搜索結果如圖4所示。由圖4可看出,當目標噪聲變量O=0時,理想結果收斂,m=8.8875時,最接近于8,如圖4b所示。其對應的實驗參數設計為:(A, B, C, D)=(0.44475, -1, 1,-0.29385)。
用同樣的方法測試噪聲因子O=[-1, 1],即非編碼變量130~170,當m=8.875時,其期望響應仍在目標范圍值內。因此,運用雙響應模型控制的變化因素非常穩定,可將O確定在一個非常小的值上。然而,這種方法需要犧牲目標值m的精確性。當m=8.875時,偏離了目標指標8。若在設計區間內,可接受這個結論;若不在設計區間內,這種方法不可取。雙響應方法的主要控制手段在于,利用m的值作為可調節的限制條件,以期獲得最小的O。其模擬結果如圖5所示。
PerMIA方法、Derringer方法和雙響應方法三種方法均采用編碼式變量的測試方法,檢驗三種實驗設計方案。Derringer方法與PerMIA方法類似,均分列均值和方差為不同方程;雙響應方法則采用預測模型對噪聲變量求偏導,由于其采用16次實驗,僅為另外二者交叉數列方式的48次實驗次數的1/3。通過對以上三種方法結果進行定量比較分析可看出,Derringer方法所得結果在目標值下,對噪聲的抵抗力最強,其箱型圖的25個百分點至75個百分點的區間最窄;雙響應方法可使結果更準確地靠近設計目標,但變量非常大;只有PerMIA方法的結果在8附近,且分布較窄,如圖6所示。

圖4 二進制搜索法尋找最適合的組合

圖5 8.75, 8.875, 9的箱型圖

圖6 三種方法仿真結果的箱型圖
由仿真結果可看出,若以期望值為目標,雙響應方法不但效果較好,且最節約成本。但雙響應方法的結果分布較散,方差巨大,穩定性極弱,且AdSEn算法的基礎需要大量的數據,因而與AdSEn結合時,雙響應方法并不能完全發揮其優勢。反之,若以最小變量為目的確定實驗參數配置時,Derringer方法為最優選項。但Derringer方法對期望值的控制能力較弱,偏差較大。AdSEn算法中,其檢測期望值偏差的能力遠遠強于檢測方差波動的能力,若與Derringer方法結合,相當于把AdSEn的強項作為一個限制條件,并不能完全發揮AdSEn算法本身的作用。PerMIA方法雖然不如Derringer方法精確,且比雙響應方法更昂貴,但PerMIA方法對期望值和方差的控制都較為準確。通過最直觀的實驗參數與實驗結果的關系的展示,PerMIA方法能通過調整參數快速作出響應,并提供最優解。
AdSEn算法本身擁有較高響應精度,能根據閾值的設置,調節響應敏銳度,與PerMIA方法非常相似,契合度極高。但AdSEn算法的量化水平不高,而PerMIA方法本身的檢測精度也有限,因而在矯正應用的實踐過程中仍需探索提高目標精度的方法。PerMIA方法與AdSEn的契合將是下一步研究方向,即在保障AdSEn方法高靈敏度的情況下,探索挖掘提高PerMIA與AdSEn結合的檢測精度。AdSEn方法需要大量的歷史數據作為支撐,在當前生產工具高度自動化、智能化的趨勢下,二進制搜索方法將變得越來越簡單。通過遞進算法,當將實驗目標設置為m的時候,計算機能快速計算出實驗結果可能的最小波動范圍。但當運用于生產實踐中,隨著數據的積累,PerMIA方法與AdSEn的契合可從實際生產數據中進行數據挖掘,運用深度學習,最終提高控制精度,實現精確質量控制的目標,成為最契合大數據的、新一代的過程能力控制解決方案。