王志瓊 李金夢 王 穎 馬彥輝
天津理工大學管理學院,天津,300384
統計過程控制(statistical process control,SPC)是一種將統計技術應用于過程監控的方法,該方法通過控制圖等工具監控過程的穩定性,以確保最終產品的質量[1]。在實際中,某些產品或過程的質量特性需要用函數關系表示,如產品故障率與使用時間的關系,這種響應變量與一個或多個解釋變量之間的函數關系稱為輪廓(profile)[2]。對由一系列輪廓組成的時間序列數據進行監控被稱為輪廓監控[3]。根據輪廓響應變量的性質,輪廓可分為兩種類型:一種是具有數值響應變量的輪廓,另一種是響應變量為屬性(計數或分類)數據的輪廓。對于第二種輪廓,大部分監控方法沒有考慮響應屬性之間的序數信息(例如,好、中和差),而這些信息對構建控制方案具有重要的作用。NOOROSSANA等[4]通過使用序數邏輯回歸擬合輪廓模型,提出了4種方法來監控序數輪廓,這是對序數輪廓的首次研究。HAKIMI等[5]使用序數列聯表擬合序數變量之間的關系,并提出了一種基于序數正態統計量的控制圖,用于監控序數對數線性模型。DING等[6]假設存在一個潛在的連續變量決定響應變量的水平,提出了一種新的控制方案,用于監控參數回歸模型。本文針對響應變量為序數數據的輪廓,采用非參數模型擬合函數關系,并使用經典的廣義似然比(generalized likelihood ratio,GLR)控制圖對該函數關系進行監控。
輪廓監控一般分兩個階段進行,即階段Ⅰ和階段Ⅱ。階段Ⅰ是以采集到的歷史樣本數據為基礎,剔除失控(out-of-control,OC)樣本點,以確保剩下樣本均處于受控(in-control,IC)狀態,從而建立穩定的IC模型。階段Ⅱ是在階段Ⅰ建立的IC模型的基礎上對實時數據進行監控,以及時發現過程異常[1]。階段Ⅱ控制圖的構建往往是假設IC模型已知或者可以被完全精確估計[7-8]。然而,在實際中,模型通常是未知的,需要通過階段Ⅰ的分析,剔除異常點和變點以確保樣本處于IC狀態,然后進行模型估計。因為模型估計值具有波動性,所以在監控過程中使用估計值代替已知模型可能會影響階段Ⅱ控制圖的性能。在根據階段Ⅰ的IC輪廓數據集估計模型時,MAHMOUD[9]評估了監控簡單線性輪廓的方案的性能。YAZDI等[10]比較參數估計對監控多元簡單線性輪廓的3種階段Ⅱ方法性能的影響。更多詳細內容見文獻[11-17]。本文的主要目的是探討在IC模型未知且被估計量取代的情況下,模型估計對階段Ⅱ序數輪廓控制圖性能的影響。
首先,樣本量在模型估計中起較大的作用, JONES等[18]討論了樣本量大小對控制圖性能的影響,認為要獲得與模型已知時類似的結果,需要較大的樣本量。其次,可以選用不同的估計方法,主要分為兩大類:參數方法[6]和非參數方法[19]。本文主要使用兩種非參數方法即局部線性核估計(local linear kernel estimation,LLKE)和樣條法(spline),以及參數方法Newton Raphson。最后,在不同的估計方法中,涉及到相應參數的設置問題(例如LLKE中參數c的取值對估計曲線的平滑度有很大影響)。針對不同的參數設置,本文將通過仿真以及案例進一步探討樣本量大小、估計方法對序數輪廓控制圖的IC和OC性能的影響,直觀地展現出選擇合適的樣本量和模型估計方法的重要性。
為了簡化表示,本文考慮的模型中僅有1個協變量。假設隨著時間的推移,收集到第j(j≥1)個輪廓。yji是第j個輪廓中的第i個響應觀測值,xi是相應的解釋變量(i=1,2,…,Nj),其中Nj是第j個輪廓中的設計點數。假設yji是具有K個屬性級別的有序響應變量,且yji服從參數為nji和pji的多項式分布,其中nji=yji1+yji2+…+yjiK,pji=(pji1,pji2,…,pjiK)T。對于不同的j和i,nji取相同的值n,yjik表示第j個輪廓中處在k級的第i個響應變量,pjik表示yji處在k級的概率。令cjik為k級的累積概率(k=1,2,…,K)。因此cjik=Pr(yji 在對序數響應變量和解釋變量之間的關系進行建模時,MCCULLAGH[20]提出的比例優勢比模型應用較多,IZADBAKHSH等[21]將比例優勢比模型作為擬合序數響應變量與解釋變量之間函數關系的基礎,DING等[6]使用以下參數比例優勢比模型對序數輪廓進行建模: logit(ck)=αk+XTβk=1,2,…,K-1 本文使用以下非參數比例優勢比模型擬合序數輪廓的回歸模型: logit(cjik)=gk(xjik) (1) j=1,2,…i=1,2,…,Njk=1,2,…,K-1 其中,gk(·)是未知的平滑函數;xjik為第j個輪廓中處于k級的第i個響應變量對應的解釋變量。 一般來說,輪廓設計點可以是固定不變的(即固定設計)也可以是隨機的(即隨機設計)。本文只考慮固定設計,將隨機設計的方法留待以后研究。也就是說,對于不同的j,取Nj為相同的值N。對于不同的輪廓,解釋變量x=(xji,xj(i+1),…,xjN)T是已知且固定的,其中xji表示第j個輪廓的第i個響應變量對應的解釋變量。 序數輪廓的響應變量yji服從多項式分布,根據非參數比例優勢比模型(式(1)),可以得到第j個輪廓的對數似然函數(省略常數項): (2) 式(1)的監控問題可以看作是回歸函數gk(·)的假設檢驗問題,原假設和備擇假設分別如下: 本文主要通過3種模型估計方法對非參數比例優勢比模型(式(1))進行估計,分別是非參數方法LLKE、樣條法,以及參數方法Newton Raphson。對于這兩類模型估計方法,參數方法將輪廓函數擬合為線性、非線性和其他復雜模型,非參數方法則不對模型做過多的假設和約束。本文關注非參數和參數方法在模型估計中的擬合精度問題。 1.2.1局部線性核估計法 局部平滑法是估計非參數函數的常用方法之一。局部擬合方法包括局部常數擬合方法和局部多項式擬合方法。與前者相比,后者在擬合過程中沒有邊界效應,擬合結果更好。本文利用局部多項式擬合的一種特殊情況——局部線性擬合來估計未知函數gk。 特別地,在給定的x0的鄰域內,函數gk(xjik)通過泰勒展開式展開為線性函數: 據FAN等[22]分析可知,對數似然函數(式(2))的核函數為Kh(xji-x0),其中h為帶寬參數。因此局部加權對數似然函數可表示為 (3) βk的估計可通過迭代加權最小二乘法(iterative weighted least squares,IWLS)的迭代過程來獲得。YEH等[23]簡要說明了使用IWLS法估計輪廓參數的步驟。為了便于表達而不影響理解,以下公式省略了一些下標。增廣因變量可定義為 zk=(z1k,z2k,…,zNk)T gk=(gk(x1),gk(x2),…,gk(xN))T Wk=diag(w1k,w2k,…,wNk) yk=(y1k,y2k,…,yNk)T μk=(μk(x1),μk(x2),…,μk(xN))T 此外,根據多項式分布的均值和方差公式以及回歸函數gk(xi)的估計,可以得到 wik=npik(1-pik)μk(xi)=npik i=1,2,…,Nk=1,2,…,K-1 基于上述條件,可以通過求解以下IWLS方程來獲得βk的估計值: Kh(xN-x0)) 使用局部擬合方法的一個重要問題就是確定局部鄰域,該鄰域主要是由核函數Kh(·)和帶寬參數h決定的。本文選取Epanechnikov核函數: 其中,I(·)是指示函數。對于帶寬h的選擇,建議使用以下經驗帶寬公式[24]: (4) 1.2.2樣條法 樣條法不再將樣本數據集當作一個整體,而是將它劃分成一個個連續區間,劃分的點稱為節點(knot),并用單獨的模型(線性函數或低階多項式函數)來擬合。 樣條估計包括光滑樣條估計、多項式樣條估計、懲罰樣條估計和局部自適應回歸樣條估計等方法??紤]到本文輪廓解釋變量中N的選擇問題,以及多項式樣條對節點的個數以及位置較敏感,本文選擇多項式樣條對回歸函數gk進行估計。通常情況下,當多項式的階數達到3時樣條法就可獲得較高的估計精度,因此針對一個輪廓下的gk,本文使用三次多項式進行擬合。 其中,θs為系數;s為函數f(x)的項數。令gk(x)=fk(x)+ε(ε為誤差項),則回歸函數gk(x)的估計問題轉化為gk(x)-fk(x)=ε的最小化問題: 令 以上為使用三次樣條估計gk的大致過程,在仿真部分本文使用的是三次樣條插值法,可直接調用Python中程序包完成模型估計。 1.2.3NewtonRaphson方法 Newton Raphson方法在統計中廣泛應用于求解最大似然估計。對于序數輪廓,可強制使用廣義線性模型擬合,然后采用Newton Raphson算法進行參數估計[6]。本文目標函數為對數似然函數(式(2))極大化,可轉化為求解函數l(·)的一階導函數l′(·)=0的問題。具體迭代步驟如下: (1)將目標函數l(·)在給定的x0的鄰域內,通過泰勒展開式展開到二階形式: (5) 當且僅當Δx=xji-x0無線趨近于0時,式(5)得以成立,此時式(5)等價于: (2)計算迭代公式: 其中,v為迭代次數,v≥0。 (3)結合對數似然函數(式(2)),令 k=1,2,…,K-1 其中,Ak為關于gk的函數,則式(2)可以轉化為有關gk的K元函數f(·): (4)對函數f(·)求偏導,計算迭代公式: Xv+1=Xv-[Hf(Xv)]-1f(Xv) 其中,H為Hessian矩陣。 (5)將Xv+1代入步驟(3)中的K元函數f(·),重復步驟(4)、步驟(5),直至|Xv+1-Xv|<ζ(ζ為搜索精度),終止計算。 GLR控制圖的應用范圍較廣,例如監控正態分布的均值或方差等。由于GLR統計量的良好性質,本文基于GLR統計量構建控制圖對非參數比例優勢比模型(式(1))進行監控。3種估計方法下GLR統計量定義如下。 LLKE方法下的統計量: 樣條和Newton Raphson方法下的統計量為 控制限L(1)和L(2)可用二分法搜索,具體迭代步驟如下: (1)在第i次迭代計算中,在區間[L(i),U(i)]中搜索L*。當i=1時,令L(1)=0和U(1)=U,其中U是滿足以下條件的上限,即L*=U時控制圖的平均運行鏈長(average run length,ARL)值大于預先指定的受控狀態下的ARL值ARL0。 (2)將搜索區間折半,即L*=l(i)=(L(i)+U(i))/2,然后計算對應控制限L*下的運行鏈長(run length,RL)。 常用的階段Ⅱ控制圖性能評價指標是ARL值。控制圖在IC狀態下的性能主要是通過ARL值ARL0進行評估,對于OC性能,ARL值的計算存在零態和穩態兩種假設。本文使用穩態OC下的ARL值ARL1作為一個指標來比較不同估計方法下的控制圖的OC性能。理想情況下,在ARL0相等的情況下,對于給定的偏移,具有較小ARL1的控制圖通常被認為具有更好的性能。除此之外,用運行鏈長的標準差(standard deviation of run length,SDRL)和運行鏈長分布的百分位數來更全面地評估控制圖的性能。在分析控制圖的IC性能時,本文主要通過ARL0、SDRL0、運行鏈長的10%分位數RL10%、運行鏈長的中位數(median run length)MRL0和90%分位數RL90%來評價控制圖的性能。通過均方誤差(mean square error,MSE)來評價不同估計方法的精確度。OC狀態下的評價指標包括ARL1、SDRL1以及MRL1指標。 采用二分搜索法,通過5000次重復仿真,逼近相應控制圖的控制限。為了便于說明,變化點設置為τ=25。為了評估每個控制圖的穩態ARL值ARL1,在第(τ+1)個觀測值之前發生警報的任何仿真序列將被舍棄。對于多項式分布中的參數,假設n=50。另外,帶寬h由式(4)確定,常數c取3個不同的值,分別為1、1.5和2。不失一般性,假設每個序數輪廓樣本中有N=50個等距設計點,有 假設序數響應變量具有3個水平,即K=3,非參數比例優勢比模型(式(1))可以寫為 logit(cji1)=g1(xji)logit(cji2)=g2(xji) i=1,2,…,Nj=1,2,… 本文主要考慮了廣義線性模型(generalized linear model,GLM)為受控模型的情況。 GLM受控模型為 logit(cjik)=αk+βxi i=1,2,…,Nj=1,2,…k=1,2 如DING等[6]所述,響應變量y的序數水平主要由截距決定,系數β反映x對y的影響。本文仍采用與DING等[6]相同的參數設置??紤]到響應變量之間的序數信息,系數選擇為(α1,α2)=(-1,0.5),β=0.2。 表1、表2、表3所示為在不同樣本量m下,分別使用樣條、LLKE和Newton Raphson估計方法時,GLR控制圖的ARL0、SDRL0、RL10%、MRL0和RL90%值。注意,表1、表2和表3的最后一列給出的是m=∞時控制圖的IC性能,即GLR控制圖在回歸模型已知條件下的性能。在每張表的最后一行,給出了不同樣本量下估計的均方誤差MSE。 表1 樣條方法下GLR控制圖的IC性能 一方面,從表1中可以看到隨著樣本量m的增大,GLR控制圖的各項評價指標越來越接近模型已知條件下的各指標值。在樣本量m≤800時,ARL0、SDRL0、MRL0和RL90%值呈現出遞增的趨勢,即樣條方法下產生的虛報警次數在減少。當樣本量增至800后,再繼續增大樣本量,GLR控制圖性能的各項指標不再發生變化。換言之,在樣本量m=800時,使用樣條方法就可以達到較好的估計效果,即此時樣條估計對控制圖性能的影響較小。 表2 LLKE方法下GLR控制圖的IC性能 表3 Newton Raphson 方法下GLR控制圖的IC性能 另一方面,根據MSE不難發現,隨著樣本量m的增大,MSE呈現出遞減的趨勢,即估計精度提高。最后,從表1中可以發現,樣本量m從30增大至800時,ARL0、SDRL0等指標的數值跨度較大,這也說明使用樣條方法估計回歸模型時,樣本量對GLR控制圖的性能影響顯著。 表2總結了LLKE方法下GLR控制圖在不同樣本量及參數c下的IC性能。在c=2和1.5時,GLR控制圖的ARL0、SDRL0、RL10%、MRL0和RL90%指標均隨著樣本量m的增大而遞減。當c=2時,在樣本量m=800處GLR控制圖的IC性能與m=∞時的性能最接近,此時使用LLKE估計非參數比例優勢比模型(式(1))對GLR控制圖的IC性能影響最小。當m>800時,LLKE對控制圖IC性能的影響不再隨著樣本量的增大而變化。當c=1.5時,在樣本量m=100處GLR控制圖的IC性能受LLKE估計的影響最小。在c=1的情況下,當樣本量達到500時,LLKE估計方法下GLR控制圖的IC性能與模型已知情況下的差距最小,繼續增大樣本量,控制圖IC性能指標不再發生變化,即m=500時,使用LLKE可獲得較好的估計效果。 觀察不同參數c下各樣本量對應的MSE指標,可以發現MSE指標均隨著樣本量的增大而遞減,即樣本量越大,取得的估計效果越好。但是,當樣本量較大時,MSE數值變化較小,因此,在使用LLKE方法估計回歸模型時,使用小樣本就可達到較高的估計精度。對比不同參數c下的GLR控制圖的IC指標不難發現,在m≤200時,隨著c的減小,各指標呈現出遞減的趨勢。當m≥500時,各參數c下GLR控制圖的IC性能幾乎不再受樣本量大小的影響,小樣本量時控制圖已可以獲得較好的IC性能。 觀察表3,首先,隨著樣本量m的增大,在Newton Raphson 方法下GLR控制圖的各項IC指標呈遞增的趨勢。當樣本量m=200時,控制圖的性能指標與模型已知時的性能差距較小。后續隨著樣本量繼續增大,ARL0、SDRL0、MRL0和RL90%等指標逐漸遠離m=∞時的數值,且當m≥500時,GLR控制圖的各性能指標不再發生變化。再者,對比不同樣本量下的MSE指標可以發現,隨著樣本量的增大,MSE的遞減幅度較小,這表明在樣本量m=200后再繼續增大樣本數量對Newton Raphson方法的估計效果影響不大。因此,在使用Newton Raphson方法估計GLM時,小樣本量也可達到較好的估計效果。 綜合表1、表2和表3,對比3種模型估計方法所需的最小最優樣本量,在IC模型是GLM時,與非參數方法相比,使用參數方法Newton Raphson可以達到較高的估計精度,對階段Ⅱ的GLR控制圖的IC性能影響較小。 由以上分析可知,模型估計會影響GLR控制圖的IC性能,而適當增大樣本量會降低該影響,但由于成本或其他限制,收集大量樣本比較困難,在這種情況下,調整控制限也可以補償模型估計帶來的影響。本文通過模擬實驗,調整GLR控制圖在不同估計方法下的控制限,使其具有預定的ARL0約等于200。樣條方法下對應的GLR控制圖的調整后的控制限見表4。根據表4可知,在樣本量一定的情況下,控制圖各性能指標相對調整控制限之前更加接近m=∞時的性能指標。當m=30時,僅看MRL0指標,表1中調整控制限之前MRL0為38,表4中MRL0為124,顯然后者更接近m=∞時的MRL0值122。在LLKE和Newton Raphson方法下,可以得到相同的結論。 表4 調整控制限后樣條方法下GLR控制圖的IC性能 對于OC模型,本文僅選取了一種有代表性且易于理解的OC模型進行仿真研究:只改變模型系數,響應變量與解釋變量之間的函數關系結構不變。失控模型如下: logit(cjik)=(αk+δ1)+(β+δ2)xi i=1,2,…,Nj=1,2,…k=1,2 為了評估失控狀態下使用不同的估計方法對階段Ⅱ的GLR控制圖OC性能的影響,本文主要考慮了3個樣本量范圍。為了公平比較控制圖的OC性能,應確保ARL0相同,因此采用調整后的控制限。首先在樣本量一定的情況下,評價樣條和Newton Raphson方法對GLR控制圖OC性能的影響。接著,當樣本量發生變化時,分析控制圖性能指標的變化情況。最后,在不同樣本量下,比較樣條、LLKE和Newton Raphson方法下控制圖的OC性能指標,找到在IC模型為GLM時,參數和非參數模型估計方法適用的樣本量范圍。 表5和表6分別總結了在使用樣條和Newton Raphson估計方法的情況下,當參數β發生偏移時,GLR控制圖在樣本量m=70和∞下的ARL1、SDRL1和MRL1的數值。從表5和表6中可以發現,GLR控制圖的OC性能受到模型估計的影響。當使用樣條估計模型時,如果參數發生的偏移較小,則該估計方法會帶來較大的負面影響;當偏移較大時,則估計對控制圖性能的影響較小。使用Newton Raphson估計回歸模型時,無論參數β發生的偏移大小,該方法均會對GLR控制圖的OC性能產生明顯的負面影響。 表5 樣條估計方法對GLR控制圖OC性能的影響(β偏移) 表6 Newton Raphson估計方法對GLR控制圖OC性能的影響(β發生偏移) 圖1和圖2分別給出了樣條和Newton Raphson方法在3種不同的樣本量下,當參數α發生偏移時,GLR控制圖的OC性能指標。從圖1中可以看到,在同一樣本量m下,隨著偏移的增大,ARL1、SDRL1和MRL1均呈現出遞減的趨勢,即參數發生的偏移較大時,GLR控制圖能夠快速檢測出異常并發出警報。另外,在偏移量相同的情況下,m=30時的控制圖的各項OC指標遠遠超過m=200時的指標,即GLR控制圖的檢出力度隨著樣本量的增大而增強。因此,適當增大樣本量可以減小模型估計對控制圖OC性能的影響。由圖2可以得出類似的結論,但與樣條方法不同的是,使用Newton Raphson估計回歸模型時,隨著樣本量m的增大,同一偏移下的各OC指標的差距較小。因此,使用Newton Raphson方法估計模型時增大樣本量m,對控制圖檢出力的影響并不顯著。 (c)MRL1的對比圖1 樣條方法下樣本量對GLR控制圖OC性能的影響(α偏移)Fig.1 The effects of sample sizes on OC performanceof GLR control chart under spline method(α shifts) (a)ARL1的對比 (b)SDRL1的對比 (c)MRL1的對比圖2 Newton Raphson方法下樣本量對GLR控制圖OC性能的影響(α偏移)Fig.2 The effects of sample sizes on OC performanceof GLR control chart under Newton Raphsonmethod(α shifts) 通過以上對不同樣本量下使用樣條和Newton Raphson方法時的GLR控制圖的OC性能分析可知,樣本量對階段Ⅱ控制圖性能的影響因估計方法的不同而有所不同,所以在實際應用時,應根據樣本量的大小謹慎選擇模型估計方法。在LLKE方法下,式(4)中的參數c對估計曲線的平滑度有較大影響,進而會影響最終的模型估計結果。因此,對于LLKE方法,本文重點關注參數c對GLR控制圖OC性能的影響。表7所示為樣本量固定為70的情況下,使用LLKE方法估計模型時,GLR控制圖的OC性能指標。根據表7可得,在同一參數c下,當參數β發生偏移時,隨著偏移量的增大,GLR控制圖的OC性能指標呈遞減的趨勢;當偏移量固定時,隨著參數c的增大,ARL1、SDRL1和MRL1大致呈遞減的趨勢,GLR控制圖的OC性能隨著c的遞增而增強。 表7 LLKE估計方法對GLR控制圖OC性能的影響(β偏移) 對比分析不同的樣本量下采用這3種估計方法的控制圖OC性能指標,得出3種模型估計方法分別適用的樣本量范圍。本文選取了樣本量分別為30,70,200的3種情況進行簡單解釋。當參數α偏移時,GLR控制圖的OC性能指標數據見表8。 表8 不同樣本量下樣條、LLKE(c=1.5)和Newton Raphson三種估計方法對GLR控制圖OC性能的影響(α偏移) 由表8可以發現,首先,對于同一種估計方法,隨著樣本量的增大,GLR控制圖的ARL1、SDRL1和MRL1指標均呈現出遞減的趨勢,即在大樣本量情況下控制圖的OC性能更優,該結論與圖1和圖2一致。其次,當樣本量固定在30時,比較3種估計方法下GLR控制圖的OC性能可以發現,Newton Raphson方法下控制圖的OC性能最優,無論偏移大小,控制圖均能夠及時發現變點,LLKE(c=1.5)次之,而樣條方法下控制圖的OC性能最差。在m=70和200時可以得到同樣的結論。因此,當IC模型為GLM且樣本量m≤200時,使用參數方法Newton Raphson可以獲得較好的GLR控制圖OC性能。 在仿真過程中,本文假設IC模型為GLM,該假設與參數方法Newton Raphson的假設一致,因此使用Newton Raphson估計模型時,GLR控制圖的性能較好。但對于復雜的函數關系,無法使用GLM擬合模型。通過以上仿真可以發現,在IC模型為GLM時,LLKE方法下的控制圖性能僅次于Newton Raphson,因此在模型為非GLM或未知時,推薦使用LLKE。 為了進一步檢驗LLKE、樣條和Newton Rapson方法的估計效果,本文將3種方法應用于一個汽車制造商的保修索賠的數據集。汽車是最常見的帶有保修合同的產品之一,在保修期內,制造商有義務免費維修或更換保修合同范圍內的瑕疵產品。汽車投入使用后,將每天(每周或每月)發生的保修索賠次數記錄在保修數據集中,通過對保修索賠數據建模分析,可盡早發現質量或現場可靠性問題[25]。通常假定同一天生產的產品具有相同的可靠性[26]。 在本文所使用的保修索賠數據集中,每周生產的汽車總數量中的累計保修索賠數量是按照汽車使用月份記錄的。為了排除其他因素的影響,本文只考慮在特定車型和型號下汽車發動機的保修索賠情況。因為發動機的保修期通常不少于兩年,所以選擇對汽車銷售后24個月的索賠數據進行分析。數據集中提供了故障類型(從工程角度)和每種故障類型下的保修索賠數量。通過整理數據發現,所有故障類型按照發生頻次可歸納為輕微、中等、嚴重3種故障類型。案例中的質量特征是一個輪廓,其中響應變量是不同故障類型的累計保修索賠數量,解釋變量是使用月份。數據集中共有52個保修索賠的輪廓,圖3顯示了6個具有代表性的輪廓(第19個輪廓到第24個輪廓)的logit(c)圖。由圖3可以看出,圖3c與圖3d之間存在明顯的差異,即從第22個輪廓開始,函數模型開始發生變化。因此,在案例研究中前21個輪廓作為IC參考數據。 (a)第19個輪廓 (b)第20個輪廓 (c)第21個輪廓 (d)第22個輪廓 (e)第23個輪廓 (f)第24個輪廓圖3 IC和OC狀態下的輪廓的logit(c)曲線Fig.3 The logit(c) curve of the profile in IC andOC states 采用非參數比例優勢比模型(式(1))來表示響應變量y與解釋變量X之間的函數關系。 綜上,當IC模型是GLM時,本文推薦使用Newton Raphson,該方法所需估計樣本量較少,且可以獲得較好的估計效果。當IC模型形式不明確時,本文推薦使用非參數方法LLKE和樣條。 (a)基準 (b)LLKE (c)樣條(d)Newton Raphson圖4 使用LLKE、樣條和Newton Raphson方法的模型估計結果與基準對比Fig.4 Comparisons of Benchmark with the estimationresults using LLKE, spline and Newton Raphson method 本文評估了使用樣條、LLKE和Newton Raphson 3種估計方法對序數輪廓控制圖的IC和OC性能的影響。首先,本文通過ARL0、SDRL0、RL10%、MRL0和RL90%等指標評價了3種模型估計方法對GLR控制圖IC性能的影響。通過對比發現,一方面增加樣本量可以減少模型估計對控制圖性能的影響,但是當樣本量增加到一定程度之后,繼續增加樣本量所到來的效果并不理想。另一方面在IC模型為廣義線性模型(GLM)時,3種估計方法中,Newton Raphson方法對樣本量大小的要求不高。其次,當IC模型由GLM變為另一種線性模型時,本文評估了GLR控制圖在3種估計方法下的OC性能。通過ARL1、SDRL1和MRL1指標可以發現,在樣本量固定的情況下,樣條、LLKE和Newton Raphson均會影響控制圖OC性能,但參數方法Newton Raphson可以獲得較好的估計效果,即在OC模型仍為GLM時Newton Raphson對GLR控制圖的OC性能影響較小。再者,本文對比了不同樣本量下使用3種估計方法時控制圖的OC指標,發現當IC模型為GLM時,參數方法較非參數方法可以達到較高的估計精度,且對控制圖性能影響較小。最后,本文通過一個實際案例進一步說明了當IC模型不明確時,非參數方法可以獲得較高的估計結果精確度。 本文存在以下兩點不足。第一,本文主要針對IC模型為GLM的情形研究了模型估計對序數輪廓控制圖性能的影響,對其他更復雜的IC模型沒有做細致的說明。在實際應用場景中,IC模型的具體表現形式不得而知,因此仿真情景中,可適當增加較復雜的模型以進行更完善的研究。第二,LLKE中的參數c對估計精度有較大的影響[19],關于模型估計對序數輪廓控制圖性能的影響以及LLKE方法下的參數c的影響可做進一步研究。
1.2 模型估計方法



1.3 監控序數輪廓的控制圖



2 控制圖IC性能分析







3 控制圖OC性能分析







4 案例研究







5 結論及展望