郭新俊,朱永忠,張 艷
控制圖作為一種重要的統計過程控制工具,被廣泛應用于實施過程控制,以改進產品質量。但常規控制圖的一個基本假設前提是觀測值彼此獨立,而往往在現實中所采集的數據會存在自相關現象很難滿足獨立性假設。為了處理自相關數據,我們采用取整的自回歸滑動平均過程模型。早在1985年,Mckenzie[1]提出了一個取非整的ARMA模型(INARMA)。因為對于標準的一階自回歸模型AR(1),一個取非整的INAR(1)模型是很接近它的,所以在2007年,Weib[2]提出了一個c-chart,一個滑動平均控制圖和帶著兩個特殊條件的控制圖去監測這樣的過程。但是,幾種相似的結果顯示它們都沒有表現出較好的監測效果。直到2009年,Weiss和Testik[3]研究了一個全新的累積和控制圖Poisson INAR(1)CUSUM,完全基于Poisson INAR(1)模型,能夠很好地監測來自INAR(1)過程的數據。而這類常規的控制圖都是假定抽樣區間和樣本容量都固定不變,它不利于及時發現過程的變化,特別是過程較小的變化,于是Reynolds et al[4]提出了具有變化抽樣區間的Shewhart控制圖,并由此形成了動態控制圖這一新的領域,之后很多學者研究了動態的累積和控制圖[5],指數加權滑動平均控制圖[6]等。本文擬在Weiss和Testik[3]的累積和控制圖Poisson INAR(1)CUSUM的基礎上進行變化的樣本區間設計,即不再假定樣本區間固定而是根據當前樣本點落入的區域從而決定采用相應的變化的樣本區間[7][8]。利用馬爾科夫鏈方法計算的數據判斷,與FSI圖相比是否減少了過程的平均報警時間,從而有效地提高生產效率。
McKenzie[1]早在1985年就給出了第一個INARMA和INAR(1)模型

其中,Nt為離散型隨機變量,α∈(0,1),°為減弱算子,εt是獨立同分布的隨機變量,減弱算子與εt都是相互獨立的,并且εt在每個t時刻與Nt-1,Nt-2,...都是獨立的。方程(1)中的INAR(1)模型在現實中有著廣泛的應用[2]。
方程(1)中的INAR(1)過程模型是一個齊次馬爾科夫鏈。顯然,零初值是固定的。再者,此模型可適用于幾種邊緣分布,包括二項分布和泊松分布等。下面,我們只考慮泊松分布的情形——設定Nt是帶有參數λ>0的泊松分布且 P(Nt=k)=e-λ(λkk!);k=0,1,...。
在方程(1)中,若εt是獨立同分布的隨機變量且服從參數為λ(1-α)的泊松分布,Nt為服從參數λ>0的泊松分布的離散型隨機變量即 P(Nt=k)=e-λ(λkk!),k=0,1,...。那么方程(1)被稱作Poisson INAR(1)模型。
在實際應用中可能會有很多原因使統計過程失控。比如Nt和εt的均值或方差可能會從受控狀態中的某個值變成失控狀態的另一個值。很多控制圖都能用來監測Nt在過程中均值的改變,由于多樣累積和控制圖在較小和中等參數漂移監測中的優越性[9],在此選用多樣累積和控制圖。Christian H Weib和Murat Caner Testik[3]在2009年提出了一個單邊的Poisson INAR(1)累計和控制圖(受控時μ=λ0):

這里,c0≥0是初值,k≥λ0是信念值。過程被認為是受控的,只有當Ct≥h時過程發出警報進入失控階段,其中h>0為控制線。盡管通常情況下取初值c0=0,但是當取c0≥0時,在監測過程失控時更加靈敏。而k的作用是在受控階段阻止控制圖向控制線靠近,能夠及時地調整自身的取值使之對控制過程中均值漂移更加敏感
動態控制圖[10]是指下一個樣本的抽樣區間或樣本容量依賴于現實樣本點統計量的控制圖。控制圖的動態設計一般有可變抽樣區間(Variable Sampling Interval,VSI),可變樣本容量(Variable Sample Size,VSS)及可變樣本容量和抽樣區間(VSSI)這三種情況。其主要思想為:在控制圖的中心限和控制限之間加上警戒限,將中心限與警戒限之間的區域稱為中心域,警戒限與控制限之間的區域稱為警戒域。如果現時樣本點統計量位于中心域,則表明其后的點超出控制限的可能性較小,這時可等待較長的時間再去抽取下一個樣本,且下一個樣本的樣本容量可以較小;反之,若現實樣本點統計量位于警戒域內,這表明其后的點很有可能超出控制限,為了能盡快的發現過程的偏移,應等待較短的時間去抽取下一個樣本,且其樣本容量應該較大,也就是說下一個樣本的抽樣區間和樣本容量的大小取決于現實樣本點統計量的大小。一般只取兩個抽樣區間長度 d1,d2,和兩個樣本容量 n1,n2,其中 d1>d2,n1<n2。當現時樣本點統計量位于中心域時,選取樣本容量n1和抽樣區間d1;當其位于警戒域時,選用樣本容量n2和抽樣區間d2;若其超出警戒限,則發出報警信號,過程失控。
早在上個世紀80年代,Reynolds[5]就一直在專注研究關于帶有變化的樣本容量或抽樣區間的控制圖,其中對累積和控制圖的研究占有很大比重。Reynolds和Arnold[5]在1990年給出了一個單邊的(正向的)VSICUSUM控制圖。

這個控制圖有效地克服了以往的抽樣區間是固定的情況下會出現不能及時發現過程較小的變化這一缺點,但是這里的隨機變量Xj一般默認為是相互獨立的,也就是說,在實際中所觀測的數值存在自相關現象時,(3)式還是可能會出現虛報或是漏報的情況。所以我們用(2)式中定義的特殊的隨機變量Nt來替換Xj再結合Poisson INAR(1)CUSUM控制圖的優點所得到的新的控制圖如下:

這兒,c0仍然是一個常數。而(2)中的Ct與(4)中的不同處在于Ct是將控制圖所有取負值的統計量全部歸零,首先會記錄那些取負值的統計量,然后當代入下一組樣本計算時又將那些負值重新置為零。除去記錄取負值的統計量這一點以外這兩者是相同的。之所以選擇控制圖是因為那些負的統計量的取值很可能被用作去判別樣本區間。同樣,過程被認為是受控的,只有當Ct≥h時會發出警報進入失控階段,其中h>0為控制線。k為信念值通常由控制圖的漂移率來定,如果讓來表示μ0變到μ的幅度,那么k的最佳取值為,h的選擇則是在受控階段時使報警前的樣本數量的期望達到某個特定的值而設定。
如果使用兩個樣本區間d1和d2,用ψi表示報警前使用抽樣區間di的樣本數量,其中i=1,2。d0為第一個樣本之前的抽樣區間,也就是說d0是指從過程開始的0時刻到取第一個樣本這段時間。在許多應用中,通常取d0=d1,其表示過程開始之后迅速地取第一個樣本。根據ATS,ANSS的定義不難得出下列等式:

定義

其中ρ1為樣本區間是d1的樣本數量占報警前所有樣本數量的比例。進一步有 ATS=d?ANSS,這里d=d1ρ1+d2(1-ρ1)。
對一個可變抽樣區間控制圖來說,d可看作是平均樣本區間的長度,而在接下來討論到的固定樣本區間圖時,d就代表固定樣本區間的長度。這都是在討論單邊的情況,雙邊的控制圖統計量情況類似,只是要復雜一些,這里就不再說明了。
在運用馬爾科夫鏈方法去近似計算控制圖效能值的時候,常常是將控制圖的連續區域分成若干個小區域,每個小區域都對應著一個馬爾科夫鏈,其中有個區域稱為吸收態,表示過程失控。現假設將某個控制圖的連續區域C分成r個區域E1,E2,...,Er。并且每個狀態Ei相應的去使用一個樣本區間長度。記bi表示當控制圖的統計量落在區域Ei時的樣本區間,b={b1,b2,...,br}'。馬爾科夫鏈的轉移矩陣P為,這兒Q是P的子矩陣對應于r個轉移狀態,0'是由零組成的r×1維零矩陣,1是由1組成的r×1維矩陣。
定義基礎矩陣M=[mij]=(I-Q)-1,這里矩陣P,Q和M都依賴于均值μ的取值。mij是轉移狀態Ej在進入吸收態之前的過程次數的期望值。用ANSSi表示在狀態Ei時的統計量ANSS,且 ANSS=(ANSS1,ANSS2,...,ANSSr)'。因為在馬爾科夫鏈的一個狀態轉移發生時只取一個樣本,所以有一個多樣累積和控制圖的ANSS的取值完全依賴于參數k和h,所以無論是可變樣本區間的累積和控制圖還是固定樣本區間的累積和控制圖,如果它們有相同的k值和h值,那么這兩個控制圖有相同的ANSS值。同樣,用ATSi表示在狀態Ei時的統計量ATS,d0=bi,并且過程的均值是常數,則有若 d0≠bi時,有 ATS=ATSi+d0-bi。
衡量控制圖性能的指標是過程運行到出現錯誤信號報警所用的時間,如果N代表報警時所運行的樣本數量,那么固定樣本區間控制圖的報警時間則是由N和固定的樣本區間長度共同決定。所以對固定樣本區間控制圖來說,刻畫報警時間的大小就可以簡單的去刻畫N的大小。在質量控制學中,N被稱作運行長度。所以它的期望值平均運行長度ARL通常被用來衡量固定樣本區間控制圖的性能。然而在變化的樣本區間控制圖中,由于抽樣區間不固定所以報警時間不能單一的由N去描述,那么只能去直接計算報警時間。同樣它的期望值定義為ATS,由于ARL關系到兩個量所以在可變的抽樣區間控制圖中我們定義報警時的樣本數量的期望值為ANSS,它代替了固定抽樣區間控制圖的ARL。例如,定義受控階段時的ANSS為500或者ATS為250小時,則意味著在受控狀態下平均運行每500個樣本就會出現一次錯誤警報或者平均運行每250小時就會出現一次錯誤警報。
控制圖應在同一條件下進行比較,換言之,當過程處于受控狀態時,它們應有相同的平均報警時間ATS。只要VSI控制圖和FSI控制圖有相同的n,h和k值,它們就具有相同的ANSS;也就是說,改變控制圖的抽樣區間并不改變它的ANSS。當 μ=μ0時,固定k和h。
選擇合適的警戒限和可變抽樣區間d1和d2,使得VSI控制圖和FSI控制圖有相同的平均抽樣區間,此時它們具有相同的平均報警時間ATS。分別計算當μ≠μ0時兩個控制圖的ATS,ATS越小,控制圖的效率就越高。
在研究累積和控制圖性能時,我們通常將h和k的值均取整并且讓它們成對出現,如表1所給出的,而當k的值接近λ0時控制圖的效果將更加明顯。不難看出無論是固定區間的FSIPoisson INAR(1)CUSUM亦或是可變樣本區間的VSIPoisson INAR(1)CUSUM,它們的ATS取值均受到參數α的影響。再者,對于參數c0來說,當c0>0時二者的統計量取值總比c0為零時的取值要小一些。而對于以上所有參數恒定的情況下,VSI圖的值比FSI圖的值要小,即可說明可變抽樣區間控制圖比固定樣本區間控制圖更加靈敏。

表2 帶有幾組不同區間的VSI圖和固定區間的FSI圖的ATS值
對于表2,我們是將FSIPoisson INAR(1)CUSUM的樣本區間取為d=1,而對VSIPoisson INAR(1)CUSUM的兩個不同的抽樣區間(d1,d2)分別取不同的組合,其中有兩組是關于d=1對稱的,而另外三組關于d=1不對稱的。由表可看出,對VSI無論是否取關于d=1對稱的抽樣區間的ATS值都要比FSI的相應的值要小。早在1989年,Reynolds就提出過這樣的理論:d1的取值要盡可能的小,言下可讓d2在一定的范圍內盡可能取大一些,但不能無限大,畢竟要受到ρ1等參數的影響。從表中也可看出,對于那三組不關于d=1的抽樣區間(d1,d2),總是d1與d2相差最大的那組(0.1,1.5)的效果最好。而在多數情況下,通常取關于d對稱的d1與d2的值能使控制圖達到最優效果,正如表中的兩組關于d=1對稱的d1與d2的取值,此時VSIPoisson INAR(1)CUSUM的效果最佳。

表1 帶有不同k和h值的單邊FSI圖和VSI圖在穩態時的ATS取值

圖1 帶著相同均值漂移率的FSI和VSI的ATS值比較
圖1 中共有四條線段,其中參數(h,k,c0)為(16,3,0)的FSI圖和VSI圖以及參數為(17,3,12)的兩種控制圖的比較,很明顯當參數相同時VSI的線段要比FSI的略低;再者,無論是FSI圖還是VSI圖,c0值較大的控制圖相應的ATS值小。
由于在實踐中所采集的數據通常具有自相關性,而多樣累積和控制圖在較小和中等參數漂移監測中有優越性,所以使用多樣累積和控制圖通過一個一階泊松取整的自回歸滑動平均過程模型(定義為Poisson INAR(1))來監測,并且對其進行可變抽樣區間設計。從文中可看出在參數大小相同的條件下,VSI圖的ATS值總是比FSI圖要小一些,也就是說無論在受控亦或是失控條件下,VSI圖都要比FSI圖靈敏。但就對VSI圖而言,考慮它的抽樣區間的組合,一般來說區間稍長的組合性能將更好一些。所以可變抽樣區間的累積和控制圖VSIPoisson INAR(1)CUSUM更加容易投入到實際生產或過程中去。
[1]McKenzie,Ed.A Traditional Interpretation of the Forecasts of Season?ally Differenced ARIMA Processes[Z].North-Holland,Amsterdam,1985.
[2]Weiss,C.H.Controlling Correlated Processes of Poisson Counts[J].Quality Reliability Engineering International,2007,23(6).
[3]Christian HWeib.Murat Caner Testik,CUSUMMonitoringof First-Or?der Integer-Valued Autoregressive Processes of Poisson Counts[J].Journal of Quality Technology,2009,41(4).
[4]Reynolds Jr.,M.R.,Arnold,J.C.X-bar Charts with Variable Sampling Intervals[J].Technometrics,1988,30(2).
[5]Reynolds Jr.,M.R.,Arnold,J.C.CUSUM Charts with Variable Sampling Intervals[J].Technometrics,1990,(32).
[6]Accucci M S,Amin R W,Lucas J M.Exponentially Moving Average Control Schemes with Variable Sampling Intervals[J].Communications in Statiatics-Simulation and Computation,1992,21(3).
[7]Yunzhao Luo,Zhonghua Li,Zhaojun Wang.Adaptive CUSUM Control Chart with Variable Sampling Intervals[J].Computational Statistics and Data Analysis,2009,(53).
[8]張維銘.可變抽樣區間的單邊控制圖[J].數理統計與管理,2002,6(21).
[9]濮曉龍.關于累積和(CUSUM)檢驗的改進[J].應用數學學報,2003,2(26).
[10]吉明明.具有可變抽樣區間的二維EWMA控制圖[J].系統工程理論與實踐,2007,9(9).