楊茜婷
(燕山大學 理學院,河北 秦皇島 066004)
自相關過程在各行業領域隨處可見,如工業生產、公共醫療保健、畜牧生產體系和分析實驗室等。傳統控制圖要求序列彼此獨立,自相關性的存在使得常規控制圖監控效果不準確,導致漏報虛報的現象發生。此外,產品功能的多樣化使得需要監控的質量不唯一,同時監控多個質量是統計質量控制的必然趨勢,因此,從多元自相關序列出發,將自相關過程轉換為獨立的殘差,設計合理的殘差控制圖具有重要的現實意義。
目前看,國內外學者已對殘差控制圖進行了大量研究。在國外,Layth和Harry首次提出了殘差控制圖[1]。Lu和Reynolds對比了殘差均值和方差取不同偏移量時在Shewhart、CUSUM、EWMA三種控制圖下的異同點[2][3]。對于整合應用控制圖,Lin和Adams提議聯合使用殘差控制圖和EWMA控制圖[4]。國內對該領域的研究起步較晚,孫靜、徐立廣和楊穆爾是最先研究該領域的學者。他們在國內首先提出殘差控制圖,并引進適用于生產過程自相關的調整均值控制圖理論[5];對于殘差T2控制圖,從二元自相關過程發展到多元自相關過程[6][7]。朱慧明和趙銳借助貝葉斯統計質量控制模型獲得殘差,并用殘差控制圖進行監控[8]。孫秋霞和高齊圣研究序列相關性對殘差控制圖性能的影響,發現殘差控制圖在負相關過程中性能更好[9]。
以上對自相關殘差控制圖的研究,無論數據呈幾階自相關,學者們大多采用一階自回歸模型擬合數據。對于單變量自相關情形,肖艷和李亞平等人已通過實驗對這種做法的合理性進行了驗證[10]。本文針對多元自相關過程,通過蒙特卡洛方法對基于殘差T2控制圖的多元自相關模型進行研究,比較VAR(1)與VAR(p)預測下殘差控制圖的性能,并分析導致性能差異的原因。
由p(p≥2)階多元自回歸模型產出的自相關數據,均可以用一階VAR(1)和同階 VAR(p)模型進行擬合,計算數據的真實值與擬合后的預測值之差即得到殘差向量,計算得到對應的T2統計量,通過殘差T2控制圖監控多元自相關過程。
1.VAR(p)擬合模型
在多元自相關過程中,VAR(p)模型的表達式為

其中μ為受控的過程均值;Φ1,…,Φp為自回歸系數矩陣,Φp≠0;εt為誤差向量,服從正態分布,E(ε)t=0,cov(εt,ε)t=∑,∑為一個常值協方差矩陣,對于E(εtεTt+)k當k=0時等于∑,k≠0時等于0;E(Xsε)t=0,s 2.VAR(1)擬合模型 在多元自相關過程中,VAR(1)模型的表達式為: 監控殘差T2統計量的控制圖即為殘差T2控制圖。殘差T2控制圖的下控制限LCL=0,上控制限取F分布控制限: 設殘差T2控制圖失控的概率為P,則ARL與多元自相關過程中的偏移量δ滿足如下關系: 這里定義的殘差統計量服從卡方分布,代入(7)式可直接計算ARL作為比較殘差T2控制圖性能的依據。 為不失一般性,設多變量自相關過程的維數為2,規定質量特性的受控均值 μ0=(0,0)T,則符合條件的二維VAR(p)模型滿足: 下面定義VAR模型的自相關度γ,以p=2為例,計算公式如下: 為了直觀比較 VAR(1)與同階 VAR(p)(p≥2)預測下的殘差T2控制圖的性能,并驗證結論的普適性,取p=2,3進行仿真實驗。下面以二階自相關數據為例介紹隨機模擬過程。 對于定義的模型(8),取p=2,并給定符合要求的Φ1和Φ2,通過蒙特卡洛方法生成一組二階自相關數據。然后,運用最小二乘法估計得到二階自相關數據的VAR(1)模型和VAR(2)模型預測值。設犯第一類錯誤的概率α=0.005,則受控狀態下預期的平均運行鏈長為200。以delta為依據,選取δ并代入式(7)中,分別計算在模型VAR(1)和模型VAR(2)預測下的殘差序列在殘差T2控制圖中受控和失控的ARL。具體的取值方案如下: 由于VAR模型的自相關度只由Φ1和Φ2的對角元素決定,所以可保證非對角元素不變,其中c12=0.1,c21=0.2,通過調整其對角元素改變求和后對角元素的值,進一步改變模型的自相關度。以delta值取2.5作為偏移量大小的分界點,將δ的取值分為如下三種情形:受控時取[0,0];較小偏移時取[0.5,0],[0.5,0.5],[0.5,1],[1,2];較大偏移時取 [2,2],[2,2.5],[2.5,2.5],[3,3]。比較兩種模型預測下的平均鏈長在不同偏移程度delta下的優劣。實驗結果見表1、表2。 表1 VAR(2)和 VAR(1)預測下殘差 T2控制圖的 ARL(delta≤2.5) 表2 VAR(2)和 VAR(1)預測下殘差 T2控制圖的 ARL(delta>2.5) 肖艷和李亞平等人發現用VAR(1)模型擬合的殘差序列具有負自相關性[10]。所以對于多元自相關過程,殘差向量可以用如下多元線性模型進行擬合,滿足: 其中k為大于0的常數,b為常數向量,ε為誤差項隨機向量。所以對于(t-1)時刻的T2統計量T2(t-1)=e(t-1)T∑(0)-1e(t-1),將式(10)代入,轉化后得到: 其中k、b為常數,ε是誤差項隨機變量。VAR(1)模型擬合的殘差T2統計量序列滿足正自相關關系,使殘差T2控制圖性能更好。 此外,肖艷和李亞平等人通過實驗發現在自相關程度下降時,一階自回歸模型預測下的殘差序列負自相關的程度會減弱,導致公式(10)中的 k→0,從而式(11)中的k2→0。因此在多變量自相關過程中,自相關程度的減弱會導致VAR(1)擬合下的殘差T2統計量的正自相關性減弱,使殘差T2控制圖探測異常變得靈敏。 對于三階多元自相關數據,同樣用上述隨機模擬方法,得出的結論一致,即VAR(1)下的殘差T2控制圖優于VAR(3)。同時,影響殘差T2控制圖性能的因素也與二階的情形相同。驗證了上述結論的普適性。 本文主要對基于殘差T2控制圖的多元自相關過程模型進行研究。通過隨機模擬實驗,對比分析兩種模型下的ARL,發現通過VAR(1)預測的殘差T2控制圖的性能優于VAR(p)擬合模型,這一發現可以使對殘差T2控制圖的后續研究減少定階過程,以節約定階所需的時間和成本。這一發現也與肖艷、李亞平等人對單變量情形的研究結論基本一致?!?/p>



(二)殘差T2控制圖


三、基于模型階數的殘差T2控制圖性能對比
(一)前期準備




(二)隨機模擬生成ARL


(三)殘差T2控制圖性能分析



四、結語