黃 贏
(南寧學院 信息工程學院,廣西 南寧 530200)
統計過程控制(Statistical Process Control,SPC)是應用統計分析技術對過程中的各階段進行評估和監控,發現異常并報警,管理工作人員會根據報警情況采取對應措施,從而消除異常,以達到提高和控制產品質量的目的[1]。在制造生產過程中,過程數據經常會產生波動,波動的因素有系統設備本身因素和外界因素。根據波動因素的不同,過程波動一般可以分為正常波動和異常波動。正常波動是由普通因素引起的,它具有偶然性和統計規律性,對生產過程數據影響小,可以忽略。異常波動是由系統本身因素造成,對過程數據的影響巨大,但是異常波動沒有隨機性,可以采取相應的措施消除異常波動帶來的影響。
統計過程控制的目的就是使正常波動在正常合理的水平之上波動,能夠對異常波動進行數據監控,及時發現異常波動并消除,從而滿足生產需要,達到產品的質量標準。
1924年,美國休哈特博士第一次提出了控制圖。控制圖是過程控制的基本工具,能及時觀察是否有正常波動和異常波動的存在,判斷生產過程是否處于受控狀態,監控生產過程的參數變化[2],是使生產過程保持正常的有效工具。自休哈特控制圖應用于過程變化監控領域以來,以休哈特控制圖為基礎不斷有成熟的控制圖相繼提出。但是目前休哈特控制圖仍被認為是監測過程變化和偏移的有效工具,休哈特控制圖相對比較簡單,在實際應用中大多數的過程觀測數據近似服從正態分布。
休哈特控制如圖1所示,由橫坐標、縱坐標與3條控制線組成。橫坐標為采樣時間,縱坐標是質量屬性值。控制限分別為中心線CL,控制上限UCL和控制下限LCL。當生產過程處于受控狀態時,總體的質量特性數據服從正態分布。
休哈特控制圖的基本原理就是利用3σ法則控制過程[3],即控制上限確定為μ+3σ,控制下限確定為μ-3σ,中心限為μ,根據3σ原理,樣本點落在控制限以外的概率僅為0.27%。這樣確定好的控制極限可以以監控數據是否處于控制極限之內來判斷生產過程是否處于受控狀態。
控制圖常常會發生兩類錯誤,即虛發報警錯誤和漏發報警的錯誤,兩類錯誤的具體分析如下:
(1)虛發報警錯誤。這種虛發報警的錯誤是指點子在生產系統處于正常運行的情況下,超出了控制極限,根據控制圖的基本原理,點子超出控制極限則認為是生產過程失控,將進行報警,但是系統仍處于受控狀態,這種錯誤稱為虛發報警錯誤。虛發報警錯誤會產生查找不存在的異常因素的麻煩。
(2)漏發報警錯誤。在生產過程失控的情況下,質量特性值的分布與其典型分布發生了偏移,但是在上、下控制界限內總存在一部分質量特性值。如果在抽樣檢驗時,正好抽到這部分產品,若樣本點沒有超出控制限即判斷生產過程穩定就犯漏發報警的錯誤,這類錯誤的概率通常記為β。漏發報警將造成產品中次品率上升的損失。
根據統計過程控制對控制圖的應用可知,控制上下限的確定是利用控制圖進行過程控制的關鍵。確定合理的控制上下限可以有效地減少虛發報警錯誤和漏發報警錯誤發生的概率,若上限與下限的間距過大,則發生虛發報警錯誤的概率α減少,發生漏發報警錯誤的概率β增大,若上限與下限的間距過小,則發生虛發報警錯誤的概率α增加,發生漏發報警錯誤的概率β減少,所以無論上限與下限如何調整,兩類錯誤發生的概率都會產生相應的變化,不可避免。所以確定上限與下限時要結合犯兩類錯誤的總概率最小來確定。控制圖的應用經驗表明休哈特控制圖采用的3σ方式使控制過程犯兩類錯誤的總概率最小。

圖1 休哈特控制圖基本結構
控制圖作為監控工具使生產過程處于受控狀態,僅在隨機因素的影響下運行。過程數據的分布曲線隨時間的輸出基本不發生變化且在要求范圍內稱為受控狀態,反之稱為失控狀態,控制圖可以通過對樣本數據進行分析處理來判斷這兩種狀態。生產管理人員根據控制圖來判斷生產是否處于正常狀態,否則采取措施使之恢復正常,使生產過程保持穩定。
假設待觀測的多變量系統的測量數據矩陣為X∈Rn,X=(x1,x2,x3,…,xn),其中n為測量樣本的個數,X為被測樣本總體,X中的每一個元素為被測變量的一個樣本,每個樣本之間相互獨立,則極差為:
R(x)=max(X)-min(X)
(1)
如果樣本容量足夠大,根據等距原則可以將極差R(X)分為N個小區間,用c代表每個區間,則每個小區間的長度:
(2)
這樣就將該列數據矩陣分成N組,其中對應的每個小區間分別記為c1,c2,…,cn,矩陣X中的每一個樣本數據都屬于其中的一個區間。
統計采樣值落入每個小區間的樣本數占樣本容量的百分比可表示如下:
(3)
其中,νr為落在該小區間的樣本的個數,r=1,2,…N。
由于每個樣本數值之間是相互獨立的,根據統計概率的定義可知,每個區間,樣本落入的概率為:
Pr{Xi∈cr}≈fr
(4)
則監測值落入每個區間的平均概率密度為:
(5)
由此,以平均概率密度Pr為高,以小區間的長度為底做矩形,得到直方圖即為X的經驗分布。當樣本容量n區間個數N足夠大時所得到的直方圖就會更加接近X的總體概率的密度分布。
根據中心極限定理[4]:設均值為μ、方差為σ2(有限)的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態分布,根據這個定理,當系統只存在一個穩定狀態時,被測變量隨樣本容量的增大,趨向服從于正態分布。
當X服從正態分布時,根據正態分布理論可知其分布函數為:
(6)
如圖2所示,當被監測的數據點處在μ±3σ的概率為99.73%,把控制極限設定在這個范圍內,當所采集的數據點超出這個范圍,則認為該數據異常,應該采取相應措施。

圖2 標準正態分布概率密度分布
根據3σ原則,在實際生產中將監測數值點處在μ±3σ之外的0.27%的概率對應的區間定義為報警區,對應的區間值設為上上限和下下限,如果采集點超出這個范圍則進行報警。將2σ點5%左右的概率定義為正常工作區,處在報警區和正常工作區之間的區間定義為調節工作區,正常工作區和調節工作區的界限點的值設為控制上限與控制下限。
在蒸汽管網流量監控中,當監控流量的樣本容量和樣本確定之后,由于系統因素,在取樣的時間段內所采取的流量值可能會發生異常波動,從而使得到的經驗分布不服從正態分布,在這樣的情況下,通常可以采用正態分布擬合的方法來獲得對應的正態分布和對應的控制極限,但是,這樣擬合會產生非常大的誤差,設定的控制極限也是均勻對稱的,容易引起虛報或者漏報的情況。
(1)假設蒸汽管網監測某一變量X的上上限為Z1,則其滿足的條件為:
P(X≥Z1)=0.13%
(7)
按照經驗概率分布的劃定標準可以寫成:

(8)
式中,rz1是Z1所在小區間中的序號,若統計區間分得足夠細,則單個小區間的概率會很小,所以令該區間的控制上限或者控制下限定為Z1誤差都很小,在這里取rz1區間的下限。
(2)假設蒸汽管網監測某一變量X的上限為Z2,則其滿足的條件為:
P(X≥Z2)=2.5%
(9)
按照經驗概率分布的劃定標準可以寫成:

(10)
式中,rz2是Z2所在小區間中的序號,Z2取rz2區間的下限。
(3)假設蒸汽管網監測某一變量X的下限為Z3,則其滿足的條件為:
P(X≥Z3)=2.5%
(11)
按照經驗概率分布的劃定標準可以寫成:

(12)
式中,rz3是Z3所在小區間中的序號,Z3取rz3區間的上限。
(4)假設蒸汽管網監測某一變量X的下下限為Z4,則其滿足的條件為:

(13)
式中,rz4是Z4所在小區間中的序號,Z4取rz4區間的上限。
根據上面4步控制極限的劃定可得到對應的報警控制極限,分別為控制上上限Z1、上限Z2、下限Z3、下下限Z4,確定極限時先劃分區間,形成對應的經驗分布函數,然后從r=1往上求和搜索,達到預定概率點的對應區間的序號,然后按照(1)~(4)確定相應的控制極限。
根據現場采集的數據,按人工設定的控制極限,按正態分布擬合設定的控制極限和按經驗分布模型設定的控制極限對比如表1所示。

表1 3種方法確定的控制極限的對比

續表1
從表1中可以看出,采用正態分布、經驗分布、人工設定的方法確定的控制極限都符合控制圖的基本原理,樣本點落在控制限以外的概率僅為0.27%,發生兩類錯誤的總概率很小。而采用經驗模型單變量控制極限的方法確定的極限中,上限加下限并不等于上上限加下下限,人工設定的控制極限也出現了同樣的情況,而采用正態分布的方法確定的控制極限是對稱的[5]。從數據來看,相對于采用正態分布的方法來確定控制極限,采用經驗模型劃定的控制極限與人工劃定的控制極限值更為接近,比較符合實際生產情況。因此,采用經驗分布來確定的控制極限值更精確,更符合生產需要。
蒸汽管網流量數據監控主要利用單變量統計過程控制的方法。確定控制極限是本章研究的核心問題。針對單變量控制極限的問題,本文主要根據流量的歷史數據,得到該流量數據的經驗分布,最后再按照正態分布“3δ”原理定義的控制極限的對應概率,在經驗分布中尋找與該概率對應的變量的取值,形成對應的控制極限。這種確定控制極限的方法是以數據統計的原理作為基礎,劃分出的控制極限并不對稱,根據實驗測試,這種控制極限的方法比采用經典的正態分布“3δ”原則得到的控制極限的方法更符合工藝與安全要求。
按本文確定控制極限的方法,運用單變量統計過程控制對蒸汽管網流量數據進行監控,監控效果表明,本章研究的方法能明確地對蒸汽管網異常數據給出明確的報警信號,起到了很好的監控效果。