北京北大維信生物科技有限公司(100094)郎春鵬 王曉峰
統計工具Minitab在1972年誕生于美國的賓夕法尼亞大學統計系,到目前為止,Minitab軟件已經在全球100多個國家,4800多所高校被廣泛使用。我公司主要使用了Minitab中方差分析、均值檢驗、泊松率檢驗的三種功能。具體用途如下:驗證結果趨勢分析、空調凈化系統確認趨勢分析、不符合驗證標準的驗證偏差的分析與處理;本文就本企業在上述Minitab應用過程中的方法、標準進行了研究,并結合確認與驗證應用實例進行應用闡述[1]。
1.1 概述 假設檢驗是統計推斷的重要方面,一般處理方法為:先把某個結論當成一種假設,然后根據樣本觀測值的情況,運用統計分析方法對假設進行檢驗并作出判斷。這類問題最終是以“判斷”為輸出結果。而我廠使用的均值檢驗,是解決一組數的均值是否高于/低于/不等于另一組數,在實際中常用于判斷驗證結果與其他結果的高低,如本次工藝驗證的數據是否與上次處于同一水平,改進的取樣方法是否比原先的取樣方法回收率高等。
1.2 方法 以其中欲檢驗其正確性的為零假設,零假設通常由研究者決定,反映研究者對未知參數的看法。相對于零假設的其他有關參數之論述是備擇假設,它通常反映了執行檢定的研究者對參數可能數值的另一種(對立的)看法。假設檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件在一次試驗中基本上不會發生。反證法思想是先提出零假設,再用適當的統計方法確定假設成立的可能性大小,如可能性小,則認為假設不成立,若可能性大,則還不能認為假設不成立。
假設是否正確,要用從總體中抽出的樣本進行檢驗,用與此有關的理論和方法,構成假設檢驗的內容。根據樣本性質的不同,假設檢驗的種類包括:t 檢驗,Z檢驗,卡方檢驗,F 檢驗等等。我廠使用均值檢驗中的雙樣本t檢驗。
1.2.1 雙樣本t 檢驗適用條件 ①兩組樣本內相互獨立,兩組間相互獨立;②兩組數據均來自正態總體;③兩個總體方差相等。
1.2.3 判定 ①當t>t1-α(n+m-2),樣本1均值>樣本2均值;②當t <-t1-α(n+m-2),樣本1均值<樣本2均值;③當|t|>t1-α/2(n+m-2),樣本1均值≠樣本2均值。注:式中α為顯著性水平。
1.3 檢驗生成 在Minitab中選擇“統計-基本統計量-雙樣本t”。
1.4 應用實例 以下是本廠某工藝驗證實例,欲比較工藝驗證數據與上個驗證周期內正常生產批次數據有無差異,以確定工藝參數有無漂移。取“含量”作為比較項目:紫外(UV)法測得含量、高效液相(HPLC)法測得含量。取當次驗證和正常生產的工藝狀況各統計10批(滿足《GMP實施指南》中對工藝回顧數據10~30批的數據要求),數據匯總從略。使用雙樣本t檢驗,以確認當次驗證和正常生產工藝狀況的工藝參數具有一致性。統計數據見附表1。通過附表1中數據,可以得到以下結論:工藝驗證和上個驗證周期正常生產的工藝狀況各統計10批,在紫外(UV)法測得含量、高效液相 (HPLC)法測得含量的對比中無明顯差異,工藝參數沒有漂移。
2.1 概述 泊松率檢驗與第二部分所說的t 檢驗同樣是假設檢驗,只不過樣本分布變成了泊松分布。我廠使用泊松率檢驗,正是為了解決某些服從泊松分布的一組數的均值是否高于/低于/不等于另一組數,在實際中常用于判斷設施設備確認結果與其他結果的高低,如本年度空調凈化系統(HVAC)的懸浮粒子數據是否與上年度確認時處于同一水平。
2.2 方法 同第二部分t 檢驗,假設是否正確,要用從總體中抽出的樣本進行檢驗,用與此有關的理論和方法,構成假設檢驗的內容。根據樣本性質的不同,泊松率檢驗的種類包括:單總體泊松率檢驗,雙總體泊松率檢驗。我廠使用雙總體泊松率檢驗。
2.2.1 雙總體泊松率檢驗適用條件 ①兩組數據間相互獨立;②兩組數據均服從泊松分布。

附表1 工藝驗證和正常生產工藝狀況的檢驗數據對比表

附表2 2017年、2018年A區域空調凈化系統懸浮粒子(≥5.0μm)確認情況對比

附表3 以混合量、混合時間為因子的方差分析表

附表4 方差分析模型評價表
2.2.2 計算統計量和判定 由于計算公式非常復雜,應用時僅適用Minitab軟件計算和判定。
2.3 圖形生成 在Minitab中選擇“統計-基本統計量-雙樣本泊松率”。
2.4 應用實例 我廠空調凈化系統(HVAC)各系統分別由冷源、熱源、加濕、輸送(分配)、臭氧消毒、空氣過濾等設備構成,在送風管末端的風口處安裝有高效過濾器,最終形成一個完整的空氣處理過程。各系統在生產過程中提供與生產相適應的潔凈等級環境。根據《驗證總計劃》,每年通過對空調凈化系統進行再確認,評價空氣凈化系統的質量。
在2018年再確認時,匯總各系統控制區域的工作房間的沉降菌、表面微生物、懸浮粒子數、溫濕度及壓差等確認數據,對比2017年空調凈化系統再確認數據;以下以A區域空調凈化系統懸浮粒子(≥5.0μm)確認情況為例,闡述使用雙總體泊松率檢驗2017年、2018年確認數據趨勢,如有趨勢明顯變差情況,應結合日常運行維修保養、日常監控情況,偏差發生情況進行分析,必要時生成確認偏差。統計數據從略;雙總體泊松率檢驗結果見附表2。
評估與措施:2017年、2018年A區域空調凈化系統確認時,懸浮粒子(≥5.0μm)使用雙總體泊松率檢驗確認數據趨勢,數據趨勢無明顯變差情況,證明空調凈化系統凈化能力未有異常變化。
3.1 概述 把試驗中要考察的結果稱為指標,在試驗中會改變狀態的因素或對指標有影響的因素稱為因子,因子在試驗中所處的不同狀態稱作因子水平;方差分析是使用不同因子、不同水平造成的指標響應的數據間的總的“變差”,按各指定的變差來源進行分解的一種技術。對變差的度量,采用離差平方和。方差分析方法就是從總離差平方和分解出可追溯到指定來源的部分離差平方和。
3.2 方法 總變異的離均平方和SS及自由度分別分解為組間和組內兩部分,其計算公式如下:MS組間=離均平方和/組間自由度;MS組內=離均平方和/組內自由度;SS總=SS組間+SS組內。
計算組間和組內離均差平方和。兩組或兩組以上數據,大組全部在一組就是組內,以每一組計算一均數,再進行離均平方和的計算:SS組間=組間離均平方和;MS組間=SS組間/組數;SS組內=組內離均平方和;MS組內=SS組內/全部數據-組數;F值=MS組間/MS組內;查F值,求P值,P值<α水平,該因子顯著。
3.3 方差分析模型 本公司使用完全析因模型,它是一種將兩個或多個因素的各水平交叉分組,進行實驗(或試驗)的設計。它不僅可以檢驗各析因實驗因素內部不同水平間有無差異,還可檢驗兩個或多個因素間是否存在交互作用(interaction)。若因素間存在交互作用,表示各因素不是獨立的,一個因素的水平發生變化,會影響其它因素的實驗效應;反之,若因素間不存在交互作用,表示各因素是獨立的,任一因素的水平發生變化,不會影響其它因素的實驗效應。
3.4 應用實例 某型混合機為本公司的混合設備,用于公司某品種原料、輔料的混合操作。該設備在性能確認時,為評估設備的混合能力,進行該混合機最大、最小、日?;旌狭繉旌蠒r間的確認,即分別在目標混合時間上下范圍進行混合均勻度確認,以考察不同混合時間能否滿足含量均勻度RSD值的要求。在日?;旌狭康男阅艽_認過程中,產生了混合均勻度不達標的確認偏差。在偏差調查中,數據采用方差分析。統計數據從略;方差分析表見附表3,方差分析模型評價見附表4。
由附表3、4 中性能確認結果可以看出,混合效果(含量)對混合量、混合時間的變化均不明顯(P=0.635,P=0.081)。且根據模型匯總,混合效果變化源于誤差(R2=9.16%),因此可判定混合器對規定物料的混合功能沒有達到預期的要求,且與混合時間、混合量無關,混合功能沒有達到預期的要求,該混合機不適用于本品種物料的混合要求。
對我公司某產品生產驗證和相關設施設備確認中數據統計分析,主要使用了Minitab(版本17)中方差分析、均值檢驗、泊松率檢驗的三種功能[2]。具體用途如下:驗證結果趨勢分析、空調凈化系統確認趨勢分析、不符合驗證標準的驗證偏差的分析與處理。Minitab的應用獲得了良好的效果,數據、數據組意義分析更加科學,趨勢更加明確,對質量決策起了重要的指導作用,證明Minitab在制藥企業生產驗證和相關設施設備確認中應用是可行的。