聞向東 邵 梅 曹宏燕
(武漢鋼鐵集團公司研究院,武漢 430080)
GB/T 6379—2004(ISO 5725)《測量方法與結果的準確度(正確度與精密度)》[1]是分析測試方法的一項重要的基礎標準。該標準的第2部分《確定標準測量方法重復性與再現性的基本方法》規定了通過組織實驗室間的共同試驗,用數理統計方法,計算并確定標準測試方法的重復性限r和再現性限R的數值,并確定重復性限r和再現性限R與質量分數m的函數關系,簡稱方法精密度,用測試方法的“精密度”代替傳統的“允許差”。精密度數值是測試方法的質量指標,它是評價、選擇測試方法和制修訂標準的依據。因此采用重復性限和再現性限來表示方法的精密度,并在實踐中判斷分析結果的可靠性,為國際標準和國外先進標準所廣泛采用。目前,一些分析方法標準的制修訂逐步開展精密度的共同試驗,用數理統計方法確定方法的重復性限和再現性限。但對如何組織和開展精密度共同試驗,如何正確理解和運用數理統計方法,共同試驗和統計中要特別注意的問題等,少有這方面的報道。本文以鉬藍分光光度法測定石灰石、白云石中二氧化硅分析方法標準制修訂工作為實例,介紹了精密度共同試驗的組織、測量數據的統計檢驗和重復性限r和再現性限R的統計計算,r和R與質量分數m函數關系(回歸方程)的確定,以及共同試驗中要注意的問題等。這些問題的討論對今后分析方法標準的制修訂、精密度共同試驗及GB/T 6379—2004中統計方法的正確運用有很好的參考價值。
在鉬藍分光光度法測定石灰石、白云石中二氧化硅分析方法標準修訂時,作者所在實驗室組織了精密度共同試驗,根據共同試驗各實驗室的測量結果進行統計處理,并最終確定了方法的重復性限和再現性限的回歸方程。
在確定了該分析方法標準草案后,向國內不同地區的八個實驗室分發覆蓋本方法的測量范圍(0.05%~4.0%)的五個水平試樣,要求各實驗室由一名操作員按方法標準草案操作,在重復性條件下,每個水平給出3個獨立的測量數據,按規定每個數據給出3位(或4位)有效數字。根據各共同試驗實驗室的測量結果進行統計檢驗,計算分析方法的重復性限r和再現性限R,確定其函數關系式,給出方法精密度的最終表達形式。
對每個水平,設實驗室i第k次測量結果為yik,按式(1)和式(2)計算實驗室i測量結果的單元平均值和標準差。
(1)
(2)
按式(3)和式(4)計算該水平p個實驗室間測量結果平均值和標準差,
(3)
(4)
在計算中同時用曼德爾(Mandel)統計量h和k檢查是否存在測量精度和測量準確度在多個水平上異常的實驗室,以科克倫(Cochran)法和格拉布斯(Grubbs)法檢驗各實驗室測量結果(單元)精密度的一致性和平均值的一致性。
在確認有效測量結果后,計算實驗室內重復性方差(式5)。
(5)
計算實驗室間變動性方差(式6)。
(6)
由實驗室內重復性方差和實驗室間變動性方差計算再現性方差(式7)。
(7)
計算的sr,sL和sR,分別表示了實驗室內測量結果的標準差、扣除實驗室內因素的實驗室間測量結果的標準差和考慮了實驗室內因素的實驗室間測量結果的標準差。
本試驗中,n=3,式⑺簡化為:
(8)
計算重復性限r和再現性限R:
(9)
(10)
將各水平計算得的重復性限r和再現性限R對測量結果平均值m進行線性迭代回歸和對數回歸,得分析方法測量值m對重復性限r和再現性限R的線性回歸方程和對數回歸方程,并最后確定表示分析方法精密度的最終表達式。
圖1給出了精密度共同試驗測量結果統計分析的基本流程。

圖1 精密度共同試驗測量結果統計分析基本流程圖Figure 1 Basic flow chart for conducting statistic analysis on the measurement data from the cooperative tests on precision.
匯總8個共同試驗實驗室的測量結果,未發現有不規則的數據。共同試驗的原始數據列于表1。
按式(11)和式(12)計算各水平和實驗室的曼德爾統計量k值和h值,并作圖表示。圖2、圖3表明,不存在有多個單元方差極端值和單元平均值的實驗室,但有數個超過k臨界值和h臨界值的數據。這幾個數據是否是岐離值或離群值,則繼續進行單元方差一致性檢驗和平均值一致性檢驗。
(11)
(12)

表1 二氧化硅精密度共同試驗原始數據匯總表 Table 1 Raw data summary for the cooperative test on the precision for the determination of silicon dioxide

圖2 按實驗室分組的實驗室單元方差一致性的曼德爾k圖Figure 2 Mandel’s k graph for the consistency of the laboratory unit variance grouped by laboratories.
(1)實驗室單元方差的一致性檢驗和重復性限r的計算
由平方和按式(5)計算各水平的重復性方差sr2和標準差sr,按式(9)計算重復性限r值。

表2 各水平單元方差的一致性檢驗及重復性標準差和重復性限的計算 Table 2 Consistency test for the variance of every level unit and calculation of repeatability standard deviations and repeatability limits

圖3 按實驗室分組的實驗室單元平均值一致性的曼德爾h圖 Figure 3 Mandel’s h graph for the consistency of the laboratory unit average grouped by laboratories.
(2)實驗室單元平均值的一致性檢驗和再現性限R的計算

通常,分析方法的重復性限r(和再現性限R)與其含量m的數學關系可用線性方程或對數方程表示。
線性方程:r=a+blgm
對數方程:lgr=c+dlgm(或相應的指數方程r=cmd)
將由表2、表3得到的r和R與相應水平的含量m值進行線性回歸和對數回歸。
(1)重復性限線性回歸方程擬合

計算數據表明,進行兩次迭代后的重復性限r變化不大(即方程r2和r3十分接近),通常進行兩次迭代即可。
(2)重復性標準差對數回歸方程計算
按GB/T 6379.2給出的計算式計算重復性限r與m的對數回歸方程系數c和d,計算的參數見表5。數學上可證明,對數回歸不必進行迭代計算,直接以其對數進行線性回歸即可。

表3 各水平單元平均值的一致性檢驗及再現性標準差和再現性限的計算 Table 3 Consistency tests for the average of each level unit and the calculation of the standard deviation and repeatability limit

表4 重復性限加權迭代線性回歸方程的計算參數 Table 4 Parameters that were used in iteratively computing linear regression equation weighted by repeatability limit

表5 二氧化硅測量重復性限的對數回歸方程計算參數 Table 5 Parameters that were used in iteratively calculating logarithm regression equation weighted by repeatability limits for the silica measurement
(3)重復性限r與m回歸方程的確定
計算回歸方程的相對誤差平方和[2-3],以確定重復性限r與m回歸方程的最終表達式。
表6分別列出了各水平的m、r及由線性方程和對數方程計算的重復性限r1和r2,并計算各水平的誤差、相對誤差平方。

表6 相對誤差平方和的計算 Table 6 Computation of the sum of squared relative errors
計算線性方程q個水平的相對誤差平方和:
計算對數方程q個水平的相對誤差平方和:
由于Se1 由表3的mj、Rj數據,按1.4方法,同樣可計算得再現性R與m的線性回歸方程和對數回歸方程: 線性方程:R=0.011 72+0.041 35m 對數方程:lgR=-1.213 5+0.631 1×lgm 計算兩回歸方程的相對誤差平方和,得線性方程Se1=0.112,對數方程Se2=0.260。 由于Se1 圖4給出了重復性限r和再現性限R與m的函數關系的擬合曲線圖。比較各函數關系曲線,r和R的線性回歸曲線更接近于精密度試驗數據的分布。用相對誤差平方和判斷與擬合曲線圖示是一致的。 圖4 光度法測定二氧化硅分析方法的重復性限r和再現性限R與m的函數關系曲線擬合圖Figure 4 Curve fitting graphs for the function relation (a) between repeatability limit r and content(level) m, (b) between reproducibility limit r and content(level) m for the determination of silicon dioxide by spectrophotometry. 為使用方便,按確定的回歸方程計算各二氧化硅含量段的重復性限r值和再現性限R值(見表7),兩含量段間的r(和R)值可近似用線性內插法計算。 將光度法測定二氧化硅原標準和修訂標準精密度的比較列于表7。 表7表明,修訂標準的重復性限r和再現性限R值基本相當或略小于原標準相應的實驗室內允許差和實驗室間允許差,這符合石灰石、白云石分析的實際情況。 表7 新舊標準精密度的比較 Table 7 Comparison of the new standard precision and the old standard precision (1)參加共同試驗的實驗室應當從所有使用該測試方法的實驗室中隨機抽取,不宜都來自那些特別“標準”或受過專門訓練的實驗室組成。參加的實驗室應有一定的代表性,包括不同地域、氣候,使用不同儀器、測量設備等因素,使最后統計出的精密度參數能代表各實驗室總體的水平。參加精密度共同試驗的實驗室數p通常取8~15。 (2)精密度試驗所使用的樣品應該完全能代表該測試方法在正常使用中的那些物料,不應全部是較為容易分析的樣品,亦不應都是較難分析的樣品。所取各樣品成分的含量應盡可能(或基本上)覆蓋測試方法的測量范圍,通常取5個或5個以上不同水平的樣品。精密度試驗負責實驗室不能將樣品的中心值(或認證值)告知各實驗室,或在實驗室之間互相“串通”,以確保測量結果的真實性。 (3)精密度試驗中特別強調要保證測試數據的獨立性。通常在測試過程中未發現異常的過失,其測試數據不能隨意丟棄,更不能從多個測量結果中選擇性報出試驗結果。操作員要認識到,參加精密度試驗不是進行操作水平的考核,測試的目的之一是求得在重復性條件下測量結果的真實分布,操作員不應隨意對不一致的結果進行丟棄或重測。如果共同試驗時部分實驗室將室內之差或室間之差很小的高精密度數據報給精密度試驗組織單位統計,則統計出的重復性限或再現性限很小,形成了假象的高精密度統計結果,在實踐中測量值的精度往往達不到方法制定的精密度要求,不利于今后標準的可操作性及執行性。 另外,對統計檢驗的岐離值(異常值)和離群值(高度異常值)的處置要慎重,通常保留的岐離值,而只剔除離群值。有時統計出來的重復性限和再現性限很大,可能反映了兩個問題。一是共同試驗人員沒有很好按分析方法規定的測量條件執行,操作的隨意性大;二是分析方法規定的測量條件不嚴密(或不是最佳條件),可操作性差,致使實驗室間測量結果高度離散。由此,分析方法的試驗一定要認證細致,測量條件嚴密認證,提出的分析方法要有很好的穩健性和可操作性。 (4)操作員應根據測試方法進行操作,不能隨意改變測試條件,以保證各實驗室都在相同的方法和條件下進行測試。操作員應報告測試中遇到的異常現象和困難,鼓勵操作員對標準測試方法做出評價,并提出標準測試方法存在的不足,以利于標準的修訂和改進。 各實驗室按規定報出數據的有效位數,不要自行過度修約。數據的過度修約會丟失測量精度的信息,并影響統計量計算的可靠性。在統計過程中也不要隨意修約,在全部計算完成后進行一次性修約。表格表示的單元平均值等至少要多保留一位有效數字。 [1] 國家標準委員會.GB/T 6379.2—2004 測量方法與結果的準確度(正確度與精密度):第2部分確定標準測量方法重復性與再現性的基本方法[S].北京:中國標準出版社,2004. [2] 方開泰,項可風,劉光儀.測試方法的精密度[M].北京:中國標準出版社,1988:28-47. [3] 曹宏燕.冶金材料分析技術與應用 [M].北京:冶金工業出版社.2008.913-928. [4] 國家標準委員會.GB/T 4883—2008 數據的統計處理和解釋 正態樣本離群值的判斷和處理[S].北京:中國標準出版社,2008.1.5 再現性限R回歸方程的擬合
1.6 函數關系的圖示

2 新舊標準精密度的比較

3 結語