李 軍,宋金明
(中國科學(xué)院 海洋研究所, 山東 青島 266071)
能力驗證(Proficiency testing)是國際上通用的評價實驗室檢測/校準(zhǔn)能力的手段和方法。開展能力驗證,是驗證實驗室技術(shù)能力,督促獲得資質(zhì)認(rèn)定的實驗室不斷提高技術(shù)水平的重要手段,可為評價實驗室出具數(shù)據(jù)的可靠性和有效性提供客觀依據(jù),實驗室也可以根據(jù)能力驗證評價結(jié)果提高自身的質(zhì)量體系管理水平。國家認(rèn)證認(rèn)可監(jiān)督管理委員會也于 2006年頒布了《實驗室能力驗證實施辦法》規(guī)范實驗室能力驗證活動和提高實驗室能力驗證活動的有效性。
能力驗證是多個實驗室針對特定具有“準(zhǔn)標(biāo)準(zhǔn)”的樣品,按照統(tǒng)一的標(biāo)準(zhǔn)規(guī)范方法進(jìn)行測定,針對不同實驗室的測定結(jié)果,以評定其測定結(jié)果的偏離程度,最終確定參加能力驗證實驗室的檢測能力與水平。近年來,我國海洋科技界組織過幾次行業(yè)內(nèi)的能力驗證,樣品涉及海水、海洋生物體、海洋沉積物等,對規(guī)范海洋實驗室的標(biāo)準(zhǔn)化運行、提高我國海洋監(jiān)/檢測實驗室的技術(shù)水平、提升海洋監(jiān)/檢測人員業(yè)務(wù)水平和確保海洋監(jiān)測/檢測數(shù)據(jù)質(zhì)量,發(fā)揮了重要的作用。本文對穩(wěn)健統(tǒng)計技術(shù)(Robust statistical technique)和Grubbs檢驗法在實驗室間能力驗證中的應(yīng)用,以海洋生物體中總汞測定結(jié)果為例進(jìn)行了分析,以期推動拓展穩(wěn)健統(tǒng)計技術(shù)在實驗室間能力驗證結(jié)果分析中的應(yīng)用。
穩(wěn)健統(tǒng)計技術(shù)(Robust statistical technique)是國際上廣泛采用的實驗室能力驗證結(jié)果的數(shù)據(jù)統(tǒng)計和能力評價的方法,中國合格評定國家認(rèn)可委員會也推薦使用此方法進(jìn)行能力驗證結(jié)果統(tǒng)計和評價[1-2]。穩(wěn)健統(tǒng)計技術(shù)主要統(tǒng)計量有結(jié)果總數(shù)(N)、中位值(Median)、標(biāo)準(zhǔn)化四分位間距(NormIQR)、穩(wěn)健變異系數(shù)(Robust CV)、最小值(Xmin)、最大值(Xmax)、變化范圍(Range)等7個。
1)結(jié)果總數(shù)(N): 對一個特定樣品按照統(tǒng)一的規(guī)范方法檢測得到的結(jié)果的數(shù)量。
2)中位值(Median): 一組由小到大排列的 N個測量值的中間值,當(dāng)N為奇數(shù)時,中位值為(N+1)/2個次序測量值;當(dāng)N為偶數(shù)時,中位值為N/2與(N/2+1)兩個次序測量值的算術(shù)平均值。
3)標(biāo)準(zhǔn)化四分位間距(NormIQR): 表示數(shù)據(jù)分散程度的一個統(tǒng)計量,類似于正態(tài)分布中的標(biāo)準(zhǔn)偏差,由上四分位值(Q3)和下四分位值(Q1)計算而得。下四分位值(Q1)為在一組順序排列的測量值中,低于結(jié)果的四分之一處的最近值,即盡可能有1/4的測量值低于該值。上四分位值(Q3)為在一組順序排列的測量值中,高于結(jié)果的3/4處的最近值,即盡可能有1/4的測量值高于該值。大多數(shù)情況下,Q1和Q3通過相鄰兩個數(shù)據(jù)值的內(nèi)插獲得。上四分位值Q3與下四分位值Q1的差值,即IQR = Q3-Q1叫做四分位間距(IQR)。由四分位間距IQR乘以因子0.7413即得標(biāo)準(zhǔn)化四分位間距(NormIQR),即 NormIQR =0.7413×IQR。
4)穩(wěn)健變異系數(shù)(Robust CV): 等于標(biāo)準(zhǔn)化四分位間距(NormIQR)除以中位值(Median),并以百分?jǐn)?shù)表示,即 Robust CV = 100%×NormIQR/ Median。
5)最小值(Xmin): 一組由小到大順序排列的測量值中的最低值。
6)最大值(Xmax): 一組由小到大順序排列的測量值中的最高值。
7)變化范圍(Range): 最大值與最小值之差,即Range=Xmax-Xmin。
穩(wěn)健統(tǒng)計技術(shù)用中位值(Median)和標(biāo)準(zhǔn)化四分位間距(NormIQR)代替經(jīng)典統(tǒng)計方法中的平均值和標(biāo)準(zhǔn)偏差,克服了經(jīng)典統(tǒng)計方法容易受離群值(極端值)影響的缺點,從而保證了統(tǒng)計方法的穩(wěn)健性。
能力驗證通常采用單一樣品或樣品對(樣品均勻性需滿足驗證要求)進(jìn)行,當(dāng)使用單一樣品作為能力驗證樣品時,通過各實驗室提供的數(shù)據(jù)計算 Z比分?jǐn)?shù)來評定一個實驗室的檢測能力。Z比分?jǐn)?shù)按下式計算:

|Z|≤ 2 為滿意結(jié)果;
2<|Z|<3 為有問題或可疑結(jié)果;
|Z|≥ 3 為不滿意或離群結(jié)果。
當(dāng)使用樣品對作為能力驗證樣品(設(shè)定測量結(jié)果為A和B)時,首先計算結(jié)果對的標(biāo)準(zhǔn)化和(S)和標(biāo)準(zhǔn)化差(D)。


ZB和ZW反映的是實驗室的系統(tǒng)誤差和偶然誤差,|ZB|≥3表明該實驗室的 ZB值為不滿意或離群結(jié)果,實驗室的系統(tǒng)誤差太大;|ZW|≥3表明該實驗室的 ZW值為不滿意或離群結(jié)果,實驗室的偶然誤差太大。
經(jīng)典的離群數(shù)據(jù)統(tǒng)計檢驗方法有多種,如Dixon檢驗法、Grubbs檢驗法、Cochran檢驗法等,《海洋監(jiān)測規(guī)范》對上述方法都有介紹,并推薦使用這些方法判定離群數(shù)據(jù),其中 Grubbs檢驗法應(yīng)用比較廣泛[3-4]。Grubbs檢驗法適用于檢驗一組測定值中最大值或最小值是否為離群值,此方法通過計算平均值和標(biāo)準(zhǔn)偏差SD,然后計算可疑值的統(tǒng)計量(T),通過查閱 Grubbs檢驗臨界值(Tα)表,在一定的顯著性水平(α)下與查到的臨界值(Tα)比較,當(dāng)統(tǒng)計量的計算值大于確定的顯著性水平 α(海洋行業(yè)一般確定 α=0.01,相當(dāng)于可信度為 99%)時的臨界值,此可疑值即為離群值,剔除此離群值,并對剩余數(shù)據(jù)繼續(xù)檢驗,直到數(shù)據(jù)中無異常值為止。
對同一驗證樣品檢測得到的 N個測量結(jié)果,分別為X1,X2,…,XN,按由小到大順序排列,最大值記為Xmax,最小值記為Xmin,對這N個測量結(jié)果按下式計算平均值和標(biāo)準(zhǔn)偏差SD:

可疑值為最大值時統(tǒng)計量T1按下式計算:

可疑值為最小值時統(tǒng)計量T2按下式計算:

使用Grubbs檢驗法評定離群值,有兩種情形:
第一種情形,單側(cè)情形,即離群值要么是最大值,要么是最小值,這需要根據(jù)經(jīng)驗或?qū)嶋H情況判定,在此種情形下,按式(6)或式(7)計算統(tǒng)計量 T1或T2,與顯著性水平α= 0.01時的臨界值(Tα)比較,如果T1>Tα,則評定最大值 Xmax為離群值;如果 T2>Tα,則評定最小值Xmin為離群值。
第二種情形,雙側(cè)情形,即離群值可能是最大值,也可能是最小值,按式(6)和式(7)分別計算統(tǒng)計量T1或T2,在此種情形下,需與確定的顯著性水平α的一半的顯著性水平(即α/2)時的臨界值(Tα/2)比較,如果 T1>T2且 T1>Tα/2,則評定最大值 Xmax為離群值;如果 T2>T1且 T2>Tα/2,則評定最小值 Xmin為離群值。
海洋環(huán)境中的汞作為主要的重金屬污染物,是海洋環(huán)境質(zhì)量調(diào)查研究中的常規(guī)檢測項目[5],由于汞的易揮發(fā)性,樣品的處理對最終檢測結(jié)果影響甚大,如操作不規(guī)范,將導(dǎo)致測定結(jié)果的不可信[6]。所以選擇海洋生物體中總汞進(jìn)行實驗室間能力驗證具有典型性和代表性。
我國海洋科技界近期組織了一次海洋行業(yè)通過實驗室資質(zhì)認(rèn)定的海洋監(jiān)/檢測實驗室能力驗證活動,驗證項目之一為海洋生物體中總汞(Hg)含量的測定。該驗證采用單一樣品作為能力驗證樣品,參加的實驗室共60家,在規(guī)定的時間內(nèi),提供有效數(shù)據(jù)的51家,各實驗室提供2個平行測定結(jié)果,取平均值進(jìn)行統(tǒng)計處理。采用穩(wěn)健統(tǒng)計技術(shù)處理后,根據(jù)式(1)計算Z比分?jǐn)?shù),結(jié)果見表1(未提供有效數(shù)據(jù)的9家實驗室,代碼為 4、28、41、44、49、51、53、57、58 未在表1中列出)。
依據(jù)表1中的數(shù)據(jù),可得Z比分?jǐn)?shù)絕對值范圍狀態(tài)分布圖(圖1)。結(jié)合表1和圖1可以看出,有42個實驗室提供的數(shù)據(jù)屬滿意結(jié)果(︱Z︱≤ 2),占82.4%,說明絕大多數(shù)實驗室具有良好的檢測能力;4個實驗室提供的數(shù)據(jù)屬有問題或可疑結(jié)果(2<|Z|<3),占7.8%;其余5個實驗室的Z比分?jǐn)?shù)絕對值大于3,占 9.8%,屬不滿意結(jié)果,說明這 5個實驗室的測定值為離群值。其中,23、60、30實驗室的離群值最大,其實驗室測定結(jié)果不可信。

圖1 海洋生物體中總汞含量測定能力驗證Z比分?jǐn)?shù)絕對值范圍分布圖Fig.1 Z-Score distribution of total mercury in marine organisms
根據(jù)Grubbs檢驗法對本次能力驗證活動生物體中總汞含量測定值(表 1)進(jìn)行離群值檢驗,將表 1中的測定值按由小到大順序排列,見表2。
按式(4)和式(5)計算平均值和標(biāo)準(zhǔn)偏差,式(6)和式(7)計算可疑值為最大值或最小值的統(tǒng)計量T1或T2,并查閱 Grubbs檢驗臨界值(Tα)表,此處離群值可能是最大值,也可能是最小值,因此需查閱與確定的顯著性水平 α=0.01的一半即 α/2=0.005(相當(dāng)于可信度為99.5%)時的臨界值Tα/2,依據(jù)1.2中給出的離群值評定準(zhǔn)則,與計算出的統(tǒng)計量進(jìn)行比較,發(fā)現(xiàn)離群值,剔除該離群值,對余下的數(shù)據(jù)繼續(xù)檢驗,直到?jīng)]有新的離群值為止。結(jié)果見表3。
結(jié)合表2中實驗室的測定數(shù)據(jù),由表3中可以看出,代碼為23、60和30的實驗室測定數(shù)據(jù)為離群值。與穩(wěn)健統(tǒng)計技術(shù)相比,離群值評定結(jié)果一致。在 2.1結(jié)果中,代碼為38和52的實驗室(Z值分別為3.86和 3.08,處于離群結(jié)果的臨界處)的測定值也評定為離群值,而用 Grubbs檢驗法評定,此兩個實驗室的數(shù)據(jù)評定為非離群值。
實驗室能力驗證樣品測定結(jié)果的評定直接決定了驗證結(jié)論,因此,樣品測定結(jié)果評定的科學(xué)、公正至關(guān)重要。本文首先對目前常用的穩(wěn)健統(tǒng)計技術(shù)(Robust statistical technique)和Grubbs檢驗法進(jìn)行了介紹,而后,應(yīng)用這兩種方法對實驗室間能力驗證海洋生物體樣品總汞含量檢測結(jié)果進(jìn)行了評定分析。結(jié)果表明,兩種統(tǒng)計方法在海洋生物體樣品總汞含量評定離群值結(jié)果基本一致。與Grubbs檢驗相比,穩(wěn)健統(tǒng)計技術(shù)數(shù)據(jù)處理和計算程序更加科學(xué)、直觀和簡潔方便。但也應(yīng)注意,使用穩(wěn)健統(tǒng)計技術(shù)評價能力驗證的結(jié)果時,對處于臨界狀態(tài)的離群值應(yīng)更加審慎,避免出現(xiàn)統(tǒng)計學(xué)上的“棄真”風(fēng)險。

表1 海洋生物體中總汞含量測定評價穩(wěn)健統(tǒng)計結(jié)果Tab.1 Proficiency testing results of the total mercury in marine organisms analyzed by robust statistical techniques

表2 海洋生物體中總汞含量測定結(jié)果按順序排列表Tab.2 Test results in sequential order for total mercury in marine organisms

表3 Grubbs檢驗評定海洋生物體樣品能力驗證中的離群值結(jié)果Tab.3 Results of outliers in proficiency testing for total mercury in marine organisms analyzed by Grubbs test method
[1]中國合格評定國家認(rèn)可委員會.CNAS-GL02,能力驗證結(jié)果的統(tǒng)計處理和能力評價指南[S].
[2]夏錚錚,劉卓慧.實驗室認(rèn)可與管理基礎(chǔ)知識[M].北京: 中國計量出版社,2003: 86.
[3]中華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會.數(shù)據(jù)的統(tǒng)計處理和解釋,正態(tài)樣本離群值的判斷和處理[S].北京: 中國標(biāo)準(zhǔn)出版社,2008.
[4]中華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會.GB17378.2-2007,海洋監(jiān)測規(guī)范 第2部分: 數(shù)據(jù)處理與分析質(zhì)量控制[S].北京:中國標(biāo)準(zhǔn)出版社,2007.
[5]Song Jinming.Biogeochemical Processes of Biogenic Elements in China Marginal Seas[M].Springer-Verlag GmbH &Zhejiang University Press,2010: 1-662.
[6]Duan Liqin,Song Jinming,Xu Yayan,et al.The distribution,enrichment and source of potential harmful elements in surface sediment sof Bohai Bay,North China[J].Journal of Hazardous Materials,2010,183: 155-164.