李玉武 狄一安 孫海容 曹實 任立軍 周昊郭婧 楊勇杰 王斗文
(1國家環境分析測試中心,北京 100029;2中國合格評定國家認可中心,北京 100062;3遼寧出入境檢驗檢疫局,遼寧大連 116001)
用經驗模型評估環境樣品測量不確定度
李玉武1狄一安1孫海容2曹實2任立軍1周昊1郭婧1楊勇杰1王斗文3
(1國家環境分析測試中心,北京 100029;2中國合格評定國家認可中心,北京 100062;3遼寧出入境檢驗檢疫局,遼寧大連 116001)
利用水樣、土壤和沉積物標準樣品定值數據,建立了評估環境樣品測量結果不確定度的經驗模型。討論了判斷模型質量的指標。用建立的經驗模型估算了實際標樣和能力驗證數據不確定度,并與實測結果進行了比較。探討了利用本模型計算的相對標準偏差允許限用于實驗室內部質量管理與控制的可行性。經驗模型能幫助客戶判斷送檢樣品檢測結果在臨界值時能否滿足相關要求。
不確定度評估;經驗模型;Horwitz函數;標樣協作定值
近年來,在中國合格評定國家認可委員會的大力推動下,測量結果不確定度評估越來越受到各級檢測實驗室的重視。認可委要求已獲認可的檢測實驗室應有能力對每一項有數值要求的測量結果進行測量不確定度評定。如果客戶有要求,檢測報告必須提供測量結果的不確定度。實驗室目前大多使用GUM法[1-2]。GUM法注重各種不確定度分量的識別與計算,評估過程繁瑣,評估過程未考慮實驗室內質控數據或實驗室間精密度數據。考慮到人力物力等因素,實驗室很難對不同測試項目、不同濃度的檢測結果提供測量不確定度。
除了經典的GUM方法外,近年來還有一些方法在歐洲和美國實驗室得到廣泛應用。我國也有相關標準推出,如精密度法[3]、控制圖法[4]、經驗模型法[5]、線性擬合法[6]和蒙特卡洛法[7]。這些方法均是在滿足特定條件下,對標準JJF1059.1的簡化和延伸應用。其中基于Horwitz函數的經驗模型法由于具有操作簡便的特點,受到基層實驗室關注。但文獻中的應用示例均為鋼鐵、金屬和礦產、食品衛生等行業檢測數據,基于環境樣品測試數據的經驗模型研究未見報導。
利用我國環境保護和地質資源行業長期積累的水樣、土壤和沉積物標準樣品定值數據,建立了評估環境樣品測量結果不確定度的經驗模型。討論了判斷模型質量的指標。用建立的經驗模型估算了實際標準樣品和能力驗證數據不確定度,并與實測結果進行了比較。探討了利用本模型計算的相對偏差允許限用于實驗室內部質量管理與控制的可行性。
基于Horwitz函數式的經驗模型法又稱目標不確定度法。Horwitz函數描述了分析濃度c與分析精密度(復現性標準偏差Sr或相對標準偏差Srsd)之間的關系,由美國Dr.Horwitz[8]于二十世紀八十年代提出。此函數是經驗擬合模型最為經典和簡潔的數學式,它有三種表達式[9],S=0.02c0.85(其中S、c均為質量濃度);Srsd=2c-0.15和Srsd=21-0.5logc(Srsd單位為%)。20世紀20年代到90年代幾萬次數據的驗證都證明了其正確性[10]。據作者發表的實驗數據分析結果和結論來看,此函數表達式中分析結果精密度只與分析濃度有關而與樣品類型、基體、檢測項目、分析方法無關。雖然該函數描述的是實驗室間精密度與分析濃度的關系,但也常用來監控實驗室內精密度。
在確保測量系統受控前提下,通過長期大量能力驗證實驗數據積累建立的經驗模型,已用于同領域樣品測量結果不確定度評定[11-13]。
ISO TC17(鋼鐵化學分析)專業委員會和ASTME01(金屬、礦產及相關材料化學分析)專業委員會根據多次能力驗證的數據(鋼鐵、金屬和礦產等相關領域)對經驗模型法進行了驗證[14-16]。TC17組織的實驗室間比對采用了45個國家和國際標準,通過6種方法(重量法、分光光度法、原子吸收光譜法、滴定法、電位法、高頻紅外碳硫法),對鋼鐵中的21種元素進行了測定[17]。ASTME01利用2年多的時間實施了碳素鋼、低合金鋼和不銹鋼等的實驗室間比對,被測元素有碳、錳、磷、硫、硅、銅、鎳、鉻、鉬、鋁和錫等,涉及原子發射光譜法、原子吸收光譜法、X-射線熒光光譜法、電感耦合等離子體質譜法(ICP-MS)法。結合上述獲得的數據,隨后E01又組織了120多個實驗室的碳素鋼和低合金鋼的比對、以及40多個實驗室的不銹鋼材料檢測結果的比對。兩個組織得到的經驗模型見表1。

表1 根據能力驗證活動數據建立的經驗函數式*Table 1 The empirical models established based on experimental data from inter-laboratory proficiency tests
圖1給出了ASTME01實驗室間比對的穩健統計對數作圖(圖中實心矩形點為離群值)。根據文獻[5]建議,實驗室可參考Horwitz函數表達式給出自己的經驗模型,并通過F檢驗,判定經驗模型是否有效。

圖1 經驗模型法示意圖[5](引自ASTME01實驗室間比對測量數據)Figure 1.Schematic diagram of the empirical model based on experimental data from collaborative studies between laboratories.
水質樣品數據有2個系列。系列1取自環保部標準樣品所標樣協作定值網2006~2011年期間每年1次組織的標樣協作定值結果通知單(167個數據)。系列2來自環境保護部標準樣品研究所網站(http://www.ierm.com.cn/)提供的2009~2011年能力驗證結果報告(88個數據)。
土壤標準物質有2個系列。系列1有8個樣品(470個數據);系列2有4個樣品(88個數據)。水系沉積物標準物質有2個系列。系列1有12個樣品(650個數據),系列2有3個樣品(159個數據)。除了土壤系列2取自中國環境監測總站標準物質證書(土壤成分分析標準物質,1986年定值,2003年修訂),其他數據均取自中國地質科學研究院地球物理地球化學勘查研究所(河北廊坊)標準物質證書(土壤成分分析標準物質,1986年定值,2003年修訂)。系列1用于建立模型,系列2用于檢驗模型。
上述標樣各系列樣品編號、測試項目名稱及分析方法見表2。系列1用于建立模型,系列2用于檢驗模型。
實際環境樣品數據中,土壤(礦石)數據來自中科院地質與地球物理研究所網站(http://www.igg.cas.cn/)微量元素分析室提供的國際比對實驗數據。氨氮測試數據是作者所在實驗室2010~2011年期間積累的各種工業廢水(如化肥、造紙、煤化、城市污水、制藥、化工、食品工業、焦化、石化等)中氨氮檢測報告。測定方法采用納氏試劑分光光度法。應客戶要求,檢測過程均采用兩次平行測定。

表2 實驗數據一覽表Table 2 Summary of experimental data used in this paper
各種標準或指南中不確定度的評估方法大致可分為兩類:“自下而上”和“自上而下”。GUM是基于計量學“自下而上”的計算方法:分析、計算分析步驟中每一操作涉及的不確定度分量,計算合成標準不確定度,然后乘以包含因子得到擴展不確定度(置信區間為95%)。GUM方法可完全覆蓋物理測量,但沒有對與化學和生物測量相關的特殊問題作出特定的規定。例如關于樣品前處理步驟,雖然對分析程序中的單一步驟(稱量、溶液移取等)、標準溶液濃度的計算、校準曲線擬合不確定度的評定,GUM也給予一般原則和指導,但GUM方法應用于較為復雜的化學測量時仍有一定局限性[18]。研究結果表明,化學分析中不確定度的主要分量大多為校準曲線和樣品重復測定。但這種重復性測定一般均是當天或短時間內完成,未能反映實驗室長期質控狀態,也不涉及實驗室間的分析精密度(如同一項目能力驗證數據及標樣協作定值)。
“自上而下”的方法使用從方法確認、實驗室內質控和/或實驗室間協作定值、能力驗證等研究數據[3-6]。由于使用了長期積累的質控數據,評估過程全面反映不確定度的潛在來源的機率會更大。在評定化學測量結果的不確定度時,“自上而下”的方法比GUM法更為實用。但能力驗證和協作定值數據的積累或獲取不是件容易的事情,普通基層實驗室很難做到。充分利用各種標準樣品定值結果,建立適合自己實驗室的經驗模型將是評估測量結果不確定度的一條有效途徑。
不確定度的一個重要應用體現在各種標準樣品定值結果的表達。協作定值結果通知單或標樣說明書上的定值結果一般表示為:標準值±不確定度。這里的不確定度是擴展不確定度。利用Excel電子表格數據趨勢線或分析工具提供的計算功能,將分析含量(濃度)和擴展不確定度作圖,用冪函數y=a×cb進行擬合(或將分析含量和擴展不確定度分別取對數后進行線性擬合,lgy=lga+blgc)。圖2(a)~2(d)分別顯示了基于水質、土壤和沉積物標樣微量元素和常量元素保證值與不確定度的函數關系。模型擬合參數參見圖2和表3。

圖2 基于環境標準樣品定值數據建立的經驗模型Figure 2.The empirical model based on the certified values of the environmental standard.

表3 環境樣品經驗模型參數、擬合質量指標一覽表Table 3 Summary of empirical model parameters and its fitting quality index based on environmental samples
從圖2(a)~圖2(d)可以看出,水質、土壤和沉積物標樣協作定值及保證值數據中,濃度與不確定度之間關系基本符合Horwitz函數特征,濃度和不確定度取對數后,存在明顯的線性關系,均通過了相關系數和F檢驗。但其參數與原函數y=0.0384c0.58(在圖中用折線表示)的兩個參數明顯不同。土壤與沉積物模型參數比較接近,但兩者與水樣模型差別較大,這可能與分析物檢測結果單位有關。土壤、沉積物分析物濃度是質量分數,而水標樣濃度單位是mg/L。為便于比較,將Horwitz函數S=0.02c0.85(此處S和c單位為質量分數),進行轉化,將S和c單位變為μg/g,S=(0.02 ×(c/1000000)0.8495)×1000000;經整理為:S=0.020× 100.903c0.850=0.160c0.850。將土壤和沉積物中微量元素經驗模型(參見圖2(b),2(c))系數a除以2,從擴展不確定度轉為S的表達式,S=0.0670c0.863和S=0.0715c0.851。與S=0.160c0.850相比,土壤與沉積物中微量元素經驗模型系數b與Horwitz函數比較接近,但系數α仍有明顯區別。這表明,標準物質的協作定值SR明顯低于基于能力驗證數據的SR。
圖2結果表明,Horwitz函數描述的分析物濃度與測量不確定度(或精密度)的關系在環境領域也存在,但在應用時,應根據本領域的實驗數據進行擬合,確定模型參數。
表3列出了4個經驗模型的擬合質量指標和擬合參數區間(95%上下限)。相關系數越接近1,標準誤差越小,表明模型擬合質量越高。參數區間越窄,表明模型計算值不確定性越小。由擬合參數區間可知建立的經驗模型用于預測時仍存在一定的不確定性。蒙特卡羅模擬法可以定量計算其不確定度。進一步的研究仍在進行中。
經驗模型計算結果檢驗可采用F方差和H比值檢驗法。其意義在于幫助判斷計算值與實驗值在數理統計上有無顯著性差別。分別將擴展不確定度實驗值和計算值分別除以2轉化為復現性標準偏差,H=SR實驗/SR計算;F=SR2實驗/SR2計算。H比值越接近于1,表明實驗值與計算值越接近,結果越理想。
用建立的經驗模型預測了水常規項目、土壤和沉積物微量元素測量結果不確定度。系列1數據參與建立模型,系列2是未參與建立模型,專門用于檢驗模型的數據。圖3顯示了水、土壤和沉積物7個系列數據穩健標準偏差計算值與實驗值F比值和H比值統計分類數據,數據按兩種標準分類,一類是F比值<0.33、0.33~3.0、>3.0;另一類是基于H=0.5~2.0的判斷標準(見4.4節),H比值<0.50、0.5~2.0、>2.0。

圖3 經驗模型計算結果F比值(a)和H比值(b)檢驗Figure 3.(a)Fratio and(b)Hratio test for measurement uncertainty estimated by the empirical model.
從圖3(a)可以看出,7個系列數據中F比值為0.33~3.0的比例為69.2%~88.0%,平均值為82.5%。除了土壤系列2符合要求的比例偏低外,其他系列數據無明顯差別。如果按照H比值要求0.5~ 2.0,其比例為86.4%~94.0%,平均值為91.6%,參見圖3(b)。此結果表明,7個系列數據中大多數測試數據的擴展不確定度計算值與實驗值在統計意義上沒有顯著性區別。
表4列出了3個沉積物樣品測量不確定度的預測值與實驗值及F值。從表中數據可以看出,大多數預測值與實驗值基本符合。同時注意到,部分元素不確定度計算值與實驗值仍有較大差別。這提示應用經驗模型法時,應考慮客戶對檢測結果不確定度的誤差要求。收集、積累更多的同一檢測項目、同一分析方法、不同濃度水平樣品檢測能力驗證數據用于建立經驗模型,將會有效改善經驗模型法計算精度。

表4 經驗模型法評估沉積物樣品測量不確定度示例Table 4 Application example for evaluation of measurement uncertainty of sediment samples by empirical model μg/g

續表4
Horwitz函數的另一個應用是用于考察、判斷能力驗證或協作研究數據和分析方法標準驗證實驗數據的合理性[9]。其方法是將參加能力驗證測試或參加協作研究的各實驗室上報數據的統計值穩健標準偏差(SR實驗)與經驗模型計算值(SR計算)的比值(H=SR實驗/SR計算)來判斷數據的合理性。研究結論表明[9],當H值小于0.5時,能力驗證數據的復現性標準偏差SR過于樂觀,其實驗條件和統計結論需重新審查;如H值大于2.0,統計值SR值得懷疑,數據精度比預期要差?;诖擞^點和方法,考察了環境保護部標準樣品研究所能力驗證數據(參見圖4)。
從圖4可以看出,水質多項指標檢測能力驗證數據基本分布在經驗模型計算值附近,大部分數據點落在H=0.5和H=2.0兩條直線所包含的區間。其中有3個點H值大于2.0。其測試項目分別為CODCr(20.1mg/L),高錳酸鹽指數(2.59和3.29mg/L),這可能與用滴定法測定低濃度COD,方法本身精密度較差有關。
如果將此系列數據進行擬合,其模型參數分別為0.0570和0.950,與(水質)經驗模型參數0.0567和0.951基本一致。
經驗模型除了用于評估樣品測定結果不確定度外,更多的應用在于檢測結果符合性判斷和計算精密度限值(目標不確定度)。由于多家實驗室、多水平樣品檢測結果協作研究需要花費大量人力、物力和財力,不易實現。各種分析方法驗證實驗及合格的精密度數據都是需要下大力氣才能完成的工作。因此,利用經驗模型計算實驗室間精密度用于符合性判斷監控實驗室內精密度將具有廣泛應用前景。

圖4 經驗模型用于考察能力驗證數據Figure 4.Inspecting proficiency test data by the empirical model.
表5比較了經驗模型法(土壤)用于能力驗證結果的判斷示例。表中Z值按下式計算:

一般認為,<2,為滿意;2<<3,為可疑值,>3為離群值。從表5中可以看出,兩種方法計算的Z值基本相符。經驗模型的優點在于,如果沒有同批次大量協作實驗室數據,經驗模型法也能用來判斷考核樣品是否滿足要求。
圖5顯示的是各種工業廢水中氨氮測定精密度數據內部監控圖?;谄叫袦y定數據按下式計算相對標準偏差(圖中簡稱為實驗數據):


表5 經驗模型用于檢測結果符合性判斷示例Table 5 Application example of empirical model in compliance assessment of test result μg/g
圖中有三條控制線:最大允許限(由水標樣定值數據擬合的經驗模型計算得到);內部控制限(由最大允許限除以);Horwitz函數。三條線均顯示隨著分析物濃度減小,檢測結果的相對標準偏差增大。經典Horwitz函數(Srsd=2c-0.15)描述的趨勢更明顯。超出限值要求的數據應及時查找原因,重新測定。通過調整系數的方法可確定符合實驗室內部控制要求的控制線,經驗模型法提供了一條有效途徑,同時也需要實驗室長期的工作積累。

圖5 工業廢水中氨氮檢測結果質量內部控制圖Figure 5.The quality control chart for the test results of NH3-Nin industry waste water.
經水樣、土壤、沉積物標準樣品定值數據和能力驗證數據驗證,描述分析物濃度與實驗室間精密度之間函數關系的經驗模型,可用于評估或核對環境樣品測量結果不確定度。利用F方差和H比值可檢驗、判斷模型計算結果的合理性。沒有同批次大量協作實驗室數據,經驗模型法可以用來判斷考核樣品是否滿足要求。通過調整系數的方法可確定符合實驗室內部控制要求的控制線,經驗模型法是一條有效途徑。收集、積累更多的同一檢測項目、同一分析方法、不同濃度水平的樣品檢測能力驗證和協作定值數據,將會有效改善經驗模型法計算精度。
[1]中國實驗室國家認可委員會.化學分析中不確定度的評估指南[M].北京:中國計量出版社,2002.
[2]國家質量監督檢驗檢疫總局計量司.JJF1059.1—1999測量不確定度評定與表示[S].北京:中國標準出版社,1999.
[3]遼寧出入境檢驗檢疫局,中國標準化研究院,等.GB/Z 22553—2010利用重復性、再現性和正確度的估計值評估測量不確定度的指南[S].北京:中國標準出版社,2010.
[4]遼寧出入境檢驗檢疫局,中國合格評定國家認可中心,等.GB/T 27407—2010實驗室質量控制-利用統計質量保證和控制圖技術評價分析測量系統的性能[S].北京:中國標準出版社,2010.
[5]遼寧出入境檢驗檢疫局,中國合格評定國家認可中心,中國計量科學研究院.GB/T 27***—201*檢測實驗室中常用不確定度評定方法與表示[S].標準報批稿.
[6]遼寧出入境檢驗檢疫局,中國合格評定國家認可中心,等.GB/T 22554—2010基于標準樣品的線性校準[S].北京:中國標準出版社,2010.
[7]國家質量監督檢驗檢疫總局計量司.JJF1059.2—2011用蒙特卡洛法評定測量不確定度[S].北京:中國標準出版社,2011.
[8]Horwitz W.Evaluation of analytical methods used for regulation of foods and drugs[J].Anal.Chem.,1982,54:67A-76A.
[9]DesiréLMassart,Johanna Smeyers-Verbeke,Yvan Vander Heyden.Benchmarking for Analytical Methods:The Horwitz Curve[J].LCGC EUROPE,2005,18(10):(http://chromatographyonline.findanalytichem.com/lcgc/author/authorInfo.jsp?id=21467)
[10]Boyer K W,Horwitz W,Albert R.Interlaboratory Variability in Trace Element Analysis[J].Anal.Chem.,1985,57:454-459.
[11]Horwitz W,Kamps LR,Boyer I W.Quality Assurance in the Analysis of Foods for Trace Constituents[J].J.Assoc.Off.Anal.Chem.,1980,63:1344-1354.
[12]Margosis M,Horwitz W,Albert R.Performance characteristics of methods of analysis used for regulatory purposes.I.Drug dosage forms.F.Gravimetric and titrimetric methods[J].J.Assoc.Off.Anal.Chem.,1988,71:619-635.
[13]Horwitz W,Britton P,Chitrel S J.A Simple Method for Evaluating Data from an Interlaboratory Study[J].J.Assoc.Off.Anal.Chem.,1998,81:1257-1265.
[14]ASTME2093:2005.Standard Guide for Optimizing,Controlling and Reporting Test Method Uncertainties from Multiple Workstations in the Same Laboratory Organization[S].ASTMInternational,United States.
[15]ASTMD6689:2006.Standard Guide for Optimizing,Controlling and Reporting Test Method Uncertainties from Multiple Workstations in the Same Laboratory Organization[S].ASTMInternational,United States.
[16]ASTME2437:2005.Standard Practice for Designing and Validating Performance-Based Test Method for the Analysis of Metals,Ores,and Related Materials[S].ASTMInternational,United States.
[17]Hobson,J D.ISO Document N938,A Survey of the Precision of Standard Methods for Analysis of Steel and Iron,based on ISO,ECISS/ENand BSI Statistics,revised 1992-06-01.
[18]National Association of Testing Authorities,Australia(NATA),Technical Note 33,December 2009,Guidelines for estimating and reporting measurement uncertainty of chemical test results.
Evaluation of Measurement Uncertainty for Environmental Sample by Empirical Model
LI Yuwu1,DI Yian1,SUNHairong2,CAO Shi2,RENLijun1,ZHOU Hao1,GUO Jing1,YANG Yongjie1,WANG Douwen3
(1.NationalResearchCenterforEnvironmentalAnalysisandMeasurements,Beijing,100029,China;2.ChinaNationalAccreditationServiceforConformityAssessment,Beijing,100062,China;3.LiaoningImport/ExportInspectionandQuarantineBureau,Dalian,Liaoning116001,China)
An empirical model for evaluating measurement uncertainty for environmental sample is established based on certified values of standard samples including water,soil and sediment.The criteria for evaluating the quality of the model is discussed.The empirical model was used to evaluate measurement uncertainty for the standard samples and for the proficiency test data.Furthermore,the results were compared with the experimental data.The feasibility of applications of permitted relative deviation limit calculated based on the empirical model in laboratory internal quality management and control is explored.The empirical model can be used to help client determine whether the analysis results obtained in the critical condition meet certain requirement.
evaluation of measurement uncertainty;empirical model;Horwitz function;interlaboratory study on standard sample
O242;X132
A
2095-1035(2012)01-0001-08
10.3969/j.issn.2095-1035.2012.01.0001
2011-10-31
2011-11-29
國家重大科學儀器設備開發專項(2011YQ14014708);中國合格評定認可委員會科技項目(2011CNAS11);國家自然科學基金青年科學基金項目(41105089)。
李玉武,男,研究員,主要研究方向是大氣顆粒物化學組分分析表征、來源解析及測量結果不確定度評估。E-mial:liyuwu@cneac.com。