米方卓,師耀龍,吳曉鳳,馮 丹,滕 曼,呂怡兵
中國環境監測總站,國家環境保護環境監測質量控制重點實驗室,北京 100012
汞是一種易揮發、可在生物體內積累的有毒類金屬,具有很強的神經毒性和致畸性,并且積累效應和遺傳毒性顯著,對環境及人類的健康造成極大的威脅。在汞污染中,土壤污染問題凸顯且日益嚴重。近年相關調查顯示,每年全球向環境排放汞的總量中,自然排放約1.8~5.8 kt,人為排放約2.2 kt[1-2]。根據國務院印發的《土壤污染防治行動計劃》,環保部門必須深入開展土壤環境質量調查,開展土壤污染狀況詳查,準確監測土壤中的污染物。汞是土壤污染情況的重要參考指標,也是我國評價土壤環境質量標準的重要指標。
環境監測工作中一個必不可少的重要環節是質量控制,質量控制是環境監測數據質量的重要保證。如何評價質量控制水平,制定科學、合理的質量控制指標是當前環境監測工作亟需研究的內容。我國環境監測標準分析方法中都有方法驗證數據或質量控制數據,特別是《環境監測分析方法標準制修訂》(HJ 168—2010)中對方法驗證具體內容進行了明確規定,這些驗證數據是按照監測標準方法實施監測質量活動的重要評價依據,也是確定質量控制指標的主要參考,但僅限于2010年以后制修訂的標準,以前的方法標準中很少涉及或未明確指出質量控制的指標。此外,質量控制指標也會根據監測活動的質量要求而變化,標準方法與實際監測活動在工作目的、測試樣品種類和數量、實驗室的環境與人員等方面存在一定的差異,并不能完全將其作為質量控制的評價指標。當前對土壤中汞的研究多集中在其形態與分布特征、遷移轉化行為、污染修復技術等方面[3-6],對土壤中汞質量控制指標的研究較少。本文通過對全國范圍內環境監測實驗室開展多家實驗室間比對,利用穩健統計方法,對大量的比對測試數據和質控數據進行統計分析,系統性地研究了土壤中汞的質量控制指標,為具有廣泛應用價值和全國性指導意義的土壤中汞的質量控制指標提供技術支撐。
1.1.1 實驗室比對范圍與比對方式
在全國范圍內組織31個省、自治區、直轄市的監測站開展土壤中汞的實驗室間比對研究,同時鼓勵社會化檢測機構參與。最終共有334家實驗室參加了本次比對。其中省級監測站34家,市級監測站293家,區縣站3家,社會化機構4家。
在比對研究中,為保證比對結果的可信性與公平性,采用濃度相近的樣品對(A樣和B樣),設計了4組不同濃度水平的樣品對,并對各參加實驗室進行隨機編碼,向各實驗室隨機發放1組成對樣品即2個樣品。
1.1.2 樣品及其檢測方法
各實驗室隨機發放的2個樣品為不同濃度的土壤樣品。樣品經過120 ℃烘干24 h,并滅活處理,封裝于不透明塑料瓶中。每瓶中的樣品量約10 g。
實驗室比對采用的樣品檢測方法為《土壤質量 總汞、總砷、總鉛的測定 原子熒光法 第1部分:土壤中總汞的測定》(GB/T 22105.1—2008)和《土壤和沉積物 汞、砷、硒、鉍、銻的測定 微波消解/原子熒光法》(HJ 680—2013)。這2種方法的基本原理是一致的,均采用原子熒光法進行檢測,只是前處理的消解方法有所不同。參加比對的實驗室首選這2種方法中的一種進行樣品測定,2種方法均不具備能力的前提下可采用其他方法,如《土壤質量 總汞的測定 冷原子吸收分光光度法》(GB/T 17136—1997)、《熱分解-汞齊化-冷原子吸收光度法測定固體及液體中的總汞》(EPA 7473—2007)、《土壤檢測 第10部分:土壤總汞的測定》(NY/T 1121.10—2006)等。
1.1.3 檢測數據
各參加比對的實驗室對發放的樣品對進行檢測分析,在分析過程中進行相應的質量控制,通過測定標準/質控樣品和樣品加標回收,獲得標準/質控樣品的相對誤差和加標回收率等質量控制數據結果。
參加比對的334家實驗室,獲得4組濃度水平共668個樣品比對測試結果的數據。292家實驗室分析了標準/質控樣品,共獲得329個相對誤差的數據;12家實驗室測定了加標回收,獲得12個加標回收率的數據。
穩健統計方法可以有效地減少異常值(離群值)對總體結果的影響,目前在實驗室間比對能力驗證活動中被廣為應用[7-9]。根據《能力驗證結果的統計處理和能力評價指南》(CNAS-GL02∶2014),檢測能力驗證計劃常用的穩健統計方法有2種:一種是中位值和標準化四分位距法(簡稱IQR法);另一種是迭代穩健統計法(簡稱迭代法)。
使用2種穩健統計方法,對實驗室間相對標準偏差和標準/質控樣品相對誤差數據進行分析,獲得相應的穩健中心值與穩健標準偏差。基于這些穩健中心值與穩健標準偏差,計算實驗室間相對標準偏差和相對誤差的質量控制指標。
本研究中加標回收率數據量較少,不適合使用穩健統計法,采用傳統Grubbs檢驗方法對回收率的數據進行檢驗,剔除異常值后再進行數據分析。
不同濃度水平樣品的比對結果數據分布情況見圖1~圖4。通過核密度圖和直方圖觀察各濃度水平樣品的比對結果,發現4種濃度水平樣品的比對結果在中心區域內大致呈現出正態分布的趨勢。當數據近似服從正態分布時,可以采用穩健統計方法對數據進行統計分析,從而減少異常值(離群值)對總體的影響。

圖1 濃度水平一樣品比對結果的核密度圖與直方圖疊加Fig.1 Superposition of the kernel density and histogram on comparison result of samples under 1st concentration level

圖2 濃度水平二樣品比對結果的核密度圖與直方圖疊加Fig.2 Superposition of the kernel density and histogram on comparison result of samples under 2nd concentration

圖3 濃度水平三樣品比對結果的核密度圖與直方圖疊加Fig.3 Superposition of the kernel density and histogram on comparison result of samples under 3rd concentration level

圖4 濃度水平四樣品比對結果的核密度圖與直方圖疊加Fig.4 Superposition of the kernel density and histogram on comparison result of samples under 4th concentration level
使用2種穩健統計方法,對4種濃度的樣品對(樣品A和樣品B)檢測結果進行統計分析,計算其穩健中心值與穩健標準偏差。基于穩健中心值與穩健標準偏差計算實驗室間相對標準偏差,所得數據結果見表1。由表1可見,不同濃度水平下,使用IQR法計算得到的相對標準偏差范圍為7.3%~18.2%,使用迭代法計算得到的相對標準偏差范圍為8.2%~19.1%。

表1 2種穩健方法對實驗室間比對結果的統計分析Table 1 The statistical analysis of inter-laboratory comparison by two robust statistics
比較這2種穩健統計方法,迭代法較IQR法計算所得的相對標準偏差范圍略寬。IQR法和迭代法對數據的分布形態沒有特殊要求,也無需剔除異常值(離群值),因此都具有穩健性,但數據的離散程度對2種穩健方法的影響有所不同。IQR法是基于數據排序以后以中位值作為對總體平均水平的估計,因此中位值是分布中間位置的一個估計,對極端分布的數據變化不敏感,即使再極端的數據也不會影響到中位數本身,而迭代法是以中位值作為初始均值,通過不斷迭代使其逐漸收斂從而構建最終的穩健平均值作為總體平均水平的估計。在多次迭代的過程中,降低了離群值的權重系統,提高了統計量的全局效率和耐抗性[8-10]。當數據較集中時,2種統計方法的結果更接近。研究表明,在數據離散程度相對高時迭代法較為溫和可靠[8,11]。
本研究中,經2種穩健統計方法計算所得的4種濃度水平樣品A樣和B樣的穩健中心值均差異不大,2種方法對總體平均水平的估計一致。但迭代法的穩健標準偏差較IQR法略大,由此計算出的實驗室間相對標準偏差較IQR法也較大。
在《土壤質量 總汞、總砷、總鉛的測定 原子熒光法 第1部分:土壤中總汞的測定》(GB/T 22105.1—2008)方法中,未明確指出實驗室間相對標準偏差的控制指標,而《土壤和沉積物 汞、砷、硒、鉍、銻的測定 微波消解/原子熒光法》(HJ 680—2013)中給出的實驗室間相對標準偏差為3.42%~11.2%。與標準方法相比,本研究得到的實驗室間相對標準偏差指標范圍更寬。這是因為標準方法通常是由6家實驗室對標準樣品進行測定所得的結果,而本研究參加比對的實驗室數量多達334家,范圍覆蓋了全國31個省、自治區、直轄市的省市級監測單位和社會化機構,代表性更強,覆蓋范圍更廣,涉及的影響因素更全面,因此更能真實地反映實驗室的檢測能力和質量控制水平。具有更為廣泛的參考價值和指導作用。此外,本研究開展的實驗室比對并沒有限定檢測方法,通過對大量比對數據進行穩健統計所得到的土壤中汞的實驗室間相對標準偏差指標可不限定檢測方法,因此具有較好的實際指導意義。本研究建議,實際監測工作中土壤汞的實驗室間相對標準偏差范圍為7%~19%。
292家實驗室對質量分數0.013~8.64 mg/kg的標準/質控樣品進行測定,共獲得329個數據,測定的相對誤差范圍為-17.6%~23.8%,其分布情況見圖5(因質量分數在1.0 mg/kg以上的相對誤差數據較少,故未進行分布統計)。利用IQR法對329個相對誤差數據進行分析,相對誤差的穩健中心值為1.40%,穩健標準偏差為4.26%。利用迭代統計方法分析所得相對誤差的穩健中心值為1.14%,穩健標準偏差為4.20%。IQR法計算的穩健中心值略大于迭代法,但2種方法的穩健標準偏差沒有差異,對相對誤差總體離散程度的估計一致。

圖5 不同濃度水平下標準/質控樣品的相對誤差分布圖Fig.5 The relative error distribution ofstandard/quality control samples underdifferent concentration levels
進一步對不同濃度水平下的相對誤差數據進行分析,結果見表2。統計結果表明,高濃度水平下2種穩健統計方法計算所得的相對誤差穩健中心值和穩健標準偏差均較小。

表2 2種穩健方法對不同濃度水平相對誤差數據的統計分析Table 2 The statistical analysis of relative error atdifferent concentration levels by two robust statistics
在日常監測工作中,標準方法中的驗證數據是監測數據質量控制評價的重要依據。不同的檢測方法所要求的質量控制指標也會有所不同。為更好地指導實際應用,對采用GB/T 22105.1—2008與 HJ 680—2013這2種首選檢測方法獲得的相對誤差數據進一步進行了統計分析,結果見表3。由此可見,GB/T 22105.1—2008與 HJ 680—2013 2種檢測方法的相對誤差經統計得出的穩健中心值和穩健標準偏差并沒有明顯的差異,同時,與上述不限檢測方法獲得的329個相對誤差數據的穩健中心值和穩健標準偏差比較,也不存在明顯的差異,故本研究中不同的檢測方法對相對誤差指標的影響不大。

表3 2種穩健方法對不同檢測方法相對誤差數據的統計分析Table 3 The statistical analysis of relative error ofdifferent methods by two robust statistics
GB/T 22105.1—2008與 HJ 680—2013 2種標準方法中相對誤差的控制指標分別為-5%~5%和-12.5%~12.5%。本研究中2種穩健統計方法所得的穩健標準偏差均能滿足標準方法的要求。在土壤汞的實際監測工作中,建議按95%置信水平取2倍的穩健標準偏差作為相對誤差的置信區間,將具有更為廣泛的適用性和應用價值。本研究建議實際監測工作中土壤汞的相對誤差控制指標為±8%,低濃度水平下相對誤差控制范圍可適當放寬至±10%。
本研究中12家實驗室進行加標回收測試,共獲得12個數據,測定的加標回收率范圍為81%~109%(圖6)。因數據量較少,不適合使用穩健統計法,故采用傳統Grubbs檢驗方法對回收率的數據進行檢驗,發現無異常值。GB/T 22105.1—2008與 HJ 680—2013 2種標準方法中對加標回收率的控制指標都沒有提及。本研究建議實際監測工作中土壤汞的加標回收率控制范圍為81%~109%,但因數據量較少,尚不具有廣泛的代表性。

圖6 加標回收率的分布圖Fig.6 The recovery rate distribution of the spiked sample
本文通過對全國范圍內31個省、自治區、直轄市的省市級監測單位和社會化機構共334家單位開展實驗室間比對,利用穩健四分位間距法和迭代法2種穩健統計方法,對大量的比對結果和質控數據進行統計分析,系統研究了土壤中汞常用的幾個質量控制指標,建議實際監測工作中土壤汞的實驗室間相對標準偏差范圍為7%~19%,相對誤差控制指標為±8%,低濃度水平下可適當放寬至±10%范圍,加標回收率控制范圍為81%~109%。不足的是,因加標回收率數據量較少,本研究的加標回收率控制指標尚不具備廣泛的代表性。但與標準方法基于6家實驗室驗證數據給出的質量控制指標中相比,本研究獲得的質量控制指標具有較好的實際指導作用,為日常監測中開展土壤汞的質量控制工作提供了評價依據和技術支撐,為初步構建我國環境監測質量控制指標體系邁出了堅實的一步。
本研究的意義不僅在于提出具體的質量控制指標,更重要的是促進更廣泛、更深入的質量控制技術體系研究,解決監測工作中的實際問題。同時,本研究有利于扭轉日常監測工作中將方法驗證數據或標準樣品參考值作為唯一質量控制評價標準的不正確觀念,正確引導環境監測質量控制工作的實施。