馬婷婷,闕澤勝
(廣東省核工業(yè)地質(zhì)局輻射環(huán)境監(jiān)測中心, 廣州, 510800)
在土壤氡背景值和異常閾值確定過程中,樣本總體服從正態(tài)分布時,傳統(tǒng)方法在篩選“清潔”土壤樣品時具有較高效率。由于人為活動和自然環(huán)境影響,地球化學(xué)數(shù)據(jù)并非服從完美的正態(tài)分布,一定程度上影響傳統(tǒng)統(tǒng)計方法剔除異常閾值的效果。因此,部分學(xué)者探索了更為穩(wěn)健的方法。
穩(wěn)健的統(tǒng)計方法是否對不同調(diào)查尺度樣本均有較好耐抗性,目前文獻鮮有報道。為驗證穩(wěn)健統(tǒng)計方法在測算土壤氡背景值和異常閾值的可靠性,本文在已有研究基礎(chǔ)上[1-4],結(jié)合地理信息系統(tǒng)理論,將地理要素抽象為點、線、面3種尺度,即進一步考慮了特點區(qū)域型(近似點型)、線型和區(qū)域型(面型)3種尺度,對研究區(qū)域調(diào)查空間進行細分。應(yīng)用傳統(tǒng)統(tǒng)計法[5]、分布形式檢驗法[6]、探索性數(shù)據(jù)分析(EDA)法[7]和中位數(shù)絕對離差(MAD)法[8]等4種方法,對不同調(diào)查尺度對象的土壤氡濃度的背景值和異常閾值分別測算,并對測算方法進行了穩(wěn)健性分析,最后計算得到研究區(qū)域土壤氡濃度背景值和異常閾值水平。
研究區(qū)域位于廣東省東部某城市。地形呈“西邊高東邊低”,地貌以平原和丘陵為主。氣候以亞熱帶季風氣候、亞熱帶海洋氣候為主導(dǎo)。研究區(qū)域地質(zhì)構(gòu)造復(fù)雜,地下河網(wǎng)密布。地下水的補給、徑流、排泄主要受降雨、地形地貌、巖性條件、地質(zhì)構(gòu)造等條件的控制,降雨是地下水的主要補給來源。
數(shù)據(jù)來源于廣東省《2021年度省地質(zhì)勘查與城市地質(zhì)專項項目》“某城市區(qū)域放射性地質(zhì)調(diào)查”項目課題的土壤氡成果數(shù)據(jù)[9]。使用的測氡儀型號為FD-3017RaA,根據(jù)《氡及其子體測量規(guī)范》[10]要求采集數(shù)據(jù)信息。測氡儀通過了“三性(即重復(fù)性、穩(wěn)定性和一致性)”檢測和儀器標定?,F(xiàn)場抽取地表下80 cm處氡氣,高壓設(shè)置為2 min,觀測時間為2 min。
土壤氡調(diào)查編號1~37為區(qū)域型尺度調(diào)查點,定義為全區(qū)地質(zhì)體(簡稱為QQDZT)。土壤氡調(diào)查編號78~86為點狀型尺度調(diào)查點,定義為秋長空地(簡稱為QCKD)。選取兩條典型地質(zhì)剖面作為線型尺度,即秋長構(gòu)造(簡稱QCGZ),測點編號為38~59號;沙田構(gòu)造(簡稱STGZ),測點編號為60~77號)。
研究區(qū)域土壤氡測量布點如圖1所示。

圖1 研究區(qū)域土壤氡測量布點圖
傳統(tǒng)統(tǒng)計法進行數(shù)據(jù)處理時,通常以區(qū)域氡濃度的幾何平均值作為背景值,以“均值+2倍標準差”確定氡異常閾值[5]。
分布形式檢驗法是通過剔除離群值(一般用算術(shù)平均值±2或3倍標準差)后,使數(shù)據(jù)服從正態(tài)或?qū)?shù)正態(tài)分布。然后將服從正態(tài)或?qū)?shù)正態(tài)分布的樣本數(shù)據(jù),求取算術(shù)平均值作為背景值,算術(shù)平均值±2或3倍標準差作為異常閾值[6]。
分布形式檢驗法剔除的數(shù)據(jù)可能隱含重要的信息,不能客觀描述實際數(shù)據(jù)所隱含的真實狀況[11]。針對上述情況,文獻[3]中采用更為穩(wěn)健的統(tǒng)計分析技術(shù)來計算異常閾值,包括探索性數(shù)據(jù)分析(EDA)法[7]和中位數(shù)絕對離差(MAD)法[8]。
(1) 探索性數(shù)據(jù)分析(EDA)法
先求出樣本的中位數(shù),利用中位數(shù)將數(shù)據(jù)分為兩組,最小值到中位數(shù)的一組數(shù)據(jù)為 LH,最大值到中位數(shù)的另一組數(shù)據(jù)為UH,再分別求取兩組數(shù)據(jù)的中位數(shù)XLH和XUH。XLH和XUH之差的絕對值就是四分位數(shù)間距YIQR[1-2]。通過式(1)、式(2)計算XLIF和XUIF:
XLIF=XLH-1.5YIQR
(1)
XUIF=XUH+1.5YIQR
(2)
落在XLIF和XUIF的數(shù)據(jù)之外的數(shù)據(jù),即為異常數(shù)據(jù) ,以四分位數(shù)間距作為背景值。
(2) 中位數(shù)絕對離差(MAD)法
首先求出中位數(shù)XMe,再將中位數(shù)與每一項濃度值做差并求出絕對值,然后對求得的絕對值再求中位數(shù)XMAD[12]:
(3)
XMAD=Median|Xi-XMe|
(4)
異常閾值為第一次求得的原數(shù)據(jù)的中位數(shù)XMe與2倍XMAD之和。首次計算的中位數(shù),與每一項濃度值做差并求出絕對值,用求得的絕對值的算術(shù)平均值作為背景值。
應(yīng)用SPSS 16.0軟件,選擇Analyze模塊下的Descriptive Statistics 工具集里的Explore工具,進行土壤氡樣本的統(tǒng)計分析,結(jié)果列于表1。

表1 土壤氡濃度樣本統(tǒng)計結(jié)果
由表1可見:QQDZT和QCGZ土壤氡濃度值的峰度和偏度均大于1,樣本不服從近似正態(tài)分布;STGZ和QCKD的土壤氡濃度值的峰度和偏度均小于1,樣本服從近似正態(tài)分布。全區(qū)域土壤氡濃度值的峰度和偏度均大于1,樣本不服從近似正態(tài)分布;經(jīng)對數(shù)轉(zhuǎn)換后,峰度為-0.105,偏度為-0.673,樣本服從近似對數(shù)正態(tài)分布。
(1) 傳統(tǒng)方法。剔除異常閾值后計算平均值和標準差:QCDZT土壤氡測量值平均值為3 794 Bq/m3,標準差為4 024 Bq/m3;QCGZ土壤氡測量值平均值為5 975 Bq/m3,標準差為3 288 Bq/m3;STGZ土壤氡測量值平均值為26 469 Bq/m3,標準差為20 535 Bq/m3;QCKD土壤氡測量值平均值為4 656 Bq/m3、標準差為2 460 Bq/m3,全區(qū)土壤氡測量值平均值為9 484 Bq/m3,標準差為13 645 Bq/m3。剔除異常閾值后,算術(shù)平均值為背景值,“均值+2倍標準差”為異常閾值。
(2) 分布形式檢驗法。STGZ、QCKD樣本服從近似正態(tài)分布,算術(shù)平均值為背景值,“均值+2倍標準差”為異常閾值;QQDZT、QCGZ、全區(qū)域樣本不服從正態(tài)或近似正態(tài)分布,取對數(shù)結(jié)果服從近似正態(tài)分布,用對數(shù)變換結(jié)果按上述方法計算背景值和異常閾值。
(3) EDA和MAD法。根據(jù)式(1)、式(2)、式(3)、式(4)計算背景值和異常閾值。
4種方法計算得到的研究區(qū)域土壤氡樣本背景值和異常閾值列于表2。

表2 不同方法計算的研究區(qū)域土壤氡樣本背景值和異常閾值結(jié)果(Bq·m-3)
由表2可見,傳統(tǒng)統(tǒng)計法、分布形式檢驗法、EDA法和MAD法在計算不同尺度的土壤氡背景值和異常閾值時,結(jié)果差異較大。對特定區(qū)域型的QCKD,土壤氡背景值傳統(tǒng)統(tǒng)計法、分布形式檢驗法和MAD法計算結(jié)果基本一致,EDA法的結(jié)果較低;異常閾值傳統(tǒng)統(tǒng)計法、分布形式檢驗法和EDA法計算結(jié)果基本一致,略高于MAD法。對線型的QCGZ和STGZ地質(zhì)構(gòu)造,土壤氡背景值4種方法計算結(jié)果基本一致;異常閾值MAD法較穩(wěn)定,其他3種方法波動較大。對區(qū)域型的QQDZT,土壤氡背景值4種方法計算結(jié)果差異較大。對全研究區(qū)域,土壤氡背景值傳統(tǒng)統(tǒng)計法、EDA法和MAD法計算結(jié)果基本一致,分布形式檢驗法計算結(jié)果偏低;異常閾值傳統(tǒng)統(tǒng)計法>EAD法>MAD法>分布形式檢驗法。
為分析4種方法在不同調(diào)查尺度區(qū)域的土壤氡背景值和異常閾值的計算穩(wěn)健性,對各調(diào)查對象,將4種方法計算的背景值和異常閾值結(jié)果進行排序,排序結(jié)果列于表3。

表3 不同方法計算的研究區(qū)域土壤氡樣本背景值和異常閾值排序結(jié)果
統(tǒng)計所有調(diào)查對象排序出現(xiàn)的次數(shù),定義為位序頻數(shù),結(jié)果列于表4。

表4 不同測算方法的土壤氡位序頻數(shù)統(tǒng)計表
計算方法穩(wěn)健性評價標準為:
(1) 背景值和異常閾值值對應(yīng)中間排名的位序頻數(shù)概率越大,計算方法越穩(wěn)健且計算結(jié)果越保守;
(2) 背景值和異常閾值對應(yīng)名次靠前的位序頻數(shù)概率越大,方法越激進且計算結(jié)果偏大;
(3) 背景值對應(yīng)名次靠前、異常閾值對應(yīng)名次靠后,或者背景值對應(yīng)名次靠后、異常閾值對應(yīng)名次靠前的位序頻數(shù)概率越大,方法越不穩(wěn)健且計算結(jié)果不確定;
(4) 背景值和異常閾值對應(yīng)靠后排名的位序頻數(shù)概率越大,方法穩(wěn)健且測算結(jié)果偏低;
(5) 背景值或異常閾值對應(yīng)多個名次的位序頻數(shù)概率越大,方法越不穩(wěn)健且結(jié)果不確定。
由表3、表4可見:
(1) 用傳統(tǒng)統(tǒng)計法計算的5個調(diào)查對象土壤氡背景值第1名出現(xiàn)3次,異常閾值第1名出現(xiàn)2次,兩者合計第1名5次,說明傳統(tǒng)統(tǒng)計方法計算的土壤氡背景值和異常閾值結(jié)果均趨于偏大,計算方法不穩(wěn)健。
(2) 用分布形式檢驗法計算的5個調(diào)查對象土壤氡背景值第1名出現(xiàn)2次,異常閾值第4名(D)出現(xiàn)3次,兩者合計第4名4次、第1名3次,說明分布形式檢驗法計算的土壤氡背景值趨于高值,異常閾值趨于低值,兩者不同步,計算方法不穩(wěn)健。
(3) 用EDA方法計算的5個調(diào)查對象土壤氡背景值第1名和第2名均出現(xiàn)2次,異常閾值第1名出現(xiàn)3次,兩者合計第1名5次,說明EDA方法計算的土壤氡背景值不穩(wěn)定,異常閾值趨于低值,計算方法不穩(wěn)健。
(4) 用MAD方法計算的5個調(diào)查對象土壤氡背景值和異常閾值第3名各出現(xiàn)3次,兩者合計第3名6次,說明EDA方法計算的土壤氡背景值和異常閾值結(jié)果趨于較保守,計算方法穩(wěn)健。
綜上分析,MAD法在計算不同調(diào)查尺度對象的背景值和異常閾值時穩(wěn)健性較高。因此,選用MAD法計算研究區(qū)域土壤氡背景值和異常閾值,結(jié)果見表2所列。
城市放射性地質(zhì)調(diào)查是城市地質(zhì)調(diào)查的重要組成部分,城市土壤氡濃度是城市放射性地質(zhì)調(diào)查的重要內(nèi)容。本文從特定區(qū)域型(點型)、線型和區(qū)域型(面型)3種調(diào)查尺度,應(yīng)用傳統(tǒng)統(tǒng)計法、分布形式檢驗法、EDA法和MAD法等4種方法進行了土壤氡濃度背景值和異常閾值計算。應(yīng)用位序頻數(shù)檢驗法對4種方法的穩(wěn)健性進行了檢驗,檢驗結(jié)果表明MAD法在計算不同調(diào)查尺度對象的背景值和異常閾值時有較好的穩(wěn)健性。
應(yīng)用MAD法,計算出區(qū)域型調(diào)查尺度對象QQDZT的土壤氡背景值和異常閾值分別為1 339、4 469 Bq/m3;線型調(diào)查尺度對象QCGZ的土壤氡背景值和異常閾值分別為5 975、13 616 Bq/m3;STGZ的土壤氡背景值和異常閾值分別為21 875、56 280 Bq/m3;特定區(qū)域型調(diào)查對象QCKD的土壤氡背景值和異常閾值分別為4 656、9 422 Bq/m3;不分調(diào)查尺度的全研究區(qū)域土壤氡背景值和異常閾值分別為9 132、13 497 Bq/m3。