王祖光,周其文*,趙玉杰*,劉瀟威,張鐵亮,王夏暉,李志濤
(1.農業農村部農產品質量安全環境因子控制重點實驗室,天津 300191;2.農業農村部環境保護科研監測所,天津 300191;3.環境保護部環境規劃院,北京 100012)
Cd是一種高活性重金屬,生物富集性強、毒性強,易被稻米吸收富集,進而危害人體健康[1-2]。Cd主要來源于工業三廢的排放,土壤污染普查結果表明我國土壤Cd含量點位超標率達7%,已成為首要土壤重金屬污染物[3-5]。2018年國家修訂了原《土壤環境質量標準》(GB 15618—1995)[6],新標準名稱為《土壤環境質量標準農用地土壤污染風險管控標準(試行)》(GB 15618—2018)[7],新標準將土壤環境質量二級限值修訂為土壤污染篩選值并細化了Cd的限值,根據土壤pH將Cd污染限值分為4類,以求最大限度地保護農產品產地及農產品質量安全。
研究表明,農產品中的Cd主要來源于土壤[8-9]。農產品對土壤Cd的吸收除受pH及土壤Cd含量影響外,還受其他諸多因素影響,如:鈣(Ca)、鐵(Fe)、錳(Mn)、鋅(Zn)、硫(S)、氯(Cl)等[10]。在某些區域,其他因素對稻米富集Cd的影響比土壤pH和土壤Cd更明顯[11],僅考慮土壤pH和土壤Cd很難正確評價產地環境質量水平,同時也很難準確劃分農用地土壤環境質量類別,從而導致Cd污染產地防控面積的誤判。
稻米是我國居民的主糧,其質量安全與人民群眾的健康息息相關。與其他農產品相比,水稻是更易吸收Cd的農作物,相關報道表明我國部分稻米產區的稻米Cd含量超過國家食品衛生標準限值的比例達10%[12-14]。尤其在我國西南地區、湖南長株潭地區存在較高的Cd污染風險[15]。因此正確評價我國稻米產地環境質量狀況,科學劃分產地類型,從而有效防控稻米Cd污染風險,對保障我國農產品質量安全,提升農業綠色發展水平尤為重要。
本研究以近年來獲取的在我國稻米產區土壤稻米一一對應采集的80 000個數據樣點為基礎,以土壤Cd與稻米Cd非對應性超標誤判率為判定參數,分析土壤污染風險篩選值在稻米產地類別劃分中的適用性,并針對個別誤判率高的區域試探性探索了降低誤判率的方法。本研究結果對于標準的科學運用及進一步改進提供了一定的技術支持。
本研究數據來源于農業農村部環境保護科研監測所風險評估團隊自2012年以來獲取的風險評估土作對應數據。數據篩選要求如下:(1)pH、土壤Cd含量和稻米Cd含量數據齊全;(2)以縣為單位,每個縣土壤作物對應監測點位不少于10個。所篩選數據分布在東北三省、天津、湖南、廣東、四川、貴州、福建、浙江等15個省(市)144個縣。土作對應監測點位約80 000個,數據分布情況見圖1。
本研究采用誤判率作為GB 15618—2018中Cd的篩選值在一定區域適用性的判定依據,總誤判率是指一定區域內(本研究以縣域為單位)土壤和作物一一對應的采樣監測數據中,土壤超標與否與對應的稻米超標情況不一致的點位數占土壤總采樣點的百分比,總誤判率(TMR)為以下兩種情況的總和:(1)土壤Cd含量超過篩選值,稻米Cd含量不超標的樣點個數占總樣點個數的比例,稱此情況為誤判率一(MR1);(2)土壤Cd含量未超過篩選值,稻米Cd含量超標的樣點個數占總樣點個數的比例,稱此情況為誤判率二(MR2)。
MR1、MR2及 TMR 的計算方法分別如式(1)、式(2)、式(3)所示:

式中:t1為土壤超過篩選值,稻米Cd含量不超標的點位個數;T為研究區(本研究以縣域為單位)的土壤-稻米對應采樣點個數。

式中:t2為土壤未超過篩選值,稻米Cd含量超標的點位個數;T為研究區(本研究以縣域為單位)的土壤-稻米對應采樣點個數。


圖1 標準研判用監測點位分布圖Figure 1 Monitoring point distribution map
式(1)~式(3)中土壤Cd含量超標是指土壤Cd含量超過《土壤環境質量標準農用地土壤污染風險管控標準(試行)》(GB 15618—2018)規定的篩選值,稻米Cd含量超標是指稻米Cd含量超過《食品安全國家標準食品中污染物限量》(GB 2762—2017)規定的限值。根據研究需要,本文假定土壤超標、農產品不超標作為誤判率1,《土壤環境質量標準農用地土壤污染風險管控標準(試行)》(GB15618—2018)并未說明土壤Cd超過篩選值,農產品一定超標。
為了進一步提升土壤Cd污染與稻米Cd超標之間的關聯性、減少誤判,本研究擬采用混合線性回歸技術(Cubist)建立土壤-稻米之間Cd轉運模型并篩選主控因子。Cubist模型是由Rule Quest公司開發的一種基于規則的模型,與傳統線性回歸技術相比,混合線性回歸技術具有以下優點:(1)可以高效處理多個變量,并自動篩選影響顯著因子。(2)更容易處理不同條件下自變量對因變量影響能力差異性問題。(3)可以把自變量對因變量的影響分為條件貢獻與模型貢獻兩類,便于使用者篩選主控因子。Cubist模型融合了若干其他模型樹的方法,它的每一條規則是一條運算路徑,樹的節點是線性模型。為了提高模型預測精度,在對目標進行預測時它的數據空間被分為若干個子空間(每個子空間無最低數據要求),然后對其進行建模。Cubist使用標準方差來度量誤差值,其每個節點的誤差表示為:

式中:T是某一節點上的訓練樣本;Ti是這些樣本分裂出的子樣本;SD(T)和SD(Ti)是T和Ti的標準偏差,是每一節點的分類誤差; ||Ti是樣本數量。Cubist使每次誤差降到最小,使其分類更加合理[12]。模型的具體使用方法可參照文獻[16]。
采用Arcgis軟件為平臺繪制相關誤判率圖件,其他相關圖件采用Excel制作。
誤判率是產地類別劃分需要重點考慮的指標。土壤篩選值的制定以pH和土壤重金屬含量為核心,以Cd為例,在某些區域采用以上兩個指標評價的土壤環境質量與實際農產品質量安全存在著明顯的不符。圖2、圖3和圖4分別為誤判率一、誤判率二及總誤判率在研究區的分布情況。結果表明,誤判率一即土壤超標農產品不超標的情況,主要分布區域為湖南中部和南部地區、廣東北部、四川盆地中部、廣西中北部地區。其他稻米主產區,如東北三省、長三角區域因本數據庫中采用的土壤數據較少存在Cd超標情況,因此無法判定標準使用誤判率一的結果。誤判率二即土壤不超標農產品超標的情況,主要分布區域為湖南長株潭地區、四川綿竹、什邡市周邊縣市、廣東省英德、韶關市周邊區域。東三省、長三角、珠三角和淮河流域稻米主產區基本不存在誤判率二的情況。綜合以上兩種情況,總誤判率突出的區域為湖南長株潭地區、廣東北部地區、四川盆地中部地區、廣西中部地區,而這些區域通常是誤判率一和誤判率二重疊區。以上4個區域總誤判率最高值分別為79%、59%、70%、64%。而珠三角地區和淮河流域誤判率一和誤判率二情況均較少,高誤判率區域也是我國土壤Cd污染較突出區域[17-18]。高的誤判率會對產地安全類別劃分及分區分類治理產生不利影響,這表明僅采用這兩個指標無法真正指示這些區域的土壤環境質量狀況。
針對誤判率高的區域,本研究首先采用改變土壤Cd篩選值的方式,分析誤判率改善情況。圖5和圖6分別為在誤判率一較高的12個縣市土壤Cd篩選值提高 0.1 mg·kg-1和0.2 mg·kg-1后的誤判率一變化情況。當土壤Cd篩選值提高0.1 mg·kg-1時,除湖南省湘潭縣和寧鄉縣外大部分縣市的總誤判率和誤判率一都會降低,其中誤判率一降低范圍為0~18.64%,總誤判率降低范圍是5%~11%,同時誤判率二會升高,其升高范圍為0~19%。當土壤Cd篩選值提高0.2 mg·kg-1時,除湖南省湘潭縣和寧鄉縣外大部分縣市的總誤判率和誤判率一都較提高0.1 mg·kg-1時降幅明顯,但總體降幅不大,介于10%~20%之間,其中冷水灘市和邵東縣尤為明顯,總誤判率分別由26.54%、24.77%降低到了12.18%、9.17%;湖南省漣源和湘鄉市誤判率一降低幅度最大,達30%。隨著誤判率一的降低,研究縣市的誤判率二都會提高,提升范圍在1%~30.29%之間。綜合結果分析表明,即使增加誤判率一較高地區Cd的篩選值,總的誤判率也不會有大的改善。
圖7、圖8和圖9分別為在誤判率二較高的12個縣市土壤Cd篩選值降低0.1 mg·kg-1和0.2 mg·kg-1后的誤判率二變化情況。當土壤Cd篩選值降低0.1 mg·kg-1時,除廣東連州和四川綿竹外大部分縣市的總誤判率和誤判率二都會降低,其中誤判率二降低范圍為6%~26.81%,總誤判率降低范圍為3%~26.09%,同時誤判率一會升高,其升高范圍為0.73%~15.29%。當土壤Cd篩選值降低0.2 mg·kg-1時,除廣東連州和四川綿竹外大部分縣市的總誤判率和誤判率二都較降低0.1 mg·kg-1時降幅明顯,介于11%~38%之間,其中湖南長沙市尤為明顯,總誤判率由39.86%降低到了9.42%。隨著誤判率二的降低,研究縣市的誤判率一都會提高,提升范圍在1.45%~29%之間。結果表明,即使降低誤判率二較高地區Cd的篩選值,總的誤判率也不會有大的改善。

圖2 稻米產地安全評估誤判率一分布圖Figure 2 Distribution chart of misjudgment rate one of safety assessment

圖3 稻米產地安全評估誤判率二分布圖Figure 3 Distribution chart of misjudgment rate two of safety assessment
綜合分析表明,大部分誤判率高的地區不能通過升高或降低土壤Cd篩選值來降低誤判率,而這些地區多是我國主要的稻米產區,高誤判率對管控稻米Cd污染產生了不利影響。為了提高土壤環境質量評價及類別劃分的準確率,除了土壤pH和土壤Cd含量外還需要考慮土壤中其他因子的作用。

圖4 稻米產地安全評估總誤判率分布圖Figure 4 Distribution chart of total misjudgment rate of safety assessment

圖5 篩選值增加與誤判率的關系(湖南誤判率一嚴重地區)Figure 5 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate one of Hunan Province)
研究表明,稻米對Cd的富集受多種因子影響。在實際農田中不同環境條件下各個因子作用效能存在差異,而篩選出主控因子,建立土壤因子與稻米質量安全之間的關系,是降低產地環境質量類別誤判的重要手段。研究表明土壤 pH、有機質、Ca、Fe、Mn、Zn、S、Cl等因素都對稻米富集Cd有影響[19-25]。而劉佳鳳等[10]提出了采用混合線性回歸技術構建土作關系模型篩選主控因子的方法。

圖6 篩選值增加與誤判率的關系(廣東、廣西、四川誤判率一嚴重地區)Figure 6 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate one of Guangdong,Guangxi,Sichuan Province)

圖7 篩選值降低與誤判率的關系(四川省誤判率二較高的地區)Figure 7 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate two of Sichuan Province)

圖8 篩選值降低與誤判率的關系(湖南省誤判率二較高的地區)Figure 8 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate two of Hunan Province)
根據以上研究結果,本研究選取了誤判率較高的湖南省湘潭市、株洲市、永興縣、宜陽縣作為采樣區域。依據土壤Cd污染狀況及前期調查發現的稻米Cd污染情況,采用專家研判法布設采樣點,采用5點混合法采集水稻根際土壤和稻米,土壤和稻米樣品一一對應,共采集137對。土壤及植物樣品前處理、檢測、質控參見相關文獻[26-28]。采用混合線性回歸技術構建土壤稻米Cd轉運模型,并篩選主控因子,模型見表1,主控因子篩查結果見表2。
由表1可見,Cubist模型結果分為6種規則,土壤各因子含量在規則1和規則2范圍內,稻米基本無Cd污染風險;土壤各因子含量在規則3和規則4范圍內,稻米存在一定的Cd污染風險;土壤各因子含量在規則5和規則6范圍內,稻米存在嚴重Cd污染風險。由表2可見,在諸多土壤因子中土壤Ca含量的條件貢獻率最高,其次是土壤Fe、Mn和S含量,表明采樣區稻米富集Cd是受土壤多種因子控制,其中Ca是主控因子,其可以增加土壤pH,通過增加土壤吸附從而固定重金屬,可以增加土壤Ca2+和陽離子交換能力(CEC),從而促進與根表面Cd2+的競爭[29-31]。土壤pH的模型貢獻率最高,6個規則中有4個規則的模型含有pH,可見pH在稻米富集Cd的過程中也扮演著重要角色,pH主要通過影響碳酸鹽的形成和溶解來影響土壤Cd形態的變化,還可以通過影響土壤表面負電荷來影響土壤對Cd的吸附[11]。
基于模型分析結果,當僅考慮Ca對稻米富集Cd的影響時,兩者的關系及擬合模型見圖10。擬合模型的公式為

式中:y為稻米Cd含量的預測值,mg·kg-1;x為土壤CaO含量,%;R2=0.44**(P<0.01)。說明此模型可解釋稻米Cd含量44%的變異性。
根據上述模型可以看出當稻米Cd含量為0.2 mg·kg-1時,CaO含量約為0.5%,這與Cubist模型預測結果基本一致。實際檢測數據表明當CaO≤0.5%時稻米Cd超標率為79.2%,土壤Cd含量的平均值及標準差為0.54±0.3 mg·kg-1,當CaO>0.5%時稻米Cd超標率為19%,土壤Cd含量的平均值及標準差為0.9±0.7 mg·kg-1,兩者稻米Cd超標率差距為61個百分點。可見Ca對稻米富集Cd的影響比土壤Cd對稻米富集Cd的影響更顯著。
同時稻米Cd含量19%的超標率也表明以CaO含量0.5%作為產地環境安全條件限值仍存在一定的誤判情況,這與混合線性回歸模型及CaO與稻米Cd關系模型的擬合結果基本一致,畢竟稻米Cd含量的變化還受Fe、Mn、SOM、pH等因素的影響,CaO僅能解釋稻米Cd含量44%變異性。
根據CaO與稻米Cd含量關系模型,當CaO含量>0.5%時稻米Cd含量仍然存在下降空間,因此采用窮舉法計算CaO含量增加、稻米Cd含量不變時CaO的最小限值,此值為0.85%,此時稻米Cd含量為0.085 mg·kg-1,95% 置信區間范圍為 0.06~0.16 mg·kg-1。實際監測樣品137個,實際樣品中CaO>0.85%的樣品62個,其中有4個樣品超標,超標率為6%,超標的樣品土壤Cd平均含量為1.17 mg·kg-1。可見要保證稻米安全,在CaO充足的條件下,土壤Cd的高富集對稻米Cd含量的影響不能忽略,畢竟稻米Cd主要來源于土壤Cd。而以篩選值為依據評估稻米安全狀況,研究區稻米Cd的總誤判率為39.41%,遠高于本研究結果。

圖9 篩選值降低與誤判率的關系(廣東省誤判率二較高的地區)Figure 9 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate two of Guangdong Province)

表1 Cubist模型擬合結果Table 1 Cubist model fitting results
以上分析結果表明,以《土壤環境質量標準農用地土壤污染風險管控標準(試行)》(GB15618—2018)的土壤Cd篩選值為標準進行產地安全評價及類別劃分時個別區域會出現誤判情況,通過增加其他因素可以將誤判降到最小。由于個別區域環境質量的差異性,具體采用哪種指標、如何定值需根據區域進行細致研究。
(1)《土壤環境質量標準農用地土壤污染風險管控標準(試行)》所規定的土壤Cd篩選值適用于大多數稻米產區產地環境質量安全水平的評價,但在湖南長株潭地區,廣東北部與湖南接壤地區,四川綿竹、什邡市等區域僅考慮pH與土壤Cd含量還不能在土壤環境質量與農作物安全之間建立良好的耦合關系,無法用這兩個指標正確評估產地環境質量安全水平。

表2 Cubist模型計算條件貢獻率與模型貢獻率Table 2 The conditions contribution rate and model contribution rate of cubist model
(2)以湖南長株潭部分區域監測數據為例,采集的數據所構建的模型分析結果表明:Ca是調控采樣區內稻米Cd富集的關鍵因素。土壤Ca含量的變化與稻米Cd含量之間存在顯著的指數關系,較土壤pH和Cd含量相比能夠更好地指征產地環境對稻米Cd含量的影響。本文由于缺少稻米品種、農田水肥管理水平等數據,在篩選影響稻米富集Cd的關鍵因子時會存在一定的不足。

圖10 CaO與稻米Cd含量擬合關系圖Figure 10 Fitting diagram of the relationship between CaO and R-Cd
(3)在采用《土壤環境質量標準農用地土壤污染風險管控標準(試行)》所規定土壤Cd篩選值判定稻米產區產地環境質量安全存在誤判率高的區域,可以通過構建相關模型篩選主控因子的方法來更加科學地評價稻米產地環境質量及劃分產地安全類型。