李艷慧,張亞惠 ,姚江軍 *,聶鵬程
(1塔里木大學信息工程學院,新疆 阿拉爾 843300)
(2浙江大學山東工業技術研究院,山東 棗莊 277800)
(3浙江大學生物系統工程與食品科學學院,浙江 杭州 310058)
地膜是農業增產增效的重大技術措施,已應用20余年,但是地膜回收率不到60%,廢棄地膜在長期的物理、化學、生物等外界作用下可進一步破碎裂解成微塑料。一般認為微塑料是指直徑小于5 mm的碎片、纖維、顆粒、發泡、薄膜等[1],微塑料的主要組成成份包括聚乙烯(PE)、聚氯乙烯(PVC)、聚丙烯(PP)、聚苯乙烯(PS)、聚乳酸(PLA)及聚對苯二甲酸乙二酯(PET)等聚合物[2],其中PVC和PE是全球范圍內合成量最高的兩種塑料[3]。目前人們對微塑料污染的研究主要集中于海洋[4-5]、海岸帶潮灘[6-7]、河口[8-9]、湖泊[10-11]等水域生態系統,但對土壤中的微塑料積聚關注較少。近期的研究表明,土壤中的微塑料含量是海洋中測量水平的4~23倍,并且土壤中的年度微塑料積累量也遠超水域系統[12]。研究發現土壤中的微塑料會對陸地生態系統的物質循環及能量流動產生深遠影響[13-14]。由于其吸附特性,進入土壤的微塑料不僅成為重金屬載體,吸附、聚集土壤中的重金屬[15]。微塑料還成為抗生素和持久性有機污染物等環境污染物的載體[16]。塑料大棚中的地膜上溴氰菊酯殺蟲劑濃度(占總濃度38.8%~52.2%)遠高于土壤(占總濃度2.9%~5.4%)[17]。地膜上毒殺酚和毒死蜱殘留量是土壤中殘留量的70多倍[18]。微塑料上的重金屬和有機污染物等經土壤動物的攝食,在食物鏈中積累最終會影響人類健康[19-20]。另外,微塑料還可以改變土壤理化性質,當它在土壤中積累到一定濃度,對土壤功能、植物生長及生物多樣性都會產生深遠的負面影響[21]。因此,為了環境安全和人類健康,需要對土壤中的微塑料污染水平進行檢測。
傳統的微塑料檢測方法主要有:傅里葉紅外光譜法[22]、掃描電鏡法[23]、顯微共聚焦拉曼光譜法[24]、熱解分析法[25]、質譜色譜法[26]等。盡管這些方法取得了較好的效果,但在對微塑料進行定性和定量檢測之前,多數情況下需要進行費力的可疑塑料顆粒的提取和鑒定操作,少數情況不需要,如便攜式儀器可實現實時、就地檢測,但精確度較低。土壤質地及團聚體結構一定程度上會影響微塑料浮選和分離的效果,而且土壤中含有難熔態化合物、有機質以及不完全燃燒產生的黑炭等[27],會影響土壤中的微塑料識別。目前為止,國內外并沒有統一成熟的微塑料提取方法,不同提取方法會對實驗結果造成不同影響,并且提取后需要對可疑的塑料碎片進行檢測和計數,由于操作過程過于復雜,這些方法不適合大批量的樣本檢測。因此需要探索新的方法解決以上問題,太赫茲光譜可以反映物質結構的“指紋”特性,適用于物質的無損檢測,具有樣本預處理少,測量速度快和準確率高的特點,已在包括微塑料等多種物質的定性定量檢測中均已取得了較為理想的效果[28-29]。考慮到上述背景,本研究的工作目標如下:利用太赫茲光譜吸光度數據探究不同預處理方法和不同建模方法結合預測土壤中微塑料濃度的精度差異,得出最優預處理方法和最優建模方法以建立土壤中微塑料濃度的最優預測方法。比較同源土壤不同種類微塑料的預測模型精度,以分析預測方法是否對微塑料種類有局限性。比較非同源土壤相同種類微塑料的預測模型精度以驗證預測方法是否有地域局限性。
本實驗選取地理位置相距較遠的東南沿海地區廣東省電白縣的紅土和西北內陸地區甘肅省張縣的黑土,土壤的理化性質相差較大,以便探究本實驗方法是否具有地域局限性。取以上兩個地方郊區農田的表層土壤(0~20 cm)進行采樣,分別命名為土壤1,土壤2,將采集到的土壤樣本放在室內通風環境中干燥72 h,然后研磨并通過100目篩子過篩,過篩后的土壤在烘箱中烘干(100℃)2 h以減小水蒸氣對太赫茲光譜的影響。
本實驗選取土壤中最常見的兩種微塑料PVC和LDPE替代土壤中的微塑料污染物,PVC購自Aike Reagent公司,LDPE購自Xiya Reagent公司。PVC初始形式是白色粉末,LDPE是白色球形顆粒需要用打磨機在充滿氮氣的環境中打磨成粉末,將打磨后的微塑料粉末過100目篩(100目篩子的孔徑為0.15 mm)。將上述兩種土壤與上述兩種微塑料粉末以14種不同的含量梯度(包括0.00%、0.05%、0.10%、0.15%、0.20%、0.35%、0.50%、0.70%、1.00%、1.50%、3.00%、5.00%、7.00%、10.00%)混合制作4組樣本,使用壓片機在壓強為13 Mpa的壓力下將樣本壓制成直徑為13 mm,厚度為1 mm的圓形樣本,每種梯度有十個相同的樣本,總樣本量為560(4×140)個。將4組樣本命名為土壤1+LDPE、土壤2+LDPE、土壤1+PVC、土壤2+PVC。將制作好的樣本放于溫度為18℃相對濕度為7%的恒溫恒濕箱中存儲待檢測,實驗過程中未使用任何塑料制品和粘合劑,以避免污染樣本。
本研究使用的是華訊方舟TDS太赫茲光譜儀CCT-1800透射模塊譜線模式。光譜范圍為0.1~4.0 THz,動態范圍為透射模式70 Db,時域信號長度為53 ps,時域信號掃描最小精度為2 μm。空氣中的水汽吸收峰較多,對樣本獲取太赫茲光譜信號影響很大。實驗開始前,先打開氮氣泵使太赫茲光譜儀的檢測倉充滿氮氣,在樣本檢測過程中需要持續對檢測倉進行氮氣吹掃,用來排除水汽的干擾。在獲取樣本光學參數前,首先需要獲得太赫茲波穿透空氣的參考信號,然后在樣本架上放置待測樣本,每個樣本掃描5次求平均值以獲得太赫茲波穿透樣本的光譜信號。每3 min更換一次樣本。在建模之前,將每組樣本的數據集按照3∶1的比例通過隨機抽樣分為校正集與預測集。每組校正集105個樣本,預測集35個樣本。
本研究使用Matlab軟件,采用多種處理方法對土壤光譜進行變換處理及相關分析。數據變換處理包括歸一化處理、均值中心化處理、移動窗口平滑處理。進行光譜預處理的目的在于比較分析不同光譜預處理方法對模型預測結果的影響,從而為后續提高預測模型精度打下基礎。
最小二乘法支持向量機(LS-SVM)回歸算法將輸入數據從正態空間映射到高維空間,用等式約束替換不等式約束,并求解高維空間中的最小損失函數以獲得線性擬合方程[30]。極限學習機(ELM)是一種新型的單隱層前饋神經網絡學習算法。通過設置網絡隱層神經元個數,且算法執行過程無需迭代隱層,輸入權值以及隱元偏置隨機產生,通過計算隱層輸出矩陣的廣義逆來確定輸出權值[31]。偏最小二乘(PLS)是一種常用的多元統計分析方法,它通過同時對光譜矩陣和性質矩陣進分解,從而建立最優的分析模型[32]。本文采用LS-SVM、ELM和PLS算法構建了以太赫茲時域光譜為自變量,污染濃度為因變量的回歸定量分析模型。
LS-SVM、ELM和PLS回歸定量分析模型分別以均方根誤差(RMSE)和決定系數(R2)作為模型性能的評價指標,均方根誤差評價定量分析模型的優劣和預測能力,決定系數衡量了模型的相關程度。計算公式如式(1)和式(2)。

在以上公式中,m表示樣本數,yr表示樣本r的參考值,fr表示樣本r的預測值。yr表示m個樣本的參考值的平均值。R2表示模型解釋樣本光譜的能力,而RMSE表示所構建模型的標準偏差(真實濃度和預測濃度之間的差)它可以評價定量分析模型的優劣和預測能力。R2越接近1和RMSE越接近0,模型的預測效果越好。
太赫茲波獨特的穿透能力可以反映物質結構的“指紋”特征,本實驗選擇的是太赫茲光譜的透射模塊譜線模式,可很好的發揮太赫茲光譜的優勢。向土壤中添加微塑料會改變土壤的成分,從而引起太赫茲吸收光譜的變化。由于實驗儀器光譜兩端信噪比較低,研究人員經過反復實驗選取包含吸收峰的0.8~1.6 THz波段進行分析,此波段信噪比最高,微塑料的檢測效果最好。
由圖1可知,4組樣本在0.8~1.6 THz波段特征峰趨勢并非全部一致,只有同源土壤不同微塑料樣本組特征峰趨勢一致,相同微塑料非同源土壤樣本組特征峰趨勢不一致,這說明特征峰是土壤的而并非微塑料的。但每組樣本隨著頻率的增加,土壤與微塑料混合物樣本和純土壤樣本的吸光度曲線呈相同的遞增趨勢。并且相同頻率下吸光度隨微塑料濃度的增大而增大,圖1(a)中土壤1+LDPE組0.8 THz時吸光度由1.4 a.u.增大到2.4 a.u.,1.6 THz時吸光度由 2.7 a.u.增大到 5.3 a.u.。圖 1(b)中土壤 1+PVC組0.8 THz時吸光度由1.4 a.u.增大到1.7 a.u.,1.6 THz時吸光度由2.4 a.u.增大到4.1 a.u.。圖1(c)中土壤2+LDPE組0.8 THz時吸光度由1.1 a.u.增大到1.5 a.u.,1.6 THz時吸光度由 2.6 a.u.增大到 4.5 a.u.。圖 1(d)中土壤2+PVC組0.8 THz時吸光度由1.0 a.u.增大到1.3 a.u.,1.6 THz時吸光度由 2.6 a.u.增大到 3.9 a.u.。由前文可知同一組樣本中微塑料濃度是唯一變量,因此,利用太赫茲吸收光譜來監測土壤中微塑料含量是可行的。此外,LEWIS R A[33]的研究已被證明太赫茲波在稀釋的土壤樣品上的吸收可有效鑒定土壤成分,例如芳族化合物和土壤污染物,李斌等[34]人的研究發現太赫茲透射光譜吸收系數可用于檢測土壤中重金屬元素鉛的含量。

圖1 樣本在0.8~1.6 THz波段的吸光度曲線
對太赫茲吸光度數據進行歸一化的預處理后結果如表1所示,三種建模方法對土壤1中LDPE濃度的預測效果為:LS-SVM=PLS>ELM。同樣,三種建模方法對土壤中PVC濃度的預測效果也為LS-SVM=PLS>ELM。總體來說,LS-SVM模型和PLS模型的預測效果是相似的,它們的預測效果都比ELM模型更精確。相比較對土壤1中LDPE濃度的預測,對土壤1中PVC濃度的預測效果更好。

表1 太赫茲光譜數據歸一化預處理后建模預測結果
三種建模方法對土壤2中LDPE濃度的預測效果為:LS-SVM>PLS>ELM。對土壤2中PVC濃度的預測效果為LS-SVM=PLS>ELM。與預測土壤2中LDPE相比,預測土壤2中PVC濃度的整體效果更精確。相比較土壤2,對于土壤1中兩種微塑料的預測效果更精確。總體而言,基于歸一化預處理的三種建模方法的預測效果相差不大。綜上所述,無論微塑料種類和土壤來源如何,LS-SVM模型的性能均優于其他兩種方法。
由表2可知,太赫茲吸光度數據經過均值中心化處理后,三種建模方法對土壤1中LDPE濃度的預測效果為:LS-SVM>PLS>ELM,三種建模方法對土壤1中PVC濃度的預測效果為:LS-SVM>PLS>ELM。相比較對土壤1中LDPE濃度的預測,對于土壤1中PVC濃度的預測效果更好。

表2 太赫茲光譜數據均值中心化預處理后建模預測結果
三種建模方法對土壤2中LDPE濃度的預測效果為LS-SVM>ELM>PLS,對土壤2中PVC濃度的預測效果也為LS-SVM>ELM>PLS。這些趨勢與表1所示的趨勢有所不同。相比較2號土壤LDPE濃度的預測,2號土壤PVC濃度預測效果更好。相比較2號土壤,對于1號土壤的兩種微塑料預測效果略優。整體來說太赫茲光譜數據基于均值中心化預處理后3種建模方法預測效果差異較小,LS-SVM建模預測效果略優于其它兩種建模方法。相比較光譜數據歸一化預處理后的建模結果,均值中心化預處理后數據建模效果整體得到提升。
由圖2得出,太赫茲吸光度數據經過移動窗口平滑處理后,三種建模方法對土壤1中LDPE濃度的預測效果為LS-SVM>PLS>ELM,三種建模方法對土壤1中PVC濃度的預測效果為LS-SVM=PLS>ELM。相比較對1號土壤中LDPE濃度的預測,對于1號土壤中PVC濃度預測效果更好。

圖2 土壤中添加的微塑料含量與預測的微塑料含量之間的線性擬合
三種建模方法對土壤2中LDPE濃度的預測效果為LS-SVM>PLS>ELM,三種建模方法對土壤2中PVC濃度的預測效果為LS-SVM=PLS>ELM,對于土壤2中LDPE濃度的預測效果不如對于土壤2中PVC濃度的精確。與土壤2相比,對土壤1中的兩種微塑料的預測效果更好。總體而言,基于移動窗口平滑預處理的三種建模方法的預測效果存在明顯差異。LS-SVM模型的預測效果和PLS模型的預測效果明顯優于ELM模型,綜合來看,LS-SVM建模效果最好。與歸一化預處理和均值中心化預處理之后的建模預測效果相比,移動窗口平滑預處理后的數據建模預測效果總體上有較大提升。
根據以上實驗結果可知,3種預處理方法結合3種建模方法,預測效果最好的是對數據移動窗口平滑預處理后進行LS-SVM建模,預測效果R2值在0.960 0以上,RMSE小于0.006 0,總體來說不同地域的土壤和不同種類微塑料預測結果差異較小。但是在所有實驗結果中,預測效果最優的是對土壤1+LDPE組的樣本數據移動窗口平滑處理后進行LS-SVM建模,所得的建模R2c值達到0.999 4,RMSEc為0.000 7,R2p值達到0.983 7,RMSEp為0.004 1。
土壤中的微塑料對土壤功能、植物生長及生物多樣性都會產生廣泛而深遠的負面影響。本文已經根據土壤來源和微塑料種類對建模結果進行了分析。太赫茲吸光度數據經過移動窗口平滑處理后進行LS-SVM和PLS建模,R2在0.940 0以上,RMSE在0.008 0以下,預測效果良好,ANDREA P等[35]人使用近紅外光譜法對土壤中的微塑料進行檢測和分類,其PLS-DA和SVR模型的相關系數分別為0.830 0和0.920 0。相較于其它光譜系統太赫茲光譜透射模塊譜線模式對微塑料的定量檢測精確度更高。本研究中的微塑料檢測是在實驗室中進行的。這種方法不如實時檢測方便。但是,微塑料是聚集性污染物,實時檢測隨機性較大。QIU Z等[36]人使用近紅外光譜對土壤中的微塑料污染程度進行實時檢測,建立流形嵌入分布對齊可傳遞模型后對目標區域土壤中的微塑料分類準確率僅為79.52%。為了使實驗更準確地模擬自然界中土壤微塑料污染情況,研究人員將微塑料的濃度梯度跨度設置的很大(0.01%~10%),它可以更全面地反映自然界中真實存在的多種情況。此外,當將土壤和微塑料混合制成樣本時,未添加任何粘合劑,研究人員將混合物在13 Mpa的壓強下用壓片機壓成樣本,鹽堿度過高的土壤壓制成的樣本容易破碎,因為此類土壤的粘附力過低,因此在未來的工作中研究人員需要開發更好的相關支持設備,以確保研究工作的順利進行。
本研究以LDPE或PVC與土壤的混合物為研究對象,對所有樣本在0.8~1.6 THz吸光度數據分別進行歸一化,均值中心化和移動窗口平滑預處理,以LS-SVM模型、ELM模型和PLS模型對土壤中的微塑料進行預測。根據以上模型預測效果本研究可以得到以下結論:太赫茲吸光度數據經移動窗口平滑處理后進行LS-SVM建模模型精度最高,R2大于0.960 0,RMSE小于0.006 0,預測土壤中微塑料濃度效果良好。太赫茲吸光度數據移動窗口平滑處理后進行PLS建模結果的R2值大于0.940 0,RMSE小于0.008 0,預測效果也值得肯定;對于預測土壤中PVC污染程度的模型精度略優于LDPE;對于1號土壤微塑料污染程度預測略優于2號土壤;總體來說以上兩種方法不受地域限制和微塑料種類限制。使用太赫茲光譜檢測農業土壤微塑料含量具有實驗預處理少、檢測速度快和準確率高等特點,本研究為監測土壤中微塑料污染程度提供了新方法。