楊可明 高 偉 陳改英 趙恒謙 韓倩倩 李艷茹
(1.中國礦業大學(北京)地球科學與測繪工程學院, 北京 100083; 2.北京農學院園林學院, 北京 102206)
金屬礦山開采會引起一系列環境污染問題,如銅(Cu)、鉛(Pb)等重金屬元素通過地下水、降雨等途徑污染土壤,并經根系富集于農作物中,威脅人類生命健康。因此,農作物重金屬污染監測尤為重要。高光譜技術具有快速、無損檢測和環境友好[1-3]等特點,被廣泛應用于農作物重金屬污染監測研究中,如利用光譜指數監測玉米中銅的污染程度[4],利用可見-近紅外光譜探測果樹葉片多類鐵的含量[5],結合顯著波段與指數特征預測向日葵中多種重金屬含量[6]等。不同種類的重金屬元素對人體產生的危害不同,如Cu中毒是引起阿爾茨海默[7]、帕金森[8]及亨廷頓[9]等神經系統退行性疾病的重要因素,Pb中毒是正常紅細胞性貧血[10]、腹痛[11]等疾病的重要誘發因素。因此,基于高光譜技術探尋農作物重金屬脅迫種類的識別方法意義重大。
近年來,國內外學者在重金屬污染元素光譜識別方面取得了一定的進展。XIE等[12]以顯著光譜變量結合線性回歸分類,對泥蚶中3種重金屬元素及混合污染進行了識別,準確度為90.67%。楊可明等[13]依據玉米葉片空間譜的峰數實現了對重金屬脅迫種類的區分。付萍杰等[14]在對植物光譜進行經驗模態分解去噪重構基礎上,基于多個特征區間光譜自相關函數一階導數比值差的變化量與0的關系,對Cu、Pb污染進行判別研究。張龍等[15]基于近紅外光譜,利用Db2小波分解進行光譜預處理,使用徑向基人工神經網絡識別了3種重金屬污染下的水稻葉片。以上研究存在判別理論不系統、光譜變化繁瑣等問題,并且已知的農作物重金屬污染元素光譜識別方法極少,有必要探索有效的識別方法。
本研究以銅鉛脅迫下的玉米葉片高光譜數據為基礎,使用0.1~2.0階分數階導數(Fractional order derivative, FOD)進行光譜變換,利用FOD光譜紅邊位置(Red edge position,REP)與任意兩波段的組合構建玉米葉片的紅邊銅鉛敏感指數(Red-edge copper-lead sensitive index,RECLSI)集群,以集群中與脅迫類型相關系數正負極值對應的RECLSI組建玉米葉片的銅鉛識別特征(Copper lead identification feature,CLIF),當CLIF在二維平面內的分布呈現出與脅迫類型相關的聚類時,建立脅迫識別界限(Stress identification boundary,SIB),從而實現玉米葉片銅鉛脅迫識別。
試驗的玉米種子為“密糯8號”,使用分析純CuSO4·5H2O和Pb(NO3)2分別進行銅鉛重金屬脅迫,脅迫梯度設置為50、100、150、200、300、400、600、800 μg/g,對應標記為Cu(50)、Pb(50)、Cu(100)、Pb(100)、…、Cu(800)、Pb(800),每種脅迫類型的各脅迫梯度均設置3組平行試驗,其中第1組和第2組作為試驗組,第3組作為驗證組。培育期間,定期通風澆水,適時向各盆中添加H4NO2、KH2PO4和KNO3營養液。
使用穗期玉米葉片進行數據采集,每盆摘取3枚不同新舊程度的葉片作為樣本;使用ASD FieldSpec 4型地物光譜儀采集葉片光譜;使用電感耦合等離子發射光譜儀測定葉片的重金屬離子含量。依據葉片的重金屬離子含量,使用四分位距法進行同脅迫種類、同脅迫梯度內異常葉片的剔除;求取各盆剩余葉片的平均光譜用于后續研究。
導數是一種常用的光譜處理方法,能有效消除基線效應[16],分數階導數(FOD)變換能夠從光譜中提取到更為細致的隱藏信息[17]。FOD變換最常用的3個定義為Caputo、Riemann-Liouville和Grünwald-Letnikov(G-L)[18-21],其中G-L法更適用于光譜信號的處理。光譜f(x)在波長[a,b]間的FOD為

(1)
其中

(2)
式中v——FOD的階數,v>0m——常數
s——指定波段的光譜值
h——光譜的采樣間隔
a——光譜的起始波長
b——光譜的終止波長
[]——取整運算函數
Γ——Gamma函數
z——自變量
u——積分變量
故而,式(1)可以表示為
(3)
紅邊位置(REP)在植被重金屬污染監測中具有重要作用,REP最常用的提取方法是最大一階導數法[22]。以葉片FOD光譜中REP與任意兩波段的組合構建紅邊銅鉛敏感指數(RECLSI)集群,任意一種組合均為集群中的一種RECLSI,RECLSI的通項為
RECLSI=(RλREP-Rλ1)/(RλREP+Rλ2)
(4)
式中Rλ1、Rλ2——波長λ1、λ2處FOD光譜值
RλREP——紅邊位置波長λREP處FOD光譜值
使用RECLSI集群中與脅迫類型相關系數最大的指數RECLSIplus和相關系數最小的指數RECLSIminus組建葉片的銅鉛識別特征(CLIF)。
將CLIF展繪于二維平面中,其中RECLSIplus作為橫坐標,RECLSIminus作為縱坐標。當不同脅迫類型下葉片的CLIF聚集于不同區域時,存在一個帶狀區域可將不同脅迫類型葉片的CLIF進行最大程度分割(帶狀區域一側為銅脅迫區,另一側為鉛脅迫區),需滿足所處脅迫區與脅迫類型一致的CLIF總數最大。以銅脅迫區內任意一個銅脅迫葉片的CLIF與鉛脅迫區內任意一個鉛脅迫葉片的CLIF作為一對CLIF,每對CLIF中兩個特征在平面內的距離稱為內距。以內距最短的兩對CLIF的中點建立脅迫識別界限(SIB),SIB一側CLIF對應的葉片被判定為受銅脅迫,另一側CLIF對應的葉片被判定為受鉛脅迫,依據CLIF-SIB進行脅迫類型的識別。SIB表達式為
y=w+kx
(5)
其中
(6)
w=RECLSIminus-cu-1-RECLSIminus-pb-1-k(RECLSIplus-pb-2-RECLSIplus-cu-2)
(7)
RECLSIminus-cu-1——第1對CLIF中銅區特征的縱坐標
RECLSIplus-pb-1——第1對CLIF中鉛區特征的橫坐標
RECLSIminus-pb-1——第1對CLIF中鉛區特征的縱坐標
RECLSIplus-cu-2——第2對CLIF中銅區特征的橫坐標
RECLSIminus-cu-2——第2對CLIF中銅區特征的縱坐標
RECLSIplus-pb-2——第2對CLIF中鉛區特征的橫坐標
RECLSIminus-pb-2——第2對CLIF中鉛區特征的縱坐標
采用SPSS 19.0軟件進行統計分析。計數資料用%表示,計量資料采用表示。組間計數資料采用χ2檢驗;計量資料兩兩比較采用t檢驗,三組間比較采用方差分析。變量間的相關性分析采用Pearson線性相關分析。所有統計結果以P<0.05為差異有統計學意義。
以精度(Accuracy,A)來表征CLIF-SIB識別效果,計算公式為
A=nright/nall×100%
(8)
式中nright——CLIF-SIB判別正確的葉片數量
nall——葉片總數
一階導數、二階導數是光譜數據處理中常用的方法,故在0.1~2.0階區間內,以0.1階為間隔,對玉米葉片光譜進行FOD變換,共獲得20組不同階次的玉米葉片FOD光譜。玉米葉片光譜隨著FOD階數的增加不斷變化,從原始光譜到1.0階FOD光譜的漸變較為明顯,1.0階FOD光譜到2.0階FOD光譜的變化趨于平緩,原始光譜中的隱含信息得到進一步提取。第1組中Cu(50)葉片樣本的原始光譜(OS)與各階FOD光譜如圖1所示,由于不同脅迫類型與梯度下的葉片樣本光譜差異較小,故其余光譜不再贅述。
使用最大一階導數法,在葉片原始光譜680~750 nm區間內提取紅邊位置,并獲取0.1~2.0階FOD光譜對應的RECLSI集群。計算0.1~2.0階FOD光譜對應的RECLSI集群中每種RECLSI與葉片重金屬脅迫類型的相關系數,以表征對脅迫類型的敏感程度。
0.1~2.0階FOD光譜對應的RECLSI集群中指數與脅迫類型的相關系數隨波長的變化情況如圖2所示。其中,0.1~0.4階FOD光譜對應的RECLSI集群與脅迫類型的相關系數分布區間為-0.46~0.4;0.5~0.6階FOD光譜對應的RECLSI集群與脅迫類型的相關系數分布區間為-0.56~0.45;0.7~0.8階FOD光譜對應的RECLSI集群與脅迫類型的相關系數分布區間為-0.62~0.56;0.9~1.5階FOD光譜對應的RECLSI集群與脅迫類型的相關系數分布區間為-0.68~0.67;1.6~1.7階FOD光譜對應的RECLSI集群與脅迫類型的相關系數分布區間為-0.64~0.61;1.8~2.0階FOD光譜對應的RECLSI集群與脅迫類型的相關系數分布區間為-0.59~0.52。由于計算中出現空值,2.0階FOD光譜對應的RECLSI集群中出現了部分與重金屬脅迫類型的相關系數不存在的情況。
可以發現,隨著FOD光譜階次的增加,對應的RECLSI集群與重金屬脅迫類型的敏感程度總體呈先升后降的趨勢;0.9~1.5階時,敏感程度極強;0.7~0.8階及1.6~1.7階時,敏感程度較強;0.1~0.6階及1.8~2.0階時,敏感程度較弱。在各階FOD光譜對應的RECLSI集群與重金屬脅迫類型的相關系數正負極值中,最大值與最小值對應的FOD光譜階次分別為1.3階與1.4階。重金屬脅迫類型敏感程度強的RECLSI為識別研究奠定了基礎。
以0.1~2.0階FOD光譜對應的每個RECLSI集群中與葉片重金屬脅迫類型相關系數最大的RECLSI(RECLSIplus)及相關系數最小的RECLSI(RECLSIminus)組成不同階次FOD光譜對應的CLIF,詳見表1。

表1 0.1~2.0階FOD光譜對應的CLIF中λ1、λ2組成
計算試驗集葉片0.1~2.0階FOD光譜對應的CLIF,并將其展繪在二維平面中,如圖3所示。由圖3易知,在試驗集中,0.1~0.6階、1.6~2.0階FOD光譜對應的不同脅迫類型的CLIF二維平面分布存在大范圍混淆,區分難度較大;0.7~1.5階FOD光譜對應的CLIF不同脅迫類型的CLIF二維平面分別表現出與脅迫類型一致的聚集。求取0.7~1.5階FOD光譜對應的SIB,將其位置與表達式標繪在圖3相應位置,SIB左側被判定為銅脅迫下的葉片CLIF,SIB右側被判定為鉛脅迫下的葉片CLIF。依據CLIF分布與SIB位置,計算0.7~1.5階FOD光譜對應的CLIF-SIB的精度。其中,1.2階下的精度最高,為100%;0.9、1.0、1.3階的精度超過了90%;另有5個階次的精度超過了80%。
由此可知,由對重金屬脅迫類型敏感程度弱的RECLSI組成的CLIF中,其二維分布均未能表明不同脅迫類型的差異,故而SIB難以求取或無實際意義,無法用于葉片銅鉛重金屬脅迫識別;由對重金屬脅迫類型敏感程度強的RECLSI組成的CLIF中,大部分CLIF的二維分布通過與脅迫類型一致的聚集表明了不同脅迫類型的差異,存在恰當的SIB,能夠不同程度地進行葉片銅鉛重金屬脅迫識別;CLIF-SIB的識別效果較大程度受其組成RECLSI對重金屬脅迫類型敏感程度的影響。試驗集識別結果顯示,多個階次FOD光譜對應的CLIF-SIB能夠對葉片重金屬脅迫類型做出有效識別,證明了基于FOD光譜的CLIF-SIB在葉片銅鉛重金屬脅迫識別中的可行性與有效性。
為驗證CLIF-SIB的穩定性與適用性,計算驗證集葉片0.7~1.5階FOD光譜對應的CLIF,將其展繪在二維平面中,標繪對應階次SIB的位置與表達式,如圖4所示。計算驗證集中0.7~1.5階FOD光譜對應的CLIF-SIB的精度。其中,1.4階的精度最高,為87.5%;1.2、0.8、1.1、1.5階的精度并列第2,為81.25%;其余階次的精度均在60%以上。1.2階時,試驗集的精度最優,其驗證集的精度僅次于1.4階時,結合1.4階時試驗集的精度,整體比較后認為基于1.2階FOD光譜的CLIF-SIB在葉片銅鉛脅迫識別中效果最好,同時最為穩定。
綜上,經試驗與驗證可得:對脅迫類型敏感程度較強的RECLSI組成的CLIF在二維分布聚類、SIB建立以及最終的脅迫類型識別中表現更好;基于部分階次FOD光譜的CLIF-SIB能夠在脅迫類型識別中得出有效且穩定的結果,證明了此方法可行且有效;對識別效果進行對比,發現基于1.2階FOD光譜的CLIF-SIB能夠較好兼顧識別結果的有效性與穩定性,識別能力最強。
(1)對玉米葉片原始光譜進行0.1~2.0階FOD變換,基于各階FOD光譜中REP與兩個不同波段的組合構建RECLSI集群。隨著FOD光譜階次增加,RECLSI集群與葉片重金屬脅迫類型的總體相關程度呈先升后降的趨勢,相關系數的最大值、最小值極點分別出現在1.3、1.4階FOD光譜對應的RECLSI集群中。
(2)根據每個RECLSI集群與葉片重金屬脅迫類型相關系數正負極值對應的RECLSI,組建0.1~2.0階FOD光譜對應的CLIF。CLIF的二維分布呈現出與脅迫類別相關的聚集,其組成指數對脅迫類別的敏感程度均較強。根據0.7~1.5階FOD光譜對應的CLIF建立SIB,并進行脅迫類型識別試驗與驗證。結果表明,基于1.2階FOD光譜的CLIF-SIB試驗結果最好,精度為100%,同時其驗證結果也極為穩定,精度為81.25%。說明基于FOD光譜的CLIF-SIB葉片銅鉛脅迫類型識別方法具有可行性與普適性,能夠在玉米葉片銅鉛脅迫識別中發揮重要作用。
(3)基于FOD光譜的CLIF-SIB為植物重金屬脅迫識別提供了新手段,可為利用其他特征參量在平面、空間或更高維的系統中進行植物重金屬脅迫識別研究提供參考。