關鍵詞:澳洲堅果;高光譜;氮素營養;光譜變量;估算模型
中圖分類號:S664.9;S127 文獻標志碼:A
澳洲堅果( Macadamia spp.) 是山龍眼科(Proteaceae)澳洲堅果屬(Macadamia F. Muell)常綠喬木果樹,原產于澳大利亞,有“堅果之王”的美譽[1]。截至2020 年底,全國澳洲堅果的種植面積為26.61 萬hm2,居世界第一位,其中云南達23.53萬hm2[2],已成為云南邊疆地區農民增收、企業增效、財政增長的新興產業。澳洲堅果是多年生經濟作物,其營養狀況直接關系到產量、品質以及樹體生產年限等。由于葉片養分含量直接反映樹體的營養狀況[3-4],可以根據澳洲堅果葉片中營養元素的豐缺程度進行針對性施肥,為果樹及時補給養分[5]。當前,澳洲堅果葉片營養診斷施肥大多基于傳統的葉片化學分析,雖然具有較高的檢測精度,但存在消耗時間長、過程繁瑣、工作量大、時效性差等弊端。然而,植物在缺乏營養元素時,會引起葉片顏色、厚度、水分含量以及形態結構等一系列變化,從而引起光譜反射率特征的變化。高光譜遙感技術因其光譜分辨率高,能夠探測到地物在光譜特征上的微小差異,故而廣泛用于作物營養快速檢測[6]。因此,基于高光譜遙感數據和營養元素分析,探索利用高光譜遙感技術估測澳洲堅果葉片營養元素含量,對監測澳洲堅果樹的生長勢、促進澳洲堅果園的精細化管理具有重要的理論與現實意義。
氮素是合成蛋白質和葉綠素的重要組成部分,并參與酶的合成,其含量直接影響果樹光合作用強度與糖類物質的形成,缺氮或者過量施氮都將造成產量和果實品質的下降。目前,將高光譜信息應用到作物氮素營養快速診斷的研究大多聚焦在小麥、水稻等短期作物。FERNANDEZ 等[7]發現660 nm(紅光)和545 nm(綠光)的線性組合可以作為光譜變量預測小麥葉片的氮素含量,李粉玲等[8]則利用550~770 nm波段的吸收峰總面積來定量估算冬小麥葉片氮素含量水平,薛利紅等[9] 發現水稻冠層近紅外與綠光波段的比值(R810/R560)與葉片氮積累量呈顯著線性關系,白麗敏等[10]采用連續投影算法、結合偏最小二乘法建立了冬小麥拔節期葉片氮含量高光譜估算模型,張玉森等[11]基于偏最小二乘法建立了水稻新鮮葉片和干葉粉末的光譜氮素預測模型。另外,部分學者也將高光譜營養診斷技術向多年生經濟作物擴展。朱曉鈴等[12]發現對數變換光譜的983、1245、1316、1457 nm 等4 個波段組合可用于估測蜜柚葉片氮濃度,李金夢等[13]采用連續投影算法、結合反向傳播人工神經網絡模型建立了柑橘樹葉片含氮量預測模型,黎小清等[14]分別采用光譜指數法和偏最小二乘法構建了橡膠樹葉片氮素含量高光譜估算模型,林靈辰等[15]發現基于6個葉片光譜參數所構建的支持向量回歸模型能夠較為準確地估測毛竹葉片氮元素含量,馬文強等[16]采用組合預處理方法并結合連續投影算法構建了核桃葉片氮元素含量的PLSR 預測模型。在澳洲堅果上,DE SILVA 等[17]基于400~1000nm 全波段高光譜反射率數據建立了葉片氮素含量估算模型,但測試集R2僅為0.55。然而,氮素光譜數據的獲得受到作物種類、種植模式、區域條件等因素的影響,進而導致基于高光譜遙感技術的氮素診斷施肥方法和模型尚需進一步探索。
研究表明,通過敏感波段、植被指數、高光譜特征參數的篩選,消除光譜波段的冗余信息后再建立預測模型,預測精度明顯提升[16, 18]。此外,不同光譜變換也會影響模型的預測精度,通過對原始光譜進行光譜變換,可增強光譜響應,降低干擾影響,有效提高模型精度[19]。在現有的敏感變量提取研究中,大多是從多種數學變換處理中尋找一種最優的處理方法,然后從最優變換數據中篩選特征波長[20-21]。本研究擬以澳洲堅果葉片為研究對象,分析葉片氮素含量和光譜特征,充分利用可用的光譜信息,嘗試從多種變換光譜數據中優選氮素敏感光譜變量,并基于優選的氮素敏感光譜變量建立澳洲堅果葉片氮素含量估算模型,可為今后進行澳洲堅果葉片氮素營養監測指導施用氮肥提供技術支撐。
1 材料與方法
1.1 材料
1.1.1 田間試驗 于2020 年在臨滄市雙江縣勐勐鎮小黑江酒廠堅果基地布置澳洲堅果施肥試驗。試驗地地理位置23°24′5″N,99°44′22″E,海拔977 m,該基地0~20 cm 的土壤理化性質如下:pH 5.28,有機質為35.66 g/kg,全氮為1.43 g/kg,水解氮為119.95 mg/kg,有效磷為27.85 mg/kg,速效鉀為183.09 mg/kg。用于試驗的澳洲堅果品種為O.C和HAES344,1998 年種植,株行距4.0 m×6.0 m;各品種分別選擇長勢較一致的35株樹用于試驗。試驗設7 個施肥處理,每個處理5 株,N為尿素,P為鈣鎂磷,K 為硫酸鉀,于每年分3 次施肥:3 月(保果肥)、6月(壯果肥)、10月(果后肥),各個時期的施肥量數據見表1。
1.1.2 葉片樣品采集 葉片采集在晴天的上午9:00—11:00進行,采集無病蟲害的成熟葉片。對于選取的澳洲堅果采樣樹,在樹冠的同一高度、同一方向采集顏色和形態特征基本一致的5 片葉作為1 個樣品。在臨滄市雙江縣勐勐鎮小黑江酒廠堅果基地試驗區,考慮到澳洲堅果葉片氮素含量的季節性變化,選擇多個月份進行樣品采集,共采集6 次;每次從各處理的5 株澳洲堅果樹中隨機選擇2 或3 株進行采樣,累計采集224 個葉片樣品。為了盡可能獲得不同氮素營養水平的葉片樣本,本研究還在西雙版納州4 個澳洲堅果園以同樣的方法進行了5 次隨機采樣,共采集147個葉片樣品。因此,用于本研究的葉片樣品為371個(表2)。
1.2 方法
1.2.1 葉片光譜與氮素含量測定 鮮葉采集后迅速裝入自封袋,儲存于移動冷藏箱中,12 h 內完成鮮葉的光譜反射率測定。采用FieldSpec4光譜儀(美國ASD公司產)測定葉片光譜反射率,測定光源由植物探頭提供,測定葉片正面的光譜反射率。測量前先進行參考白板校正,測量時利用葉片夾持器將葉片固定,選取葉片中部無病斑區域,測定葉片正面的光譜反射率,連續掃描3 次,每個葉片樣品的光譜反射率由15條光譜曲線取平均而得。去除噪聲較大的350~399 nm 波長,僅保留400~2500nm 光譜反射率用于本研究。將已采集光譜反射率的澳洲堅果葉片,烘干后粉碎過40 目篩,采用連續流動分析法測定葉片氮含量[22]。
1.2.2 樣本數據集劃分 2021—2022年采集的252個樣品中,先剔除2個光譜曲線明顯異常的樣品后,再采用“平均值±3 倍標準差”的方法剔除4 個氮素含量異常樣品,以剩余的246 個葉片樣品用于模型校正和驗證,其中O.C 品種葉片樣品125 個,HAES344品種葉片樣品121 個。采用分層隨機抽樣方法劃分校正集和驗證集,結合品種、采樣點和采樣日期,將246 個樣品分為14個類型,每個類型分別抽取80%的樣品作為校正集,剩余的樣品作為驗證集,將抽取的各類型樣品按校正集和驗證集進行合并。將2020年采集的119個樣品作為測試集。表3 為用于模型校正、驗證和測試的澳洲堅果葉片樣品氮素含量描述性統計。
1.2.3 對數變換 本研究的對數變換是對光譜反射率R 的倒數求對數log(1/R)。光譜反射率R 經對數變換后,可以增強原始光譜反射率值較低的波段(如可見光波段)的光譜差異。
本研究用于模型構建的校正集樣本數為197個,當決定系數DC(λi)gt;0.04 時,已經處于0.01水平上顯著相關。通過上述方法提取得到不同變換形式光譜數據的氮素敏感波長,從而得到相應的氮素敏感光譜變量。
本研究選取決定系數曲線圖中波峰特征點作為氮素敏感波長,主要依據有:(1)波峰特征點對應的決定系數是某個波段范圍內的最大值;(2)這些特征點的兩側波長變量通常與特征點波長變量有較強的共線性,因此去除特征點以外的波長。
1.2.6 模型建立與評價 選擇多元線性回歸(MLR)、偏最小二乘回歸(PLSR)、支持向量回歸(SVR)等3 種建模方法[23],建立澳洲堅果葉片氮素含量估算模型。采用決定系數(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)進行模型評價,R2越接近1,RMSE 越小,RPD越大,說明模型估算效果越好。當RPD 在1.4~2時表示模型有一定的估算能力,在2~2.5時表示模型估算能力良好,大于2.5時則表明模型有很好的估算能力[24]。
2 結果與分析
2.1 澳洲堅果葉片氮素含量與多種變換光譜數據的相關性分析
將197個校正集樣品用于分析澳洲堅果葉片光譜反射率及其變換光譜與葉片氮含量的相關性。對原始光譜反射率R 先進行log(1/R)計算,得到LR,再對R 和LR 進行1 階導數變換得到FDR 和FDLR,最后對R 和LR 進行2 階導數變換得到SDR 和SDLR,建立澳洲堅果葉片氮素含量與光譜反射率R 及其變換形式光譜的相關系數曲線圖。結果如圖1 所示,R、LR、FDR、FDLR、SDR、SDLR 的最高相關系數分別為?0.507、0.515、?0.540、?0.584、0.618、?0.631,分別出現在528、527、2154、2070、532、522 nm 處。相比原始光譜反射率R,經對數變換或導數變換處理后,光譜數據與葉片氮素含量的相關性得到了增強。從圖1 來看,導數變換后,雖然也會一定程度放大光譜噪聲,但大大增強了敏感波段光譜對氮素的響應能力。
2.2 澳洲堅果葉片氮素敏感光譜變量優選
對圖1 的相關系數進行平方運算,得到澳洲堅果葉片氮素含量與光譜反射率及其變換形式數據的決定系數曲線圖(圖2)。依據氮素敏感光譜變量提取方法,在決定系數大于0.04 的原則下,選擇決定系數曲線圖中波峰特征點對應的波長作為氮素敏感波長。在氮素敏感波長提取過程中,去除決定系數較低的波長的同時,還剔除了與波峰特征點波長變量存在較強共線性的波峰特征點兩側波長變量,盡可能保留了可用的光譜信息。通過氮素敏感波長初步篩選,6 種形式光譜數據的變量總數從12 594 個壓縮到619 個,壓縮率達95%。其中,R、LR、FDR、FDLR、SDR、SDLR提取得到的氮素敏感波長個數分別為33、37、138、145、139、127。
從圖3 可以看出,R 與LR,FDR 與FDLR,以及SDR 與SDLR 的敏感波長分布基本一致,這是因為R 與LR,FDR 與FDLR,以及SDR 與SDLR在相同波長處呈現高相關性。雖然在上述氮素敏感波長提取過程中,已經消除了各變換形式光譜內部的部分冗余波長,但不同變換形式光譜之間還存在較大的共線性問題。
為消除共線性的影響,采用逐步回歸法對619個氮素敏感光譜變量進一步優化。以619 個氮素敏感光譜變量為自變量,葉片氮素含量為因變量,將619個氮素敏感光譜變量與葉片氮素含量進行逐步回歸分析。逐步回歸和共線性診斷結果如表4所示,對模型的貢獻達到顯著水平而被留在模型中的變量有19個。通過模型中變量共性線診斷發現,變量中方差膨脹因子均小于10,說明變量間不存在多重共線性[25]。最終確認不存在共線性的19 個優選氮素敏感光譜變量分別是:LR474、FDR1072 、FDR1414 、FDR1631 、FDR1837 、FDR2063、FDR2154、FDLR492、FDLR1672、FDLR2227、FDLR2389、FDLR2428、SDR587、SDR1595 、SDR1769 、SDR1780 、SDR1948 、SDLR2153、SDLR2328。其中,變量入選最多的光譜類型是FDR、FDLR 和SDR,氮素敏感波長主要分布在近紅外波段1072~2428 nm(圖4)。
2.3 澳洲堅果葉片氮素含量估算模型的建立與驗證
將19個優選的澳洲堅果葉片氮素敏感光譜變量作為自變量,葉片氮素含量作為因變量,并采用MLR、PLSR、SVR 等3 種方法構建澳洲堅果葉片氮素含量高光譜估算模型。分別利用驗證集和測試集對構建的澳洲堅果葉片氮素含量高光譜估算模型性能進行測試,結果如表5 所示,MLR、PLSR、SVR 等3 種模型估算能力均表現良好,驗證集和測試集的RPD 均在2.0 以上。綜合來看,PLSR 模型為最優估算模型,驗證集和測試集的RPD 分別為2.099 與2.110,估算能力良好。由于測試集樣品全部采集于西雙版納州,而建模集和驗證集約88.6%的樣品采集于臨滄市,從測試集的估算效果來看,本研究構建的模型具有較強的區域普適性。
為了進一步驗證本研究構建模型的普適性,將構建的光譜最優模型與常規的全波段PLSR 模型進行性能和普適性對比(表6)。從驗證集的估算表現來看,基于全波段原始光譜反射率(R)構建的PLSR 模型效果最好。但從測試集的估算結果來看,本研究構建的模型估算性能大大優于6種變換光譜的全波段PLSR 模型,其RPD 為2.110,而全波段PLSR 模型的RPD 最高僅為1.136。結果表明,該光譜最優模型的區域普適性優于全波段PLSR 模型,適合推廣應用。
3 討論
本研究首先采用對數變換、導數變換及變換組合對原始光譜反射率進行多種數學變換,然后分析了澳洲堅果葉片氮素含量與多種變換光譜數據的相關性。結果發現,R、LR、FDR、FDLR、SDR、SDLR 與澳洲堅果葉片氮素含量的最高相關系數分別為?0.507、0.515、?0.540、?0.584、0.618與?0.631,分別出現在528、527、2154、2070、532、522 nm 處。這表明,經對數變換、導數變換及變換組合處理后,各光譜數據與氮素含量的相關性均得到提升。其中,單一變換處理以二階導數變換的提升效果最明顯,與郭發旭等[26]的研究結果一致;組合變換處理則以對數變換結合二階導數變換的提升效果最明顯。本研究中,葉片氮素含量與R 的最高相關性在528 nm 波段,與前人在橡膠[14]和琯溪蜜柚[27]上的研究結果相似,但也有一定差異,這可能是作物類型的差異所致。JOHNSON 等[28]研究發現道格拉斯冷杉葉片氮素含量與FDR 在2160 nm 波段處的相關性最高,與本研究發現澳洲堅果葉片氮素含量與FDR 最高相關性在2154 nm 波段處的結果基本一致。
大量研究表明,葉片氮素敏感波段主要在可見光波段[7-8]。本研究通過分析決定系數,篩選到619 個氮素敏感光譜變量,并采用逐步回歸法進一步優選到不存在共線性影響的19個氮素敏感光譜變量, 其波長主要分布在近紅外波段的1072~2428nm 區間,這與朱曉鈴等[12]的研究相似。薛利紅等[29]認為,葉片中的氮素大多以蛋白質的形態存在,而2100nm 左右為蛋白質的吸收波段,因此2100nm 左右也是氮素的敏感波段,這在本研究中得到證實。本研究優選的19 個氮素敏感光譜變量中,最多的光譜類型是FDR、FDLR和SDR,入選變量個數分別為6、5和5,這進一步表明對數變換、導數變換及變換組合處理能夠有效增強敏感波段光譜對氮素的響應能力。本研究發現,與澳洲堅果葉片氮素含量最高相關的6個光譜變量中僅有FDR2154 入選為最優的氮素敏感光譜變量,這是逐步回歸法的變量優選結果,但不同的變量優選方法可能會呈現不一樣的結果。
為得到最優的澳洲堅果葉片氮素含量高光譜估算模型,比較了MLR、PLSR 與SVR 等3 種模型的估算效果。結果顯示,PLSR 模型的估算效果要優于MLR 和SVR,其驗證集和測試集的RPD分別為2.099 及2.110,表明PLSR 模型具有較高的估算精度。與6 種變換光譜的全波段PLSR 模型相比,經優選氮素敏感光譜變量后的PLSR 模型效果最好,表明其具有較強的區域普適性,可能更適用于澳洲堅果葉片氮素含量的實時預測,為澳洲堅果樹科學合理施加氮肥提供了一定的參考依據。同時,基于多種變換光譜數據,優選氮素敏感光譜變量,充分利用了不同變換光譜數據中可用的光譜信息,為光譜敏感變量的篩選提供新思路。