陳珠琳 王雪峰
(中國林業科學研究院資源信息研究所,北京 100091)
鐵是土壤中含量較高的微量元素,也是植物生長必需的營養元素之一[1-2]。雖然鐵在土壤中的含量豐富,但可供植物直接利用的鐵離子(Fe2+)含量并不高,植物易出現缺鐵脅迫;但在天然的酸性土壤或者礦區附近,土壤中過多的Fe2+會產生鐵毒,迫使植物產生生理病變。
自植物營養無損檢測技術成為農林業研究的熱點后,植物在大量元素(氮(N)、磷(P)、鉀(K))脅迫下的光譜特征研究[3]已較為成熟,并成功應用于田間管理。近年來,國內學者致力于研究植物對微量元素[4]脅迫的光譜特征變化[5-6]。與其他重金屬不同[7],鐵在微量礦物元素中需求量最大[8]。當植物受到鐵脅迫時,其生理特征會發生變化,從而影響色譜信息。川梨受到缺鐵脅迫時,其葉綠素含量明顯降低,葉色變黃[9]。水稻在進行鐵過量脅迫試驗時,葉片中鐵含量增加,光譜反射率在可見光波段升高,同時明顯抑制水稻地上部和根系的生長,降低下位葉片的葉綠素含量[10-12]。玉米發生鐵毒脅迫時,綠峰反射率升高、綠峰位置紅移、紅邊藍移,且綠峰反射率與紅邊藍移變幅隨濃度增加而增大[13]。
植物營養無損診斷方法多樣,但數字圖像處理技術因其快捷方便、價格低廉的特點得到了廣泛應用[14]。由于田間和林內環境復雜,對圖像分割造成影響,所以研究者們針對不同的試驗環境提出了多種圖像分割方法[15-18]。由于自然圖像的復雜性較強,傳統的紅綠藍(RGB)顏色系統無法滿足分割的精度,而亮度色彩模型(CIE Lab)具有對光照變化不敏感的特性[19],增強了適應性[20-21],所以該顏色模型常用于分析野外自動獲取的圖像。
在回歸預測方面,人工神經網絡(Artificial neural network, ANN)應用較為普遍。其中,反向傳播神經網絡[22-24](Back propagation neural network, BPNN)在網絡理論和性能方面均較成熟,但BPNN學習速度慢,易陷入局部極小值,需結合各類優化或迭代算法,以提高預測準確率。
目前,珍貴樹種營養診斷研究陸續展開[25],但均圍繞大量元素進行。微量元素脅迫尚處于初步研究階段[26],且均為實驗室獲取光譜信息,人為消除了田間或林內影響因素,應用性較差。本文基于數字圖像技術預測檀香(Santalum album L.)葉片全鐵含量,對野外獲取圖像進行分割,并根據鐵脅迫下檀香出現的顏色變化提取顏色因子,使用優化后的BPNN進行反演,旨在為珍貴樹種的微量元素營養診斷與監測提供更準確、應用性強的技術方法。
研究區設在海南省文昌市島東林場(1 9°4 3′5 8″~1 9°4 4′5 8″N,110°57′34″~110°57′50″E)。該林場位于沿海平原地帶,海拔5~10 m,屬熱帶海洋季風氣候,年平均溫度23.9℃,年平均降水量1 808.8 mm,臺風較多,常風2~3級,年平均濕度為86%。主要土壤類型為初育土土綱的濱海沙土,試驗地土壤pH 5.0~6.6,有效氮98.3~114.8 mg·kg-1,有效磷3.38~4.56 mg·kg-1,速效鉀69.9~78.2 mg·kg-1,有效鐵2.33~4.89 mg·kg-1。該區域植被類型為熱帶季雨林,人工經營樹種主要有木麻黃(Casuarina equisetifolia Forst)、椰子(Cocos nucifera L)、瓊崖海棠(Calophyllum inophyllum L)和桉樹(Eucalyptus robusta Smith)等。
研究所用的檀香采用種子育苗,待生長4.5 a后,選取生長良好的幼齡檀香進行試驗。本研究所用鐵源為乙二胺二鄰羥苯基大乙酸鐵鈉(EDDHAFeNa),采用根部埋施法。單因素試驗設計,包括4個Fe濃度水平,分別為每棵苗0、10、15、20 g-1,記為CK(不施Fe)、Fe1(低濃度)、Fe2(中濃度)、Fe3(高濃度),每個濃度水平下種植8棵檀香。使用加拿大植物營養公司的普羅丹高濃度水溶性復合肥施入其他元素,采用葉面噴施,施加量為每棵樹200 mg。
于2017年2月(鐵脅迫之前)測量東西冠幅(w01)和南北冠幅(w02),之后每個月進行一次鐵脅迫,施肥量與初始施入量一致,其他營養元素不再施加。數據采集時間為2017年4—12月,每隔兩個月進行圖像、冠幅、養分數據獲取,測量5次,數據總量為160個。圖像獲取選擇天氣晴朗少云少風時進行,拍攝時間為10:00—14:00,拍攝距離為1.5 m,使用Canon ESO700D相機拍攝,圖像大小為5 184×3 456像素。獲取圖像時,分為東、西、南、北四個方向進行拍攝。之后進行葉片采樣,分為上內、上外、中內、中外、下內、下外共6個層次,每棵檀香共采集約15 g葉片。使用便捷式養分測定儀(Reflectoquant RQflex,德國)進行全鐵含量測定,該儀器使用10點校正和雙光束測量,校正數據精度高。試驗對每個樣品進行3次測定,所有數據的變異系數均在3%之內。
紅綠藍(RGB)、色度飽和度亮度(HSI)、亮度色彩(Lab)是常用的三種顏色模型,其中,RGB最為常用,它是一種與人的視覺系統密切相連的模型[17,27]。由于不同模型、不同分量對顏色的表述不同,本文通過計算上述顏色系統各分量的顏色值,描述全鐵含量對葉片顏色的影響。
所有的圖像數據處理均在Matlab R2012a中實現。由于Fe2+脅迫對新葉和老葉的影響不同,可根據新老葉表現出的色譜差異來判定全鐵含量。但考慮到檀香長勢并不相同,本研究通過定義4個方向(東、西、南、北各拍攝一張圖像)上同心圓的方式來確定新葉區域,如圖1所示,具體步驟如下:
首先完成檀香圖像分割,然后尋找最小外接圓,半徑記為Ri(i=1~4,分別代表東、西南、北拍攝的圖像);確定同心圓ri的值(若該圖像為在南、北方向拍攝,則;若該圖像在東、西方向拍攝,則分別代表本次試驗測得的東西、南北冠幅,代表上一次試驗測得的東西、南北冠幅);圓環部分葉片ARi-ri既為從圖像中獲取的新葉(如圖1所示),最終新葉部分為。

圖1 圖像確定新葉區域方法Fig. 1 Method using images to determine new leaf area
通過上述方法確定了兩個同心圓的大小,可獲得3個區域,即ARi(半徑為R的圓中葉片區域)、Ari(半徑為r的圓中葉片區域)和ARi-ri(圓環中的葉片區域)。因此,本研究進行4組對比試驗,所提取的顏色因子分別為:ARi的單通道顏色值(紅(R)、綠(G)、藍(B)、色調(H)、飽和度(S)、強度(I)、亮度(L)、橫軸顏色(a)、縱軸顏色(b))、ARi-ri的單通道顏色值(同上)、ARi-ri與ARi的單通道顏色比值(同上)、ARi-ri與Ari的單通道顏色比值(同上)。
BPNN的隱含層神經元個數對預測精度影響較大,過多過少均會導致訓練效果不佳,本文使用經驗公式,即

式中,n為隱含層神經元個數;ni為輸入層神經元個數;n0為輸出層神經元個數;a為1~10之間的常數。
BPNN易出現過擬合等現象,所以常與其他尋優或增強算法結合使用。常見的有遺傳算法[28-29](Genetic algorithm, GA)、粒子群優化算法[28](Particle swarm optimization, PSO)和Adaboost迭代算法[29-31]。本文對三種優化算法(下文分別縮寫為GA-BPNN、PSO-BPNN、BPNN-Adaboost)不做詳細介紹,具體參考文獻[28]~[33]。
試驗共獲取160個數據,隨機抽取110個為擬合樣本,剩余50個為檢驗樣本。同時選擇擬合和檢驗樣本的決定系數R2、平均殘差、均方根誤差RMSE對模型進行評價。
本研究基于地面獲取檀香圖像進行全鐵含量的反演,如圖2A所示,檀香圖像背景復雜,除土壤、雜草外,還有其他樹種,對圖像分割造成了很大難度。所以,為保證后期工作的質量,有必要提出準確的圖像分割算法。
大津(Otsu)法是1979年日本學者大津提出的一種自適應性閾值確定方法,其基本原理是確定一個最佳閾值,使最佳分類狀態的類間分離性最好[16-17]。本研究將圖像分別轉換至Lab通道、L通道、a通道和b通道(圖2)并做Otsu法分割。通過大量試驗發現,Lab通道使用Otsu法分割失敗,僅能將極小部分的土壤與綠色植物區分開。a通道和b通道均可將檀香葉片與背景土壤區分開,但b通道保留的葉片更完整。L通道則彌補了a、b通道的弱點,將檀香葉片與寄主等綠色植物區分開,所以本文選擇結合b通道和L通道對自然圖像中的檀香進行分割。
分割算法流程如下:(1)對b通道進行Otsu法分割,并進行7×7的中值濾波處理。(2)與原圖進行掩膜并提取L通道,并使用原圖L通道得到的最佳閾值進行分割。(3)使用7×7模板的中值濾波進行平滑處理,然后使用半徑為5的圓形結構元素腐蝕膨脹各2次。分割結果如圖3所示。
算法所使用的模板以及結構元素均為在大量的對比分析后得到的最佳方案。為驗證該分割算法的效果,使用Photoshop CS5軟件中的磁性套索工具(相當于目視解譯法)手動分割檀香,并將此結果作為評價基準。將使用本文提出算法(編號為①)、ENVI 5.1軟件中的支持向量機分類法(編號為②)和Photoshop CS5處理(編號為③)得到的結果進行比較,結果如表1所示。從表中可以看出,本文提出算法在像素數和顏色誤差方面均要優于支持向量機處理結果,這是因為支持向量機算法對土壤和葉片的分割效果較差,易出現誤分割,導致像素誤差較大,G均值降低,R均值和B均值升高。而本文提出算法像素數誤差在5%之內,各通道誤差控制在3%之內,說明該算法可行。

圖2 大津(Otsu)法分割檀香不同通道圖(A. 原圖, B. Lab, C. L通道, D. a通道, E. b通道)Fig. 2 Graphs of channels in Sandalwood images segmentation using Otsu’s method (A. Original image, B. Lab, C. Channel L, D.Channel a, and E. Channel b)

圖3 檀香圖像分割過程及結果(A. b通道Otsu法分割結果,B. 7×7中值濾波后腌膜圖像, C. L通道大津法分割及7×7中值濾波處理結果,D. 形態學處理, E. 最終圖像)Fig. 3 Process and results of sandalwood image segmentation (A. Segmentation using Otsu’s method via Channel b; B. Masked image after 7×7 median filtering; C. Segmentation using Otsu’s method via Channel L and masked image after 7×7 median filtering;D. Morphological processing; and E. Finalized image)

表1 分割方法評價Table 1 Segmentation method evaluation proposed in this paper

續表
表2所示為樣本的全鐵含量以及檀香圖像的RGB單通道值統計信息。試驗采集的原始圖像數據包含RGB三個通道,通過顏色系統的轉換,最終得到R、G、B、H、S、I、L、a、b共9個通道的顏色值。

表2 檀香葉片全鐵含量及RGB單通道值統計信息Table 2 Statistical information of total iron content and RGB single channel color value
本研究將獲取的擬合數據按100為梯度劃分為6組,并求得平均值,分析不同全鐵含量對光譜反射率的影響,如圖4所示。可以看出,R和B通道值先下降后上升,而G通道值先上升后下降。這說明,全鐵含量的上升促進了葉綠素濃度增加,葉片向純綠色變化;而隨著全鐵含量持續增高,葉片開始失綠,說明檀香受到了鐵毒脅迫作用,葉綠素遭到了破壞,生長也會隨之受到影響。
由于9種顏色因子之間存在較大的相關性,為了縮短建模時間、提高模型的精度,對其進行了主成分分析,結果得到四種試驗的前四個主成分的累計貢獻率均達到99%,所以本文選擇前四個主成分作為輸入因子。試驗構建4種神經網絡模型,參數設置分別為:BPNN使用4-10-1的網絡結構,其輸入、輸出層傳遞函數分別為Tansig和Purelin,訓練函數使用L-M優化算法,迭代次數為100;PSOBPNN中種群粒子數為20,每個粒子的維數為4,算法迭代進化次數為100;GA-BPNN種群大小為20,遺傳代數為100,交叉概率為0.6,變異概率為0.005。BPNN-Adaboost中預測器個數選擇10,預測時迭代次數為20。
對4組試驗得到的結果進行分析,結果如表3所示。可以看出,單個評價指標對不同試驗的結果說明不同,例如,BPNN模型中,試驗2的決定系數 R2高于試驗1,但平均殘差高于試驗1,為綜合考慮各評價指標,本研究分別對建模和驗證數據得到的決定系數 R2、平均殘差、均方根誤差RMSE進行打分,指標最優的記為1,最差的記為4,得分最低的為最佳試驗方案。排名結果如表3最后一列所示。

圖4 紅綠藍(RGB)顏色值隨檀香葉片全鐵含量濃度變換趨勢Fig. 4 Variation of RGB color value with content of total iron in sandalwood leaves

表3 不同神經網絡模型和不同試驗的預測結果Table 3 Prediction results of different neural network models and different tests
由表3可知,試驗1和試驗2無論在擬合優度和預測精度方面均相差不顯著,且在使用BPNN和GA-BPNN時,試驗1的結果優于試驗2,而在使用PSO-BPNN和BPNN-Adaboost模型時,結果相反。但試驗3和試驗4的結果在各項指標均有明顯提高,同時,所有模型均顯示試驗4結果最佳,即使用新葉與老葉的顏色比值結果優于新葉與整體的顏色比值,這是因為在缺鐵狀態時,新葉失綠,老葉保持綠色,若計算整體比值,則新老葉的光譜特征差異減弱;而在鐵毒情況下,葉綠素受到破壞,新葉最先受到影響,葉片由綠變黃,所以新葉與整體的顏色比值同樣削弱了光譜特征差異,導致精度降低。
從表3中還可以看出,相同試驗下,綜合分析擬合優度以及預測精度,4種神經網絡模型優劣排名為GA-BPNN>PSO-BPNN>BPNNAdaboost>BPNN。這說明優化后的神經網絡確實減小了出現過擬合的概率,同時,尋優算法(G A、P S O)的效果要優于迭代增強(Adaboost),也說明合適的初始值與閾值對網絡預測能力的提高更明顯。
以海南省文昌市島東林場栽植的檀香為試驗對象,通過施加不同梯度的螯合鐵對檀香進行鐵脅迫,從而研究植株葉片光譜參數與植株體內全鐵含量之間的關系。結果表明,葉片從缺鐵向正常含量變化過程中,葉綠素含量增加,顏色變得濃綠;當超過最佳值(250~300 mg·kg-1)時,葉綠素含量開始減少,產生鐵毒效應。研究通過將Lab系統中的b通道、L通道與大津法、中值濾波以及形態學運算相結合完成檀香分割,計算冠幅生長量占總冠幅的比例確定新葉區域,將新葉與老葉光譜參數比值作為GA-BPNN的輸入因子,得到較好的預測結果。與前人的研究相比,本文在模型輸入因子方面進行了改進,提出了圖像法確定新葉,并驗證得出,通過該方法獲得的新老葉顏色比值作為輸入因子得到的結果最優。同時,由于海南地區土壤類型多樣,不同土壤類型對試驗結果是否產生較大的影響,也需要后期的討論分析。