王鑫野 李欣庭 李紅梅 馮潔



摘要:針對馬鈴薯晚疫病,提出了將病害葉片和健康葉片聯合測試并提取有效特征波長的檢測方法。對健康和病害葉片的光譜圖像進行主成分分析,并從主成分圖像的權重系數曲線中提取出6個健康葉片特征波長和病害葉片特征波長。基于健康葉片與病害葉片的6個特征波長做第二次主成分分析,將特征波長優化至712、19nm、749.70 nm和841.47 nm,再基于這3個特征波長做主成分分析,選用主成分中對比度最明顯的圖像來識別病害區域。研究表明,采用健康葉片與病害葉片聯合使用并結合二次主成分分析可實現馬鈴薯葉片病害的設別,且識別率可達100%。
關鍵詞:高光譜成像技術;馬鈴薯晚疫病;健康病害結合;二次主成分分析;特征波長
中圖分類號:0433.4 文獻標志碼:A
引言
馬鈴薯作為一種糧食作物在世界上占據重要的地位,尤其在中國,馬鈴薯的種植越來越廣泛,晚疫病作為馬鈴薯種植過程中常見且高發的病害之一始終威脅著馬鈴薯的生長。目前針對馬鈴薯晚疫病的診斷大都是采用傳統的經驗定性診斷方法,但該方法的精確度有待提高且受多種因素影響。有效診斷、預防、治療晚疫病不僅能保證馬鈴薯的產量,而且能確保經濟效益和社會效益。
近些年,高光譜成像技術飛速發展,該技術在許多方面得到應用,尤其是在農作物的檢測方面。相比其他技術,高光譜成像(hyper-spectralimaging)技術具有圖譜合一優勢,能夠對待測樣品的內外部數據信息進行可視化的表達,可以采集大量數據,并對多個指標進行同時采集。但是高光譜的數據量巨大,其中包含了大量與被測樣品無關的信息,這些信息會對數據的處理產生干擾,削弱模型的預測能力,甚至會造成大量誤判。為了避免這種誤差的產生,需剔除不相干的數據,簡化模型,使模型具有穩定準確的預測能力,因此特征波長的提取就顯得尤為重要。科研人員在農產品的特征波長選取方面已做了許多研究:馮潔等采用波段指數對水稻的特征波長進行提取,提取的10個波長能有效地反映出水稻的特征光譜信息;孫靜濤等對哈密瓜的可溶性固形物和硬度的波長進行篩選,根據特征波長對成熟度進行識別,設別的準確率達94%;王海龍等使用相關系數法和競爭性自適應重加權算法對番茄葉片真菌的特征波長進行提取,分別得到4個和5個特征波長,并對葉片的真菌進行了預測;董明等用ABS算法提取了小白菜的8個特征波長,這些波段可作為小白菜的有效特征波段,反映其光譜信息;尤笛等利用一階微分曲線選取了9個特征波長,并對4種不同蘋果的損傷區域進行了識別;古文君等采用連續投影法選取了藍莓的6個特征波段,并對藍莓的內部品質進行了檢測。以上研究均以傷病樣本為特征提取對象。在實際分類中,分類對象多為病害與健康樣本的合集,但把健康與病害樣本合用來提取馬鈴薯晚疫病特征波段的報道較少。主成分分析在數據降維方面具有顯著的效果,尤其是在特征波長選取方面。所以本文提出將健康樣本與典型病害樣本合用作為研究對象,結合主成分分析對采集的高光譜數據進行特征波長的選取。
1材料與方法
1.1實驗材料
實驗材料選用云南師范大學生命與科學學院馬鈴薯種植基地種植的馬鈴薯葉片,生長時間為80 d,其中健康葉片18片、病害葉片(感染晚疫病的葉片)18片(發病時間為7 d),共36片。用高光譜成像系統快速采集這36片馬鈴薯葉片的高光譜圖像。
1.2高光譜成像系統與數據采集
高光譜成像系統如圖1所示。光譜儀為北京卓立漢光公司出產的GaiasSorter-Image-V10E,可以采集520個波段,波長范圍為400nm至1 000nm。系統兩側的線光源為4個50 w的鹵素燈,在步進電機驅動的載物臺上放置待測樣本,采集樣本圖像的CCD相機為Lumenera Infi-nity,垂直放置在平臺上方。為避免在樣本采集過程中受到其他光源干擾,將整個系統封裝在密閉的暗箱內。
為避免采集的圖像出現失真,根據光源的照度調整好系統的參數。通過反復測試優化,最終CCD相機的曝光時間確定為9.732 ms,步進電機的速度為0.6 mm·s-1,相機到載物臺的垂直高度為23 cm。為了減少采集工作的重復性,對多個病害樣本同時進行采集,在載物臺上放置2排樣本,每排有3個,總共6個。采集健康樣本時,載物臺上每次只放1個作為參照。CCD相機對載物臺上的樣本進行線掃描,載物臺在與CCD相機垂直的被掃平面內移動。
1.3高光譜圖像校正
為了減少因光源造成的圖像顏色失真,需對采集的高光譜圖像進行黑白校正。在相同環境下分別采集白幀圖像數據Pw和黑幀圖像數據Pd,對采集得到高光譜圖像數據進行校正,設PS為初始圖像數據,則R為校正后的高光譜圖像數據,可表示為
所有高光譜圖像數據的采集采用Specview軟件,數據處理采用ENVI 5.1、MATLAB R2010a軟件。
2結果與分析
2.1光譜反射率曲線
采集36個樣本的光譜反射率曲線,此過程在Specview軟件中實現。如圖3所示。
從圖3中可以看到:健康和病害葉片的光譜反射率的走勢相似,兩者在550 nin附近都存在一個反射峰,在680nm附近存在一個吸收峰,在680~750 nm范圍內光譜反射率急劇升高,表明近紅外范圍內的光譜反射率明顯比可見光范圍的高;在600~690nm范圍內健康葉片光譜反射率比患病葉片的光譜反射率稍低,在720~900 nm范圍內健康葉片的光譜反射率卻遠高于病害葉片的光譜反射率。在可見光范圍內產生這種差異的原因是:在發病初期葉片本身存在自我保護機能,致使某種元素活性提升從而使得病害葉片的反射率數值略高;在近紅外范圍內,病害逐漸侵染,葉片組織破損,水分喪失,使其光譜反射率數值比健康葉片低。
2.2特征波長選取
主成分分析(principal component analysis,PCA)是一種去除波段之間多余信息,且將多波段的圖像信息壓縮到比原波段更有效的少數幾個轉換波段的方法。該方法既能避免信息間的互相重疊,還能通過簡化數據得到最具代表性且互不相關的變量子集。
首先對馬鈴薯晚疫病樣本的全波段高光譜數據進行降維,并對全波段進行主成分分析,得到分析后的前6個主成分圖像PC-1~PC-6,如圖4所示。
圖4中PC-1、PC-3、PC-5的主成分圖像保留了大部分的圖像信息,而其中第3主成分(PC-3)和第5主成分(PC-5)包含的病害區域最明顯,PC-1病害與健康部位對比不是很明顯,不利于后期處理,故選擇PC-3和PC-5進行處理。
權重系數曲線的波峰處或波谷處被認為是顯著特征波長,對區別感興趣特征波段貢獻最大。圖5為PC-3、PC-5主成分圖像的權重系數曲線,對PC-3、PC-5分別選取2個特征波長,即PC-3為563.32nm、749.70nm,PC-5為719.03nm、841.47 nm。
同樣,對健康馬鈴薯葉片進行主成分分析,得到前3個主成分圖像。如圖6所示,PC-3圖像特點明顯,葉脈清晰,其他主成分圖像噪聲過大,因此選取PC-3進行分析。
健康馬鈴薯葉片PC-3圖像權重系數曲線,如圖7所示。通過分析可選取2個特征波段,即712.19nm、958.48nm。
2.3基于特征波長的二次主成分分析
經過主成分分析,對病害葉片選取4個特征波長,即563.32nm、719.03nm、749.70nm、841.47nm,對健康葉片選取2個特征波長,即712.19nm、958.48nm。為使檢測結果更具實效性,將病害葉片的4個特征波段與健康葉片的2個特征波段聯合使用,用選取出來的6個特征波長對病害葉片進行二次主成分分析,主成分圖像如圖8所示。由主成分圖像可以看出,PC-1、PC-2和PC-6因噪聲較大或對比度較低不利于觀察病害區,PC-3、PC-4和PC-5可明顯觀察到病害區域。
為了得到更少更優的波段,我們通過PC-3、PC-4和PC-5的權重系數曲線進一步將6個特征波長最終縮減為3個,即712.19 nm、749.70 nm和841.47nm。
對優化提取的3個特征波長進行主成分分析,得到的灰度圖像如圖9所示,圖中的PC-3能明顯地區分病害區域。
2.4病害葉片二值化
采用ENVI軟件對最終提取的PC-3灰度圖像進行二值化處理,經過二值化處理后的圖像的病害部位更加明顯,更利于我們進行區分,如圖10所示。對其余的病害葉片和健康葉片進行同樣的處理,經實驗可以發現,該方法對所有實驗樣本的識別率達100%。
3結論
二次主成分分析對馬鈴薯晚疫病特征波長的選取具有顯著的實效。健康葉片與病害葉片聯合使用效果佳,二值化處理更加利于病害的區分。此方法為馬鈴薯葉片病害分級和缺陷檢測提供了參考,也為其他植物的病害檢測提供了可行性方法。