鄭西方
(河南理工大學測繪與國土信息工程學院,河南 焦作 454003)
為能及時準確統了解計農作物種類、空間分布、種植面積等信息,以及如何實時監測其生長狀況,為其及時精準提供最佳生長條件以便優化其種植結構、精準化智能化生產管理,是當今智慧農業研究的主要課題,所以進行農作物精細分類具有重要意義[1]。由于傳統農作物精細分類完全依賴于傳統形態學和生物學調查法[2],其雖有較高精度,但需投入大量的人力物力財力,已滿足不了現代“智慧農業”的需求。其次在傳統遙感技術方面,主要基于星載或機載的多光譜影像進行精細分類識別研究[3-6]。但由于多光譜影像空間分辨率低、波段范圍短且數目少,往往致使農作物精細分類受到較大局限性,尤其針對一些小區域、“同譜異物”的農作物。而高空間分辨率遙感影像數據獲取成本高,且需要一種能夠精準捕捉地物光譜信息的技術。于是高光遙感技術在近年來發展成為一種新技術,高光譜遙感具有“空譜合一”、波長范圍廣、波段數目多、光譜曲線完整、信息量豐富等特點。當前已有許多學者基于高光譜遙感技術對農作物精心精細化分類并取得了一定成果[7-8]。但又因普通星載或大型機載高光譜影像存在低空間分辨率、數據獲取成本極高等問題受到了局限。緊接一種新型無人機高光譜遙感技術被推向高潮,其技術不僅操作簡單、數據獲取成本低等優勢,而且能將高空間分辨率與高光譜分辨率做到真正地有機結合并實現了“空-譜合一”。目前已有部分學者基于無人機高光譜遙感技術對農作物信息進行了提取[9-15],為農作物估產、生長監測等提供了有力依據和保障。
于是本文針對農作物弱類特征精細化分類問題同時響應國家農業精細化智能化號召,將基于無人機高光譜遙感技術對試驗田典型農作物冬小麥通過引入主成分分析和最大噪聲分離兩種降維變換進行特征提取。并基于典型機器中的支持向量機和集成學習法中的隨機森林分類模型進行精細分類研究,以期能為農作物精細管理提供有力支持。
本文以河南省武陟縣冬小麥研究基地為實驗區,地理位置約為:N:35°07′59″~35°08′0.822″,E:113°15′26.91″~113°15′28″,平均海拔為92m 且屬于溫帶季風氣候。于2018 年10 月份人工設計90 個小區塊且每個小區塊面積為4mx3m,共播種六種冬小麥。其呈18 行5 列,且每3 行5 列播種同一品種,如圖1。

圖1 研究區
高光譜傳感器采用的是德國Cubert 公司研發的Cubert UHD185 型成像高光譜儀,其傳感器主要技術參數為:光譜范圍450~950/nm、光譜分辨率8/nm、光譜采樣間隔4/nm、光譜通道數125 個、Cube 分辨率/像素1000×1000、數字分辨率12/bit 等。傳感器搭載平臺為大疆M600 六旋翼無人機,具有動力充足穩定性極佳特點。
1.3.1 高光譜數據獲取及預處理
于2020 年05 月份(小麥拔節孕穗期),選在無云無風且天氣晴朗的正午11:30-12:10 進行遙感作業。其中行高、航向重疊、旁向重疊設計為100m、90%、85%。且作業之前需利用黑白板對相機輻射定標。并利用A4 紙質制作像控制點均勻布設在測區,再基于RTK 實測其點位信息。無人機獲取的高光譜數據處理主要包括輻射校正、影像融合、影像拼接3 部分組成。根據UHD185 型成像光譜儀中心波長和波長半幅寬在Matlab 環境設計的輻射定標系統,完成由影像DN 值到地表反射率的輻射校正[16]。其拼接技術流程如圖2 所示。

圖2 拼接技術流程
1.3.2 高光譜數據降維處理
由于高光譜數據相比多光譜數據,其數據量大,信息豐富、高維度等,但同時也帶來了信息冗余,處理效率低下、存儲困難等問題,因此需要對其進行降維處理[17]。于是本文實驗基于降維變換中常用的主成分分析變PCA 變換、最小噪聲分離MNF 變換分別對高光譜影像數據進行變換。并通過變換結果特征值拐點進行波段特征選擇,其變換直方圖如圖3 所示。因特征值較大且拐點之前的波段富含特征信息量豐富,而拐點之后波段分量信息基本為零。可知前幾個波段特征值變換速度較快且所蘊含有用信息多,而后面的波段特征值變換緩慢且噪聲較多,最終選擇前10(PCA)、20(MNF)個主分量分別作為數據降維后的光譜特征。

圖3 光譜波段降維變換
1.3.3 分類模型
本文實驗基于經典機器學習分類中的支持向量機(Support Vector Machine,SVM)和基于決策樹分類器集成的隨機森林(Random Forest,RF)分類模型分別對研究對象精細化分類實驗。并對其試驗結果采用整體分類精度(Overall Accuracy)、Kappa 系數指標加以評價。

在SVM 分類中為避免分類結果受其他參數的影響,均采用一致參數,如均選取徑向基核函數(Radial Basis Function,RBF)作為核函數。在RF 分類中為方便本次實驗并查閱相關文獻,將決策樹取為500 棵[21],特征數量為特征數量的平方根且節點不純度由Gini 系數決定。最終分類結果與精度評價如圖4、表1 所示。

圖4 各分類模型分類結果圖

表1 各分類模型分類結果精度表
由圖4、表1 可知:在基于SVM 分類結果中,未經降維處理分類精度較均未達到50%,而經PCA/MNF 降維處理后分類精度均在74%以上,且遠優于未降維變換分類精度約30%。對全波段影像先作降維變換處理后分類,其不僅可降低數據量提高了運算效率,還較大程度地提高了分類精度。在降維變換后,無論基于何種分類模型,都表現出基于MNF 變換分類效果均優于PCA 變換分類,且基于MNF 變換分類精度約高于基于PCA 變換分類精度3%左右。在對原始影像同種降維變換后分類中,RF分類模型均略優于SVM 分類模型,其中MNF-RF 變換模型組合的精度最高,其整體精度Overall Accuracy 和Kappa 系數分別為78.1289%、0.7455。由此可見針對無人機高光譜影像精細分類問題,首先先降維變換處理再進行分類不失為一種有效方案。從各分類模型分類結果圖中可知:未經降維變換的分類效果中,存在大量的錯分、漏分現象和嚴重的“椒鹽”現象,尤其是1 號類、2 號類、3 號類和6 號類。而經降維變化處理后分類效果中,此現象都得到較大程度地緩解。且各號類冬小麥分類效果均遠優于未降維變換分類效果。但仍存在個別頑固性的“椒鹽”錯分混分類別現象,如2 號類、3 號類與5 號類相對嚴重。在以上多組分類結果中,均存在各分類塊的小麥陰影部分或多或少地被誤劃分為本地塊冬小麥類別之中,且塊與塊之間的田埂沒有被較好地分類識別出來。經研究分析:在采集研究對象數據時正出于拔尖孕穗期,而且田埂上生長中雜草未清除,使得部分雜草光譜與小麥光譜極為相似和造成部分混合像元現象,以致于田埂未能被較好地分類出。而針對降維后仍存在個別類別混分現象,其原因在于各其類別冬小麥光譜極為相似,屬于典型弱類間特征差問題,一直給予其精細化分類研究帶來巨大挑戰。
針對弱類特征冬小麥精細分類問題,本文基于無人機高光譜遙感技術進行了數據采集、拼接和降維變換處理等研究工作,并引入經典機器學習中的SVM 和集成學習法中的RF 分類模型進行了精細化分類實驗,得出:
3.1 對于無人機高光譜影像精細化分類時,需進行降維變換處理。經過降維變換分類精度遠優于未經降維變換分類精度30%左右,降維變換不僅可減少數據量提高運算速度,還能較大程度地提高分類精度。
3.2 本文在MNF 和PCA 變換分類中,其中MNF 變換相比PCA 變換更具有優勢。且在降維后基于SVM 和RF 模型分類效果中,MNF-RF 變換分類法具有更優的分類效果,其總體分類精度和kappa 系數分別達到了78.1289%、0.7455。
3.3 針對弱類特征農作物精細分類問題,無人機高光譜遙感技術對其分類研究應用將具有巨大潛力,是未來研究發展的重要方向。