朱松松,陳至坤
(華北理工大學電氣工程學院,唐山063210)
針對基于無人機的棉田地膜分割研究較少的現狀,以無人機低空拍攝的棉花播種期圖像作為實驗數據,分析圖像中黑色地膜、土壤以及雜草等圖像特點,發現地膜和周圍環境顏色差異較明顯,采用K均值聚類的算法分割出地膜區域。針對圖像中雜草及陰影等干擾,通過圖像去相關拉伸后,運用閾值法刪除離群點。結果顯示,K均值聚類對棉田地膜的分割效果優異,識別率為99.13%,滿足棉田地膜分割的要求。此研究為棉田殘膜的識別以及覆蓋度對棉田生產的影響提供方法和參考。
地膜;聚類;圖像分割;K均值;去相關拉伸
地膜覆蓋栽培技術是從20世紀中葉發展起來的廣泛應用于農業生產的農藝技術,1978年從日本引進以來在我國迅速得到了推廣使用,現在地膜覆蓋技術已經廣泛應用到多種經濟作物和糧食作物的生產之中。根據顏色,地膜主要分為透明、白色、黑色,都有增溫保墑,減少水分流失的作用。黑色地膜雖然在增溫方面稍遜于其他顏色地膜,但它能夠很好地抑制雜草的生長,減少了除草劑使用帶來的生產成本[1],從而得到了廣泛應用。地膜的應用大大提高了農作物的產量,但是隨著廢膜越來越多的殘留,對耕地、村莊造成了嚴重的污染[2]。因此對棉田地膜覆蓋技術的研究,主要可分為增產效益和環境效應,如田間不同地膜、不同覆蓋方式、不同覆蓋時間、不同覆蓋度等相關參數對比。而野外調查耗費人力、物力,且難于保證準確性和實時性。因而,隨著無人機(Unmanned Aerial Vehicles,UAV)和傳感器技術的不斷提高,田間影像數據的獲取方式也更加多樣化[3],無人機平臺具有效率高、成本低、操作靈活、更適合復雜農田環境等特點[4],在田間影響數據的獲取領域得到廣泛應用。
圖像分割是根據一定的規則,將圖像中的不同性質的區域分開,提取感興趣的區域,是圖像識別、場景解析、對象檢測等任務的預處理[5]。有研究者把圖像處理技術運用于地膜識別,梁長江等人[6]對垂直拍攝的6葉期單壟單行煙田圖像進行研究,通過對比多種閾值分割方法,應用迭代閾值分割算法對地膜分割識別,地膜最高識別率到達80.06%,閾值分割在田間存在各種干擾時,容易出現誤分割情況。朱秀芳等人[7]應用融合監督分類和圖像形態學算法的覆膜農田提取方法,進而通過面積閾值分割法獲取高精度的覆膜農田分布信息,這種方法從宏觀尺度上分割覆膜農田區域,未對覆膜農田中的地膜進行分割和識別。張航[8]基于對高光譜影像的研究,提出了一種地膜多波段均值圖像的分割方法,AOM值達到0.6439,這種方法為對夾雜在棉花里的地膜的識別方法研究,而非棉田中的覆膜。哈斯圖亞[9]分別開展基于單時相和多時相多特征的地膜覆蓋農田遙感識別,實現地膜覆蓋的農田識別,此方法應用的是Landsat-8衛星數據,在時效性方面有很大不足。
為了對地膜覆蓋技術使用進行科學規劃管理、更好地發揮地膜覆蓋技術的積極作用、減輕負面影響,準確獲取棉田地膜覆蓋率具有重要的理論和實踐意義。針對以上地膜的研究現狀,本文提出了一種基于K均值聚類的棉田地膜分割算法,為棉田中地膜的分割和識別提供了理論依據,為棉田中殘膜的污染評估以及地模覆蓋度對棉花生長的影響提供了方法,為棉田苗行檢測提供參考標準。
試驗區棉田鋪設地膜為黑色,膜寬為80cm,棉田為1膜2行,膜距大約40cm,采用先鋪地膜后在膜上開孔播種的方式。
圖像獲取設備為大疆無人機-精靈系列-3Profes?sional,飛行器重量1280g,風速5m/s以下飛行,飛行器機身配備GPS模塊和視覺定位系統,視覺定位系統高度測量范圍為30cm至300cm,GPS模塊需GPS衛星信號良好。
相機配備1/2.3英寸CMOS影像傳感器,有效像素1240萬,CMOS尺寸比例為,4:3,傳感器寬度為5.565mm,高度為4.174mm。鏡頭為FOV 94°,20mm(35mm格式等效),f/2.8,對焦無窮遠。照片最大分辨率為4000×3000。
圖像處理硬件平臺為筆記本電腦,型號戴爾N5110,處理器為Intel Core i5-2410M CPU@2.3GHz,運行內存為6.00 GB,操作系統為Windows 7旗艦版。圖像處理和分析軟件平臺為MATLAB 2018b,手動分割圖片軟件為Photoshop CS6。
圖像拍攝于2020年4月23日,天氣多云無風,無人機飛行高度為5m,拍攝圖片20張,拍攝時期為已經播種未出苗。從20張圖片中選取6張圖片進行處理,分別為棉田前段2張,中段2張,后段2張,如圖1所示。圖像中內容主要有:黑色地膜、土地、地膜上覆蓋的土、剩余殘膜、綠色雜草,部分土塊和遺留的玉米秸稈存在陰影。圖2為圖像中存在的部分干擾,圖2-a中為土地裂縫,圖2-b為雜草,圖2-c為玉米秸稈,圖2-d為土塊及其陰影。
圖像分割是圖像識別和圖像理解的預處理,主要是將圖像中感興趣的區域分割出來,為后續高級任務的處理提供技術前提。彩色圖像分割方法主要分為:基于閾值的分割方法、基于聚類的分割方法、基于區域的分割方法以及基于特定理論的分割方法[10]。基于閾值的分割[11-12],多應用于灰色圖像或將圖像從RGB顏色空間轉化成其它顏色空間,然后對各分量分別進行處理,主要目標是找到一個最佳閾值。基于聚類算法的分割[13-14],需要先確定類的數目,然后根據選定的類以隨機確定各類的初始聚類中心,屬于無監督分類方法。基于區域的分割方法[15-16],對噪聲比較敏感,且目標較大時分割速度較慢。特定圖論的分割[17-18],首先需要把圖像映射為圖(Graph),然后根據不同的分割準則實現圖像的分割。
棉田中地膜與周圍土地顏色區別很大,肉眼可識別,因此可以通過聚類的方法進行分類。但圖2中雜草、陰影等與地膜顏色相近,容易出現錯誤的分類,需提前處理離群點。在圖像分割領域,K均值算法由于其原理簡單,計算效率高,得以廣泛的運用。

圖1 實際拍攝圖像

圖2 棉田中干擾
文中采用Photoshop軟件中魔棒工具,容差為20,通過目視解譯的方法對圖像中地膜進行選取,并計算出地膜的覆蓋率,以此覆蓋率作為評價圖像分割算法效果的標準。
通過對棉田地膜圖像的分析,使用圖像去相關拉伸進行圖像增強,然后通過閾值法刪除大區域的離群點,再用聚類算法進行圖像分割及形態學的開閉操作刪除小區域干擾,最后得到棉田地膜的覆蓋率。基于以上信息,本文提出了棉田地膜分割方案總體框架如圖3所示。

圖3 圖像分割總體框架
為了提高分割精度,先對原圖像進行預處理,通過去相關拉伸達到圖像增強的效果。去相關拉伸[19-20](Decorrelation Stretch)是一種常用的圖像增強方法,該方法能夠保留原圖像中的色彩信息且失真程度較低。其主要原理是放大圖像中相關程度低的信息,從而提高生成圖像的飽和度。去相關拉伸的步驟分為以下幾部分:首先對原始圖像進行坐標變換,然后對變換后的圖像進行部分拉伸來放大某一部分的信息,最后通過坐標逆變換恢復圖像。圖像去相關拉伸后圖像如圖4所示。
圖像去相關拉伸后,圖中雜草顯示為綠色,土塊間紋理顯示為紅色。通過閾值法分別刪除區域性綠色和紅色,并用背景色填充,如圖5所示。經過以上預處理后,區域性干擾被刪除,圖中剩余部分為地膜和土地,將此圖像輸入給聚類算法進行圖像分割。

圖4 圖像去相關拉伸

圖5 圖像刪除離群點
K均值(K-means)[21-22]算法是基于樣本集合劃分聚類算法,其基本思想是,將樣本集合劃分為k個子集,構成k個類,將n個樣本分到k個類中,計算出類中樣本到其所屬類的中心的距離,將所有距離求和并使其最小,K均值聚類的策略就是通過最小化損失函數,從而得到最優的劃分。
樣本到類中心的距離,采用的是歐氏距離的平方,如式(1):
作為中國的數學教師,可以為自己積極參與了這些年來的課改實踐,以及自身的專業成長感到自豪;當然,在這方面又應說還有很長的路要走,大家應繼續努力.

其中為xi和xj為樣本空間中的兩個樣本,m為樣本的維度,d(xi-xj)為樣本xi和xj之間的歐氏距離。
樣本與其所屬類的中心之間的距離的總和為損失函數,如式(2):

形態學操作一般作用于二值化圖像,來連接相鄰的元素或分離成獨立的元素,腐蝕和膨脹[23]是圖像形態學中的基本操作。在聚類分割后,應用3×3方形結構元素對二值圖像進行腐蝕和膨脹,平滑掉二值化圖像中的細小干擾,保留大區域的地膜區域,分割后圖像如圖6所示。

圖6 K均值分割二值圖
將應用Photoshop分割和K均值聚類算法分割出圖像的覆蓋率統計如表1和圖7所示,計算方法如式3和式4。其中fp為Photoshop手動分割覆蓋率,fk為K均值分割覆蓋率,fε為覆蓋度誤差率,fˉ為平均覆蓋率,n為樣本數。文中以棉田前段、中段、后段各取兩張圖像進行處理,以平均覆蓋率fˉ作為評價分割效果的優劣的標準。


表1 覆蓋率數據表

圖7 覆蓋率統計折線圖
分別對比圖1和圖7中的各張子圖,發現棉田中的地膜區域已經全部分割出。從表1中覆蓋度誤差率可以看出,K均值聚類可以有效分割出地膜區域大部分區域,但與手動分割值存在上下波動。分析是由于應用Photoshop手動分割,存在人為主觀因素,在地膜上覆蓋些許薄土及地膜邊緣處,人員會存在過分割和欠分割情況,但是多張圖像的平均覆蓋度較接近實際覆蓋度,滿足對地膜的分割及覆蓋率獲取的要求。
綜上,通過實驗效果圖的對比,K均值聚類可以實現棉田地膜的圖像分割,聚類前對離群點的處理是實現地膜有效分割的關鍵一步。在大塊棉田中進行地膜分割時,利用平均覆蓋度進行統計時K均值聚類效果優異。
在棉田圖像分割中,存在地膜上覆蓋極少數土壤等情況,制定相關地膜分割尺度標準是一個重要方向。K均值聚類在黑色地膜分割中取得了較優異的效果,但未對白色地膜、透明地膜等進行研究,如何提高地膜分割算法的適用性及效率仍是努力的方向。