安曉飛 王 培 羅長海 孟志軍 陳立平 張安琪
(1.北京農業智能裝備技術研究中心, 北京 100097; 2.國家農業智能裝備工程技術研究中心, 北京 100097)
農田秸稈覆蓋率是保護性耕作評價的重要指標之一,實現秸稈覆蓋率快速檢測對黑土地保護評價非常重要。保護性耕作是以秸稈覆蓋地表、免少耕播種為主要內容的現代耕作技術體系,具有防治農田揚塵和水土流失、蓄水保墑、培肥地力、節本增效、減少秸稈焚燒和溫室氣體排放等作用[1-4]。2020年4月,農業農村部發布的《東北黑土地保護性耕作行動計劃(2020—2025年)》中提出,到2025年,保護性耕作實施面積達到9.33×106hm2,形成較為完善的保護性耕作政策支持體系、技術裝備體系和推廣應用體系。
秸稈覆蓋率作為保護性耕作重要技術指標,更是秸稈還田補貼的重要依據,準確高效的秸稈覆蓋率檢測對于推進保護性耕作具有重要作用。而國標GB/T 20865—2017《免(少)耕施肥播種機》中采用人工“拉繩法”進行秸稈覆蓋率測量,作業效率低,勞動強度大,已嚴重落后于當前農機“互聯網+”模式下的實際生產需要。
隨著大數據、云計算、物聯網等新一代信息技術在現代農業中的推廣應用,將這些技術與農業場景深度融合,利用計算機圖像處理技術快速而準確地識別秸稈覆蓋圖像已成為一種趨勢。圖像法成本低且效率高,成為秸稈檢測的熱門研究方向和手段。國內外很多學者都致力于這方面的研究,并取得了重要成果[5-23]。文獻[5-7]基于航拍圖像,提出一種圖像自動分割的優化算法多閾值差分灰狼優化算法(DE-AS-MOGWO),運用該算法可以實現對圖像的多閾值分割處理,并對秸稈覆蓋率進行精確的檢測。文獻[8-9]基于衛星遙感影像開展了地表秸稈覆蓋度估算研究,但遙感圖像尺度較大,缺乏地面數據驗證,尚無法成為秸稈還田補貼依據。文獻[10-11]將紋理特征的熵值結合反向傳播神經網絡,進行秸稈覆蓋度檢測,該方法計算耗時較長,無法滿足商業化檢測要求。目前基于圖像的秸稈覆蓋度識別研究多針對靜態條件下,秸稈紋理清晰、特征明顯的情況,但農機田間作業真實環境復雜,土塊、溝壑等因素影響識別;秸稈形狀、尺寸、姿態各異,細碎秸稈難于精準辨別。傳統機器視覺算法泛化能力弱,難以解決田間不同環境中的秸稈精準識別問題。
本文針對農田秸稈形態多樣、細碎秸稈難以識別的問題,提出一種基于K-means聚類和分區尋優方法結合的玉米秸稈覆蓋率算法,并通過不同天氣、不同種植模式、不同地塊條件進行田間實際驗證。
采集農田秸稈圖像的設備為自主研發的前后雙置攝像頭的保護性耕作作業計量遠程監測系統,系統主要由前置攝像頭(采集農田秸稈圖像)、后置攝像頭(采集機具圖像)、機具識別傳感器、數據采集器、顯示器和衛星定位天線組成(圖1)。該裝置可以實現保護性耕作作業面積計量、秸稈圖像采集、機具圖像采集、作業質量分析等功能。
其中秸稈圖像采集攝像頭選用廣州譜泰通信科技有限公司PTC02-200型200萬像素串口防水攝像頭,5 V供電,圖像傳感器類型為CMOS,模塊核心DSP芯片集成了新一代ISP算法,圖像尺寸為1 920像素×1 080像素,輸出格式為標準JPEG格式,拖拉機田間行進速度為3.6~5.0 km/h,采樣間隔10 s,串口通信速率為115 200 b/s。
本批圖像采集時間為2021年4月26—28日,選取吉林省長春市雙陽區10個地塊,采集100幅不同時間段、不同天氣、不同種植模式下的秸稈覆蓋圖像,其中陰天、晴天秸稈圖像數量比為2∶8,壟作、平作秸稈圖像數量比為1∶3,土塊根茬與平整秸稈圖像數量比為1∶9。圖2為6種典型條件下的農田秸稈圖像。
采用人工拉繩法測定秸稈覆蓋率,用長2 m的繩子,每隔10 cm做記號,測定時沿地塊對角線鋪放繩子,統計標記點上有秸稈的點數,將統計點數除以總標記點數,即為秸稈覆蓋率,具體計算公式為
(1)
式中F——人工法秸稈覆蓋率,%
D1——測定有秸稈的點數
D2——測定點數
圖3為人工拉繩法獲取玉米秸稈覆蓋率示意圖。
由于田間秸稈覆蓋變異性比較大,同一地塊變異系數達到0.71,采用人工拉繩法,無法與采集的秸稈圖像做到嚴格一一對應,本研究中進一步采用了“人工標注+二值化識別”方法獲得玉米秸稈圖像覆蓋率真實值,與采集到的秸稈圖像實現真值、測量值嚴格一一對應。圖4為人工標記法獲得秸稈覆蓋率方法。
1.3.1經典K-means方法
聚類是無監督學習的一種重要形式,其主要作用是將數據對象分為多個簇,保證同一簇內的數據對象相似度盡可能大,而不同簇間的數據對象相似度盡可能小。其中,K-means聚類是解決聚類問題的一種經典算法,使用非常廣泛。
由于圖像分割可以看成聚類問題,即圖像中像素點類別未知的前提下,根據像素點的特征值,將圖像劃分為若干個區域。因此,本文利用K-means聚類算法實現對秸稈圖像的分割,即將其分為2類:秸稈和背景。
1.3.2分區尋優聚類迭代
K-means聚類有2個參數確定比較困難:聚類數量、聚類中心。在玉米秸稈圖像中,目標物和背景清晰,聚類數量可確定為2。聚類中心在經典K-means聚類算法中是隨機確定的,造成了聚類算法效果不穩定,無法達到最優。本研究在一次聚類基礎上,提出了一種分區尋優的方法確定了新的聚類中心,并進行聚類迭代,直到秸稈聚類中心收斂不再發生變化時停止聚類迭代。
首先將原始圖像(1 920像素×1 080像素)分隔為16區;然后依次判斷各分塊中第1類(秸稈類)和第2類(土壤類),通常情況下,土壤背景灰度小于100,秸稈灰度大于160,如果每個分塊中均有2類,則利用統計學方法分別計算各區秸稈中位數和眾數灰度平均值,如果分塊中只有一類,則判斷類別屬性后計算對應類別的灰度平均值,并計入對應類別總數組中。根據16分區中的秸稈中位數和眾數灰度平均值及數量,按照公式
(2)
式中Ci——秸稈中心灰度
Aj——各區眾數灰度
Mj——各區中位數灰度
n——實際有效分區個數
計算獲得秸稈中心灰度,同理獲得土壤中心灰度。
在獲得16區平均值后分別獲得秸稈中心灰度和土壤背景灰度后,將其作為新的分類中心,重新采用K-means聚類方法對玉米秸稈圖像進行分割,直到秸稈中心灰度不再發生變化,則停止K-means聚類迭代。
K-means聚類迭代停止后,基于灰度差異判斷秸稈和土壤背景,對秸稈像素和土壤背景像素分別進行二值化,并計算秸稈像素數量,則玉米秸稈覆蓋率計算式為
(3)
式中Pi——分區尋優K-means聚類法計算的秸稈覆蓋率,%
Ti——秸稈像素點數
N——圖像像素點總數
圖5為分區尋優聚類迭代流程圖。
為了評價農田秸稈覆蓋率計算方法,采用相關系數、相對誤差和誤判率3個指標進行,其中相關系數用于評價農田秸稈覆蓋率計算結果和人工檢測結果相關程度;相對誤差用于判斷本計算方法的誤差偏離程度;誤判率是結合實際作業補貼發放場景,根據計算結果和實際補貼檔次結果的判斷準確率。相關系數r、相對誤差E、誤判率Je計算式為
(4)
(5)
(6)
式中x1k——農田秸稈覆蓋率標準值
x2k——農田秸稈覆蓋率檢測值
Pc——秸稈覆蓋率檢測值
Jn——等級判斷錯誤數
Jr——等級判斷正確數
從圖6中可以看出,分塊尋優聚類迭代后秸稈分割效果和一次聚類相比較,細碎秸稈部分的識別效果得到提高。通過對不同場景的100幅圖像分別進行分區尋優聚類迭代,獲得結果如圖7所示,與人工拉繩法和人工標記法相關系數分別為0.716 1和0.906 8。如圖8所示表明該方法可以有效獲取玉米秸稈覆蓋率。
相關系數差別大的原因主要是田間秸稈變異系數較大,拉繩法覆蓋區域與圖像采集區域無法做到嚴格一一對應,造成相關系數較低,但也仍然達到了0.70以上,采用人工標記識別提高了一一對應度,相關系數達到0.90以上。
運用Otsu方法、經典K-means方法、分區尋優K-means聚類迭代法對100個樣本分別進行處理,與人工標記法進行比較,結果如表1所示,結果表明分區尋優K-means聚類迭代法在平均誤差和誤判率上明顯優于Otsu方法、經典K-means方法,其中平均誤差降低了45.6%和29.2%,誤判率最小,為7%。與Otsu方法和經典K-means方法相比較,本文算法由于增加了中心點優化更新、聚類迭代的環節,所需時間最長,為810 ms,但處理時間小于1 s,可以滿足田間條件下的圖像檢測響應速度。

表1 秸稈覆蓋計算方法性能比較Tab.1 Performance of different corn straw coverage detection algorithms
該方法實現了在不同環境條件下(不同天氣、不同種植模式)均可實現秸稈的準確識別,在農機上連續穩定運行,具有一定的普適性。但在根茬裸露條件下,分區尋優聚類迭代容易將根茬底部識別為土壤,主要是因為只有根茬的地塊中,根茬造成的陰影部分和根茬底部顏色與土壤背景相近,兩者疊加影響,容易將秸稈錯誤識別為土壤,此種情況還需要進一步研究。
(1)基于機器視覺技術,提出了一種基于K-means聚類和分區尋優結合的玉米秸稈覆蓋率檢測算法,實現了秸稈覆蓋率快速檢測,在不同環境條件下(不同天氣、不同種植模式)均可實現秸稈的準確識別。
(2)該算法與人工標記法相關系數達到0.906 8,平均誤差為6.8%,誤判率為7%,該算法為秸稈覆蓋率在線計算提供了一種新的技術手段。