張媛芳
(昆明市日報,云南 昆明 650201)
耕地的數量和質量是保持農業可持續發展的關鍵,準確的耕地分布能夠為國家決策部門提供重要支撐,利用衛星遙感影像可以高精度、高質量識別并提取耕地。 為了解決在遙感圖像中耕地分割與提取的問題,本文通過將原始圖片灰度化并進行二值化處理,分離耕地與背景區域;以主干特征提取網絡MobileNetV2和加強特征提取結構PSP模塊搭建的PSPNet神經網絡模型進行圖片訓練,得到訓練后的模型,進行圖片預測,從而將圖像中的耕地區域提取出來。通過改變模型訓練的數據集和訓練次數的大小,探討這一改變對圖片提取耕地區域精準度的影響。
問題背景:目前高精度的耕地信息提取主要依靠人工解譯,耗費大量人力、財力且效率較低。圖像分割與提取是獲取圖像內部信息的兩種重要手段,利用衛星遙感影像可以識別并提取耕地,進行自動化地塊提取顯得日益重要。
需要解決的問題:建立模型構造出分割耕地與背景的方法,可以使其耕地區域與背景區域準確分離出來,并且計算出耕地區域在圖像中所占比例;進行數據集制作,構建神經網絡進行模型訓練,使之通過訓練好的模型進行預測,提取出耕地區域,用labelme軟件進行數據標簽的制作。
問題的研究對象是遙感圖像,研究內容為在遙感圖像地塊中分割耕地與背景,并且通過模型訓練,進行模型預測,從遙感圖像中提取出耕地區域,制作耕地標簽圖。問題1要求計算途中耕地在各圖像中所占比例,問題2要求從給定的測試圖像中提取出耕地,制作耕地圖標簽。
問題1希望能將耕地與背景分離,計算出耕地在圖像中所占比例。解決問題的關鍵是得到進行二值化圖片的最佳閾值,排除遙感圖像中較深色和較淺色區域的干擾。首先將原始圖片灰度化,并進行二值化處理,耕地區域的像素點顏色值255(即變為白色),耕地區域以外的像素點顏色置0(即變為黑色),計算出白色(耕地)區域在整個圖像中所占的比例;問題2構建數據集,進行模型訓練,利用模型進行圖片預測,實現耕地的提取。首先利用已給出的原圖與標簽進行擴充,制作數據集,然后利用以mobilenetv2為PSPnet網絡的主干特征提取網絡,進行模型訓練,圖片預測,將耕地區域從圖片中提取出來,耕地標簽圖可在labelme軟件上制作。
(1)假設耕地邊緣沒有缺陷點;
(2)假設耕地區域無誤差且不考慮隨機誤差;
(3)假設淺色和深色區域即可看為缺陷點;
(4)假設耕地區域圖像提取完全。

注:未列出符號及重復的符號以出現處為準
問題1需要建立一個能將遙感圖像中的耕地區域精確分離出來的分割模型,建模時應考慮圖像中待測區域之外的邊緣在提取中的干擾。此外,在忽略耕地檢測邊緣缺陷點以及系統觀測誤差的基礎上進行求解。
模型建立:要精確提取耕地區域并將區域外顏色填充為黑色,模型建立過程為:首先將原始圖片灰度化,通過灰度圖像均衡處理,增大對比度[1],利用大津法得到最佳分割閾值,進行二值化處理,白色區域代表的是耕地類、黑色區域代表的是背景類,即可得分離后耕地在各圖像中所占比例。
模型求解:將RGB圖像轉換為灰度圖像,采用大津法,得到最佳閾值,將灰度圖像轉換為二值圖像。設final_threshold為耕地和背景的分割閾值,灰度級小于等于final_threshold的為背景,大于final_threshold的為前景(耕地)。前景像素點數所占的圖像的比例為wo及平均灰度為u0;背景像素點數所占的圖像的比例為w1,平均灰度為u1。則圖像的總平均灰度為[2]:

前景和背景圖像的方差為:

當計算出來的方差值g取最大值時,可以認為前景跟背景的差異達到最大,此時的分割閾值final_threshold為最佳閾值。
模型結果:
(1)Data1圖像經二值化處理,如圖1所示。

圖1 Data1 耕地與背景分離圖
(2)Data2圖像經二值化處理,如圖2所示。

圖2 Data2 耕地與背景分離圖
(3)Data3圖像經二值化處理,如圖3所示。

圖3 Data3 耕地與背景分離圖
(4)Data4圖像經二值化處理,如圖4所示。

圖4 Data4 耕地與背景分離圖
(5)Data5圖像經二值化處理,如圖5所示。

圖5 Data5 耕地與背景分離圖
(6)Test1圖像經二值化處理,如圖6所示。

圖6 Test1 耕地與背景分離圖
計算出圖片中耕地(白色)區域在圖像中所占比例,如圖7所示。

圖7 耕地在各圖像中所占比例
問題2要求從測試圖像中提取耕地區域,制作耕地標簽。處理方法:進行數據集的制作,在PSPnet網絡中以MobileNetV2作為主干特征提取網絡,在3x3網絡結構前利用1x1卷積升維,在3x3網絡結構后,利用1x1卷積降維,先進行擴張,再進行壓縮[3],加強特征提取結構PSP模塊典型情況下,將輸入進來的特征層劃分成6x6,3x3,2x2,1x1的區域,然后每個區域內部各自進行平均池化[4-5]。利用已經搭建好的PSPnet網絡進行圖片訓練,得到訓練模型,根據輸入的圖片,提取出圖片中的耕地區域。
模型建立:完成數據集的制作,進行模型訓練,完成圖片預測,進行耕地的提取。
模型求解:處理已經制作好的數據集;通過搭建好的Pspnet網絡進行模型訓練,得到已經訓練好的模型;利用已訓練好的模型,提取圖片中耕地區域;用labelme軟件進行耕地標簽的制作。
模型結果:
輸入Test1圖像文件,提取耕地區域,如圖8所示。

圖8 Test1 原圖與耕地提取混合圖
Test1圖像文件的耕地標簽,如圖9所示。

圖9 Test1 耕地標簽圖
模型訓練的數據集大小與模型預測得到的效果緊密相關。當模型數據集過小時,Test1圖片提取耕地區域圖片如圖10所示。

圖10 Test1 耕地提取圖
當數據集大小適當時,Test1圖片提取耕地區域圖片如圖8所示。
模型的優點:分離圖像時,采用大津法尋找最佳閾值使更清晰的看到田埂輪廓。檢測模型:通過PSPnet神經網絡搭建的模型訓練數據集,來進行圖片預測,較為精準的提取出圖片中的耕地區域。
模型的不足:在進行耕地與背景區域分離時,顏色較深的像素點被置為0(黑色區域),顏色較淺的像素點被置為255(白色區域),導致計算耕地(白色)區域所占圖像比例不準確;進行模型訓練時,數據集不能過小,會導致訓練出的模型進行預測時不準確。
依靠人工解譯來提取耕地信息,耗費大量人力、財力且效率較低,基于PSPnet神經網絡的遙感圖像耕地識別算法研究將對耕地遙感制圖提供重要幫助,隨著訓練數據集的增大,進行預測得到的效果會大幅度提升,能夠快速、精準的識別出田塊。