程清 張航 張承明 殷復偉 王程成
摘要:針對目前利用深度學習技術進行高分光學遙感圖像分類方法研究中尚存在的不足,本文提出了一種以多時相遙感數據為數據源,面向農作物種植信息提取的分類算法。該算法首先獲取農作物在若干典型生長時期的光學遙感圖像并進行配準等預處理,然后建立了一種以像素為單位的數據組織結構,該結構包含不同生長時期的作物信息、紋理信息,能較好地解決現有分類研究中信息不足的問題;接著以前饋神經網絡為基礎,建立了一種以像素為單位的分類算法,最后以得到的逐像素分類結果為基礎進行成圖。與同類方法相比,本文提出的算法綜合考慮了農作物在不同生長時期的特征,更能發揮深度學習技術的優勢,且多時相數據在提高農作物提取信息精度方面具有明顯優勢。
關鍵詞:遙感分類;多時相數據;信息提取;農作物;神經網絡
中圖分類號:S127文獻標識號:A文章編號:1001-4942(2018)04-0149-05
Abstract In view of the shortages in researching high resolution optical remote sensing image classification method by the deep learning technology, a classification algorithm for crop information extraction based on the multi-temporal remote sensing data was proposed in this paper. The algorithm firstly obtained the optical remote sensing images of crop at several typical growth stages, and preprocessed these images such as registration. Then it established data organization structure based on pixels to solve the problem of insufficient information in the existing classification researches, which contained crop information and texture information at different growth stages. And it proposed a pixel classification algorithm based on the feedforward neural network. Finally,it mapped images based on pixel by pixel classification results. Comparing to the previous methods, this method comprehensively considered the characteristics of crop at different growth stages,could give full play to the advantages of the deep learning technology and had obvious advantages in improving the precision of crop information extraction.
Keywords Remote sensing classification; Multi-temporal data; Information extraction; Crop; Neural network
獲取準確的農作物種植種類、面積、空間分布等信息,對于加強農業生產管理和國家宏觀調控、保障農業可持續發展并最終保障國家糧食安全具有重要的意義。
圍繞該問題,研究者們已開展了很多研究,并取得一定成果。閆慧敏等[1]利用MODIC/EVI時間序列影像,分析了鄱陽湖農業區多熟種植時空格局特征;鄭長春等[2]以黑龍江852農場為研究區域,利用 SPOT 影像基于簡單決策樹分類器提取了水稻、小麥和玉米三大作物組成的種植結構信息;Mathur 等[3]利用IRS-1D 影像的光譜單波段特征量,采用支持向量機分類器提取出了印度旁遮普區域棉花和水稻兩大農作物的空間分布;苗翠翠等[4]利用TM與NOAA影像數據,以江蘇省水稻面積分布為研究對象,對NOAA-AVHRR進行混合像元分解,統計出各市的水稻面積;王凱[5]利用多源遙感數據,建立了針對湖北省的作物耕作面積提取及其動態監測技術體系;胡瓊等[6]對利用遙感數據提取農作物種植結構的研究進行了綜述,分析了各類方法的適應性;舒田等[7]在分析農作物光譜信息特征基礎上,利用不同數據變換形式和10種常用植被指數對采收期的7種農作物進行了識別能力研究。盡管以往的研究中研究者們提出了多種優秀的提取算法,但由于數據源的限制,導致結果的精度仍較低,不能更好地滿足農業生產管理和決策的需要。
隨著高分辨率衛星的發展,人們獲取的光學遙感圖像的分辨率不斷提高。在我國,隨著高分系列衛星的成功發射,研究者已經可以穩定獲取1 m分辨率的遙感圖像,成為可靠的數據源。高分辨率圖像與中低分辨率圖像存在著較大的差異,突出表現在:高分辨率圖像中地物的光譜特征更加豐富,同類地物內的光譜差異增大,而不同類別間的光譜差異減少,導致同物異譜及同譜異物現象更加普遍;同時,影像中大量細節的出現和地物光譜特征的復雜化導致了基于光譜統計特征進行分類的傳統方法如極大似然法、最小距離法、K-均值聚類法等分類準確性的降低,甚至不能應用[8,9]。針對高分遙感圖像的分類問題,研究者們已進行了大量研究,目前遙感影像分類方法主要分為兩大類:監督分類與非監督分類[10]。監督分類是理論最成熟、應用最廣泛的一類方法,主要包括最大似然法、最小距離法、人工神經網絡等。
現有研究中基于高分遙感圖像的分類算法多是針對一般地物的,專門考慮農作物分類的算法較少。事實上,農作物信息提取與一般地物分類問題有很大不同,其中最大的不同之處在于農作物存在一個明顯的生長變化過程,只有綜合利用多個時相的數據,才能有效提高分類精度[11]。為此,本研究提出了一種利用多時相遙感數據提取農作物信息的方法,該算法將多幅典型生長時期的遙感圖像統一按像素組織,然后利用神經網絡強大的自學習能力學習每類樣本的特征,最終利用學習到的特征進行農作物信息提取。
1 研究區概況與數據來源
1.1 試驗區概況
本研究選取華容區作為試驗區。華容區隸屬湖北省鄂州市,位于鄂州市西部,長江中下游南岸。地處東經114°30′~115°05′,北緯30°~30°36′。位于我國地勢第二階梯過渡到第三階梯的地帶,以丘陵為主,西北部為壟崗平原,東南部多湖泊。
華容區屬典型的亞熱帶大陸性季風氣候,四季分明,光照充足,雨量充沛。無霜期年均266 d,年降水量1 315 mm,年均日照射時數1 995 h。良好的氣候條件為農作物提供了良好的生長環境。
華容區土地總面積為49 274.72 hm2,占全市土地面積的39.2%。其中,耕地面積20 682.55 hm2,占總面積的41.97%,糧食生產在該區占據重要地位,是我國主要的糧、棉、油生產基地之一。因此,及時準確地掌握華容區的農作物信息,可以為農業生產部門提供有利數據,具有極大的利用價值。
1.2 數據來源
高分二號衛星(GF2)于2014年8月19日11時15分發射,是迄今為止中國地面像元分辨率最高的光學對地觀測衛星,具有米級空間分辨率,全色分辨率為1 m,多光譜分辨率為4 m,成像幅寬為45 km。主要參數見表1。
本研究選取了華容區2015年11月、2016年3月、2016年5月共三期的GF2遙感影像,并利用華容區的矢量邊界對獲得的三期高分影像進行裁剪,最終得到研究區域的遙感影像圖(圖1)。
2 方法建立
2.1 數據預處理
遙感數據在采集過程中,由于受到衛星高度、角度、傳感器性質等多種因素的影響,會產生圖像變形。因此,首先利用ENVI軟件中的RPC(有利多項式系數)和FLAASH模塊分別對影像進行正射投影和大氣校正,接著進行圖像融合,以提升圖像的空間分辨率和光譜分辨率,利于監測。
2.2 數據結構
為了充分利用遙感數據提供的信息,考慮到紋理信息是由多個相鄰像元共同表現出的特征,是二維結構的數據,而光譜信息是一維結構的數據,本方法首先設計了一個以一維數據存儲像素信息的數據結構,以便逐像素統一存儲光譜和紋理信息。該結構以經過預處理的數據為基礎,采用逐像素逐時相存儲的方式,首先存儲像素第一個時相的光譜信息,然后存儲第一個時相的紋理信息,由于每個像素的紋理是3×3的結構,需將該結構逐行逐列轉化成一維結構加以存儲;然后存儲像素第二個時相的信息,依此類推。
2.3 模型建立與學習
神經網絡和遺傳算法都是仿效生物處理模式,并從中獲取解決復雜實際問題的方法。神經元網絡算法是一種“黑匣”式的映射,無需明確兩者之間的確切關系,只需要“現象上”存在關系即可,非常適合解決非線性的復雜問題,具有極強的容錯性、自組織性、非線性模擬和泛映射能力;但運用該算法容易陷入局部最優,得不到全局最優解,且其網絡的設計沒有理論上的指導,完全依賴設計者的經驗和樣本空間的反復試驗,這限制了運用神經網絡求得全局最優解的可能性。遺傳算法(genetic algorithm,GA)是基于自然選擇和遺傳學機理的迭代自適應概率搜索算法,是一種全局優化算法,能夠收斂得到全局最優解,魯棒性好,但其不具備自適應學習能力。因此,將神經網絡和遺傳算法結合起來,不僅能發揮神經網絡的泛化映射能力,而且能使神經網絡具有較快的收斂性、全局優化能力和較強的學習能力,進一步提高網絡訓練速度和預測精度。
基于以上考慮,本文提出一種基于GA-BP神經網絡優化的分類模型,并以此為基礎進行農作物信息提取。該模型首先建立一個BP神經網絡,并利用遺傳算法對網絡的節點權值進行優化;然后將樣本逐像素數據作為遺傳神經網絡的輸入參數,像素的類別作為輸出,通過學習,建立一個能夠用于分類的識別模型。其分類識別流程如圖2所示。
遺傳算法對BP神經網絡進行優化的具體步驟如下:
(1)初始化BP神經網絡,確定輸出輸入節點個數X、Y,隱含層數H,訓練次數N,訓練誤差ε等。
(2)遺傳編碼。確定遺傳算法的種群規模P,染色體個數n與最大迭代次數T,交叉概率Pc與變異概率Pm,將BP網絡權值與閾值按一定順序級聯起來,作為遺傳算法的一個染色體,其長度l為神經網絡的權值個數和閾值個數之和,即:
l=H×(X+Y)+H+Y 。
(3)適應度函數計算。將BP網絡的誤差函數E作為適應度函數,計算種群中每一個染色體的適應度。
(4)遺傳進化。將交叉和變異算子作用于父代種群Pt產生子代種群Qt,并將兩個種群聯合在一起形成2n的種群Rt,對Rt進行非劣分類操作,按照擁擠選擇算子的原則產生下一代種群Pt+1,并將副本復制到P′。
(5)重復(2)~(4)步,直到滿足終止條件為止。至此,將P′中最優個體解碼,作為BP網絡的初始權值和閾值。
GA的進化代數要求不是很大, 因為GA-BP神經網絡中只要求GA為BP神經網絡提供具有全局性的進化較好解,并不要求GA進化至權值、域值的最優解。
2.4 分類實現
改進好的BP神經網絡,設置輸入層神經元節點數目為4,輸出層神經元節點數目為5,最后確定隱含層神經元節點數,即根據輸入、輸出層神經元節點數目、網絡傳遞函數等參數,采用遺傳算法進化確定隱含層神經元數目。在Matlab中讀入待分類圖像數據并歸一化,然后將向量數據輸入到訓練好的BP神經網絡中,再結合紋理信息在Matlab中實現農作物信息的提取。
3 試驗驗證
利用本文構建的方法,對華容區的作物進行識別分類。分類模型在Matlab中編程實現,成圖在ENVI中實現。圖3給出了分類結果圖,圖4給出了以分類結果為基礎形成的矢量圖。
該方法的總體分類精度達到87.133 2%,Kappa系數達到0.803 3,與單一時相的光學遙感數據分類算法相比,分類結果準確度較高,能獲得較為理想的分類效果,具有明顯的優勢。可見,在運用神經網絡進行遙感分類的基礎上,考慮數據源問題,結合合適的紋理信息進行分類,能夠獲得更好的分類結果。
4 結論
本文提出了一種基于GA-BP神經網絡的利用多時相遙感數據的農作物信息提取方法,該方法首先建立了一種能夠逐像元統一存儲多時相光譜信息和紋理信息的數據結構,然后建立一個BP神經網絡,并采用遺傳算法對BP網絡的節點權值進行優化,獲取一個最優權值作為BP網絡的初始權值;完成BP網絡訓練后,以多時相光學遙感數據作為輸入,生成逐像素的分類圖,并利用ENVI軟件進行成圖。
試驗結果表明:
(1)本文提出的數據結構能夠有效、統一地存儲像素的光譜信息和紋理信息,并應用于神經網絡模型,解決了異構數據在神經網絡中的應用問題。
(2)經與單一時相光學遙感數據分類算法對比,新優化算法的總體分類精度達到87.133 2%,Kappa系數達到0.803 3,能取得利用潛力更好的特征和信息,有效提高識別精度,能夠用于工程實踐。
參 考 文 獻:
[1] 閆慧敏, 黃河清, 肖向明, 等. 鄱陽湖農業區多熟種植時空格局特征遙感分析[J]. 生態學報, 2008, 28(9):4517-4523.
[2] 鄭長春, 王秀珍, 黃敬峰. 基于特征波段的SPOT-5衛星影像水稻面積信息自動提取的方法研究[J]. 遙感技術與應用, 2008, 23(3): 294-299.
[3] Mathur A, Foody G M. Crop classification by support vector machine with intelligently selected training data for an operational application [M]. Taylor & Francis, Inc.,2008.
[4] 苗翠翠, 江南, 彭世揆, 等. 基于NDVI時序數據的水稻種植面積遙感監測分析——以江蘇省為例[J]. 地球信息科學學報,2011,13(2):273-280.
[5] 王凱. 基于多源衛星遙感的湖北省作物耕作面積提取及其動態監測[D]. 荊州:長江大學, 2015.
[6] 胡瓊, 吳文斌, 宋茜, 等. 農作物種植結構遙感提取研究進展 [J]. 中國農業科學, 2015,48(10):1900-1914.
[7] 舒田,岳延濱,李莉婕,等.基于高光譜遙感的農作物識別[J]. 江蘇農業學報,2016,32(6):1310-1314.
[8] 劉大偉, 韓玲, 韓曉勇. 基于深度學習的高分辨率遙感影像分類研究[J]. 光學學報, 2016,36(4):298-306.
[9] Cybenko G. Approximation by superpositions of a sigmoidal function[J]. Approximation Theory & Its Applications, 1993, 9(3):17-28.
[10]Lippmann R P. Pattern classification using neural networks[J]. Communications Magazine IEEE, 2002, 27(11):47-50.
[11]郝衛平, 梅旭榮, 蔡學良, 等. 基于多時相遙感影像的東北三省作物分布信息提取 [J]. 農業工程學報, 2011, 27(1):201-207.