計雪偉 , 霍興贏 , 薛 端 , 伍曉平
(六盤水師范學院,貴州 六盤水 553004)
隨著社會的不斷發展,世界人口數量的不斷增長,人們對農作物的需求量也在不斷增加。因此,準確地預測農作物產量對于全球的糧食安全具有重要意義[1]。
傳統的預測產量的方法是建模,通過擬合過去的數據統計出結果,然后預測未來的數據。這種方法一般精度不高,而且很難用于大范圍的預測。隨著人工智能技術的不斷發展,關于農作物產量預測研究也取得了一定的進步[2]。深度學習算法能夠自動提取圖像特征,并且能夠很好地利用這些特征信息。因此,不少研究者將深度學習技術應用到了農作物產量預測上并取得了一定的成績,如邢聰仁[3]用機器學習方法預測產量、宗宸生等[4]用BP網絡預測產量、李昂等[5]利用無人機影像預測農作物產量。
本文利用公開的遙感圖像數據對搭建好的神經網絡模型進行訓練,發現其對農作物產量預測有較好的效果,其實驗結果及分析可以為農作物產量預測研究提供一定的參考。
實驗一共分為三部分,第一部分是影響農作物產量的關鍵因素分析,第二部分是圖像預處理,第三部分為搭建、訓練神經網絡并分析結果,詳細內容如下。
綠色植物中的葉綠素對不同的波段吸收能力是不一樣的,對于紅光波接收率達到85%以上,對于近紅外波段接收率就很低,利用這一特點建立了植被指數的概念。它能夠反映綠色植物中葉綠素的含量,因此植被指數是體現作物生長狀況的重要指標之一,常用的植被指數有NDVI、LAI、EVI等,其中EVI的計算公式如下:

式中:ρBLUE、ρRED、ρNIR分別表示作物在藍光波段、紅光波段、近紅外波段上的反射率,引入藍光波段是為了進一步加強作物的反射率;C1是校正參數,用于彌補紅光波段接收信號弱的缺點,C2是藍光校正參數,L是土壤校正參數。EVI指數通過去除大氣分子、水汽、大氣殘留物等實現了對大氣環境的校正,同時它還解決了觀測區域實際覆蓋缺乏線性關系的問題。
目前用于農作物產量預測方面的主要特征參數有歸一化的植被指數(NDVI)、增強型植被指數(EVI)、土壤濕度(Soil Moisture)、地表溫度(LST)以及溫度植被干旱指數(TVDI)等。作物在不同的生長階段具有不同的特征,早期,土壤肥力和地表溫度是預測的關鍵;中期,植被指數尤為重要。正確的特征選取可以使得模型的精度和魯棒性得到提高,反之會使得模型的性能下降。因此,本文采用多個特征疊加的方法來進行訓練模型。
由于氣候條件和云層的影響,遙感圖像中會含有許多噪聲,噪聲會覆蓋圖像中的有用信息,所以在將圖像送入神經網絡訓練前需要對圖像進行相應的處理。另外,實驗部分樣本數目分布不均衡,這將會導致訓練好的模型對樣本的識別存在較大的偏差。為了使數據平衡,實驗中采用了圖片翻轉、裁剪以及加權的損失函數等措施使得數據得以均衡。
本文分析了卷積神經網絡(CNN)和長短期記憶網絡(LSTM)的結構特點以及優缺點,并混合這兩種結構搭建了一種新結構進行作物產量估計研究,最后通過擬合問題的分析以及神經網絡參數設置來優化神經網絡以滿足實驗的需求。
農作物產量的主要影響因素常常是溫度、土壤、光照等。文中使用的實驗數據來自于Google Earth Engine提供的公開衛星數據集,其中包含關于植被指數、地表溫度、土壤濕度、土地年產量數據等。
CNN卷積神經網絡由輸入層、卷積層、池化層等構成。該網絡的主要優點在于能夠通過卷積層從輸入圖像中自動提取圖像特征,并不需要人為干預,這給整個實驗帶來了很大便利。另外,它通過卷積核實現了網絡參數的權值共享,能夠在一定程度上減少網絡參數,從而降低網絡模型的復雜程度。
LSTM網絡是一種RNN網絡的改進型,在該網絡中數據流動成一個環狀,這使得當前數據不僅能夠受前面數據的影響還能受到后面數據的影響。通過這種結構網絡能夠很好地處理具有時間相關性的序列數據。
本文利用遙感圖像來進行農作物產量預測[6],而卷積神經網絡[7]在處理圖像方面具有很大的優勢;對于同一區域的農作物來說,其每一年的產量[8]具有一定的時間相關性,LSTM能夠發揮一定的作用。結合以上兩點,本文在搭建神經網絡模型時采用了CNN與LSTM網絡相結合的方式。具體來說,模型一共由五個部分組成,CNN層主要負責的是圖像特征自動提取,LSTM層和全連接層負責預測輸出。詳細模型結構圖如圖1所示。

圖1 模型結構圖
本文采用基于 Windows 的 tensorflow深度學習框架對卷積神經網絡進行搭建,神經網絡的訓練參數為learning rate=0.001,epochs=50,batch size=300。
為了評估神經模型的有效性,本文將與另外的神經網絡進行比較,其中包括DNN、CNN,使用同樣的數據集,做同樣的數據預處理,對預測結果進行評價,評價標準是均方根誤差,即預測結果與實際產量的偏差程度,計算公式如下:

式中:yi為對應該縣的大豆實際產量,xi為該縣的預測值,n是共選取該縣的總數。
不同模型的誤差率如表1所示。由實驗結果可以發現DNN網絡模型的效果沒有CNN和CNN+LSTM好,而CNN網絡由于在特征提取階段受各種因素影響,對輸入數據的要求高,而且很難學習到數據間的時間相關性,因此采用CNN和LSTM結合的模型來彌補單一網絡在某些方面的不足,使得其效果有進一步的提升。

表1 不同模型的誤差率
本文采用了深度學習的方法來搭建神經網絡模型,并且通過公開的[9]遙感影像[10]數據集來訓練模型。最后通過相關的數據表明,本文中提出的方法相對于傳統方法有一定的優勢,不僅準確率高于傳統方法而且魯棒性也優于傳統方法,能夠為以后的農作物產量預測[6]的相關研究[7]提供一定的參考。