





摘要:為進一步提高農產品供需過程模擬與估算精度,本研究以自1980年以來國家級和省級的大量農業(yè)數(shù)據(jù)作為樣本,充分考慮農產品品種、時間、收入、經濟發(fā)展等因素影響,構建基于深度學習長短時記憶神經網絡(Long Short-Term Memory Neural Network ,LSTM)的多種農產品供需預測模型。模型在充分考慮機理性約束條件的前提下,利用深度學習算法在非線性模型分析預測中的優(yōu)勢,對稻谷、小麥、玉米、大豆、豬肉、禽肉、牛肉、羊肉、水產品等9種主要農產品供需進行分析預測。將基于本模型的2019—2021年產量預測結果與國家統(tǒng)計局公布數(shù)據(jù)進行對比驗證,三年平均預測準確率96.98%,表明本研究構建的預測模型能夠高效地反映隱性指標變化對預測結果的影響。該模型可以通過及時地監(jiān)測農業(yè)運行數(shù)據(jù),為多區(qū)域、跨期的農業(yè)展望工作提供智能化技術支持。
關鍵詞:深度學習;供需預測模型;長短時記憶神經網絡;循環(huán)神經網絡;農產品產量;農業(yè)展望
中圖分類號:F323.7;TP183""""" 文獻標志碼:A"""""""" 文章編號:SA202203013
引用格式:莊家煜, 許世衛(wèi), 李楊, 熊露, 劉克寶, 鐘志平.基于深度學習的多種農產品供需預測模型[J].智慧農業(yè)(中英文), 2022, 4(2):174-182.
ZHUANG Jiayu, XU Shiwei, LI Yang, XIONG Lu, LIU Kebao, ZHONG Zhiping. Supply and demand forecasting model of multi-agricultural products based on deep learning[J]. Smart Agriculture, 2022, 4(2):174-182.(in Chinese with English abstract)
1引言
“民為國基,谷為民命”,糧食安全事關國計民生,監(jiān)測預警是現(xiàn)代農業(yè)管理的高端工具和保障國家糧食安全的重要手段。農業(yè)展望作為監(jiān)測預警體系建設的重要工作,既能增強政府對農產品市場調控的主動權,又能提升農民、商戶等各類市場主體應對市場變化的掌控權[1]。然而,農產品品種多、產業(yè)影響因素雜、品種間關聯(lián)性強,無疑對農產品生產、消費、貿易等主要環(huán)節(jié)實時精準量化分析預警工作提出挑戰(zhàn)[2]。
農產品供需分析預測有助于積極釋放市場信號、引導農業(yè)生產與消費,一直受到國內外研究者的廣泛關注,其研究大體可分為農產品產量預測和需求預測兩方面。其中,產量預測研究多基于氣象[3, 4]、遙感[5, 6] 和作物生長機理[7, 8] 等模型,結合線性回歸、時間序列[9]、人工智能[10]等方法進行預測;需求預測研究多采用人均營養(yǎng)攝取推算法[11, 12]、趨勢和經驗估算法[13, 14]、結構模型預測法[15, 16]等。農業(yè)系統(tǒng)具有很強的非線性、隨機性和動態(tài)特征[17],其模型的有效應用依賴于參數(shù)的快速、準確估算。許多研究者認為智能優(yōu)化算法應用到作物模型參數(shù)估算中,如利用個體優(yōu)勢遺傳算法優(yōu)化水稻生育期模型參數(shù),實現(xiàn)模型參數(shù)的自動率定,可有效提高模型的調參效率[18, 19]。王盈旭等[20]證明通過改進的深度學習算法可以適合非線性系統(tǒng)的建模,并能得到很好的預測效果。Deléglis等[21]發(fā)現(xiàn)深度學習算法適合處理糧食供需相關多源異構數(shù)據(jù)且預測效果較好。" Emerson 等[22]、" Schwalbert 等[23]" 及 Shahhosseini等[24]進一步研究表明,應用人工神經網絡( Artificial Neural Network , ANN )等智能學習方法預測農作物產量較傳統(tǒng)時間序列和多元線性回歸模型效果要好。
智能化模型方法綜合分析方法已成為農產品供需分析預測的有效工具。從現(xiàn)有研究來看,傳統(tǒng)的統(tǒng)計方法不能全方位對農產品供需過程進行定量描述,需充分發(fā)揮深度模型所具備的時間、空間數(shù)據(jù)連續(xù)等優(yōu)勢,進一步提高農產品供需過程模擬與估算精度。本研究結合農學、氣象學、經濟學及計算機等多學科知識,在撰寫《中國農業(yè)展望報告》過程中積累的大量數(shù)據(jù)基礎上,充分考慮農產品品種、時間、收入、經濟發(fā)展等因素影響,應用長短時記憶神經網絡(Long Short- Term Memory Neural Network , LSTM )等智能算法在多維變量非線性特征感知中的優(yōu)勢,優(yōu)化傳統(tǒng)農產品供需預測模型,構建多時間維度不同農產品供需預測模型,不僅可以根據(jù)某一農產品供需預測模型集群智能調配構建另一種農產品的模型集群,還可以針對同一農產品智能調配建立不同時間尺度的模型集群,提高農產品供需過程模擬與估算精度的同時,實現(xiàn)對農產品供需信息實時精準監(jiān)測分析預警,并可為多區(qū)域、跨預測期的農業(yè)展望工作提供有效技術支撐。
2數(shù)據(jù)與方法
2.1數(shù)據(jù)來源與預處理
2.1.1數(shù)據(jù)來源
農產品供需預測模型使用的數(shù)據(jù)為1980年以來國家級和省級的數(shù)據(jù),涉及的指標有:產量、作物種植面積、畜產品出欄量、口糧消費、工業(yè)消費、飼用消費、種用消費、損耗和其它消費、進出口、價格、GDP 、人口、城鎮(zhèn)人口、農村人口、氣象要素等,數(shù)據(jù)來自于官方發(fā)布的統(tǒng)計年鑒或報告(《中國統(tǒng)計年鑒》《全國農產品成本收益資料匯編》、海關總署進出口數(shù)據(jù)庫等)。部分數(shù)據(jù)通過調查、回溯等方法進行估算,如飼用消費、工業(yè)消費、種用消費和其它消費。
具體的,作物生產相關影響因素包括:降雨量、日照時數(shù)、溫度、成本收益情況、費用和用工情況、化肥種子投入、支持政策、保護政策和科技政策;畜禽生產相關影響因素包括:出欄量、存欄量、育齡結構、成本收益情況和管理因素;農產品消費相關影響因素包括:口糧消費、工業(yè)消費、飼用消費、種用消費、損耗、人均收入、市場價格、人均國民生產總值、工業(yè)增長率、畜產品產量、料肉比、飼料價格、投入品和產出品的價格、每畝用種量(作物類)和損耗系數(shù)等。
2.1.2數(shù)據(jù)預處理
Bengio 等[25] 發(fā)現(xiàn)導致雙向循環(huán)神經網絡( Recurrent Neural Network , RNN )訓練極其困難的根本因素在于梯度消失(或梯度爆炸),因此在使用模型計算之前,需要對數(shù)據(jù)進行預處理。由于本研究涉及的農產品供需預測模型數(shù)據(jù)來源眾多、數(shù)據(jù)量龐大,為消除指標之間的量綱影響,對不同指標所具有不同的量綱進行數(shù)據(jù)標準化處理,以解決數(shù)據(jù)指標之間的可比性問題。對不完整的數(shù)據(jù)集進行處理,以保證分析結果的可靠性。分別采取均值、熱卡填充、k 最近鄰、回歸分析等方法進行填充,采用劃分比例、趨勢分析等方法對數(shù)據(jù)進行拆分或合并。對異常數(shù)據(jù)進行判定和處理,主要包括拉依達準則(36)、肖維勒準則( Chauvenet )、狄克遜準則 ( Dix- on)、羅馬諾夫斯基準則(t檢驗)和格拉布斯準則( Grubbs )等。模型所需數(shù)據(jù)的預處理包括農產品供需數(shù)據(jù)的質量分析、異常檢測、填充、轉換、標準化和歸一化等。其中數(shù)據(jù)的轉換和歸一化在模型內部通過參數(shù)的形式根據(jù)模型需要自主選擇,其他數(shù)據(jù)處理方式通過數(shù)據(jù)導入過程實現(xiàn)。數(shù)據(jù)轉換的方式包括:
(1) 求解差分數(shù)據(jù)。當前時間點的數(shù)據(jù)與前一時間點的數(shù)據(jù)進行差分處理,通過差分后的值進行預測。
(2)數(shù)據(jù)對數(shù)處理。對于不符合正態(tài)分布的數(shù)據(jù)計算偏度,取對數(shù)使數(shù)據(jù)近似服從正態(tài)分布。
為使 LSTM深度學習模型盡快達到收斂,模型中對所有特征數(shù)據(jù)采用最大最小值歸一化方法,歸一化之后的數(shù)據(jù)直接用于建模預測,最后預測結果根據(jù)歸一化過程中記錄的最大或最小值換算還原成實際值。
2.2研究方法
本文涉及的農產品供需預測模型主要考慮中國農產品供給與需求的特點,并基于均衡原理假設:農產品的供給和需求共同決定了價格,且農產品的總供給為國內總產量、進口量、期初庫存之和,總需求為國內消費量、出口量、期末庫存之和。在本模型構建時,為深入分析主要農產品的消費需求,對中國國內消費量進行了更詳細的劃分,根據(jù)消費用途將糧食類消費分成口糧消費、飼用消費、工業(yè)消費、種用消費、損耗和其它消費;其中,大豆分為食用消費、壓榨消費、種用消費、損耗和其它消費。不同用途的糧食消費所受到的影響因素也不相同。口糧(食用)消費受人口和城鎮(zhèn)化率水平影響;飼用消費主要受飼養(yǎng)所需的農產品產量影響,工業(yè)用糧主要受工業(yè)產品產量影響,種用消費主要取決于畝均用種量和播種面積;損耗和其它消費主要取決于產量和損耗系數(shù)。
本研究提出的中國農產品供需預測模型主要有兩個特點:一是系統(tǒng)考慮農業(yè)與非農業(yè)、農業(yè)內部之間的各種產業(yè)聯(lián)系,包括消費和生產方面的聯(lián)系,不同產品之間的相互影響,這些產品的產出共同構成 GDP ,并決定居民收入,進而決定居民消費需求:二是將供需均衡基本假設作為先驗知識融合到模型中,并作為約束條件,再引入LSTM方法作為智能預測模型的核心算法。
2.2.1 LSTM 算法
本研究設計的深度神經網絡結構的關鍵部位包括 InputGate (輸入門), OutputGate (輸出門)和 ForgetGate (遺忘門),這些 Gate (門)的實現(xiàn)由 Sigmoid函數(shù)輸出,且取值都在0~1之間,可與節(jié)點 h (.)進行逐點相乘,以實現(xiàn)“門”的功能。
其中輸入門、輸出門和遺忘門的更新方法如公式(1) ~公式(3) 所示。
其中, int , outt 和ft 分別是輸入門、輸出門和遺忘門;σ是遺忘因子; Ct 是當前層 LSTM 的輸出; Ct -1是 LSTM 上一層的輸出; xt 是當前層的輸入;ht -1是上一層到當前層的輸入;ht 是當前層到下一層的輸出。
輸出與下一個輸入和隱藏狀態(tài)有關,本研究將使用 RNN來計算該關系,時間步長 t的前向隱藏狀態(tài)通過以下公式(4) 計算:
其中,ht(f)為向前隱藏狀態(tài);bh 為偏置。
利用公式(5) 計算后向隱藏狀態(tài):
最后,利用公式(6) 計算時間步長 t 處的輸出:
2.2.2模型建立
農產品供需預測模型涵蓋稻谷、小麥、玉米、大豆、油料、棉花、糖料、馬鈴薯、蔬菜、水果、豬肉、禽肉、牛肉、羊肉、禽蛋、奶制品、水產品和工業(yè)飼料共計18種農產品的供需平衡表和價格預測。在多品種模型運算時,糧食類農產品的飼用消費需要建立在畜禽產品的生產基礎之上,所以建模時將豬肉( PK )、牛肉( BV )、羊肉( MU )和禽肉( PT )等肉類品種劃分為優(yōu)先計算組,通過模型計算出肉類聯(lián)合平衡表方程,再將預測的肉類產量(視結果可用性,若不可用則以存欄量、出欄量等變量替代)作為輸入數(shù)據(jù)引入稻谷( RI )、小麥( WT )、玉米( MA )和大豆( SB )等主要糧食作物品種的聯(lián)合平衡表方程,計算有種植競爭、消費替代的關聯(lián)農產品。
供需預測模型總體思路為:將深度神經網絡訓練模型封裝為一個 I/O (輸入/輸出)開放的模塊化模型,預留出外部數(shù)據(jù)輸入控制接口,實現(xiàn)供需平衡相關指標預測和平衡表的換算。主要功能包括模型自動訓練封裝、模型自動調參、模型接口參數(shù)輸入、平衡表的自動換算、自動配平和最終平衡表輸出等。上述方案可以實現(xiàn)農作物、肉類和禽蛋類等各種類別平衡表的自動平衡和品種間關聯(lián)耦合,并可以動態(tài)測算未來10年內的狀況。模型可以通過選擇待預測的農產品品種、模型訓練的歷史數(shù)據(jù)時間段,也可選擇未來的幾年的平衡表的輸出(中長期預測),對模型預測場景進行設置。
模型的輸入包括農產品自2000年以來預測的平衡表數(shù)據(jù),以及平衡表數(shù)據(jù)(包括生產量、消費量、進口量、出口量、結余變化)、生產量和消費量的組成分項數(shù)據(jù)(包括單產、面積、畝均用種量、自損系數(shù)、損耗系數(shù)、城鎮(zhèn)人口比例、出欄量、胴體重等)、年度價格數(shù)據(jù)、宏觀經濟數(shù)據(jù)(人口、CPI等價格指數(shù)、GDP 、工業(yè)指數(shù)等)、國際貨幣數(shù)據(jù)(人民幣與主要貨幣的匯率)等。模型的輸出為各類農產品自預測時間以來未來十年的平衡表。平衡表測算模型主要采用 LSTM 模型方法測算,輔以邏輯回歸(Logis‐tic Regression ,LR )模型進行局部變量的配平。在 LSTM中,測算主要是通過多輸入多輸出,系統(tǒng)自動建模得出。其中,所有的測算都可以設置限制條件,如設定輸入變量因素的權重等。參考經濟學中均衡理論,供給和需求影響價格,同時被價格影響,因此建立生產量、消費量、進出口量、結余變化、價格和受價格影響的宏觀變量及指標的多輸入、多輸出模型。
農產品供需平衡模型的基本約束方程如公式(7) ~公式(12):
其中,“[]”中的內容表示可選項。
2.2.3模型數(shù)據(jù)接口
供需預測模型的輸入為每組包含 m個特征的n 組歷史數(shù)據(jù),輸出為每組包含 m 個特征的 k 組預測數(shù)據(jù)。通常,模型輸出數(shù)據(jù)要求越多,預測結果的精度也會相應降低。因此,本研究設計的LSTM模型輸入輸出數(shù)據(jù)滿足如下形式:
其中,X為影響農產品供需的各類影響因素向量,各因素之間需要根據(jù)其含義進行特定的特征衍生; Y為供需平衡表各項形成的向量,所有特征在進入網絡前需要進行標準化和歸一化處理,同時需要控制參數(shù)對 Y分項進行邊界限制。對于 LSTM 的多輸入多步長多輸出數(shù)據(jù),使用Encoder-Decoder (編碼-解碼模型) LSTM ,其對于多輸入多步長多輸出的序列到序列(Sequenceto Sequence)問題具有比較好的效果。
2.2.4模型評估方法
通常,預測模型平均損失越小越好,且損失曲線趨于收斂。在模型集群驗證時,將歷史數(shù)據(jù)進行滑動處理,以最新的一年數(shù)據(jù)作為驗證集,之前的數(shù)據(jù)用于建模訓練,將真實值和模型預測值做對比驗證。例如,為驗證2015年預測結果,則將1980—2014年數(shù)據(jù)作為訓練集,2015年實際數(shù)據(jù)作為驗證集;同理,驗證2016年預測結果,則將1980—2015年數(shù)據(jù)作為訓練集,2016年實際數(shù)據(jù)作為驗證集,以此進行滑動驗證。
本研究涉及的模型評估主要使用平均絕對值誤差( Mean Absolute Deviation , MAE )和平均絕對百分比誤差(Mean Absolute Percentage Er‐ ror ,MAPE )兩個指標判斷模型的效果。
3結果與分析
3.1單品種建模預測
以耦合度較小的禽蛋供需預測(2021—2030年)為例,預測時使用雙輸入模型,將樣本數(shù)據(jù)分為禽蛋歷史平衡表數(shù)據(jù)和影響禽蛋供需的各要素數(shù)據(jù)。其中,卷積層輸入數(shù)據(jù)為影響禽蛋供給與需求各分項的影響因素數(shù)據(jù),卷積處理后對數(shù)據(jù)進行特征提取。在全連接層接收平衡表分項數(shù)據(jù),與先前的因素特征組合成新的特征,通過LSTM 算法進行禽蛋供需預測,流程如圖1所示。
圖1中模型網絡采用串聯(lián)結構,可以提高模型的表達能力。模型采用模塊分組的形式,以模塊為基礎,重復提取不同數(shù)量的特征。模塊的基本構成為:先對輸入進行3×3的卷積,輸出為 n/4個通道;然后連接2×2的卷積,輸出為 n/4個通道;對數(shù)據(jù)進行兩次特征變換,最后加入一個1×1的卷積,提高網絡的表達能力,同時組合不同通道的信息,輸出為 n個通道(其中 n為濾波器的個數(shù))。在主體網絡結構中引入模型池化層,以合成初始特征區(qū)域內某一個特征,并有效減小過擬合現(xiàn)象的發(fā)生。丟棄層(Dropout)使隱層神經元隨機失活,防止模型過擬合,同時可以提高模型的泛化能力。由于樣本數(shù)據(jù)存在分布不均勻現(xiàn)象,采用加權交叉熵作為目標的損失函數(shù)。全連接層加入時序信息特征,綜合考慮時間特征。對于預測出的結果,需要滿足平衡表的分項之間的關系,同時使用 Lasso回歸模型進行校正。首先,將禽蛋的歷史數(shù)據(jù)處理成一系列的時間序列,并利用 LSTM 模型學習其周期特征,訓練過程中損失隨訓練次數(shù)(Epoch)的變化曲線如圖2所示。根據(jù)中間過程的輸出信息,在迭代過程中損失函數(shù)在減小。
模型預測的未來10年中國禽蛋供需結果如表1所示,表中2011—2020年為中國禽蛋歷史供需平衡表,2021—2030年為模型預測值。
3.2多品種集群建模預測
與上述禽蛋供需預測方法類似,通過 LSTM方法優(yōu)化的農產品供需預測模型可以實現(xiàn)多品種集群建模預測。在產量預測方面,主要使用氣象數(shù)據(jù)、投入和管理政策等影響因素;在消費預測方面,建立差異化消費預測,引入人口、農產品價格、地區(qū)消費差異等因素,為不同消費類型的消費量計算提供定量分析技術;在價格預測方面,引入多品種價格關聯(lián)和競爭機制,建立多維農產品價格預測方法。
利用本研究供需預測模型對中國主要農產品(稻谷、小麥、玉米、大豆、豬肉、禽肉、牛肉、羊肉和水產品)產量進行預測,預測結果與國家統(tǒng)計公布的實際結果進行對比,結果如圖3所示。產量預測模型的三年(2019—2021年)總體MAPE 為3.02%,即三年平均預測準確率為96.98%。其中2019年 MAPE 為3.90%,2020年MAPE 為1.74%,2021年為3.42%,即準確率分別為96.10%、98.26%和96.58%。可以看出2020年和2021年的產量預測精度要好于2019年,說明隨著樣本容量的增加,智能學習模型預測效果會逐步變好。
4總結與展望
由于傳統(tǒng)農產品供需統(tǒng)計分析方法不能全方位對生產、流通、消費的全過程進行定量化描述,為充分發(fā)揮大數(shù)據(jù)應用的時間連續(xù)、空間數(shù)據(jù)連續(xù)等優(yōu)勢,進一步提高多品種供需的模擬與估算精度,本研究提出了一種基于深度學習模型LSTM的農產品供需分析預測模型,可實現(xiàn)多元高頻數(shù)據(jù)協(xié)同分析,有效解決農產品供需分析過程中因單一信息源造成的“視覺盲區(qū)”,對全息精準進行農產品供需預測預警具有一定的探索性和開創(chuàng)性。
本方法在對農產品供需模型參數(shù)敏感性分析和參數(shù)校正基礎上,以 1980年以來中國農產品供需平衡表數(shù)據(jù)作為基礎學習樣本,構建了基于長短時記憶神經網絡和均衡關聯(lián)的農產品供需預測模型。可實現(xiàn)稻谷、小麥、玉米、大豆和禽蛋等主要農產品供給、需求的定量化模擬與估算。本研究構建的農產品供需預測模型,利用均衡理論對農產品供需各個分量進行約束,同時綜合考慮農產品產業(yè)鏈各環(huán)節(jié)的歷史特征以及影響因素,避免了人工經驗干預引入的不可控誤差,并通過循環(huán)神經網絡優(yōu)化了模型的參數(shù),提高了模型的預測性能。
農產品供需預測模型是中國農業(yè)展望工作的核心,該類模型的應用可以提升“用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新”的技術支撐能力,為農業(yè)生產經營和宏觀調控提供市場預警、政策評估、資源管理和輿情分析等數(shù)據(jù)產品與技術支持。本研究所構建模型尚存在一些不足,對諸如非洲豬瘟、中美貿易摩擦等特殊事件的響應還不夠。這是因為重大政策、突發(fā)事件等外部沖擊因素屬于偶發(fā)性干擾變量,很難獲取大量的樣本特征,并通過深度學習方法形成相應的智能模型。所以,未來農產品供需預測模型還需要和更多的模型進行協(xié)同應用,才能更好地對農產品供需形勢進行定量化分析預測。
參考文獻:
[1] 農業(yè)農村部市場預警專家委員會.中國農業(yè)展望報告(2021—2030)[M].北京:中國農業(yè)科學技術出版社, 2021.
[2] 許世衛(wèi), 邸佳穎, 李干瓊, 等.農產品監(jiān)測預警模型集群構建理論方法與應用[J].中國農業(yè)科學 , 2020, 53(14):2859-2871.
XU S, DI J, Li G, et al. The methodology and applica‐ tion of agricultural monitoring and early warning mod‐ el cluster[J]. Scientia Agricultura Sinica, 2020, 53(14):2859-2871.
[3] ZHUANG J, XU S, LI G, et al. The influence of meteo‐rological factors on wheat and rice yields in China[J]. Crop Science, 2018, 58(3):837-852.
[4] LAUDIEN R," SCHAUBERGER B, MAKOWSKI D,et" al. Robustly" forecasting" maize" yields" in" Tanzania based" on" climatic" predictors[J]. Scientific" Reports, 2020, 10: ID 19650.
[5] JOHNSON M D, HSIEH W W, CANNON A J, et al.Crop yield forecasting on the Canadian Prairies by re‐ motely sensed vegetation indices and machine learning methods[J]. Agricultural" and" Forest" Meteorology, 2016, 218-219:74-84.
[6] EUGENIO F C E, GROHS M, VENANCIO L P, et al.Estimation" of" soybean" yield" from" machine" learning techniques" and" multispectral" RPAS" imagery[J]. Re‐ mote Sensing Applications, 2020: ID 100397.
[7] PAUDEL D, BOOGAARD H, DE WIT A, et al. Ma‐chine learning for large-scale crop yield forecasting[J]. Agricultural Systems, 2020, 187: ID 103016.
[8] DE WITA, BOOGAARD" H, FUMAGALLI D," et" al.25 years of the WOFOST cropping systems model[J]. Agricultural Systems, 2019, 168:154-167.
[9] MASUDA, TADAYOSHI, GOLDSMITH, et al. Worldsoybean production: Area harvested, yield," and" long- term projections[J]. International Food amp; Agribusiness Management Review, 2009, 12(4):143-161.
[10]王桂芝, 胡慧, 陳紀波, 等.基于 BP 濾波的 Fourier 模型在糧食產量預測中的應用[J].中國農業(yè)氣象 , 2015, 36(4):472-478.
WANG G, HU H, CHEN J, et al. Application of Fouri‐ er model based on BP filter in crops yield prediction[J]. Chinese" Journal" of" Agrometeorology, 2015, 36(4):472-478.
[11] 肖玉, 成升魁, 謝高地, 等.我國主要糧食品種供給與消費平衡分析[J].自然資源學報 , 2017, 32(6):927-936.
XIAO Y," CHENG" S," XIE" G," et" al. The balance be‐tween" supply" and" consumption" of the" main" types" ofgrain in China[J]. Journal of Natural Resources, 2017,32(6):927-936.
[12]謝高地, 成升魁, 肖玉, 等.新時期中國糧食供需平衡態(tài)勢及糧食安全觀的重構[J].自然資源學報 , 2017,32(6):895-903.
XIE" G," CHENG" S," XIAO Y," et" al. The balance be‐tween grain supply and demand and the reconstructionof China's food security strategy in the new period[J].Journal of Natural Resources, 2017, 32(6):895-903.
[13]趙萱, 邵一珊.我國糧食供需的分析與預測[J].農業(yè)現(xiàn)代化研究, 2014, 35(3):277-280.
ZHAO X," SHAO Y. Analysis and forecast of China'sgrain supply and demand[J]. Research of AgriculturalModernization, 2014, 35(3):277-280.
[14]劉洋, 羅其友, 周振亞, 等.我國主要農產品供需分析與預測[J].中國工程科學, 2018, 20(5):120-127.
LIU Y, LUO Q, ZHOU Z, et al. Analysis and predic‐tion of the supply and demand of China's major agricul‐tural products[J]. Strategic Study of CAE, 2018, 20(5):120-127.
[15] LU W, NING L C, WEN X Q. Modeling the effects ofurbanization" on" grain production" and" consumption" inChina[J]. Journal of Integrative Agriculture, 2017, 16(6):1393-1405.
[16]黃季焜.對近期與中長期中國糧食安全的再認識[J].農業(yè)經濟問題, 2021(1):19-26.
HUANG J. Recognition" of recent" and mid-long termfood security in China[J]. Issues in Agricultural Econo‐my, 2021(1):19-26.
[17]陳錫康, 楊翠紅.農業(yè)復雜巨系統(tǒng)的特點與全國糧食產量預測研究[J].系統(tǒng)工程理論與實踐 , 2002(6):108-112.
CHEN" X," YANG" C. Characteristic" of" agriculturalcomplex" giant" system" and" national" grain" output pre‐diction[J]. Systems" Engineering-Theory amp; Practice,2002(6):108-112.
[18]許世衛(wèi).農業(yè)信息分析學[M].北京:高等教育出版社, 2013.
[19]高亮之.農業(yè)模型學[M].北京:氣象出版社, 2019.
[20]王盈旭, 韓紅桂, 郭民.一種基于改進型深度學習的非線性建模方法[J].信息與控制 , 2018, 47(6):680-686.
WANG" Y," HAN" H," GUO" M. A nonlinear" modelingmethod based on improved deep learning[J]. Informa‐tion and Control, 2018, 47(6):680-686.
[21] DELéGLISE H, INTERDONATO R, BéGUé A, et al.Food security prediction from heterogeneous data com ‐bining machine and deep learning methods[J]. ExpertSystems with Applications, 2022, 190: ID 116189.
[22] EMERSON R A, DOS REIS J G M, VENDRAMET ‐TO O, et al. Time series prediction with artificial neu‐ral networks: An analysis using Brazilian soybean pro‐duction[J]. Agriculture (Basel), 2020, 10(10): ID 475.
[23] SCHWALBERT R A, AMADO T, CORASSA G, et al.Satellite-based soybean yield forecast: Integrating ma‐ chine" learning" and" weather" data" for" improving" crop yield prediction in southern brazil[J]. Agricultural and Forest Meteorology, 2020, 284: ID 107886.
[24] SHAHHOSSEINI" M," HU" G," HUBER" I," et" al. Cou‐pling" machine" learning" and" crop" modeling" improvescrop yield prediction in the US corn belt[J]. ScientificReports, Scientific Reports, 2021, 11(1):1-15.
[25] BENGIO Y, SIMARD P, FRASCONI P. Learning long-term dependencies with gradient descent is difficult[J].IEEE" Transactions" on" Neural" Networks, 1994, 5(2):157-166.
Supply and Demand Forecasting Model of Multi-Agricultural Products Based on Deep Learning
ZHUANG Jiayu1,2 , XU Shiwei1,2* , LI Yang3 , XIONG Lu1,2 , LIU Kebao3 , ZHONG Zhiping1,2
(1. Agricultural Information Institute of CAAS, Beijing 100081, China;2. Key Laboratory of Agricultural Informa‐tion Service Technology of MOA, Beijing 100081, China;3. Institute of Agricultural Remote Sensing and Informa‐tion of HAAS, Harbin 150086, China )
Abstract: To further improve the simulation and estimation accuracy of the supply and demand process of agricultural products, a large number of agricultural data at the national and provincial levels since 1980 were used as the basic research sample, in‐ cluding production, planted area, food consumption, industrial consumption, feed consumption, seed consumption, import, ex‐ port, price, GDP, population, urban population, rural population, weather and so on, by fully considering the impact factors of agricultural products such as varieties, time, income and economic development, a multi-agricultural products supply and de‐ mand forecasting model based on long short-term memory neural network (LSTM) was constructed in this study. The general thought of supply and demand forecasting model is packaging deep neural network training model as an I/O-opening modular model, reserving control interface for input of outside data, and realizing the indicators forecasting of supply and demand and matrixing of balance sheet. The input of model included forecasting balance sheet data of agricultural products, annual price da‐ ta, general economic data, and international currency data since 2000. The output of model was balance sheet data of next de‐ cade since forecasting time. Under the premise of fully considering the mechanical constraints, the model used the advantages of deep learning algorithms in nonlinear model analysis and prediction to analyze and predict supply and demand of 9 main types of agricultural products, including rice, wheat, corn, soybean, pork, poultry, beef, mutton, and aquatic products. The pro‐ duction forecast results of 2019-2021 based on this model were compared and verified with the data published by the National Bureau of Statistics, and the mean absolute percentage error was 3.02%, which meant the average forecast accuracy rate of 2019-2021 was 96.98%. The average forecast accuracy rate was 96.10% in 2019, 98.26% in 2020, and 96.58% in 2021, which shows that with the increase of sample size, the prediction effect of intelligent learning model would gradually get better. The forecasting results indicate that the multi-agricultural supply and demand prediction model based on LSTM constructed in this study can effectively reflect the impact of changes in hidden indicators on the prediction results, avoiding the uncontrollable er‐ ror introduced by manual experience intervention. The model can provide data production and technical support such as market warning, policy evaluation, resource management and public opinion analysis for agricultural production and management and macroeconomic regulation, and can provide intelligent technical support for multi-regional and inter-temporal agricultural out‐ look work by monitoring agricultural operation data in a timely manner.
Key words: deep learning; supply and demand forecasting model; LSTM; RNN; agricultural production; agricultural outlook