徐鑫鑫 胡玉璐 姚治林







摘要:近五年由于蒜價劇烈波動及地域的物流水平差異,中國農業市場遭受巨大損失。總結闡述了智慧農業中大數據的應用,以安徽省智慧農業在信息流通和農業市場監控方面做出的成果以及亟待解決的問題為切入點,通過RFE方法遴選出導致農產品價格波動的長期和短期因素,并結合ARIMA模型和BP神經網絡模型進行市場預測,從多個角度出發為智慧農業大數據管理提出合理建議。
關鍵詞:智慧農業;信息流通性;RFE法;ARIMA模型;BP神經網絡模型
一、前言
中國農貿市場的營業利潤受多種因素影響,而各種農副產品的價格波動也在很大程度上影響著農民和農場主的經濟收益。以近幾年大蒜價格的波動為例,自2009年大蒜百倍漲幅,到2019年由央視網的報道的蘇寧家樂福超市蒜價30%的降幅,在這一過程中,不僅消費者生活受到極大影響,作為中國大蒜主產地的山東也受其影響勉強保本。
在大數據人工智能時代背景下,基于大數據分析和管理平臺的智慧農業應用邁進了一個新的發展階段。環發所在2013年提出,目前農業大數據主要應用于:生產過程管理數據;農業資源管理數據;農業生態環境管理數據;農產品與食品管理大數據;農業裝備與設備監控大數據;各種科研活動產生的大數據6個主要領域[1]。在我國市場經濟條件下,農業分散化的生產經營模式使其對市場競爭中的信息依賴性較強,對農產品市場流通數據進行采集和分析,盡量降低信息與服務的滯后性顯得十分重要。
二、文獻綜述
以安徽省智慧農業發展為例,要保證信息與服務滯后性的減輕,首先需要分析中國智慧農業在信息流通和農業市場監控方面所做出的成果和丞待解決的問題。在該問題的研究中,張樂樂等[2](2021)通過調查得到:安徽省智慧農業的信息進村入戶工程成效明顯,通過構建的信息服務體系,大幅提高了安徽數字化農村農業的發展水平;但同時其在數字資源體系建設的基礎數據方面和核心技術研究開發方面都面臨巨大挑戰和問題。丁靜[3](2017)從物聯網的角度出發,提出安徽省智慧農業在農產品加工流通應用方面的顯著成效,保證農產品“從產地到餐桌”的全程追溯,實現農產品流通過程的全紀錄,但是相應的在農產品流通的其他方面也有明顯缺陷,除去農業化規模和資金投入的不足,最主要的是農業信息化建設的不完善,進而導致對農戶及時、全面、準確的獲取相關農業信息來直到農業生產的進程。
其次,在得出以上待解決問題后,需要分析影響中國農業收益的主要因素,在保證信息流通性的前提下保證流通數據的有效性和可用性。在該問題的研究中,楊根全等[4](2010)等通過文字調查分析,針對農產品價格市場中常見的連鎖效應,將影響農產品的因素分為供求因素、貨幣因素、國際因素、政策因素和市場因素五個方面,并綜合分析提出:農產品供求基本面短期內不會發生大的改變,但是農產品的生產成本和各種政策力度的加強也會加劇農產品的價格波動。許世衛等[5](2012)相較于前者,附加了價格信息傳遞和發布機制的影響,在很大程度上,由于信息不對稱和價格傳導的阻滯現象導致的農產品價格體系紊亂也在影響著農產品的價格大幅波動。
三、基于遞歸特征選擇法的影響因素選擇
(一)研究思路
根據上述由遞歸特征選擇篩選得到的五個因素,首先利用農田每畝產值合計代表農產品市場收入值,其次尋找可能對每畝產值合計值產生影響的因素,并將其分為供求因素、貨幣因素、國際因素、政策因素、市場因素五個方面,根據中國農業部、國家林業局、中國國家統計局、水利部、中國氣象局、中國海關等公布的數據,共確定影響因素16個。
(二)研究結果
從上述幾個方向出發,為保證后續研究的高效性,對于確定的影響因素使用遞歸特征選擇法行降維篩選,代碼中對應no_features定為5,即篩選對每畝產值合計值影響最大的前五位因素,其對應篩選結果如下表所示。
四、基于ARIMA—BP神經網絡對農產品市場發展進行預測
(一) 研究方法
1.單位根檢驗
原始數據皆是非平穩的時間序列數據,在對數據進行二階差分后,使用 Eviews創建一個ARIMA模型,對糧食產量x1、農產品綜合市場數量x2、貨幣與存款x3、職工平均工資x4、農業各稅x5這5個變量以及農田每畝凈收益y進行單位根檢驗,驗證序列是否平穩,能否達到建立ARIMA模型的建模前提。
由表1顯示的數據可知,這6個序列在 5%的置信水平下它們各自的ADF統計量的值均小于其所對應的臨界值,且P值也都小于0.05,充分說明了所選取的6個指標所對應的時間序列中無單位根,即進行檢驗的各個原始序列的數據都是平穩的,符合ARIMA模型建立的條件,因此可以進一步進行建模和分析。
2.ARIMA模型構建
在對農田每畝收益進行BP神經網絡預測時,需要對各個輸入數據變量進行預測,各個輸入變量均需要考慮時序性,故采用時間序列ARIMA模型進行預測,構建ARIMA(p,d,q)模型如下:
其中L是滯后算子,d∈Z, d>0。
3.BP神經網絡預測模型構建
我們運用預測出來的影響因素來對進行BP神經網絡的預測[6],BP神經網絡模型的拓撲結構如下,包括三個主要部分:輸入層,隱藏層,輸出層。
根據上述分析,本問題選用xj影響因素的值為輸入層,以yi農田每畝收益作為輸出層,建立如下模型:
其中,x1,x2,… ,xn為輸入層信號,wi1,wi2,… ,win為神經元i的權值,ui為上述線性組合結果,θi為閾值,φ(·)為激活函數,yi為神經元的輸出。
(二)結果分析
對影響因素x1的原始數據進行一階差分運算,并對運算后的時間序列的繪制自相關圖和偏制相關圖,觀察發現其自相關系數和偏自相關系數均呈現拖尾的狀態。
根據Box-Jenkins模型識別方法,應該用ARMA(p,q)模型進行擬合。通過重復實驗,綜合每個模型最大滯后變量對應的系數顯著性,以及最小的AIC,SC,HQ信息準則,判斷的模型應選擇ARMA(2,1)。
其余變量的操作類似,預測得到結果見表3。
本部分以糧食產量x1、農產品綜合市場數量x2、貨幣與存款x3、職工平均工資x4、農業各稅x5對應數據為輸入層,對農田每畝產值y進行BP神經網絡訓練預測,以2003年—2014年的農田每畝產值為訓練數據,2015年—2018年的農田每畝產值為測試數據,建立五輸入一輸出的BP神經網絡模型。
1.誤差分析
我們對BP神經網絡擬合出來的模型進行誤差分析,看模型的擬合效果如何,預測結果是否較為準確,對預測農田每畝凈收益的BP神經網絡模型的誤差分析結果如下:
2.預測結果
根據上述模型訓練結果,預測得到2019-2022年間農田每畝產值合計為
根據上述BP神經網絡對農田每畝產值的預測結果可以分析得到,自2019年后的至少四年內,農田每畝產值基本不發生改變,在生產的人力和物力成本不斷上漲的情況下,如果不能及時尋找解決辦法,中國農產品市場短時間內將呈現低迷狀態。
五、建議
政府近幾年應格外注意農業補貼政策的執行和落實,同時積極投入資金完善智慧農業的信息流通體系,保證農戶能夠第一時間準確收獲市場信;可與科學院等機構合作,保證省市智慧農業建設的科學性,保證技術的專業性和執行的高效性。
各農戶應密切關注政府或各類權威組織發布的消息,以保證信息流通性。其中應該主要關注糧食產量、農產品綜合市場數量、貨幣與存款、職工平均工資、農業各稅五個方面。
參考文獻:
[1]孫忠富,杜克明,鄭飛翔,尹首一.大數據在智慧農業中研究與應用展望[J].中國農業科技導報,2013,15(06):63-71.
[2]張樂樂,陳翔,王韋韋,李金才.安徽省智慧農業發展現狀及對策[J].現代農業科技,2021(10):243-245.
[3]丁靜.物聯網視閾下安徽省智慧農業的發展研究[J].重慶科技學院學報(社會科學版),2017(06):44-47.
[4]楊根全,李圣軍.農產品價格波動的影響因素及發展趨勢[J].農業展望,2011,7(02):24-27+37.
[5]許世衛,李哲敏,孔繁濤,董曉霞,崔利國,任育鋒.農產品價格傳導機制及其主要影響因素分析[J].中國科技論壇,2012(09):71-76.
[6]焦淑華,夏冰,徐海靜,劉瑩.BP神經網絡預測的MATLAB實現[J].哈爾濱金融高等??茖W校學報,2009(01):55-56.
基金項目:
本文屬安徽財經大學大學生創新創業訓練計劃項目《大數據與智慧農業發展現狀及潛力的調查研究——以安徽省為例》(編號:S202010378502)研究成果。
作者簡介:
徐鑫鑫(2000-), 女,漢族,山東德州人,單位:安徽財經大學統計與應用數學學院,2018級本科生,研究方向:數據科學與大數據技術。
胡玉璐(2001-),女,漢族,安徽銅陵人 單位:安徽財經大學國際經濟貿易學院,2019級本科生,研究方向:國際經濟與貿易。
姚治林(2001-),女,漢族,安徽銅陵人 單位:安徽財經大學法學院,2019級本科生,研究方向:法學。