999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習LSTM 多模型的湖南農業產量預測研究

2023-12-16 07:28:40李森林馬竹根
懷化學院學報 2023年5期
關鍵詞:記憶產量模型

李森林, 唐 波, 馬竹根, 印 東

(懷化學院,湖南 懷化 418008)

湖南省地處我國中部,特殊的地理位置和環境使得其農業的發展對我國農產品產量供給的作用非常重要[1]。農產品產量預測一直是農業科技研究的重要方向和熱點問題。傳統的農產品產量預測方法存在預測精度低、易受人為因素影響等問題,如著名反饋網絡(Back Propagation,BP)預測模型[2],盡管能擬合輸入和輸出變量之間復雜的非線性關系,但由于BP 算法是一種局部搜索的優化方法,在訓練中易陷入局部極值,使訓練失敗。近年來,隨著深度學習技術的快速發展,基于深度學習的時間序列數據預測方法表現優異,尤其長短期記憶網絡(Long Short-term Memory,LSTM)模型作為一種善于處理長期依賴性的循環神經網絡,已經廣泛應用于金融、氣象、交通、能源、農業等領域,取得了很好的預測效果[3-5]。為此,我們提出了基于深度學習LSTM 的湖南農產品產量預測模型。

本文的研究目的如下:第一,研究人工神經網絡(Artificial Neural Network,ANN)模型是否能夠有效預測典型氣候條件下湖南農產品產量;第二,建立湖南農產品的LSMT 預測模型;第三,評估LSTM 神經網絡模型相對于參數變化的性能;第四,比較LSTM 模型與BP 模型的有效性;第五,總結研究結果,指出研究的不足之處,提出未來的研究方向。

1 相關工作

時間序列數據預測模型一般以歷史數據為基礎,通過數學模型來預測未來的趨勢和變化,如移動平均法、回歸分析等。自從人工神經網絡出現以來,基于梯度下降算法的BP 神經網絡及其變體模型得到快速發展。例如,路思恒等[7]利用BP 神經網絡對云南省糧食產量進行預測,研究了不同的輸入特征、神經網絡結構和訓練方法對預測精度的影響;Kohzadi[8]比較了BP 神經網絡和時間序列模型在預測商品價格方面的性能。這些模型的應用需要工作人員具有一定領域的專業知識,進行數據特征提取,參數配置等,因此模型的推廣和應用并不容易。Hochreiter 等[9]于1997 年提出深度學習循序模型,基本思想是通過引入記憶單元來捕捉時間序列數據中的長期依賴關系。之后,LSTM模型在結構和訓練方法上被不斷改進和拓展。例如,Gers 等[10]在2002 年提出了帶“忘記門”的LSTM模型,用于消除過去信息對當前預測的干擾;Sunny 等人在使用雙向LSTM模型,用于對時間序列金融數據進行雙向建模[11]。這些應用表明了LSTM 模型在時間序列預測中的廣泛適用性和優越性。然而,目前的研究大多集中在某一種農產品上,對于多種農產品的預測研究仍然較少,同時,模型的優化和改進仍然是一個值得研究的問題。

2 方法

本部分首先簡要敘述人工神經網絡基本模型,然后重點闡述使用的深度學習LSTM模型和評估指標,最后給出基于LSTM模型的預測流程。

2.1 人工神經網絡

人工神經網絡是一種模擬人類神經系統的計算模型,由多個神經元(節點)組成,通過神經元之間的連接和傳遞信息來實現對數據的學習和處理。BP 人工神經網絡至少需要3 層:輸入層、隱藏層和輸出層,如圖1 所示。輸入層和輸出層分別包含對應于輸入和輸出變量的節點。數據通過加權在層之間移動連接。1 個節點接受來自上1 層的數據,所有輸入的加權和ti計算公式為

圖1 3 層神經網絡

其中n是輸入的數量,wij是節點i和j之間連接的權重,x是來自節點j的輸入值。然后對加權值ti應用激活函數來計算節點輸出Oi

隱藏層和輸出層最常用的激活函數是Sigmoid 函數,而輸入層通常使用線性激活函數。隱藏節點的數量決定了輸入和輸出之間的連接數量。

2.2 LSTM 模型

循環神經網絡(Recurrent Neural Network,RNN)模型是一種深度的遞歸神經網絡模型,LSTM是RNN的一個變體。Hochreiter[9]于2011 利用LSTM模型解決了RNN 模型隨著網絡層數的增加和迭代次數的增加,后續節點會逐漸忘記之前的信息,導致梯度遞減或梯度爆炸問題。

LSTM模型將信息存儲在一個個記憶細胞中,不同隱藏層的記憶細胞之間通過少量線性交互形成1條傳送帶,實現信息的流動。圖2 顯示LSTM 模型引入了一種“門”的結構,用來新增或刪除記憶細胞中的信息,控制信息的流動內存單元專門用于保存歷史信息。其中,Ft是遺忘門,負責遺忘記憶單元Ht-1中多少記憶得以保存,其計算公式為:

圖2 LSTM 單元

It為輸入門,主要選擇需要流入當前記憶細胞的信息,其計算公式為:

Qt為輸出門,主要選擇需要流入隱藏狀態的記憶信息,其計算公式為:

Ct為當前記憶細胞,由候選記憶細胞及上一時間步記憶細胞組合而來,其計算公式為:

Ht為當前時刻的輸出,是通過輸出門更新當前的記憶細胞得到的,其計算公式為:

2.3 模型性能評估指標

為了證明所提出的湖南農產品預測模型的有效性,本文使用了3 種常用的統計指標,即相關系數(Correlation Coefficient,R)、平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE),來綜合評估預測性能。R的值在0 和1 之間,其值越接近于1,性能越好。MAE和RMSE的值越接近于0,其精度越高。R、MAE和RMSE的計算公式如下:

上述公式中,n表示待評估樣本的總數;yi和是觀察值和預測值;和分別是測量的時間序列均值和預測的時間序列均值。

3 實例研究

3.1 概要

本文旨在研究基于LSTM 模型的農產品產量預測方法,圖3 顯示了其主要研究內容,包括構建LSTM模型、獲取和預處理數據、模型訓練和預測、分析等。具體方法為:第一,從氣象網和統計年鑒中獲取了歷史的氣象數據和農產品產量數據,包括不同品種的年度產量情況;第二,數據預處理包括特征提取、數據清洗、歸一化等;第三,數據集劃分為訓練集和測試集,其中訓練集為前n年的數據,測試集為后m年的數據;第四,基于Keras 平臺構建了LSTM 模型,包括輸入層、LSTM 層、全連接層和輸出層等。訓練時,模型采用Adam 優化器和均方誤差損失函數。測試階段,測試集輸入到模型中得到預測結果。

圖3 預測模型示意圖

3.2 數據采集與處理

數據取自于2021 年湖南統計年鑒(http://222.240.193.190/2021tjnj/indexch.htm)。我們主要針對油料、糧食和棉花3 種農產品的產量開展研究。首先我們獲取了與農業產量有關的因素,如有效灌溉面積、用電量和機械總動力數據。我們對數據集進行預處理操作,與其他數據集一樣,數據集也存在缺失值,常用的缺失值填充方法有均值填充、線性插補和最近鄰插補等方法。在此,我們使用了如下2 種方法,第一,極個別數據的缺失用線性插值補全;第二,數據塊缺失補全使用了線性插值加隨機擾動相結合,這是因為在對無缺失變量分析時,我們發現數據具有近似線性的特征。然后,我們使用sklearn.preprocessing包中LabelEncoder方法將字符串類型的農產品種類列轉換為數值,并在用于模型之前,完成最大最小數據標準化縮放。為了避免異常值的影響,采用了4 分位間距構建箱形圖來檢測異常點和修正。最后我們對數據集按照8∶1∶1 的比例分為訓練數據塊、驗證塊和測試塊,分別用于模型的訓練、驗證和測試。

我們需要認真考慮輸入何種變量,這是因為輸入變量的組合對模型性能的影響取決于在多大程度上利用相關信息和去除冗余信息。選擇的變量過少可能出現多擬合,從而導致模型沒有足夠的輸入信息來做出令人滿意的預測;而使用所有變量或過多的變量往往會導致欠擬合,同樣結果不理想,這2 種情況都會導致模型性能下降。由于我們使用了相對復雜的LSMT模型,這需要一定數量的數據集用于訓練提高精度,為此我們完成了盡量多農產品數據的爬取。

3.3 模型開發和模型參數配置

選擇適合的模型對數據進行訓練,訓練集用于模型的訓練,驗證集用于模型的選擇和調參,測試集用于評估模型的性能。

本文基于湖南農業數據,創建基于LSTM的3 種時間序列預測模型和BP模型,包括單層LSTM 模型(S_L)、堆疊LSTM 模型(D_L)、雙向LSMT 模型(B_L)和BP模型(BP)。

我們給出第2 種堆疊模型的基本配置,如表1 所示,模型包括2 層LSTM、2 層Dropout 和1 層Dense,參數總計為7 2651 個。

表1 模型參數

本節詳細分析和討論模型的預測性能。表2 顯示了4 種結構的性能指標,結果表明單層LSTM模型性能較好,其次是BP網絡,D_L和B_L模型。這說明模型性能并不總與其復雜性成正相關關系,也與數據特性、參數選擇等相關。

表2 不同模型的性能指標

為了驗證提出各種LSTM預測模型的有效性,在實例中我們預測所選的3 種農產品的產量,可視化了數據預測的結果如圖4—7 所示。

圖4 堆疊LSTM 模型農產品模型預測與實際值變化

圖5 單層LSTM 模型農產品模型預測與實際值變化曲線

圖6 雙向LSTM 模型農產品模型預測與實際值變化曲線

圖7 BP 模型農產品模型預測與實際值變化曲線

4 種模型預測結果圖表明,第一,這些模型在現有數據集上的預測效果都很好;第二,堆疊或雙向的復雜LSTM模型相對于簡單的單層LSTM模型,在預測精度和泛化能力上差別并不明顯;第三,傳統淺層BP 模型與深度神經網絡LSTM 模型相比,性能并不差,甚至更好。這都進一步驗證了模型精度不只與復雜度有關,更與數據直接相關。

我們基于湖南農產品構建了3 種LSTM 模型和1 個BP 模型,并對3 種農產品產量進行了預測。實驗結果表明,3 種LSTM 模型和BP 模型都得到了較為準確的預測結果。因此,這些模型可以用于有限數據集上的其他預測問題。在實驗過程中,我們發現模型參數、模型結構與性能有關,合理調整這些參數同樣重要,數據量多少非常重要。為此,我們將進一步獲取農產品如農林牧副漁、各種水果、蔬菜等種類,從而增加數據量,深入研究深度LSTM神經網絡的在農業領域的應用。

猜你喜歡
記憶產量模型
一半模型
2022年11月份我國鋅產量同比增長2.9% 鉛產量同比增長5.6%
今年前7個月北海道魚糜產量同比減少37%
當代水產(2021年10期)2021-12-05 16:31:48
重要模型『一線三等角』
海水稻產量測評平均產量逐年遞增
今日農業(2020年20期)2020-11-26 06:09:10
重尾非線性自回歸模型自加權M-估計的漸近分布
2018上半年我國PVC產量數據
聚氯乙烯(2018年9期)2018-02-18 01:11:34
記憶中的他們
3D打印中的模型分割與打包
兒時的記憶(四)
主站蜘蛛池模板: 国产9191精品免费观看| 尤物精品视频一区二区三区 | 尤物精品国产福利网站| 99热最新网址| 亚洲日韩AV无码一区二区三区人| 亚洲欧洲日韩久久狠狠爱| 一本久道久综合久久鬼色| 国产综合在线观看视频| 国产免费人成视频网| 麻豆国产在线观看一区二区| 毛片一级在线| 久久综合AV免费观看| 青青极品在线| 五月天在线网站| 亚洲经典在线中文字幕| 国产欧美日韩资源在线观看| 欧美日韩国产系列在线观看| 精久久久久无码区中文字幕| 国产精品手机在线播放| 久久一本精品久久久ー99| 小说区 亚洲 自拍 另类| 亚洲综合九九| 国外欧美一区另类中文字幕| 国产高清不卡视频| 国产综合精品日本亚洲777| 国产特级毛片| 中文字幕无码av专区久久| 亚洲爱婷婷色69堂| 伊人网址在线| 欧美h在线观看| 欧美天天干| 中国一级特黄视频| 国产成+人+综合+亚洲欧美| 视频国产精品丝袜第一页| 深夜福利视频一区二区| 国产成人精品高清不卡在线 | 久久亚洲中文字幕精品一区| 国产日本欧美在线观看| 亚洲欧美另类专区| 色网站免费在线观看| 久久伊人色| 亚洲免费福利视频| 中文字幕首页系列人妻| 热久久综合这里只有精品电影| 欧洲熟妇精品视频| 伊人婷婷色香五月综合缴缴情| 亚洲第一页在线观看| 日本在线国产| 国产视频只有无码精品| 精品一区二区三区视频免费观看| 手机在线免费不卡一区二| 色婷婷在线播放| 精品福利视频网| 久久性妇女精品免费| 亚洲男人天堂2018| 91丝袜乱伦| 亚洲一区毛片| 国产99精品视频| 国产又爽又黄无遮挡免费观看| 国产乱子伦精品视频| 国产精品美女在线| 2020亚洲精品无码| 欧美精品H在线播放| 三区在线视频| 久久综合丝袜日本网| 亚洲欧美日本国产专区一区| 丁香综合在线| 精品国产乱码久久久久久一区二区| 亚洲女同欧美在线| 亚洲中文久久精品无玛| 亚洲成aⅴ人在线观看| 欧美不卡视频一区发布| 欧美日韩国产成人在线观看| 久久99国产精品成人欧美| 国产黑丝视频在线观看| 一级毛片不卡片免费观看| 国产福利一区二区在线观看| 亚洲 欧美 偷自乱 图片| 在线国产欧美| 午夜电影在线观看国产1区| 亚洲床戏一区| 色综合手机在线|