999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林與長短期記憶網絡結合的藍莓黑腹果蠅發生預測

2024-09-22 00:00:00高馳涵張梅陳哲張群英伍俊舟
山東農業科學 2024年8期

摘要:黑腹果蠅侵害嚴重影響藍莓產量,現已成為遏制貴州省藍莓產業發展的主要原因之一,快速、準確預測黑腹果蠅發生有利于及時采取防控措施,但目前對藍莓園黑腹果蠅發生預測的研究尚少。為此,本研究提出了一種藍莓黑腹果蠅發生預測模型。首先,利用Pearson相關系數分析溫度、濕度、風速等相關氣候特征指標與黑腹果蠅發生的相關性:然后,利用隨機森林算法選出影響黑腹果蠅發生的重要氣候特征指標:最后,提出一種隨機森林和長短期記憶網絡相結合的蟲害預測模型。將該模型與其他傳統模型的預測效果進行對比,結果表明其在預測黑腹果蠅發生方面表現出良好的性能,均方根誤差為2.120 3,平均絕對誤差為1.865 9,決定系數為0.979 5。本研究結果可為預測黑腹果蠅發生并及時采取相應防治策略提供技術支持。

關鍵詞:黑腹果蠅:藍莓:蟲害發生預測:隨機森林:長短期記憶網絡:Pearson相關系數:氣候特征

中圖分類號:S126:S436.63 文獻標識號:A 文章編號:1001-4942(2024) 08-0158-07

近年來貴州省藍莓產業發展迅速,栽培面積和產量均居全國首位,為貴州省帶來了巨大的經濟效益。但隨著栽培時間的延長和栽培面積的擴大,藍莓病蟲害的發生越來越嚴重,貴州省藍莓園的害蟲種類多達11種,其中黑腹果蠅(Drosophilamelanogaster)是較為嚴重的害蟲之一。黑腹果蠅的生長發育與氣候條件密切相關,研究表明,16-29℃是其生長發育的最佳溫度區間,當溫度超出這個范圍時,它的壽命會顯著減短,在12℃以下或32.5℃以上幾乎不可能生長發育:另外,溫度對其成蟲體型也有顯著影響。研究人員還發現濕度對果蠅的生長發育也起著至關重要的作用,日平均濕度與其種群增長之間存在很強的正相關關系,在200%- 94%的相對濕度范圍內,濕度越高,成蟲的產卵量和壽命增加越顯著。因此,溫度和濕度可作為預測果蠅發生的基礎氣候條件。明確影響黑腹果蠅發生的主要氣候條件,對于建立氣候條件一蟲害發生預測模型并提高預測準確性具有重要意義。

數據處理和分析工具的優劣影響著蟲情預測的準確率,隨著大數據和人工智能的快速發展,機器學習方法已被廣泛應用于蟲害預測。早在20世紀初,Chon等就利用反向傳播神經網絡(Back Propagation Neural Network,BPNN)建立了農業害蟲分類的預測模型;后來,Shang等將遺傳算法(Genetic Algorithm,GA)與BPNN相結合,提升了蟲害預測的準確性。近年來,研究者們在蟲害預測方面做了大量工作,并提出了多種預測模型,包括廣義回歸神經網絡(GeneralizedRegression Neural Network,GRNN)、模糊神經網絡(Fuzzy Neural Network,FNN)、支持向量回歸(Support Vector Regression.SVR)、卷積神經網絡(Convolutional Neural Network,CNN) 等。Li等提出了一種基于深度學習技術的自動檢測方法,能夠實時監測、識別不同種類的田間害蟲,具備較高的識別和定位準確性。Li等開發了具有密度圖的多分支卷積神經網絡(Multi-branch Convolutional Neural Network,Mb-CNN)用于蚜蟲數量估計,可以提高蚜蟲在密集分布區域和重疊區域的計數精度。Xie等利用無監督特征學習方法從大量未標記的圖像塊中提取蟲害圖像的特征,優化了大多數分類方法中依賴手工提取特征的過程。

利用機器學習方法預測蟲害的發生需要大量數據作為基礎,而與農業環境監測技術相結合可為蟲害預測提供更豐富的數據源。Xiao等在2019年利用Apriori算法發現了天氣因素與棉花害蟲發生之間的關聯規則,并基于此建立了一個基于長短期記憶網絡(Long Short-Terrn Memory,LSTM)的蟲害暴發預測模型,用該模型準確地預測了未來一段時間內蟲害發生的嚴重程度;之后,Chen等使用雙向長短期記憶網絡(Bidirection-al Long Short-Term Memory,Bi-LSTM)來捕捉雙向信息流,可更好地了解時間序列數據的相關性,且基于Bi-LSTM的氣候和大氣環流預測模型能夠有效地預測害蟲的發生率。

目前關于貴州省藍莓園黑腹果蠅發生預測的研究較少,在前人研究的基礎上,本研究首先通過Pearson相關系數和隨機森林(Random Forest,RF)算法選出影響黑腹果蠅發生的重要氣候特征,然后提出一種基于LSTM網絡的藍莓黑腹果蠅發生預測模型,以期為貴州地區藍莓園及時監測、防控黑腹果蠅發生提供技術支持。

1 材料與方法

1.1 數據來源

1.1.1 氣候特征相關數據

本研究所用氣候數據來自天氣預報網站(http://www. wunderground.com/),該網站提供溫度、濕度、風速和降水量等相關歷史和最新數據。本研究選用貴州省黔東南地區2022年6月初-9月底的歷史氣候數據,經相應處理后將原始數據轉換為每天的最高、最低和平均值,具體見表1。

1.1.2 黑腹果蠅發生數量調查

黑腹果蠅發生數量的調查地點為貴州省黔東南宣威鎮藍莓種植園,調查時間為2022年6月初-9月底。調查期間,在藍莓植株枝條中間離地面1.2 m處懸掛1張黃色的粘蟲板,兩張粘蟲板間距2m,10張為一組,每7天統計一次粘蟲板誘捕到的黑腹果蠅數量,并及時更換新的粘蟲板。統計結果(圖1)顯示,調查藍莓園的黑腹果蠅發生數量呈現出先增加后減少的趨勢,即6月下旬隨著藍莓進入開花期,黑腹果蠅數量逐漸增加,7月下旬進入結果期后數量迅速增加,在8月初達到峰值,之后黑腹果蠅數量逐漸減少。

1.2 氣候特征指標選擇

1.2.1 Pearson相關分析

氣候特征與植物病蟲害發生間存在著一定的關系。Pearson相關系數通常被用于分析兩個連續變量之間的關系,其計算公式見式(1)。本研究首先采用Pearson相關系數來衡量各氣候特征指標與黑腹果蠅發生數量之間的線性關系。

其中,xij是第i天第i個輸入特征的值;xj是第j個輸入特征的平均值;Yi是第i天的黑腹果蠅數量;y是黑腹果蠅數量的平均值;Pi取值范圍為[-1,1]。

1.2.2 應用RF算法篩選重要氣候特征指標

相關性分析對于評估變量之間的線性關系是有效的,然而當變量之間存在非線性關系時,其有效性會顯著降低。因此,本研究應用RF算法進一步分析各氣候特征指標對黑腹果蠅發生的影響程度,并篩選出影響顯著的指標。

RF是一種利用決策樹作為集成學習基礎模型的機器學習算法,具有很高的魯棒性,對噪聲數據和異常值不敏感,具有強大的復雜多維特征分析能力。用RF評估特征重要性的標準是準確度的平均降低(Mean Decrease Accuracy,MDA),基本思想是使用噪聲數據來替換與特定特征相對應的樣本數據,并用袋外(Out of Bag,OOB)數據(決策樹構建中未使用的數據)計算預測誤差。特征在模型構建中的重要性越高,用噪聲數據替換特征后預測誤差的增加就越大。使用RF評估特征重要性的具體步驟:

①應用自舉采樣方法,通過對原始樣本集進行重新采樣來生成n個新的樣本集,每個樣本集用于訓練決策樹Tb,并將對應的OOB數據表示為LbOOB;

②使用決策樹Tb對OOB數據進行預測,并將預測誤差記錄為EOOB;

③將OOB數據中的特征xi(i=l,2,…,m,其中m是特征總數)替換為噪聲,然后使用Tb對修改后的OOB數據進行預測,并將所得到的預測誤差表示為Eri OOB。特征xi的重要性計算如下:

本研究使用RF算法計算出每個氣候特征指標的重要性度量EMDA,然后按降序對其進行排序,選出排名前50%的氣候特征指標構建特征變量子集,用于建立預測模型。

1.3 RF-LSTM模型構建

LSTM是一種特殊類型的遞歸神經網絡(Re-current Neural Network,RNN)結構,由Hochreiter和Schmidhuber于1997年首次提出。LSTM結合了存儲單元和門機制,能夠更有效地捕獲和處理時間序列數據中的長期依賴關系。LSTM單元的核心組成部分是細胞單元狀態,它可以在不同的時間步長上攜帶信息。在每個時間步長,LSTM通過遺忘門(Forget gate)、輸入門(lnput gate)和輸出門(Output gate)三種門機制控制信息流。LSTM的結構單元如圖2所示。

遺忘門負責決定從細胞狀態中丟棄哪些信息,該過程將前一個時間步長(或輸入)的隱藏狀態與當前時間步長的遺忘門權重相乘,通過Sig-moid函數得到結果:

ft=σ(Wf·[ht-1,xt]+bf)。(3)

輸入門確定哪些新信息應該被添加到細胞單元狀態,使用Sigmoid函數來確定應該更新哪些信息:

it=σ(Wi`[ht-1,xt]+bi);(4)

并使用tanh函數來計算新的候選值:

Ct =tanh(Wc·[ht-1,xt]+bc);(5)

然后,遺忘門的輸出與上一個時間步長的細胞單元狀態相乘,輸入門的輸出與新的候選值相乘,兩者相加的結果為當前時間步長的細胞單元狀態:

Ct=ft·Ct-1+it·Ct。(6)

輸出門確定在當前時間步長應該輸出什么信息,使用Sigmoid函數來確定應該輸出細胞狀態的哪些部分:

Ot=σ(Wo·[ht-1,xt]+bo);(7)

并使用tanh函數縮放細胞單元狀態:

ht=Ot·tanh(Ct)。(8)

式中,ft、it、Ot分別是遺忘門、輸入門、輸出門的輸出問題;xt表示輸入序列;σ是Sigmoid函數;tanh是雙曲正切函數;Wf、Wi、Wo和WO分別是與遺忘門、輸入門、當前時間步長的候選細胞狀態和輸出門相對應的權重矩陣;bf、bi、bc和bo分別是遺忘門、輸入門、當前時間步長的候選細胞狀態和輸出門的偏置向量;Ct表示當前時間步長的候選細胞狀態;Ct-1和ht-1分別表示前一時間步長的細胞狀態和輸出向量;Ct和ht分別表示當前時間步長的細胞狀態和輸出向量。

RF-LSTM首先通過RF評估各個輸入特征的重要性,從而選出重要特征,構建最具預測能力的特征子集,以降低過擬合風險,提高模型的解釋性:然后將挑選出的特征輸入到LSTM中,以捕獲其中的復雜關系,達到預測蟲害發生的目的。因此,RF-LSTM模型既能充分利用RF的特征選擇能力,又能充分發揮LSTM在蟲害預測建模方面的優勢,在保留關鍵信息的同時提高預測的準確性和穩定性,從而實現更高水平的預測性能。

RF-LSTM預測模型的工作流程如圖3所示。使用Pearson相關系數分析計算氣候特征指標與蟲害數據之間的相關性后,使用RF算法通過特征重要性排序選出影響蟲害發生的重要氣候特征指標:然后對預處理后的氣候特征指標和蟲害數據進行數據分析,包括去除異常值、插補缺失值、標準化和歸一化過程:將處理后的數據分為訓練集和測試集,使用訓練集對LSTM模型進行訓練,訓練完畢就可以使用測試集預測害蟲的發生,而預測結果又會被反饋到模型評估過程中,用于模型的改進。

1.4 模型性能評估指標

為了有效地評估預測模型的性能,選擇機器學習回歸算法預測中常見的三種評估指標:決定系數(R2)、均方根誤差(RMSE)、平均絕對誤差(MAE)。公式如下:

其中,fi是i預測節點預測值;yi是i預測節點的實際值;yi是實際值的平均值;RMSE表示RMSE;MAE表示MAE。

2 結果與分析

2.1 LSTM網絡參數的設置

為了測試所提出模型的準確性和泛化能力,隨機選擇數據集中70%的數據來訓練LSTM網絡并確定網絡參數。首先將LSTM中隱藏單元的數量、全連接通道的數量均設為1,進行網絡初始化。然后進行如下實驗:

(1)分別設置隱藏單元數為4、8、16、32,比較隱藏單元數量不同時的模型預測性能。如表2所示,當隱藏單元數為16時,模型表現最好,R2最高,而RMSE和MAE最低:而設置更多的隱藏層并不總能帶來更好的性能,這可能是因為更多的隱藏層會導致結果不穩定。因此,在下面的實驗中將隱藏單元的數量設置為16。

(2)在上一步實驗的基礎上,分別設置全連接通道數為1、2、3,比較全連接通道數量不同時的模型預測性能。如表3所示,隨著全連接通道數的增加,模型的預測誤差增加,模型擬合度降低,當全連接通道數為1時模型表現最好。這可能是因為全連接層的通道數多會導致由于數據集有限而造成的對較大權重的訓練不足。因此,在下面的實驗中將全連接通道的數量設置為1。

(3)在確定上述兩個參數后,調整其他參數:學習率(learningrate)設置為0.001,批量大小(batch size)設置為32,丟棄率(dropout rate)設置為0.1。在網絡訓練過程中,使用Adam算法更新所提出的深層結構中的網絡。

2.2 與黑腹果蠅發生相關的重要氣候特征選擇

本研究使用Pearson相關系數和RF算法對氣候特征指標進行了冗余特征篩選。Pearson相關分析結果如表4所示,可見,有關溫度、露點溫度的特征指標與黑腹果蠅發生均呈中等相關關系,夜間相對濕度、最大風速、平均濕度則呈弱相關關系,其余特征呈微弱相關或無相關關系。

進一步通過RF算法對氣候特征指標的重要性進行排序,將決策樹的數量設置為20,最小葉大小設置為5,所得重要性排序結果如圖4所示。可以看出,排名前6的特征分別為maxT、RH2、meanT、minDP、meanDP、minWS,表明這些氣候特征指標能夠顯著影響黑腹果蠅的發生,特別是日最高溫度(maxT),其重要性位列第一,說明其可能是影響黑腹果蠅發生的主導因素。

RF的優勢在于其對異常值和缺失值的魯棒性,以及處理高維數據和非線性關系的能力,這可以補充Pearson相關分析的局限性。綜合兩種方法的結果,我們選取特征重要性排名前6的氣候特征指標作為輸入特征。

2.3 RF-LSTM模型性能評價

2.3.1 RF-LSTM模型預測結果

用測試集樣本驗證RF-LSTM模型預測性能,結果如圖5所示,預測值曲線可以很好地對真實值曲線進行擬合,最高誤差保持在個位數以內,達到了預期的精度。

2.3.2 RF-LSTM與其他模型的對比分析

與原始LSTM模型相比,改進后的RF-LSTM模型在3個評估指標上都表現出更優的結果,且模型訓練時間縮短1.568 s(表5)。表明本研究提出的RF -LSTM模型在預測藍莓園黑腹果蠅發生方面更可行、有效。

將RF-LSTM與3種經典機器學習網絡模型(BPNN、SVR和CNN)的預測效果進行比較,結果見表6。其中3種經典模型的參數設置如下:對于BPNN,隱藏層數為8,學習率為0.01,誤差閾值為10-6:對于SVR,核函數選擇徑向基函數,gamma參數設置為0.8,懲罰因子設置為2.0;CNN由兩個連續的卷積池模塊和一個全連接層組成,兩個卷積層的核大小均為3xl,激活函數使用ReLU函數。可以看出,本研究提出的RF - LSTM模型的RMSE為2.120 3,MAE為1.865 9,R2為0.979 5,均明顯優于3種經典模型,表明本研究提出的預測模型對黑腹果蠅的發生具有較好的預測性能,可用于預測藍莓園黑腹果蠅的發生。

3 結論

本研究首先利用Pearson相關系數分析氣候特征指標與黑腹果蠅發生數量的相關性,然后用RF算法計算各指標的重要性并排序,選出對黑腹果蠅發生有重要影響的6個指標作為LSTM網絡的輸入特征,從而構建了藍莓園中黑腹果蠅發生的預測模型RF - LSTM。用測試集數據對模型的預測效果進行驗證,結果顯示其RMSE為2.120 3,MAE為1.865 9,R2為0.979 5,均優于LSTM、BPNN、SVR、CNN,表明該模型具有優越的預測性能,可以根據氣候特征預測藍莓園黑腹果蠅的發生,有助于農戶及時采取防控措施,保護藍莓生產。

黑腹果蠅的發生受到多種因素的影響,但本研究僅考慮了氣候因素,這使得黑腹果蠅發生的數據集輸入特征不夠全面。在今后的研究中,我們將進一步豐富數據集涵蓋的信息,如病蟲害發生周期等,優化預測模型,提高預測的準確性,以更好地為及時制定病蟲害防治策略提供技術支撐。

基金項目:國家自然科學基金項目(62003106);貴州省科技支撐計劃項目(黔科合支撐[2022]一般133);貴州省科學技術基金項目(黔科合基礎-ZK[2021] 一般321)

主站蜘蛛池模板: 精品少妇人妻一区二区| 亚洲中文无码av永久伊人| 97视频精品全国免费观看| 国产精品不卡片视频免费观看| 国产一级片网址| 亚洲欧美另类日本| 国产欧美日韩91| 香蕉久久国产超碰青草| 丝袜亚洲综合| 国产swag在线观看| 精品国产香蕉在线播出| 亚洲欧洲免费视频| 欧美一级高清视频在线播放| 国产在线观看第二页| 国产成人精品视频一区二区电影| 日本一区二区不卡视频| 色妞永久免费视频| 欧美一道本| 午夜无码一区二区三区| 欧美97欧美综合色伦图| 不卡国产视频第一页| 亚洲成a人片| 亚洲AV无码久久天堂| 亚洲高清在线播放| 欧美区国产区| 久久久久国产一级毛片高清板| 国产精品9| 国产喷水视频| AV在线天堂进入| 一级毛片中文字幕| 日韩色图在线观看| 日韩成人在线一区二区| 99在线观看国产| 激情六月丁香婷婷| 欧美a网站| 国产中文在线亚洲精品官网| 国产精品手机视频| 国产亚洲精品yxsp| 亚洲无限乱码一二三四区| 免费a级毛片18以上观看精品| 日韩免费成人| 中文无码精品A∨在线观看不卡| 国产91精品久久| 国产精品免费电影| 欧美另类一区| 国产精品真实对白精彩久久| 一本无码在线观看| 波多野结衣一区二区三区四区| 欧美一区中文字幕| 国产91丝袜在线播放动漫 | 亚洲精品国产首次亮相| 国产精品福利导航| 国产精品乱偷免费视频| 亚洲综合天堂网| 欧美怡红院视频一区二区三区| 日韩高清中文字幕| 成·人免费午夜无码视频在线观看| 青青草国产精品久久久久| 青草91视频免费观看| 2020久久国产综合精品swag| 国产午夜人做人免费视频| 91人人妻人人做人人爽男同 | 蜜桃视频一区二区三区| 人人妻人人澡人人爽欧美一区| 人妻无码AⅤ中文字| 精品无码国产自产野外拍在线| 综合色88| 亚洲IV视频免费在线光看| 97国产精品视频自在拍| 亚洲精品大秀视频| 国产成人一区| 欧美日韩在线观看一区二区三区| 精品久久高清| 中文纯内无码H| 久久综合丝袜日本网| 一级香蕉人体视频| 制服丝袜国产精品| 免费精品一区二区h| 久久亚洲综合伊人| a天堂视频| 中文字幕在线观| 国产乱码精品一区二区三区中文|