劉庭洋,李 燁,浦仕磊,李志宇,李文靜,吳 奇,王云月
(云南農業大學植物保護學院/教育部生物多樣性與病害防控重點實驗室,云南 昆明 650201)
?
基于BP神經網絡的稻瘟病預測預報研究
劉庭洋,李 燁,浦仕磊,李志宇,李文靜,吳 奇,王云月*
(云南農業大學植物保護學院/教育部生物多樣性與病害防控重點實驗室,云南 昆明 650201)
【目的】稻瘟病是水稻主要病害之一,嚴重制約水稻高產穩產。近年來隨著品種布局、耕作制度改變及氣候變化的影響,其流行程度年度間波動很大。目前,稻瘟病在云南省各水稻產區呈現中等偏重發生的趨勢,預測預報作為指導防治的先行者,具有重要作用。【方法】為了及時有效的做好稻瘟病防范工作,本研究采用稻瘟病發生相關氣象因子及田間穗瘟病情指數,利用BP神經網絡技術,選取德宏州芒市為試驗點開展稻瘟病預測預報研究。【結果】從氣象因子與預測對象的相關性來看,篩選出來的各氣象因子與病情指數之間都存在較強的相關性,其理想輸出和實際輸出值都比較接近,誤差曲線也比較吻合,預測準確度能滿足實際需求。【結論】由此可見,BP神經網絡建立的稻瘟病中期預測模型更具有優勢。不需要事先進行數學公式表達,具有更高的預測準確度,選擇試驗點5-9月的氣象數據以及田間稻瘟病病情指數建立的預測預報模型,預測結果更為客觀和可靠,能及時做好稻瘟病的防控工作。
稻瘟病;BP神經網絡;預測預報
【研究意義】稻瘟病(Rice blast)是云南省水稻重要病害之一,居于三大水稻病害之首,近年來該病在云南省常年發生面積23.33萬hm2左右,約占水稻種植面積的24%,嚴重制約水稻高產穩產[1-2]。隨著品種布局、耕作制度改變及氣候變化的影響,其流行程度年度間波動很大。預測作為指導防治的先行者,其作用受到普遍關注。【前人研究進展】稻瘟病的發生受到寄主、環境、病源三因素相互作用并與各影響因子間是一種復雜的交互關系,具有非線性的特點,而BP神經網絡具有較好的解決非線性的能力,良好的運算效率,容錯性和適應性強等優點,擺脫了傳統測報方法的運算速度慢,準確率低等缺陷[3~10]。 【本研究切入點】本研究采用稻瘟病發生相關氣象因子(溫度、濕度、降雨量、日照時數)及田間穗瘟病情指數,利用BP神經網絡技術有效的預測稻瘟病發生趨勢和流行程度,【擬解決的關鍵問題】用以指導重災年份重點防控,抓住關鍵期及時用藥、統防統治,這樣不但可以節省人力、物力和財力,更可以減少濫用農藥所帶來的環境污染,無疑具有重要的經濟、生態效益[11-15]。
1.1 試驗點的選擇
本研究結合各地稻瘟病發生程度、發生面積、品種布局及氣候環境因素,選取單雙季秈稻區的德宏州芒市作為本研究的試驗點,該試驗點為云南省水稻種植的主產區,稻瘟病為當地水稻生產中的主要病害,且當地的氣候、水稻品種、病原菌以及栽培方式均有利于稻瘟病的發生,該地的稻瘟病發病較早。
1.2 數據收集
收集到本研究所需試驗點近10年(2002-2012)年的氣象資料,包括(均溫、濕度、降雨量、雨日、日照時數)以及往年稻瘟病發生情況(病情指數),該數據由芒市植保站提供。
為驗證模型有效性,參照稻瘟病測報調查規范(GB/T 15970-2009)對2012年的水稻稻瘟病病害發生情況進行田間調查。計算田間穗瘟病情指數。
1.3 預測因子篩選
利用SPSS軟件分析試驗點的氣象因子與水稻稻瘟病之間的相關性,篩選出建模所需數據。本研究采用逐步回歸分析方法,進行因子篩選。在SPSS中根據建立測報模型的需要,以篩選出對稻瘟病發病影響加大的因子和避免逐步回歸過程中過度擬合為目標,將F值設置為:F值<0.15的自變量進入回歸方程,而F值>0.18的自變量剔除,篩選出的顯著相關的氣象因子。
1.4 逐步回歸模型建立
在SPSS軟件中對氣象因子進行逐步回歸分析,然后篩選出影響主要發病的氣象因子,并建立逐步回歸預測模型。
所采用逐步回歸模型為y=b0p+b1px1+b2px2+…+bnpxp+εp。
1.5 BP神經網絡模型建立
在MATLAB軟件中選用traingd、raingdx、trainlm 3種訓練函數,將歸一化后的數據作為BP網絡的學習樣本,氣象因子作為學習樣本的輸入數據,病情指數是學習樣本的輸出數據。用threshold函數規定輸入向量的最大值和最小值在[0,1]范圍內,newff函數創建一個前向BP網絡。中間層神經元傳遞函數采用S型正切函數,相應的輸出層神經元傳遞函數采用S型對數函數。選取合適隱層神經元數目和訓練函數,訓練次數設置為100 000次,訓練目標誤差設置為0.0001,其他參數取默認值。對網絡進行訓練。以此來建立BP神經網絡模型。
1.6 數據檢驗
將芒市試驗點的歷史數據輸入到逐步回歸模型和BP神經網絡模型中,檢驗模型對歷史數據的預測準確度。
將2012年數據作為測試數據輸入模型,進行運算,得到稻瘟病當年病情指數的預測值,與實際病情指數進行比較,計算絕對誤差及預測準確度,評價模型的有效性。
2.1 SPSS統計篩選結果

表1 逐步回歸篩選出芒市氣象數據
經過SPSS軟件逐步回歸篩選后與芒市水稻稻瘟病發生程度相關的氣象因素有:5月上旬累計日照時數、6月中旬平均濕度、6月下旬平均濕度、7月中旬累計降雨量、7月下旬累計日照時數,其中(上、中、下旬均以10 d為準)等5個氣象因子(表1)。從氣象因子與預測對象的相關性來看,篩選出來的各氣象因子與病情指數之間都存在較強的相關性。
2.2 芒市逐步回歸模型建立
芒市水稻稻瘟病的逐步回歸預測模型為y=-236.717+0.466X1-1.441X2+3.788X3+0.075X4+0.508X5回歸方程相關系數R=1,顯著性檢驗F>100。回歸方程總體回歸R值和F值達到極顯著水平。
利用傳統回歸模型計算出預測值后與芒市的實際病情指數比較(表2),其中2005和2007年的回檢預測值與實際值存在一定的差距,且絕對誤差較大,由此可見傳統的回歸模型得出的預測結果還不是完全的精確。
2.3 芒市BP神經網絡的模型建立
將芒市(2002-2011)年氣象數據作為輸入訓練樣本,將(2002-2011)年的病情指數作為輸出訓練樣本,以此來建立BP神經網絡模型(表3)。
2.3.1 MATLAB歸一化結果 對芒市2002-2011年的數據進行不同函數、不同隱含層神經元數目進行訓練,所得結果都顯示traingd、traingdx、trainlm 3種訓練函數的神經網絡測報模型的隱層神經元數目分別在17、13、15個時,每種訓練函數的模型誤差最小,因此,芒市稻瘟病病害的3種訓練函數神經網絡測報模型的隱層神經元數目分別選擇17、13、15。學習率分別為0.162、0.208、0.243。
2.3.2 3種訓練函數建立的芒市稻瘟病BP神經網絡性能圖 網絡初始化后,traingd訓練函數建立的模型經過100 000次訓練后雖然網絡的性能沒有為0,但是輸出的均方誤差已經很小了,網絡的誤差平方和為0.000289,達到目標誤差的要求,網絡訓練的誤差平方和變化曲線如圖1。
traingdx訓練函數建立的模型經過190次訓練后網絡的誤差平方和為9.73e-05,達到目標誤差的要求,網絡訓練的誤差平方和變化曲線如圖2。
trainlm訓練函數建立的模型經過8次訓練后網絡的誤差平方和為4.64e-05,達到目標誤差的要求,網絡訓練的誤差平方和變化曲線如圖3。

表3 MATLAB歸一化后的芒市氣象因子

圖1 traingd函數網絡性能圖Fig.1 Network performance chart for traingd function

圖2 traingdx函數網絡性能圖Fig.2 Network performance chart for traingdx function

圖3 trainlm函數網絡性能圖Fig.3 Network performance chart for trainlm function
在各自最適隱層神經元數目的條件下,3種訓練函數都可以使網絡收斂達到目標誤差,traingd訓練函數的速度最慢,所需訓練步數多,trainlm訓練函數速度最快,所需訓練步數最少,traingdx訓練函數的速度級所需步數居中。對比圖1~3可以看出traingd、traingdx訓練函數的誤差平方和變化曲線比較平緩,而trainlm訓練函數的誤差平方和變化曲線較尖銳。
鑒于trainlm訓練函數是BP神經網絡模型中3種函數性能最好,運算速度最快的,因此選擇trainlm訓練函數建立芒市試驗點BP神經網絡模型。利用MATLAB軟件得出以下結果(表4~6)得出芒市BP神經網絡的輸出接點的閥值為-1.5290。

表4 芒市BP神經網絡輸入層到隱含層的權重矩陣
表5 芒市BP神經網絡隱含層和輸出層間的權重矩陣
Table 5 Weights matrix of Mangshi BP neural network hidden layer and the output layer

節點數Serialnumber權重矩陣Weightsmatrix12.556722.43063-4.399444.12795-1.486860.551071.88488-0.96809-1.000510-2.714211-1.2539121.657513-1.712214-1.8059150.1900
由以上過程得到芒市試驗點BP神經網絡預測預報模型為:
其中,xi為預測當年氣象因子輸入數據,yj為隱層節點輸出值,z為預測病情指數輸出值(該值為歸一化后的),ωji和bj分別表示第i輸入節點到第j個

表6 芒市BP神經網絡隱含層的閥值向量

2.3.3 芒市BP神經網絡回歸模型誤差與預測精確度對比 表7~9結果顯示,芒市的traingd、traingdx、trainlm 3種訓練函數模型對歷史數據回檢預測準確度都在80%以上。其回檢預測值為合格。trainlm訓練函數的模型預測準確度最高,相比其他2個函數,trainlm訓練函數對芒市的水稻稻瘟病的擬合程度更好。

表7 芒市traingd函數BP神經網絡模型歷史數據回檢結果

表8 芒市traingdx函數BP神經網絡模型歷史數據回檢結果

表9 芒市trainlm函數BP神經網絡模型歷史數據回檢結果
2.3.4 VB環境下的簡化BP神經網絡可視化程序設計 運用BP神經網絡預測模型對病情指數進行預測,關鍵是生成符合歷史數據的神經網絡模型,其中權、閾值等參數的確定顯得尤為重要。為方便相關農業部門對病害病情指數的預測,給出簡單易用的病情指數預測程序是具有重大現實意義的。

圖4 VB環境下芒市測報模型初始參數選擇Fig.4 Initial parameter selection of Mangshi forecasting model under VB environment
以下是在VB環境下對芒市試驗點數據歸一化后的簡易BP神經網絡可視化測報。在不影響測報準確性的要求下,對輸入層到隱層和隱層到輸出層的傳遞函數,均選擇logsig函數,且權值調節系數和閾值調節系數不再通過訓練函數的調整迭代,而設定為0.1,網絡學習次數(訓練次數)為10000。

表11 2002-2012年芒市病情指數(歸一化后)
可視化測報程序的運行操作過程分為3步:第1步,如圖4所示,為芒市試驗點選取神經網絡各層節點數,以芒市10年氣象數據為訓練年分數,以試驗點篩選出的氣象因子數為輸入層節點個數,選擇15個隱含層數目,1個輸出層節點數。第2步,生成BP神經網絡模型并對歷年數據進行檢測。將2012年芒市篩選出的氣象因子歸一化處理后,輸入到VB測報程序,預報模型的權、閾系數及數據檢測結果見圖5,其理想輸出(實際病情指數歸一化)和實際輸出值都比較接近,誤差曲線也比較吻合,預測精確度都能達到80%以上(表10)。第3步,利用已生成BP神經網絡測報模型,輸入2012年芒市相關影響因子的氣象數據,預測2012年的發病程度(歸一化),預測輸出為:0.9897,而理想輸出為1.0000(表11),預測精確度為98.97%,可以看出預測準確度能滿足實際需求。
3.1 測報因子的選擇
影響稻瘟病發病的因子很多,在建立稻瘟病BP網絡預測模型時,這些因子不可能都作為預測因子,需選取那些對稻瘟病的發生影響明顯的因子,以提高預測的精度,在篩選預測因子時,選取了對水稻生長有影響的氣象因子作為預測因子,從結果來看,5-6月的溫雨氣候條件顯著影響稻瘟病的發生,這主要是由于此時水稻正處于分蘗末至拔節的營養生長階段,是葉瘟發生發展的關鍵時期,這一時期氣象條件既影響水稻的長勢長相,又影響葉瘟的發病程度,從而影響后期穗瘟的流行強度,同時,7月中旬是水稻揚花灌漿的生殖生長階段,此時如遇連續多日低溫及降雨形成水膜的情況下,有利于病菌的繁殖和侵入,直接影響后期穗瘟的發生流行,是后期穗瘟發生至關重要的氣象因素;水稻生長中后期,也就是水稻收割之前的8-9月在田間具有大量菌源的情況下,如遇連續陰雨悶熱天氣,也會造成病害的流行。
3.2 BP神經網絡的構建
訓練神經網絡之間需要構造一個網絡構架,函數newff()就是用來構建神經網絡的。它需要4個輸入條件,依次是:由R維的輸入樣本最大最小值構成的R>2維矩陣,各層的神經元個數,各層神經元的傳遞函數以及訓練用函數的名稱。
假設需要構建1個2層神經網絡,其輸入向量是二維的,輸入向量的范圍為[-1 2; 0 5],第1層(隱層)有3個神經元,傳遞函數是tansing();第2層(輸出層)是單個神經元,傳遞函數是線性的,訓練函數選擇traingd(),至此就生成了初始化待訓練的神經網絡。
3.3 BP神經網絡隱層神經元數目的選取
改變非線性函數的頻率和BP神經網絡隱層神經元的數目,對于函數逼近的效果有一定的影響,網絡非線性程度越高,對于BP神經網絡的要求越高,則相同的網絡逼近效果要差一些;隱層神經元的數目對于網絡逼近效果也有一定的影響,一般來說,隱層神經元數目越多,則BP網絡逼近非線性函數的能力越強,同時網絡訓練所用的時間相對來說要更長一些。因而,在設計一個神經網絡時可以結合該公式以及經驗,選準一定的隱層神經元數目進行網絡訓練,驗證所設定的這些值是否能賦予神經網絡良好的性能,從中找出適合的隱層神經元數目。
(1)影響稻瘟病發生的因素很多,但主要因素是氣象條件,結果表明,從5月水稻分蘗期到9月水稻收割前起的溫度、濕度、降雨量以及日照時數與試驗點水稻稻瘟病發生息息相關,因此選擇試驗點5-9月的氣象數據以及田間稻瘟病病情指數來建立預測預報模型,以及時做好稻瘟病防控工作。
(2)利用3層BP網絡建立的稻瘟病中期預測模型更具有優勢。不需要事先進行數學公式表達,具有更高的預測準確度,預測結果更為客觀和可靠。可以更好地反映出病害與相關因子間的函數關系,其擬合與預測精度均較高。
[1]張思竹.云南省水稻產業發展報告[R]. 2011.
[2]王園媛, 李曉菲, 陳 濤, 等. 云南省水稻白葉枯病BP神經網絡測報技術研究[J].云南農業大學學報,2013,28(2):257-263.
[3]張 蕾, 燕亞菲, 劉志紅, 等. 灰色人工神經網絡在稻瘟病發生預報中的應用[J].中國農學通報, 2010,26(12):238-241.
[4]唐啟義, 程家安, 蔣學輝, 等. 晚稻稻瘟病BP神經網絡分區預報[J].植物保護學,2002,2(3):205-209.
[5]張孝羲, 張躍進.農作物有害生物預測學[M].北京: 中國農業出版社,2006.
[6]張德豐.MATLAB神經網絡應用設計[M].北京:機械工業出版社,2009.
[7]張映梅, 李修煉, 趙慧燕, 等. 人工神經網絡及其在小麥等作物病蟲害等預測中的應用[J].麥類作物學報,2002,22(4):84-87.
[8]陳觀浩, 張耀忠, 董 鵬, 等. 早稻葉瘟灰色災變長期預測模型[J].山地農業生物學報,2003,22(6):209-511.
[9]何忠全, 張志濤, 陳志誼, 等. 我國水稻病蟲害防治技術研究現狀及發展策略[J]. 西南農業學報,2004(1): 110-114.
[10]胡小平, 楊之為, 李振岐, 等.漢中地區小麥條銹病的BP神經網絡預測[J].西北農業學報, 2000(3): 28-31.
[11]黃偉杰, 劉曉平, 李 軍, 等. 基于BP網絡的水利工程投資風險評價[J]. 長沙理工大學學報, 2004, 1(2): 34-38.
[12]李祚泳, 彭荔紅, 等. 基于人工神經網絡的農業病蟲害預測模型及其效果檢驗[J].生態學報, 1999,19(5):759-762.
[13]殷世才, 周曉吉, 楊和生, 等.穗瘟測報模型及應用[J].云南農業大學學報,1998,13(1): 97-101.
[14]周開利, 康耀紅. 神經網絡模型及其MATLAB仿真程序設計[M].北京: 清華大學出版社,2005.
[15]吳先麗, 彭洪江, 彭仕鐘. 水稻稻瘟病葉瘟與穗頸瘟相關性分析[J].西南農業學報,1995, 8(4): 79-83.
(責任編輯 王家銀)
Investigation of Rice Blast Prediction and Forecast Based on BP Neural Network
LIU Ting-yang, LI Ye, PU Shi-lei, LI Zhi-yu, LI Wen-jing, WU Qi, WANG Yun-yue*
(Key Laboratory of Biological Diversity to Control Pests and Diseases, Ministry of Education/College of Plant Protection, Yunnan Agricultural University, Yunnan Kunming 650201, China)
【Objective】Rice blast was one of the major diseases of rice, and seriously restricted stable high yield of rice. With the influence of varieties layout, cropping system and climate change in recent years, the prevalence of inter-annual fluctuation was very large. Currently, the rice blast showed a trend towards the middle to high of the rice-producing areas in Yunnan Province. Prediction and forecast played an important role as a pioneer of the guide of prevention and control. 【Method】In order to timely and effective do a good job of rice blast prevention work, we adopted its related meteorological factors and field rice panicle blast disease index, used BP neural network technology, selected Dehong prefecture Mang city as a test point to carry out the prediction and forecast research. 【Result】From the relevance of meteorological factor and forecasting object, there was a strong correlation between various meteorological factors by screening and the disease index, the ideal and actual output values were closer, error curve was consistent, prediction accuracy could satisfy the actual demand.【Conclusion】The medium-term prediction model of the rice blast disease established by BP neural network was more advantageous, that was no need for a mathematical formula to express in advance, had a higher prediction accuracy. The prediction model was established by 5-9 meteorological data of experimental sites and disease index of rice blast in the field were more objective and reliable, and could do a good job of disease prevention and control.
Rice blast; BP neural network; Prediction and forecast
1001-4829(2017)7-1546-08
10.16213/j.cnki.scjas.2017.7.014
2015-09-10
云南省現代農業水稻產業技術體系
劉庭洋(1988-),男,河南信陽人,碩士研究生, 主要從事水稻稻瘟病預測預報研究,E-mail:136216341@qq.com。*為通訊作者,王云月(1962-),女,云南昆明人,教授,博士生導師,主要從事利用生物多樣性控制病蟲害促進種質資源保護研究,E-mail:1371209436@qq.com。
S435.111.4+1
A