



摘要:極限學習機(ELM)學習速度快且泛化性好,極易產生惟一最優解,適用于蟲害預測。通過實情驗證,在廣西宜州三化螟蟲害預測預報中,ELM預測精度較高,能夠滿足蟲害預測對準確率和實時性的要求,可作為一種新的蟲害預測方法。
關鍵詞:極限學習機(ELM);三化螟;預測
中圖分類號:S126;S435.112+.1 文獻標識碼:A 文章編號:0439-8114(2015)05-1205-03
DOI:10.14088/j.cnki.issn0439-8114.2015.05.045
Abstract:Extreme learning machine(ELM) is easy to generate a unique optimal solution and suitable for the pest forecast with fast speed of learning and good generalization. Through the truth verification, ELM had high prediction accuracy in the Tryporyza incertulas forecast in Yizhou city of Guangxi, which could meet the requirements about accuracy and real-time, and it will be a new method in the pest forecast.
Key words:extreme learning machine(ELM); Tryporyza incertulas; forecast
廣西河池宜州地區水稻病蟲害主要是“三蟲兩病”,即三化螟、稻縱卷葉螟、稻飛虱、紋枯病、稻瘟病,在各稻作區普遍發生且較為嚴重,尤其是三化螟蟲害對水稻生產影響較大,甚至造成顆粒無收。三化螟蟲害預測預報的準確性是有效防治三化螟蟲害的前提和保證。傳統的蟲害預測預報常用的是線性方法,而在大多數情況下,預報因子與蟲害發生之間常常是非線性關系,若廣西宜州三化螟蟲害預測仍采用傳統的線性方法,則難以確保三化螟蟲害預測預報的準確性。
近年來的研究表明,人工神經網絡具有較強的非線性逼近能力,在蟲害預測中常被采用[1-3]。極限學習機,即ELM(Extreme Learning Machine)是一種簡潔、快速、有效的單隱層前饋神經網絡(SLFN)學習算法。相比較而言,傳統的神經網絡學習算法(如BP算法)需要人為設置大量的網絡訓練參數,且極易產生局部最優解,而ELM只需要設置網絡的隱層節點個數,在算法執行過程中不需要調整網絡的輸入權值以及隱元的閾值,只產生惟一最優解,具有學習速度快且泛化性能好的優點[4],故ELM應用領域極其廣泛[5-8],已取得了令人滿意的結果。為此,提出了一種基于ELM的廣西宜州三化螟蟲害預測方法,以期為該地區三化螟蟲害的預測方法提供一定的參考。
1 極限學習機基本原理
ELM在訓練的過程中不需要調整ω和b的值,只需根據相應算法調整β值,便可獲得一個全局最優解,參數選擇的過程簡單易用,訓練速度提升明顯,且不會如傳統神經網絡學習算法(如BP算法)陷入局部最優。
2 實例仿真
將上述ELM模型應用于廣西河池宜州地區田間水稻病蟲害的預測。
2.1 預測的樣本數據來源
實例所用的數據來自宜州市蟲情燈下誘蛾數據及田間蟲情調查,是該地區第1~9年3、5、7、9月的三化螟蟲害發生程度及相應的田間數據,3、5、7、9月的三化螟對應第1代、第2代、第3代、第4代三化螟。把第1~6年的數據作為ELM學習樣本,第7~9年的數據作為ELM預測樣本。
通過綜合考慮,選取上代殘蟲密度、上代燈下蛾量、平均氣溫、降雨量等4個因素作為預測的影響因子。
2.2 蟲情等級標準
三化螟發生程度分級參照廣西農作物主要病蟲測報技術規范標準,具體見表1。由蟲害發生面積和卵密度的數據作為分級依據,把預報對象劃分為5個等級,依次為:1級,小發生;2級,中等偏輕發生; 3級,中等發生; 4級,中等偏重發生;5級,大發生。
2.3 數據預處理
預測的影響因子數據均為數值型,但是量綱和單位存在不同,故必須對數據進行標準化處理。把影響因子數據歸一化,使其分布在區間(-1,1)內。歸一化后的部分數據如表2。
2.4 仿真結果
選擇隱含層神經元個數為35,隱含層神經元的激活函數為sig。由于宜州地區三化螟病蟲害連續9年的數據發生程度只有1級(小發生)、2級(中等偏輕發生)、3級(中等發生),所以發生程度只分為1~3級,目標輸出模式為(100)、(010)、(001),故輸出層神經元個數為3,采用ELM預測第7~9年各代蟲害的程度。用ELM模型得到的目標輸出中,對于每個目標輸出,當a是最大值時,取a=1,否則a=0。ELM模型蟲害預測測試集訓練結果與預測值的對比如圖1所示,回測率和預測率均達到了100%。預測值與模擬結果對應如表3所示。
選擇隱含層神經元個數不同,得到的結果也不相同,在25~45之間,回測率一般達到97%~100%,預測率達到94%~100%,隱含層神經元個數太多會使預測率呈逐步下降趨勢,隱含層神經元個數太少,回測率和預測率不高。在學習速度上,試驗基于3.0 GHz 的雙核Intel處理器、2 GB內存的PC機,試驗環境為MATLAB 2009a版本,運行預測模型所花的時間為3.533 5 s, 滿足了蟲情預測實時性要求。
3 小結
仿真試驗結果表明,在廣西宜州三化螟蟲害預測中采用極限學習機(ELM)方法,在參數選擇以及學習速度上優勢明顯,準確率高,實時性強,可作為一種新的蟲害預測方法。下一步將繼續對極限學習機(ELM)應用作深入研究,如采用優化的極限學習機[9]或引入結構風險最小化策略[10]等,進一步提高蟲害預測的效率和準確度;同時開展廣西宜州三化螟蟲害預測軟件的研發,將極限學習機(ELM)推廣應用到農業生產領域的其他方面,比如甘蔗種植戶信息分析模型研究等。
參考文獻:
[1] 趙國富,趙 朋.基于BP網絡的蟲害預測預報系統的分析與實現[J].農機化研究, 2008(4): 14-17,28.
[2] 唐建軍,王映龍,彭瑩瓊,等.BP神經網絡在水稻病蟲害診斷中的應用研究[J].安徽農業科學,2010,38(1):199-200,204.
[3] 賈花萍.農作物蟲情的模糊神經網絡預測模型[J].浙江農業學報, 2013, 25(4): 819-822.
[4] HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70:489-501.
[5] 潘華賢,程國建,蔡 磊.極限學習機與支持向量機在儲層滲透率預測中的對比研究[J].計算機工程與科學, 2010,32(2):131-133.
[6] 黃宴委,吳登國,李 竣.基于極限學習機的結構健康監測數據恢復[J].計算機工程,2011,37(16):241-243.
[7] 陳盛雙.基于極限學習機的XML文檔分類[J].計算機工程,2011,37(19):177-178,182.
[8] 丁 姣,蔡建榮,張海東,等.近紅外結合Si-ELM檢測食醋品質指標[J].食品與機械,2012,28(1):93-96.
[9] 王 杰,畢浩洋.一種基于粒子群優化的極限學習機[J].鄭州大學學報(理學版),2013,45(1):100-104.
[10] 何其慧,姚登寶,王翠翠,等.基于模糊隨機樣本的結構風險最小化原則[J].計算機工程與科學,2011,47(34):51-55,144.