唐國棟,高 永,汪 季,賈 旭,梁 超,孫曉瑞
(內蒙古農業大學沙漠治理學院,內蒙古呼和浩特 010011)
基于數學模型預測森林病蟲害的研究進展
唐國棟,高 永,汪 季*,賈 旭,梁 超,孫曉瑞
(內蒙古農業大學沙漠治理學院,內蒙古呼和浩特 010011)
闡述了我國森林病蟲害預測預報的發展歷程,介紹了近年來非線性模型和線性非線性組合模型在森林病蟲害預測中的應用現狀,綜述了組合模型的建模方法、支持向量機回歸原理及應用現狀,總結了目前森林病蟲害預測預報中存在的問題,并展望了其今后的發展趨勢。
森林病蟲害;預測預報;非線性模型;支持向量機;組合模型
森林病蟲害是我國一類頻發性生物災害。據統計,我國發生的森林病蟲害種類有8 000多種,其中經常造成嚴重危害的有200多種,發生面積超過800萬hm2,約占全國森林面積的5.5%,年均減少林木生長量1 700萬m3,經濟損失高達50多億元[1-2],已成為林業生產和生態工程建設的重要制約因素之一。改善這一現狀的過程中,森林病蟲害預測預報工作是其中的重要環節。
森林病蟲害預測預報的目的是通過長期、系統觀察,結合實際環境因素綜合分析,探討森林病蟲害的發生發展規律,預測森林病蟲害發生發展的趨勢。早在20世紀50年代我國就開展了病蟲害的調查工作,經歷了經驗預測、試驗預測、統計預測和信息預測等階段的發展,20世紀80年代人工神經網絡、小波分析及混沌理論等非線性理論的引入,為病蟲害預測預報開辟了一條新的道路[3]。但是由于森林病蟲害的發生具有不均勻性、差異性、多樣性、突發性、隨機性和規律性復雜等特點,單一地運用線性或非線性理論建模都不能很好地挖掘數據中的深層規律,人們意識到若要達到好的預測預報效果,需要同時抓住病害蟲發生的線性和非線性規律;因此,線性與非線性的組合模型已成為當今研究的熱點之一。筆者闡述了我國森林病蟲害預測預報的發展歷程,介紹了近年來非線性模型和線性非線性組合模型在森林病蟲害預測中的應用現狀,綜述了組合模型的建模方法、支持向量機回歸原理及應用現狀,總結了目前森林病蟲害預測預報中存在的問題,最后展望了其發展趨勢。
早在20世紀30年代國外就開展了森林病蟲害的預測預報工作,注重科學技術的應用以及測報資料的系統調查、積累和基礎理論研究[4]。我國森林病蟲害測報工作開始于20世紀50年代,隨著數學、計算機等其他學科的應用發展,我國森林害蟲的測報工作大致經歷了經驗預測、試驗預測、統計預測和信息預測4個階段的發展。①經驗預測階段(20世紀50—60年代)。我國開展森林病蟲害預測預報工作較早,早在20世紀50年代就開展了對馬尾松毛蟲和竹蝗的群眾性調查工作,通過觀察害蟲基數及發育進度確定是否需要防治,隨著我國森林病蟲害發生面積的不斷擴大、發生種類的不斷增加,研究工作也逐步深入。②試驗預測階段(20世紀60—70年代)。以有效積溫為基礎的預測和編制主要害蟲生命表是此時期國內外研究的熱點,它對病蟲害測報的發展和林區的綜合管理起著至關重要的作用。我國對松毛蟲等主要森林害蟲生命表進行了大量研究,深入了解害蟲種群數量的變化情況,并將研究成果應用于測報實踐中,給害蟲發生量的短、中、長期預報提供了可靠的依據,取得了良好的效果[5]。③統計預測階段(20世紀80年代)。統計預測是利用數學手段探究一定范圍內預測因子和生物及非生物因素之間的關系,主要統計預測方法包括回歸分析[6]、逐步回歸[7]、逐步判別[6]、馬爾可夫鏈[8]、灰色系統分析[9]、預測克立格方法[10]等。目前,這類預測方法仍有廣泛應用,但也存在一些弊端,例如模型在研究中擬合率較高,但實際應用中隨著某些因素的改變準確率較低。④信息預測階段(20世紀80—90年代)。主要有害蟲發生預測預報系統[11-12]、專家決策系統[13-15]和地理信息系統等[16]。隨著測報方法和計算機科學的發展以及害蟲信息數據的積累,信息預測法逐漸成為目前國內外研究的熱點。此類模型綜合了許多分室模型,參數多且假定為常數,而隨著時間和空間的變化,環境差異較大,導致預測準確率不高。今后隨著科學的進步和信息的進一步完善,信息預測具有廣闊前景。
20世紀80年代以來人工神經網絡(Back propagatior,BP)的引入以及20世紀迅速興起的小波分析、混沌理論等非線性理論,大大推動了森林病蟲害預測預報的發展。
2.1 人工神經網絡 人工神經網絡(BP)是一種基于生理學上的神經系統的理論抽象模型,它是由大量被稱為神經元的簡要信息處理單元通過高度并聯、互聯而成的非線性動力學網絡系統[17-18]。國外學者Alessandro和Hassoun將其形象地比喻為“黑箱”,經過訓練后,輸入值后通過神經網絡計算出輸出值[19]。人工神經網絡具有很強的自學習、自組織、自適應及容錯性等特點,不需假設前提條件和人為確定因子權重,就可對害蟲發生等非線性動力學現象的任意非線性函數進行逼近和模擬[20-22]。其中,BP神經網絡研究最為活躍,被廣泛應用于病蟲害預測預報領域。
楊淑香等[23]運用人工神經網絡理論建立了內蒙古東部地區鄂倫春自治旗的落葉松毛蟲發生面積及蟲口密度與氣象因子之間的BP神經網絡模型,預測結果的最大誤差僅為12.8%。朱壽燕等[24]、陳繪畫等[9]、項云飛等[25]均根據浙江省仙居縣1983—2002年馬尾松毛蟲的調查資料,只考慮氣象因子的條件下運用相關分析和逐步回歸篩選預報因子,根據BP神經網絡建立模型,擬合訓練后對2個預留年份進行預測,結果非常理想。但由于研究區為純人工林,長期人為干擾和采取的防治措施也是影響病蟲害發生的主要因素[9,24-25]。雖然基于BP神經網絡所建立的模型擬合較高,但模型可解釋性差,不能很好地反映具體環境因素的影響程度。隨著研究的深入,人們發現了BP神經網絡的不足之處,因其基于風險最小原則,小樣本條件下容易出現局部過優、過擬合、泛化能力不強等問題,導致預測效果不佳。為彌補此類不足,專家開發了人工神經網絡的衍化模型。蘇小紅等[26]提出徑向基函數(RBF)神經網絡的混合學習算法,陳繪畫等[27]提出粒子群優化神經網絡混合模型,都是基于BP神經網絡不足之處的改進模型。
2.2 小波分析 在病蟲害預測中得到的數據包含趨勢項、周期項和隨機項等,傳統的線性方法往往會忽略掉其中的部分重要信息,而小波分析具有分層提取不同信息分量直至方便建模為止的優勢[28]。我國小波分析最早引入農業病蟲害預測預報是袁磊等[29]利用小波網絡建立了小麥條銹病預測模型,但實際上是小波分析和神經網絡的混合模型,并非純粹的小波分析,但預測準確率較單一的神經網絡有一定提升。朱軍生等[30]運用小波分析多分辨率分析功能將害蟲原始非平穩時間序列數據分解分層得到平穩時間序列分量,分層數通過觀察和檢驗已得到的分量確定,再利用傳統線性方法分別建模后將預測結果疊加得到最終預測結果。關秀敏等[31]采用symlets小波函數變換對二點委夜蛾測報燈逐日誘蛾數量原始數據進行分解、過濾、重組,結果發現第3層的低頻重構序列可以完全反映二點委夜蛾年變化規律。這些均是小波分析在農業病蟲害中的應用,在對中國知網檢索的文獻查詢過程中,并未查到關于小波分析在森林病蟲害的研究。農業病蟲害與林業病蟲害的發生雖有不同,但有著極大的相似性,森林病蟲害預測預報的多種新興方法都是從農業上借鑒的,并取得了很好的效果。
2.3 混沌理論 近十幾年來,基于Takens相空間重構理論建立的混沌時間序列預測得到廣泛應用,并被應用到不同的研究領域,研究重點主要是如何選擇合適的預測模型和重構參數,以提高預測模型精度[32]。大量研究表明,害蟲所處的復雜系統普遍存在著混沌現象,因此將害蟲發生與混沌結合起來,害蟲發生變化可看作是混沌系統策動的結果和表現,運用相空間重構原理對害蟲進行測報。但是,目前在森林病蟲害預測預報中的研究還較少。向昌盛等[33]建立了混沌理論的相空間重構(Phase space reconstruction,PSR)和最小二乘支持向量機(Least squares support vector machine,LSSVM)的PSR-LSSVM組合模型,以云南省普洱市思茅區1985—2006年松毛蟲發生面積和浙江省仙居縣1983—1989年松毛蟲發生面積數據為例進行驗證,預測結果優于單一的BP神經網絡和差分自回歸移動平均(ARIMA)模型,很好地解決了大樣本要求和泛化能力弱等問題。
近年來,為了更好地利用各模型的優勢,除了單純地研究線性、非線性方法以外,一些學者提出組合模型預測法,事實證明組合模型較單一模型預測精度有大幅度提高[34]。Vapnik基于統計學習理論提出的支持向量機(Support vector machine,SVM)是目前發展最快的機器學習方法,是近年來組合模型研究中主要的非線性模型。SVM包括分類診斷和模式識別(SVC)、非線性時間序列分析或非線性回歸分析(SVR)[22,35-36],SVR基于結構風險最小,與BP神經網絡相比較好地解決了小樣木、非線性、過擬合、維數災和局極小等問題[37-38]。組合模型研究中的線性部分,最經典的時間序列模型是差分自回歸移動平均(Autoregressive integrating moving average,ARIMA),ARIMA模型極富彈性,可表示不同種類的時間序列模型,兼具時間序列分析和回歸分析的優勢,在害蟲種群動態變化研究中廣泛應用[39]。此外,還有帶控制項的自回歸滑動平均模型(Controlled autoregressive integrating moving average,CARIMA)及其簡化模型一帶受控項的自回歸模型(Controlled autoregressive,CAR)[38,40]。
3.1 SVM回歸原理 對于一個給定的樣本數據集{(xi,yi),i=1,2,…,k},k為樣本個數,SVM回歸算法的基本思想是通過一個非線性映射函數將數據映射到高維特征空間,并在這個空間進行線性回歸,具體表現形式如下:
f(x)=ωTΦ(x)+b
(1)
式中,ω為平面的權值向量,b為偏置量。
支持向量機回歸基于結構風險最小,使用了一種新的損失函數形式——ε不敏感損失函數(ε-insensitive cost function),ε為回歸允許最大誤差,控制支持向量的個數和泛化能力,ε值越大,支持向量數量就越少。回歸模型既使得訓練集具有更好的推廣能力,又考慮經驗風險的最小化時降低模型的復雜度,在這種理念指導下,SVM回歸求解變成以下的優化問題:
(2)
約束條件如下:

(3)

3.2 組合模型的應用 組合模型預測研究中,差分自回歸移動平均(ARIMA)和支持向量機(SVM)是目前研究較多的組合。向昌盛等[34]運用此方法建立了ARIMA-SVM組合模型,具體步驟為先以ARIMA進行線性預測,再用SVM對殘差預測,最后將兩部分結果相加得出最終結果。基于遼寧朝陽市1986—2006年數據,進行模型擬合和預測,結果較為理想。在此基礎上進一步改進模型,為提高預測精度,采用融合了時間動態變化的ε-DSVM模型對非線性部分進行預測,近期數據值相對較小,而遠期數據值相對較大,這樣ε-DSVM就能夠同時捕捉時間序列的非線性和動態特征。同樣,用遼寧朝陽市1986—2006年數據,ARIMA-DSVM預測結果較ARIMA-SVM更加準確[41]。此外,張永生等[38]、袁哲明等[42]建立了支持向量機回歸(SVR)和帶受控項的自回歸模型(CAR)的SVR-CAR組合模型,并結合文獻數據進行了實例分析,預測結果較參比的單一線性或非線性模型更為準確。由此可見,組合模型能夠融合線性和非線性2種方法的優點,挖掘到害蟲數據中大量的動態特征、環境因子的影響和非線性特征,在森林害蟲預測預報中將會得到廣泛應用。
在建模過程中,害蟲發生量具有時滯和后效性,害蟲當年的發生量既與當年的各影響因素有關,也與歷史害蟲發生量和影響因素有關,因此確定最佳時滯階數非常關鍵,也是當今研究的難點和重點。其基本原理是從低階起對害蟲發生建模,然后逐漸增加模型的階數,并用F檢驗判別來確定最佳時滯階數。傳統確定時滯階數運用回歸方法,由于害蟲發生的非線性特點,很難找到最佳時滯階數。袁哲明等[42]采用留一法基于MSE最小原則確定模型階數,預測精度有所提高,但過程較為繁瑣,且容易得到局部最優解。李星等[40]提出了一種基于地統計學(Geostatistics,GS)定階方法,半變異函數模型的后效時間長度直接給出拓階上限,實現了對原始因變量的快速定階,克服了傳統定階方法易陷入局部最優和耗時長等缺點。向昌盛[43]基于地統計學定階建立了GS-ARIMA-SVM模型,ARIMA預測線性部分,GS進行模型定階,SVM對非線性部分進行預測,疊加得到預測結果,與ARIMA-SVM模型相比,不僅提高了定階速度,而且進一步提高了預測準確率。
非線性和線性非線性組合模型的應用在森林病蟲害預測領域取得了很大的成功,但仍需進一步完善,組合模型的研究已經展現出了一定的優勢,基于機器學習領域的集大成者支持向量機的組合模型研究是當下的熱點,如ARIMA-SVM、SVR-CAR、GS-ARIMA-SVM等都取得了很好的預測效果,再進一步完善模型定階方法和核函數選取及參數確定方法,將在病蟲害預測預報領域發揮越來越大的作用。同時,準確收集、更新數據是當今亟需解決的問題之一,只有準確的基礎數據配合正確的方法才能對未來發展趨勢做出精準判斷,現階段用于測報研究的連續數據較少,尤其是森林病蟲害方面,例如浙江省仙居縣1983—2002年的馬尾松毛蟲調查數據已被多人多次使用。目前,僅限于基礎理論的研究,大范圍的研究僅靠人工調查數據根本不可行,而遙感技術在森林病蟲害監測領域的應用已日漸成熟。隨著技術的發展,新衛星的相繼升空,運用多光譜、高光譜、高空間和高時間分辨率衛星遙感數據提取病蟲害發生信息已成為當今研究的重點,應用此類數據對區域性森林病蟲害預測預報研究具有其他不可比擬的優勢,今后應有效利用遙感數據對大區域乃至全國森林進行病蟲害的預測預報。
總而言之,隨著非線性科學中的神經網絡、小波分析和混沌理論在森林病蟲害中的應用,以及基于支持向量機的組合模型預測研究,預測效果越來越準確。其中,小波分析和混沌理論在農業病蟲害預測中應用較為成熟,在林業中應用研究的報道較為少見。今后應進一步深入研究非線性理論在森林病蟲害預測中的應用,結合線性模型不同方式的組合模型將具有更加廣闊的應用前景。參考文獻
[1] 武紅敢,石進.松毛蟲災害的TM影像監測技術[J].遙感學報,2004,8(2):172-177.
[2] 國家林業局森林病蟲害防治總站.森林病蟲害防治工作任重道遠[N].中國綠色時報,2000-02-28(2).
[3] 李祚泳,彭荔紅.基于人工神經網絡的農業病蟲害預測模型及其效果檢驗[J].生態學報,1999,19(5):759-762.
[4] 張福麗.氣象因素對黑龍江省三種病蟲害的影響及預測預報[D].哈爾濱:東北林業大學,2009.
[5] 薛賢清,崔力,齊艷.我國森林害蟲預測預報的科技進展[J].南京林業大學學報(自然科學版),1992(4):80-86.
[6] 張福麗,景天忠,王志英,等.氣象因素與楊干象蟲口密度的多元線性回歸和判別分析[J].安徽農業科學,2011,39(15):9000-9001.
[7] 薛賢清.在馬尾松毛蟲測報中應用逐步回歸電算方法的研究[J].林業科學,1984,20(1):42-49.
[8] 賈春生.運用馬爾可夫鏈預測馬尾松毛蟲發生面積[J].信陽師范學院學報(自然科學版),2007,20(1):43-44.
[9] 陳繪畫,崔相富,朱壽燕,等.馬尾松毛蟲發生量灰色系統模型的建立及其預報[J].東北林業大學學報,2004,32(4):19-21.
[10] 陳繪畫,崔相富,張建薇.基于預測克立格方法的馬尾松毛蟲空間發生量預報[J].中國森林病蟲,2007,26(3):5-7.
[11] WANG N H,MIAO T Y,WANG A C.Research and application of Web-based forecast expert system for forest diseases and insects[J].Journal of northeast forestry university,2008,36(1):79-82.
[12] WANG N H,LI D,PAN H.Information service platform of forest pest forecast based on WebGIS[J].Journal of forestry research,2009,20(3):275-278.
[13] 王淑芬,張真,陳亮.馬尾松毛蟲防治決策專家系統[J].林業科學,1992,28(1):31-38.
[14] 王阿川,繆天宇,曹軍.基于Web森林病蟲害防治決策專家系統研究[J].計算機技術與發展,2008,18(4):228-231.
[15] 王霓虹,繆天宇,王阿川.基于WebGIS的森林病蟲害預測預報專家系統的設計與應用[J].東北林業大學學報,2008,36(1):79,80-82.
[16] LUO S Z,WANG C.Forest pests and diseases forecasting based on GIS[J].Advanced materials research,2011,250/251/252/253:2945-2948.
[17] 孫凡,陳漢容.稻癭蚊發生趨勢的B-P網絡預測模型[J].計算機仿真,2000,17(3):61-63.
[18] 陳繪畫,朱壽燕,崔相富.基于人工神經網絡的馬尾松毛蟲發生量預測模型的研究[J].林業科學研究,2003,16(2):159-165.
[19] 林高飛,林乃銓,尤民生.人工神經網絡在三化螟預測中的應用[J].華東昆蟲學報,1999,8(2):4-5.
[20] 張愛兵,陳建,王正軍,等.BP網絡模型和LOGIT模型在森林害蟲測報上的應用初報:以安徽省潛山縣馬尾松毛蟲為例[J].生態學報,2001,21(12):2159-2165.
[21] 羅盛健.基于人工神經網絡的剛竹毒蛾發生面積的預測模型[J].華東昆蟲學報,2006,15(1):37-39.
[22] 譚泗橋,林雪梅,陳淵,等.基于地統計學的多維時間序列模型及其在生態學中的應用[J].湖南農業大學學報(自然科學版),2009,35(4):433-436.
[23] 楊淑香,趙慧穎,包興華.基于人工神經網絡的落葉松毛蟲發生量預測模型的研究[J].中國農學通報,2014,30(28):72-75.
[24] 朱壽燕,陳繪畫,崔相富.應用人工神經網絡預測馬尾松毛蟲的有蟲面積[J].中國農業氣象,2004,25(1):53-55.
[25] 項云飛,陳繪畫.應用人工神經網絡預測馬尾松毛蟲的有蟲面積[J].浙江林業科技,2004,24(3):44-46,54.
[26] 蘇小紅,侯秋香,馬培軍,等.RBF神經網絡的混合學習算法[J].哈爾濱工業大學學報,2006,38(9):1446-1449.
9.1 區域阻滯麻醉還是全身麻醉 在大手術(如開腹手術)和高危患者中區域阻滯麻醉可能具有優勢。一項針對各種手術患者的薈萃分析顯示,與全身麻醉相比,區域阻滯麻醉降低術后30 d內肺炎發生率和死亡率[15]。在一項針對接受各類手術、并合并慢性阻塞性肺病患者的傾向性評分匹配分析中,區域阻滯麻醉伴隨術后30 d肺部和其他并發癥發生率降低[16]。
[27] 陳繪畫,崔相富,楊勝利.基于粒子群優化神經網絡混合模型預測馬尾松毛蟲發生量[J].東北林業大學學報,2008,36(11):88-91.
[28] 馬社祥,劉貴忠,曾召華.基于小波分析的非平穩時間序列分析與預測[J].系統工程學報,2000,15(4):305-311.
[29] 袁磊,李書琴.基于小波網絡的小麥條銹病預測模型研究[J].微計算機信息,2009,25(12):42-43.
[30] 朱軍生,翟保平,劉英智.基于小波分解的害蟲發生非平穩時間序列分析和預測[J].南京農業大學學報,2011,34(3):61-66.
[31] 關秀敏,朱軍生,陳淑娟,等.小波分析二點委夜蛾發生規律[J].應用昆蟲學報,2013,50(6):1643-1648.
[32] 張春濤,關文忠,劉學飛.混沌時間序列的2階預測模型[J].數學的實踐與認識,2016,46(5):186-193.
[33] 向昌盛,萬方浩.基于混沌理論的害蟲發生量非線性建模與預測[J].湖南農業大學學報(自然科學版),2015,41(2):172-176.
[34] 向昌盛,周子英.ARIMA與SVM組合模型在害蟲預測中的應用[J].昆蟲學報,2010,53(9):1055-1060.
[36] MOUSAVI S A,HANIFELOO Z,SUMARI P,et al.Enhancing the diagnosis of corn pests using gabor wavelet features and SVM classification[J].Journal of scientific & industrial research,2016,25(6):349-354.
[37] 向昌盛,周子英,張林峰.支持向量機在害蟲發生量預測中的應用[J].生物信息學,2011,9(1):28-32.
[38] 張永生,袁哲明,熊潔儀,等.基于SVR和CAR的多維時間序列分析及其在生態學中的應用[J].生態學報,2007,27(6):2419-2424.
[39] 賈春生.ARIMA模型在馬尾松毛蟲發生面積預測中的應用[J].安徽農業科學,2007,35(19):5672-5673.
[40] 李星,陳淵,張永生,等.基于支持向量回歸與地統計學的多維時間序列分析[J].中國農學通報,2011,27(29):133-138.
[41] 向昌盛,周子英,武麗娜.基于ARIMA和DSVM組合模型的松毛蟲發生面積預測[J].湖南農業大學學報(自然科學版),2010,36(4):430-433.
[42] 袁哲明,張永生,熊潔儀.基于SVR的多維時間序列分析及其在農業科學中的應用[J].中國農業科學,2008,41(8):2485-2492.
[43] 向昌盛.基于地統計學定階的松毛蟲發生面積組合預測[J].計算機應用研究,2012,29(3):984-987.
Research Progress on Forecasting Forest Diseases and Pests Based on Mathematical Model
TANG Guo-dong, GAO Yong, WANG Ji*et al
(College of Desert Science and Engineering, Inner Mongolia Agricultural University, Hohhot, Inner Mongolia 010011)
The development history of forecasting forest diseases and pests in China was expounded. The application status of nonlinearity and linearity-nonlinearity models in recent years was introduced. And the modeling methods of combined model, the regression principle and application status of support vector machine were reviewed. And the existing problems in current forecast of forest diseases and pests were summarized. Finally, its developed trend in the future was forecasted.
Forest diseases and pests; Forecast; Nonlinearity model; Support vector machine; Combined model
內蒙古自治區林業廳橫向項目。
唐國棟(1991- ),男,內蒙古烏盟人,碩士研究生,研究方向:森林病蟲害風險評估。*通訊作者,教授,博士,博士生導師,從事荒漠化防治研究。
2016-11-30
S 711
A
0517-6611(2016)35-0008-03