摘要:做好農作物的病蟲害預測工作具有一定的經濟意義,也是農業現代化的必要內容之一。病蟲害的發生受到多方面因素的綜合影響,這些因素所起的作用相互交織。新興的模糊測度與模糊積分理論能較好地分析多因素的交互作用。將模糊測度和Choquet積分應用于蟲害預測,建立非線性害蟲預測數學模型,并對不同地域的金紋細蛾(Lithocolletis ringoniella)數據進行檢測,結果表明該數學模型具有很好的預測效果。
關鍵詞:蟲害預測;金紋細蛾(Lithocolletis ringoniella);模糊測度;Choquet積分
中圖分類號:S436.62 文獻標識碼:A 文章編號:0439-8114(2013)22-5485-03
中國是農業大國,如果發生大面積的嚴重農作物和森林病蟲害,會給社會帶來嚴重影響,做好病蟲害防治對促進農業可持續發展意義重大。病蟲害防治的一個重要環節就是做好預測工作,病蟲害的預測被普遍認為是農業生產的基礎性工作[1-4]。
植物病蟲害的發生常受生物和非生物因素綜合影響,害蟲的生物學特征、環境溫度、濕度、天敵的數量、農藥的使用等因素與蟲害的發生有著復雜關系,同時蟲害的發生是相互影響的。從數學角度看,蟲害預測本質就是一個多輸入的系統而輸入量是相互影響的,存在交互作用。隨著現代科技的發展,促生了一些新的基于統計信息的預測模型,提出了一種蟲害預測數學模型——基于Choquet積分的非線性回歸。Choquet積分是模糊積分的一種,是經典積分-勒貝格積分的推廣,其依據的模糊測度可以很好地表示多個影響因素間的交互作用,適用于蟲害預測此類問題[5]。
1 模糊測度與Choquet積分
測度是測量在數學中的進一步抽象。對于滿足加法原理的測度,數學中稱為經典測度或可加測度,不滿足加法原理的測度為模糊測度,也稱為不可加測度。蟲害預測主要為模糊測度[5]。
定義1:設X={x1,x3,…,xn}為非空有限集合,P(X)為X的冪集,即P(X)由X的所有子集構成,若集函數μP(X)→(-∞,+∞)滿足μ(?覫)=0,則稱μ為有符號模糊測度。
有符號模糊測度是不滿足加法原理的,體現為次可加性μ(A∪B)≤μ(A)+μ(B),A∩B=?覫和超可加性μ(A∪B)≥μ(A)+μ(B),A∩B=?覫。
有符號模糊測度恰恰可以用來表示蟲害預測問題中各影響因素間的交互作用。如μ({溫度})=0.1表示溫度這個因素對于蟲害發生的重要度為0.1;μ({濕度})=0.2表示濕度這個因素對于蟲害發生的重要度為0.2;μ({溫度,濕度})=0.38則表示溫度和濕度共同作用時的重要度為0.38,表明濕度和溫度對蟲害共同作用時的重要度超過了各自作用時重要度之和,此種情況表明溫度和濕度之間存在積極交互作用。若出現μ({溫度})+μ({濕度})>μ({溫度,濕度}),則表明溫度和濕度之間存在消極交互作用。
定義2:設f為定義在非空有限集合X上的函數,μ為定義在P(X)上的有符號模糊測度,則函數f關于有符號模糊測度的Choquet積分定義如下。
Choquet積分是非線性的,即Choquet積分不滿足下面的線性性質:(c)∫(kf+lg)dμ=k(c)∫fdμ+l(c)∫gdμ。其中f、g為被積函數,k、l為常數。
在蟲害預測中,Choquet積分起到了將各影響因素的值與各因素的重要性及其之間的交互作用進行綜合的作用,而且這個過程是非線性的。例1為模擬一個簡化的蟲害預測。
例1:假設影響金紋細蛾(Lithocolletis ringoniella)的僅為3個因素:上一代金紋細蛾的密度x1、本代的平均溫度x2和平均濕度x3。3個因素組成集合X={x1,x2,x3}。各因素的重要度列于表1、各影響因素組成的被積函數f列于表2。
因為被積函數f不取負值,而且X為有限集合,所以有:
∫fdμ=(f(x3)-0)×μ({x1,x2,x3})+(f(x1)-f(x3))×μ({x1,x2})+(f(x2)-f(x1))×μ({x2})=0.42×1+(2.39-0.42)×0.7+(5.56-2.39)×0.2=2.433
Choquet積分預測的金紋細蛾的密度為2.433。
通過例1可以看出Choquet積分可以看作是有符號模糊測度μ的線性形式,這種特性決定了以后根據歷史數據確定有符號模糊測度μ時,可以通過求解線性方程組得到,計算復雜度得到降低。
2 基于Choquet積分的非線性回歸模型
在生產實際中,經常出現一些變量,它們相互聯系,相互依賴,因而它們之間存在著一定的關系,一類是確定性的關系,如長方形的面積是長與寬的乘積;一類是非確定性的關系,如蟲害的密度(因變量)與上代蟲害的密度、溫度、濕度、天敵的數量之間有密切的關系,但是由于其復雜性以及人類的知識有限性,蟲害的密度與它們之間的關系是不能用準確的函數關系來表達的。對于具有相關關系的變量,雖然不能找到它們之間的精確表達式,但是以大量試驗或者觀察得到的數據為基礎,可以發現它們之間存在一定的統計學規律性,就是數理統計中的回歸分析。線性回歸就是常用的一種回歸分析,運用十分廣泛,因變量和自變量之間存在線性回歸的情形。線性回歸方程形式如下:
y=c+a1g(x1)+a2g(x2)+…+ang(xn)+N(0,σ2)(1)
其中,y為因變量,xi為影響y的因素,g(xi)為影響因素的值,也就是自變量因素,N(0,σ2)為服從正態分布的誤差項,c與ai為回歸系數。
(1)式也可以看做經典的黎曼積分:
y=c+∫gdμ+N(0,σ2) (2)
其中,μ({xi})= ai。
當這些影響因素相互影響、交互作用時,線性回歸方程就不合適了,可以用Choquet積分替換線性回歸方程(2)中的黎曼積分得到下面的非線性回歸方程[6]:
基于Choquet積分的非線性回歸系數,可以利用遺傳算法來進行確定[6]。遺傳算法只需要對由a1,a2,…,an,b1,b2,…,bn構成的參數空間進行搜索,而對于每種a1,a2,…,an,b1,b2,…,bn的可能取值,相應的c和有符號測度μ都可通過解線性方程組得到。
3 驗證與分析
為了驗證基于Choquet積分的非線性回歸的有效性,在金紋細蛾的歷史數據上進行了測試。金紋細蛾廣泛分布于遼寧、河北、河南、山東、山西、陜西、甘肅、安徽、江蘇等地,寄主有蘋果、海棠、山楂、梨、桃等,以為害蘋果為主,近些年有日趨嚴重之勢,造成嚴重災害,嚴重果園被害率100%。將從河北、山東、遼寧、河南、山西、寧夏、甘肅共7個省(區)收集的2010年的金紋細蛾的數據整理成表3。金紋細蛾的寄生性天敵很多,其中以金紋細蛾跳小蜂數量最多,但是在果園內,由于農藥的噴灑,使得金紋細蛾跳小蜂的數量很少,對金紋細蛾的作用不明顯,因此在收集數據時主要考慮了影響金紋細蛾的主要因素:上期蟲害量、距離最近一次噴灑農藥的時間(施藥時間)、平均溫度、月份(因金紋細蛾有很強的時間周期性)。數據的收集過程為每個果園5點取樣,每點選1棵樹作為當年調查樹固定下來并編號調查樹;每樹調查不少于100張葉片;蟲害量以被金紋細蛾為害的葉片所占比例進行標識。
將基于Choquet積分的非線性回歸模型用于蘋果園的金紋細蛾預測時,表3中的第2-5列就是回歸模型中的自變量,即X={上期蟲害量、施藥時間、溫度、月份}。每一行的后面4個數構成(3)式中的被積函數g,代入(3)式計算出相應的y,并與同一行的第一個值,也就是本期實際蟲害量進行比較,兩者的差為誤差,將每一行的誤差取平方,再對所有行的誤差平方求和,為誤差平方和。以誤差平方和最小化為目標,用Matlab軟件中的遺傳算法工具箱對(3)式中的非線性回歸系數求得最優值,代入(3)式,就得到了可以對未來的金紋細蛾進行預測的回歸方程。
將收集到的金紋細蛾的數據進行隨機劃分,一部分(70%)用來確定回歸系數,為訓練集;一部分(30%)用來測試檢驗回歸方程,為測試集。并將該過程重復10次,其結果都類似于圖1。
在對2010年的數據多次重復測試中,利用所介紹的方法,平均相對誤差是9%,最大相對誤差是19%,最小是0。通過對金紋細蛾的實際測試表明,基于Choquet積分的非線性回歸方法具有很好的預測效果。該方法可以充分考慮各影響因素間的交互作用,可以將該方法應用于蟲害的預測。
4 小結
影響蟲害的因素很多,這些因素存在著交互作用。本研究提出了用模糊測度表示這些因素的交互作用,并基于Choquet積分建立了非線性回歸預測方法。在2010年金紋細蛾的數據上進行的多次測試證明該預測方法具有很好的效果,可繼續研究將該方法推廣到其他蟲害預測中。
參考文獻:
[1] 程極益,蘇慶玲,張孝羲.多元模糊回歸在害蟲測報上的應用[J].昆蟲知識,1994,3(2):65-68.
[2] 彭瑩瓊,王映龍,唐建軍,等. B/S模式的水稻病蟲害診斷專家系統研究[J].江西農業大學學報,2008,30(6):1157-1160.
[3] 許漢亮,管楚雄,林明江,等.甘蔗金龜子可持續控制技術研究[J].廣東農業科學,2012(2):65-68.
[4] 楊 漾,謝健文,胡月明,等.GIS技術在農作物病蟲害監測預警系統中的應用[J].廣東農業科學,2012(10):200-202.
[5] WANG Z Y, GEORGE J K. Fuzzy measure theory[M]. New York: Plenum Press, 1992.
[6] WANG Z Y, GUO H F. A new genetic algorithm for nonlinear multiregressions based on generalized Choquet integrals[A]. The 12th IEEE International Conference on Fuzzy Systems 2003(2)[C]. Louis:IEEE Press,2003.
(責任編輯 陳 焰)