王守會, 戴建國, 李栓明, 張國順, 崔美娜
(石河子大學信息科學與技術學院/兵團空間信息工程技術研究中心,新疆石河子 832000)
棉葉螨別稱棉紅蜘蛛,是世界性棉花害蟲,在國內外各大棉區均有分布[1-3]。尤其在新疆,夏季高溫炎熱且干燥少雨,氣候條件適宜種植棉花的同時也給棉葉螨種群的生長和繁殖提供了優越條件,使棉葉螨成為新疆地區危害棉花的主要害蟲之一,其中被危害嚴重的棉田可造成30%以上的減產[4],給新疆棉花生產帶來了較大損失。如果能夠運用科學有效的手段及時準確地對棉葉螨的發生發展趨勢進行預測,實現災前預防,對減少災害損失具有十分重要的意義。
病蟲害的發生發展主要受氣候條件(如溫濕度、降水量等)影響。基于此,許多學者基于氣象數據建立模型在病蟲害預測方面做了很多的研究工作,并取得了較好的研究成果[5-7]。其中在棉葉螨發生預測研究中,劉婧然等基于徑向基函數神經網絡(radical basis function,簡稱RBF)利用平均氣溫、最低氣溫、相對濕度和降水量建立了新疆石河子地區棉葉螨發生程度預測模型[8]。吳昊等對棉紅蜘蛛的發生成因進行了分析,并基于氣象因子分別建立了棉花苗期和伏秋期螨害等級預測模型,且預測結果均達到顯著水平[9]。因此,氣候條件是進行螨害預測時須要考慮的關鍵因素。
除氣象因素外,病蟲害的發生發展還與農田生境、作物長勢等多種因素有關[10-11]。研究表明,當作物受到病蟲害脅迫時其葉綠素含量、水分含量、細胞組織結構等生理狀態會發生變化,并由此引起光譜特征呈現一定的變化規律[12-13],成為遙感監測的依據。尤其近年來,隨著衛星遙感數據獲取及處理分析技術的不斷成熟,遙感逐漸成為大面積農作物病蟲害監測預測的有效手段,學者們對此開展了大量研究。
綜合分析,雖然氣象環境是導致螨害發生的主要因素,但作物的當前生長狀態和受害程度對螨害后續擴散發展也有很大影響。因此,棉葉螨的發生發展受氣候環境和棉花當前生理狀態2個方面的影響,將能夠反映作物生理指標的遙感植被指數與氣象數據相結合用于螨害預測研究較為科學合理,該研究方法也逐漸成為研究趨勢[14-15]。鑒于此,以新疆生產建設兵團第八師為研究區域,將棉花遙感生理監測與氣象因子相結合用于預測研究大面積棉田螨害的發生發展趨勢,為新疆棉花生產過程中棉葉螨的合理預防提供理論依據,并為類似的應用研究提供方法參考。
新疆生產建設兵團第八師(含石河子市)地處天山北麓中段,準噶爾盆地南緣,古爾班通古特大沙漠南緣(84°58′~86°24′E,43°26′~45°20′N,圖1),屬于典型的溫帶大陸性氣候,水資源較為豐富,冬季長而嚴寒,夏季短而炎熱,年平均氣溫為7.5~8.2 ℃,年日照時數為2 318~2 732 h,無霜期為147~191 d,年降水量為180~270 mm,年蒸發量為1 000~1 500 mm。棉花為全師的主要經濟作物,其播種面積每年在19萬hm2左右。
1.2.1 遙感數據獲取及處理 所選用的遙感數據來源于美國國家航空航天局(national aeronautics and space administration,簡稱NASA)于2013年發射的Landsat 8衛星,該衛星攜帶有陸地成像儀(operational land imager,簡稱OLI)和熱紅外傳感器(thermal infrared sensor,簡稱TIRS)2個傳感器。

OLI設有9個波段,包括可見光、近紅外和短波紅外波段,其中多光譜波段的空間分辨率為30 m,全色波段的空間分辨率為15 m,成像寬幅為185 km×185 km。影像的獲取時間為2017年6月27日和2017年7月13日共2景影像,影像清晰且覆蓋整個研究區,能夠滿足研究需要。
首先對影像進行輻射定標,將圖像的數字量化值(digital number,簡稱DN)轉化為輻射亮度值,然后進行大氣校正,以消除大氣和光照等因素對地物反射率的影響獲得真實地物反射率,最后對影像進行裁剪得到研究區的遙感影像。
1.2.2 棉花種植區域提取 利用2017年6月27日研究區遙感影像采用監督分類法對棉花的種植面積進行提取。首先,以曹衛彬等建立的農作物及地塊類型解譯標志為參考,結合近紅外波段合成的假彩色圖像對研究區內的7種地物類型(棉花、玉米、葡萄、居民地、山體、裸地、水體)建立感興趣區作為訓練樣本[16]。然后選擇監督分類中的最大似然分類方法對研究區地物類型進行分類,實現對棉花種植面積的提取。最后利用混淆矩陣對分類結果進行精度評價,總體精度為 97.24%,Kappa系數為0.95,分類效果較好,可以滿足后續研究需要。研究區地物類型以棉花為主,其他地物類型相對于棉花屬于極少數,存在分類樣本不平衡現象,因此可取得較高分類精度。
1.2.3 遙感特征因子提取 利用2017年6月27日(蕾期)、7月13日(花期)的2景遙感影像分別計算病蟲害監測研究中常用的7種植被指數[17-19],共獲得14種植被指數作為初選遙感特征因子。相關植被指數及其計算公式如表1所示。

表1 相關植被指數及其計算公式
1.2.4 氣象數據獲取與處理 為全面考慮氣象因素對棉葉螨發生發展的影響,共收集全師范圍內11個氣象站點的氣象數據(數據來源于新疆氣象網),氣象站點分布如圖1所示。由于氣象站點空間分布離散,所收集的氣象數據屬于點狀數據,而本研究需要獲取面狀連續的氣象數據,因此使用ArcGIS 10.4.1軟件對11個氣象站點的氣象數據采用克里金(Kriging)插值方法進行空間插值分析,從而得到空間連續的氣象信息。
1.2.5 氣象特征因子選取 根據氣象對棉葉螨的發生與作用規律,初選2016年11月、12月及2017年1月的平均溫度、最高溫度、最低溫度、平均相對濕度、地表溫度、5 cm地溫、2016年12至2017年1月累積降水量,2017年1月降水量及極度低溫,2月地表溫度、5 cm地溫,3—4月大于10 ℃積溫,3、4、5、6月平均溫度、平均相對濕度,4—6月累積降水量,5—6月累積降水量、溫濕系數、溫雨系數,6月上旬、下旬降水量,5、6月的溫濕系數、溫雨系數,7月平均溫度、最低溫度、降水量、溫濕系數、溫雨系數共47種數據作為氣象特征因子。
1.2.6 螨害實地調查數據 于2次衛星過境時間段(2017年6月27日—7月13日)內由人工進行實地調查??紤]到Landsat 8影像的空間分辨率為30 m,因此以30 m×30 m為1個調查單元。在調查單元內采用“Z”字形采樣法,每個單元調查8~10點,每點調查10株棉花并記錄螨害的發生情況(發病、健康),最后根據紅葉株數和調查總株數計算紅葉株率,并按照紅葉株率進行分級[27]。當紅葉株率達到3級時,則認為達到防治要求,將該調查點標記為螨害發生點,否則標記為健康點,并使用全球定位系統(global positoning system,簡稱GPS)記錄該點坐標,共調查106個采樣點。
首先,采用Relief算法[28]和泊松相關系數法(poisson correlation)相結合的方法對氣象與遙感共61個(47個氣象因子,14個植被指數)初選特征因子進行特征降維,獲取建模最佳特征;其次,分別使用3種方法(單一氣象因子、單一遙感植被指數、氣象因子與遙感植被指數相結合)建立預測模型;最后,對3種模型進行精度評價和對比分析,從而獲取最佳的建模方法和預測模型,并對整個研究區進行螨害預測,生成螨害發生空間分布圖。技術路線如圖2所示。
1.3.1 特征降維 首先利用Relief算法計算61種初選特征因子的特征權重(圖3)。特征權重越大,表示該特征用于分類模型時的分類能力越強,反之則表示該特征分類能力越弱。設置權重閾值為1 500,小于該閾值的特征將會被移除,最后剩余14種特征。其次,采用泊松相關系數法去除冗余特征,計算剩余兩兩特征之間的泊松相關系數,并設置相關性閾值為0.85,超過該閾值則認為2個特征之間相關性過高,存在信息冗余,將其中特征權重較小者進行剔除。最終篩選得到6月27日GNDVI、MSR以及7月13日RVI、5—6月累積降水量、5月溫濕系數、4—6月累積降水量、6月上旬降水量共7種特征因子。


1.3.2 模型建立 螨害的發生與否屬于非線性二分類問題,Logistic回歸是解決二分類問題非常有效的方法之一,該算法能夠很好地解釋在一定條件下事件發生與否的概率[29]。因此,本研究采用Logistic回歸建立螨害預測模型。螨害發生與否的表示方法為發生記為1,未發生記為0。Logistic回歸模型為:
(1)
式中:β0為常數項;β1、β2、…、βp為Logistic模型回歸系數;x1、x2、…、xp表示p個自變量;P表示在p個自變量的作用下發生螨害的條件概率,P≥0.5表示發生螨害,P<0.5表示健康。
對公式(1)作Logit變換,Logistic回歸模型可以變成線性形式:
(2)
1.3.3 精度評價 將準確率(Acc,公式3)、精確率(P,公式4)、召回率(R,公式5)和F1值(公式6)作為分類器的評價指標。各種指標的計算方法如下:
(3)
(4)
(5)
(6)
式中:TP表示將正類預測為正類數;FN表示將正類預測為負類數;FP表示將負類預測為正類數;TN表示將負類預測為負類數。
分別使用單一氣象因子(2017年5—6月累積降水量、5月溫濕系數、4—6月累積降水量、6月上旬降水量,記為模型1)、單一遙感植被指數(6月27日GNDVI、MSR以及7月13日RVI,記為模型2)以及氣象因子與遙感植被指數相結合(全部7個特征,記為模型3)3種方法進行Logistic回歸建模。其中,2/3的數據樣本用來建模,1/3用來精度驗證。由表2可以看出,3種模型在測試集上的準確率相較于訓練集上的準確率均有所下降,表明該分類模型的泛化能力有待提高,但對模型的錯分漏分情況分析發現,3種模型整體分類效果較好。通過計算測試集上的精確率、召回率、F1值并對比分析發現,模型3分類效果最好,模型2次之,模型1效果最差。

表2 不同螨害預測模型分類結果對比
分別用3種預測模型對整個研究區的螨害情況進行預測并生成分布圖,結果如圖4、圖5、圖6所示。


由圖4可知,螨害發生嚴重地區主要分布在142團、144團、134團、133團和石總場,而在132團、135團、136團、122團、147團和143團部分發生且相對較輕,在150團、149團和148團均無螨害發生。
由圖5可知,整個研究區均有螨害發生但整體發生相對較輕,無大面積螨害暴發區域。其中,在136團、135團、132團、133團、134團和142團附近相較于148團、149團、150團和石總場附近螨害發生嚴重。

由圖6可知,螨害發生集中分布于142團附近,在150團、石總場、143團和136團螨害均有發生,但相對較輕,呈零星點狀分布。根據調查,2017年研究區棉葉螨發生情況整體呈“南重北輕”的趨勢,其中142團發生面積較大,石總場有一定面積發生,其他團場均有輕微點片發生。將模型預測結果與實際情況分析比較可以看出,模型1和模型3的整體預測趨勢與實際情況較為相符,說明氣象環境的確在整體上對棉葉螨的發生起著重要作用,因此基于氣象因子的模型在大尺度上的預測效果比較好,這與前人的研究結果一致。但氣象隨空間變化緩慢,相鄰點差異很小,相比而言,遙感植被指數能夠反映空間上更細小的變化,具有更好的洞察能力。因此,對于螨害點片發生的情況,遙感模型的預測效果更好。而氣象與遙感結合的模型綜合了2類數據的優勢,既能反映空間上的變化趨勢,也能對小范圍點片發生情況進行較為準確地預測。
氣象環境和作物生理狀況均為棉葉螨的生存環境,決定了其發生發展的趨勢,因此,使用其中任何一種數據進行建模均可以對螨害發生發展進行預測。但結果表明,同時使用2種數據綜合考慮了影響螨害發生的2大因素,結合了二者的特點和優勢,因而所建模型具有更高的精度和更好的預測效果。
對于大尺度區域,氣象站點分布離散且不均勻,無法獲取研究區連續的氣象數據。因此,基于研究區內及周圍11個氣象站點通過空間插值方法獲取空間分布連續的氣象數據用于解決該問題。在實際應用時,所采用的空間插值方法和參數的選擇會直接影響插值精度,如果選擇不當,會使插值效果不理想,將影響預測模型的準確性。此外,越冬基數、棉花品種也是影響棉葉螨發生發展的關鍵因素,因此在后續的研究中應盡可能將該部分因素進行融合,以提高模型預測精度。
使用的遙感數據來源于Landsat 8衛星。Landsat 8空間分辨率為30 m,即每個像元表示30 m×30 m范圍的棉田,由于范圍較大,使得完全健康區域和有輕微螨害發生區域之間的光譜差異大大降低。尤其在棉葉螨點片發生初期,健康采樣點和螨害點片發生采樣點之間的光譜差異更小,如果處理不當會對模型造成干擾,為防止發生這種情況,將紅葉株率達到3級以上的采樣點認為有螨害發生,這種處理方法勢必會對模型精度造成影響,導致螨害早期輕微發生的區域無法得到有效判別,因此,發病樣點的紅葉株率閾值該如何設定還須進一步研究。如果能夠使用無人機進行遙感監測,則會在很大程度上克服這個問題。
基于氣象遙感數據建立模型并對新疆生產建設兵團第八師2017年7月棉葉螨進行預測,結果表明,將氣象數據和遙感數據相結合能夠對棉葉螨發生趨勢和分布情況進行較好地預測,該方法可以為新疆地區大尺度區域的棉葉螨預測預報和提前預防提供理論依據,并為相關研究提供借鑒。