蔡大鑫,劉少軍,陳匯林,田光輝
基于植被長勢的香蕉區域估產信息擴散模型*
蔡大鑫,劉少軍,陳匯林,田光輝
(海南省氣象科學研究所/海南省南海氣象防災減災重點實驗室,海口 570203)
基于Landsat-8和MODIS數據,首先采用面向對象方法對海南島香蕉種植區的空間分布進行初次提取,然后采用基于時序植被指數的馬氏距離方法進行二次提取,最后對兩次提取結果進行空間疊加,采用隨機選點實地驗證的方法對分類精度進行評價。針對區域估產樣本數量少的問題,統計2014?2015年的MODIS數據和2015年的香蕉區域產量數據,以全生育期香蕉長勢為輸入變量建立信息擴散區域估產模型,利用交叉驗證方法評價估產精度,同時評價估產模型對于產量增減變化趨勢模擬的準確性。通過組合多個生育階段構建三種信息擴散估產方案,對比各方案的估產精度。結果表明:(1)采用面向對象和馬氏距離的綜合分類方法精度較高,總分類精度和Kappa系數分別為82.5%和0.7338,一致性檢驗的結果較好。(2)基于全生育期香蕉長勢的信息擴散模型估產精度較高,平均相對誤差為26.0%,決定系數為0.9216,解釋能力和穩定性較好;對年際間產量趨勢變化的預估準確率達到83.3%。(3)基于全生育期構建的單變量信息擴散估產方案精度最高,相比其它兩種多變量建模方案平均相對誤差分別降低2.9個百分點和10.4個百分點。可見,信息擴散方法對于小樣本數據的處理能力較強,以全生育期為輸入變量構建的估產模型精度較高,適應性較好,可為熱帶經濟作物區域估產提供重要參考。
信息擴散;估產模型;遙感;經濟作物;香蕉
受限于氣象災害和生產技術水平,海南島香蕉產量穩定性差,年際間波動較大,因此,開展香蕉估產研究,準確把握產量的變化趨勢,對于香蕉種植產業的規劃布局和穩定發展具有重要意義。遙感估產是目前應用最廣泛的作物估產方法之一,特別適用于大面積、分布均一的種植類型。大面積作物產量遙感估算模型主要包括經驗模型、半機理模型和機理模型[1]。許多學者應用遙感方法開展了廣泛的研究,如趙東妮等[2?3]利用HP濾波法、Logistic方法模擬水稻趨勢產量,分析氣象條件對產量波動的影響。Dettori等[4]通過試驗及分析30a數據集校準CERES-Wheat模型,調試后的模型在預測小麥產量和開花期方面表現出相當好的性能。劉紅超等[5]以冬小麥關鍵生育期遙感數據與產量建立統計模型,其估產精度在95%以上。張祎等[6]選用作物機理模型APSIM模型開展氣候變化對玉米產量的影響研究,發現其對玉米生長發育和產量形成有很好的模擬能力。解毅等[7]通過粒子濾波算法同化LAI、土壤含水量、地上干生物量和CERES-Wheat模型狀態量,構建小麥同化估產模型,分析同化變量組合估產的精度。
經驗方法建模簡便,精度較高,研究成果也較多,如聚類分區[8]、混合光譜分析[9]、卷積神經網絡[10]、蒸散發模型[11]、隨機森林回歸[12]、時序定量遙感[13]等。但以往的研究多以小麥、水稻等大宗糧食作物為主,對經濟作物尤其是下墊面復雜的熱帶經濟作物研究不多,有關作物模型的研究也較少見,而且影響產量形成的因素復雜,因此采用何種方法預估能夠取得較好效果仍需開展研究加以驗證。另外開展大面積區域估產時經常會面臨樣本數量不足的問題,制約了模型的精度和適用性。信息擴散是一種對樣本進行集值化的模糊數學處理方法,可以將不完備的單值樣本基于擴散函數擴散到不同的控制點上,以實現挖掘更多的信息;還可以通過求取論域的控制點所確定的信息矩陣,獲得論域之間的模糊關系[14]。但目前的信息擴散方法多見于災害風險評估領域,而在作物產量預估方面應用較少。鑒于此,本研究以熱帶經濟作物香蕉為研究對象,利用信息擴散方法構建估產模型,評價其精度及適用性,同時分析生育期對建模精度的影響,以期為及時了解不同生態區域香蕉產量豐歉變化趨勢,制定貿易和宏觀調控政策提供參考。
海南島(18°10′?20°10′N,108°37′?111°03′E)面積約3.4萬km2,地勢四周低平,中間高聳,山地、丘陵、臺地、平原構成環形層狀地貌,梯級結構明顯。氣候類型屬熱帶季風海洋性氣候,主要特點是光照充足,熱量豐富,降水充沛。香蕉種植區主要分布在北部和西部,品種有香牙蕉、大蕉、粉蕉、龍牙蕉等。
香蕉沒有固定的生育期,一年四季都可種植。海南以春植為主,當年2?4月種植,第二年4?6月收獲,以避開夏、秋季臺風對成熟期香蕉的影響[15]。選定2014年3月?2015年5月為香蕉生育期,此時段的MODIS數據來源于國家衛星氣象中心網站(http://satellite.nsmc.org.cn/)。Landsat-8數據來自美國地質勘探局(USGS),1?7波段分辨率為30m,全色波段分辨率為15m,覆蓋海南全島共4景,時間及數據信息見表1。海南島18個市縣2014年和2015年香蕉種植面積、總產量數據來自《海南統計年鑒》2015版和2016版。

表1 數據源Landsat-8數據
MODIS數據提取前4個波段(0.459?0.876μm),經投影、校正、插值、裁切后的空間分辨率為250m。由MODIS數據計算NDVI,利用NDVI提取香蕉種植區面積和構建估產模型。對逐日NDVI數據采用最大值合成法合成為月度數據,即2014年3月?2015年5月逐月NDVI序列數據集。采用遙感影像處理軟件ENVI(The Environment for Visualizing Images)處理高分辨率衛星數據。下載的數據級別為L1T,已經進行過較為精確的幾何校正,滿足分類提取的要求。之后進行輻射定標,對多光譜數據和全色數據進行圖像融合,最后進行鑲嵌、勻色和增強。由于高分辨率影像僅用于香蕉面積提取,不參與指數計算,因此未進行大氣校正。
利用面向對象分類和馬氏距離兩種方法,通過對衛星影像資料的處理提取香蕉種植區。海南島山地丘陵面積超過三分之一,成片分布的蕉園較少,大量蕉地為分散種植,存在同物異譜或同譜異物的問題,因此采用面向對象分類技術對大面積蕉園種植區進行提取。面向對象分類技術以鄰近像元組成的對象為目標,在考慮對象光譜信息的同時,兼顧其形狀和紋理信息,通過對圖像進行分割和分類得到準確的輸出。之后根據香蕉與其它植被生育期內NDVI序列的差異,利用馬氏距離方法對分散蕉地進行提取[16]。馬氏距離表示數據的協方差距離,可以用來計算兩個未知樣本集的相似度或一個樣本點與數據分布集合的距離。NDVI序列是生育期內樣本NDVI月合成值曲線,待分類像元的NDVI序列與訓練樣本集之間的馬氏距離越小,表明該像元種植香蕉的概率越高。
1.4.1 基于全生育期NDVI的模型
據研究[17],生育期內NDVI累積值與產量存在較好的相關性。以各市縣香蕉全生育期的NDVI累積值作為信息擴散模型的輸入變量,其數據生產過程的詳細流程如下:
(1)逐日MODIS影像計算NDVI。
(2)NDVI按月進行最大值合成,即同位置像元取當月最大值。
(3)NDVI月合成值求和得到全生育期NDVI累積值。
(4)利用提取到的香蕉種植區矢量文件,得到各市縣香蕉全生育期NDVI累積值。
(5)由于NDVI累積值和產量數據的數量級較大,因此為便于計算,采用對數標準化方法進行處理,即求取二者以為底的對數。
標準化之后的全生育期NDVI累積值即為模型輸入變量,產量為輸出變量。信息擴散估產方法的一般步驟是將輸入輸出樣本在論域進行擴散,建立由信息增量構成的信息矩陣。然后由信息矩陣得到NDVI累積值與產量之間的模糊關系,即模糊關系矩陣。最后通過模糊近似推理方法,由輸入樣本得到模擬輸出產量。

X = {(x1, y1), (x2, y2),…, (xn, yn)} (1)
兩個分量的論域分別為U和V,其中的離散點為uj,j=1,2,…,m和vk,k=1,2,…,t。本文的樣本點經標準化處理后的值無量綱,在8.5~12.5之間,因此將論域U和V的區間設為8~13,包含樣本序列,論域離散點等步長取100個。
U = {u1, u2,…, um}, V = {v1, v2,…, vt} (2)
通過正態信息擴散函數將樣本信息擴散到論域空間U×V的離散點上。

式中,μ(xi, yi)是X×U×V到區間[0,1]的映射,hx、hy為函數的擴散系數,表示信息擴散的控制范圍[14],按以下經驗公式計算。

式中,b、a分別為樣本序列的最大值、最小值,n為序列長度。本文NDVI累積值和產量的擴散系數依式(4)計算,分別為0.4633和0.5780。

式中,Quv為X賦給U×V的信息增量,則矩陣

為X在U×V上的信息矩陣。由下式得到模糊關系矩陣。

通過模糊近似推理計算產量輸出采用文獻[18]的方法。
(1)根據輸入的單個驗證樣本x0,即NDVI累積值,利用信息分配方法建立論域U的模糊子集。下式中uj為U的離散點,Δ為步長。

(2)由模糊子集和模糊關系矩陣μR(u, v)得到模糊推論,其隸屬函數為

(3)取模糊子集向量與模糊關系矩陣乘積的最大值為權重向量W(w1, w2,…,wp),其對應的產量論域的vk組成估計向量G(g1, g2,…,gp),其中p為論域離散點個數。
(4)對估計向量G和權重向量W進行加權組合,得到產量估計y0。

1.4.2 基于分生育期NDVI的模型
作物敏感生育期的長勢變化對產量具有重要影響[19],因此,通過分析香蕉各生育期的特點,綜合一般發育期和敏感發育期,構建不同生長階段NDVI累積值與產量之間關系,建立分生育期NDVI的產量估算模型。
香蕉種植區提取結果利用總分類精度與Kappa系數檢驗,方法見文獻[20]。采用交叉驗證的方法比較分析18個市縣估測值與實測值之間的相對誤差(RE)、均方根誤差(RMSE)和決定系數(R2),評價信息擴散估產模型的適用性。
統計《海南統計年鑒》2015版中2014年各市縣的香蕉種植面積,由于后期建模是利用MODIS資料,因此依MODIS影像分辨率將種植面積換算得到總像元數量N。利用ENVI的面向對象圖像分類模塊對Landsat-8影像中的大面積蕉園進行提取。影像分割基于“邊緣檢測”,分割閾值設為30;合并基于“具有類似顏色和邊界大小相鄰節段”,合并閾值設為90;紋理內核大小設為10。將樣本分成香蕉、林地、草地、水體和其它五個類別,在分割圖中分別選擇對應樣本作為訓練樣本,分類方法選擇K鄰近法。初次分類后的影像依MODIS分辨率進行重采樣,其中香蕉像元數量為N1。將野外實地調查得到的香蕉分布點作為訓練樣本集,以這些香蕉像元生育期內的NDVI序列作為總體特征維度,對Landsat-8影像中分類得到的非香蕉區圖層,在MODIS數據中分別計算各像元與香蕉樣本總體之間的馬氏距離,并將所有像元依距離由小到大排成序列,由前往后取N?N1個像元。兩種方法得到的圖層進行空間疊加,即為海南島的香蕉分布,結果見圖1。
由圖中可見,海南島的香蕉主要分布在北部和西部。為評價分類精度,在分類圖中隨機選取40個樣本像元,通過實地調查獲取地物類型,計算得到總分類精度和Kappa系數分別為82.5%和0.7338,一致性檢驗的結果較好。

圖1 綜合面向對象方法和馬氏距離方法提取的海南島香蕉種植區分布
以各市縣全生育期(3月?翌年5月)標準化NDVI累積值作為輸入變量,以總產量為輸出變量,構建信息擴散模型。將模擬結果與2015年各市縣實際產量對比。結果見表2。由表中可見,信息擴散法模擬的2015年海南島18個市縣香蕉產量的平均相對誤差為26.0%,均方根誤差RMSE為34.2×103t,產量與實際產量的決定系數較高(R2=0.9216),偏離程度較小,模擬效果較好。
預測當年產量與上一年的增減動態變化,可以為經濟決策和生產規劃提供參考。利用作物長勢反映產量的變化趨勢,并根據距平大小推斷變化程度,在大區域尺度下可以取得較好效果[21],但隨著研究區域空間尺度的降低,預測誤差會隨之增大。由《海南統計年鑒》2015版和2016版分別得到2014年和2015年各市縣香蕉的實際產量,2015年實際產量與2014年實際產量的差值表示實際產量變化,2015年模擬產量與2014年實際產量的差值表示模擬產量變化,結果見表3。由表中可見,增減趨勢一致的站點占83.3%,預測效果較好。

表2 基于全生育期NDVI累積值的信息擴散估產模型模擬的2015年各市縣產量與實際產量對比
2.3.1 生育階段劃分方案
按照生育進程將香蕉的生育期依次劃為幼苗期、營養生長期、花芽分化期、抽蕾期和果實發育期,各時期遭遇氣象災害均會對產量造成影響,但影響程度有所差異。幼苗期為抽出大葉之前的時期,歷時2~3個月。營養生長期為抽出大葉?花芽分化前,期間抽生20~25片葉,主要是積累營養物質,為后期的花芽分化奠定基礎,此期生物積累量占全生育期生物產量的10%~16%。香蕉生長前期受害主要影響植株長勢和干物質積累,推遲花芽分化。花芽分化期和抽蕾期為花芽分化?斷蕾,此期易遭受冷害,干冷主要危害葉片,尤其是嫩葉、果穗和果實;濕冷主要危害未抽蕾的植株生長點或花芽花蕾,造成爛心。果實發育期為斷蕾至果實成熟,此期遇低溫陰雨易造成果實細小,果皮灰黃,同時滋生病害。香蕉進入花芽分化后以生殖生長為主,對氣象條件的變化較敏感,為敏感生育期,發育狀況與產量直接相關。
以不同生育期NDVI累積值的組合作為信息擴散模型的多維輸入變量構建模型,比較不同發育階段對產量形成的影響。綜合香蕉的一般發育期和敏感發育期,共構建三種估產方案。方案I:以整個生育期的NDVI累積為輸入變量;方案II:以幼苗初期?營養生長末期的NDVI累積為輸入變量1,以花芽分化初期?果實發育末期的NDVI累積為輸入變量2;方案III:以抽蕾期的NDVI累積為輸入變量1,果實發育期的NDVI累積為輸入變量2。三種方案的生育期及各輸入變量的擴散系數見表4。

表3 2015年各市縣模擬/實際香蕉產量相比2014年增減趨勢對比
注:“+”表示2015年產量比2014年增加,“-”表示2015年產量比2014年下降。
Note: “+”means that yield in 2015 is up (positive change) compared with 2014, “-”means down (negative change).
2.3.2 產量估算效果
基于不同生育期NDVI累積值構建信息擴散模型,比較不同發育階段對產量形成的影響。由表5可見,三種方案的平均相對誤差分別為26.0%、28.9%和36.4%,決定系數分別為0.9216、0.9229和0.8287,以全生育期建模方案(方案I)的精度最高,相比方案II和方案III的平均相對誤差分別降低了2.9個和10.4個百分點,而以生育后期NDVI值作為單獨輸入的方案III估產結果誤差最大,表明營養生長期的長勢變化對產量影響較大。

表4 三種生育階段建模方案的生育期和擴散系數

表5 三種方案的信息擴散模型模擬結果比較(2015年)
研究發現,作物長勢與產量之間存在非線性關系[22],許多學者也嘗試應用多種方法進行模擬以提高估產精度[10,23],并取得了較好的效果。但在進行大范圍遙感估產實踐中,常常會面臨實測數據不足的問題,而許多算法模型均建立在大樣本的基礎上[10]。本研究選擇的信息擴散方法既可以對樣本進行集值化處理,彌補信息不足,又具有一定的非線性模擬能力,在區域估產中表現了較好的適應性。
作物的生殖生長期新陳代謝旺盛,是產量形成的關鍵時期,此時的長勢狀況與產量的相關性最強[19],劉紅超等[5,24]的研究都基于這一理論,也取得了較好的效果。但本文對2015年香蕉產量分生育期建模估產結果表明,全生育期建模方案的效果最好,而僅考慮果實生長關鍵期的方案誤差較大,其原因可能與海南2014年的氣候狀況有關。海南每年的臺風季為6?10月,此時正值香蕉的營養生長期,一般影響較小的臺風可以通過采取防臺措施,如合理選址、種植抗風品種、打防風樁、施肥培土等措施減輕災害,但2014年海南遭遇史上最強登陸臺風“威馬遜”,兩個月后又受“海鷗”侵襲,大風、暴雨使香蕉的株體斷倒,葉片破損,光合作用降低,養分運輸受阻,因此,導致產量對生長前期長勢變化的響應高于后期。香蕉生育期長,氣象災害對產量影響大,前期受害嚴重會導致光合產物的分配發生變化[25],而孕蕾后的作物長勢不能完全反映這種變化,有關生理過程對長勢影響的機理性研究也較少,因此選用全生育期構建的模型更符合熱帶香蕉種植區的實際。
(1)信息擴散估產模型通過構建模糊集合,建立香蕉長勢與產量之間的模糊關系,估計的產量精度較高,平均相對誤差為26.0%,解釋能力和穩定性均較好,對于年際間產量變化趨勢預測的準確率也較高,可以滿足實際業務需求。
(2)通過建立分生育期估產方案對比各發育階段對估產精度的影響,發現以全生育期香蕉長勢作為輸入變量的信息擴散模型效果最好,優于分階段的多維信息擴散方案,可以兼顧氣象災害和敏感生育期長勢對產量的影響。以營養生長期和生殖生長期同時輸入的估產方案Ⅱ的精度又要高于僅考慮生殖生長期的方案Ⅲ,表明熱帶地區香蕉營養期長勢對于產量的影響較大。
(3)信息擴散方法在小樣本數據的處理中具有優勢,而且對于非線性關系的模擬能力較好,構建的全生育期估產模型在香蕉種植區具有較好的適用性。本文構建的估產模型可以在香蕉果實膨大后期應用,也可以在進入抽蕾后開展定期滾動預報,以提高時效性,為農業部門和農戶合理安排生產銷售提供科學依據。
[1] 陳仲新,任建強,唐華俊,等.農業遙感研究應用進展與展望[J].遙感學報,2016,20(5):748-767.
Chen Z X,Ren J Q,Tang H J,et al.Progress and perspectives on agricultural remote sensing research and applications in China[J].Journal of Remote Sensing,2016,20(5):748-767.(in Chinese)
[2] 趙東妮,王艷華,任傳友,等.3種水稻趨勢產量擬合方法的比較分析[J].中國生態農業學報,2017,25(3):345-355.
Zhao D N,Wang Y H,Ren C Y,et al.Comparative analysis of three fitting methods of rice trend yield[J].Chinese Journal of Eco-Agriculture,2017,25(3):345-355.(in Chinese)
[3] 胡慧芝,劉曉瓊,王建力.氣候變化下漢中盆地水稻產量變化研究[J].自然資源學報,2018,33(4):609-620.
Hu H Z,Liu X Q,Wang J L.Study on the change of rice yield in Hanzhong basin under climate change[J].Journal of Natural Resources,2018,33(4):609-620.(in Chinese)
[4] Dettori M,Cesaraccio C,Motroni A,et al.Using CERES-Wheat to simulate durum wheat production and phenology in Southern Sardinia,Italy[J].Field Crops Research,2011,120: 179-188.
[5] 劉紅超,梁燕,張喜旺.多時相影像的冬小麥種植面積提取及估產[J].遙感信息,2017,32(5):87-92.
Liu H C,Liang Y,Zhang X W.Winter wheat area extraction and yield estimation using multi-temporal images[J].Remote Sensing Information,2017,32(5):87-92.(in Chinese)
[6] 張祎,趙艷霞.多模式集合模擬氣候變化對玉米產量的影響[J].中國生態農業學報,2017,25(6):941-948.
Zhang Y,Zhao Y X.Multi-model ensemble for simulation of the impact of climate change on maize yield[J].Chinese Journal of Eco-Agriculture,2017,25(6):941-948.(in Chinese)
[7] 解毅,王鵬新,王蕾,等.基于作物及遙感同化模型的小麥產量估測[J].農業工程學報,2016,32(20):179-186.
Xie Y,Wang P X,Wang L,et al.Estimation of wheat yield based on crop and remote sensing assimilation models[J]. Transactions of the CSAE,2016,32(20):179-186.(in Chinese)
[8] 李昂,王洋,曹英麗,等.基于無人機高清數碼影像的水稻產量估算[J].沈陽農業大學學報,2017,48(5):629-635.
Li A,Wang Y,Cao Y L,et al.Rice yield estimation based on high-definition digital image of UAV[J].Journal of Shenyang Agricultural University,2017,48(5):629-635.(in Chinese)
[9] 劉雅婷,龔龑,段博,等.多時相NDVI與豐度綜合分析的油菜無人機遙感長勢監測[J].武漢大學學報(信息科學版), 2020,45(2):265-272.
Liu Y T,Gong Y,Duan B,et al.Combining multi-temporal NDVI and abundance from UAV remote sensing data for oilseed rape growth monitoring[J].Geomatics and Information Science of Wuhan University,2020,45(2):265-272.(in Chinese)
[10] 周亮,慕號偉,馬海姣,等.基于卷積神經網絡的中國北方冬小麥遙感估產[J].農業工程學報,2019,35(15):119-128.
Zhou L,Mu H W,Ma H J,et al.Remote sensing estimation on yield of winter wheat in North China based on convolutional neural network[J].Transactions of the CSAE,2019,35(15): 119-128.(in Chinese)
[11] 蔣磊,尚松浩,楊雨亭,等.基于遙感蒸散發的區域作物估產方法[J].農業工程學報,2019,35(14):90-97.
Jiang L,Shang S H,Yang Y T,et al.Method of regional crop yield estimation based on remote sensing evapotranspiration model[J].Transactions of the CSAE,2019,35(14):90-97.(in Chinese)
[12] 王鵬新,齊璇,李俐,等.基于隨機森林回歸的玉米單產估測[J].農業機械學報,2019,50(7):237-245.
Wang P X,Qi X,Li L,et al.Estimation of maize yield based on random forest regression[J].Transactions of the Chinese Society for Agricultural Machinery,2019,50(7):237-245.(in Chinese)
[13] 劉新杰,魏云霞,焦全軍,等.基于時序定量遙感的冬小麥長勢監測與估產研究[J].遙感技術與應用,2019,34(4): 756-765.
Liu X J,Wei Y X,Jiao Q J,et al.Growth monitoring and yield prediction of winter wheat based on time-series quantitative remote sensing data[J].Remote Sensing Technology and Application,2019,34(4):756-765.(in Chinese)
[14] 王學林,黃琴琴,柳軍.基于信息擴散理論的南方雙季早稻氣象災害風險評估[J].中國農業氣象,2019,40(11):712-722.
Wang X L,Huang Q Q,Liu J.Risk assessment for meteorological disasters of early rice in the southern double-season region based on information diffusion theory[J].Chinese Journal of Agrometeorology,2019,40(11): 712-722.(in Chinese)
[15] 許林兵,高愛平,蒲金基,等.香蕉、芒果安全生產技術指南[M].北京:中國農業出版社,2011:49-50.
Xu L B,Gao A P,Pu J J.Technical guide for safe production of banana and mango[M].Beijing:China Agriculture Press,2011:49-50.(in Chinese)
[16] Li Z,Fox J M.Mapping rubber tree growth in mainland Southeast Asia using time-series MODIS 250m NDVI and statistical data[J].Applied Geography,2012,32:420-432.
[17] 高學慧,黃淑娥,顏流水,等.基于MODIS遙感資料的江西省雙季早稻估產研究[J].江西農業大學學報,2013, 35(2):290-295.
Gao X H,Huang S E,Yan L S,et al.Yield estimation on Jiangxi early rice based on MODIS data[J].Acta Agriculturae Universitatis Jiangxiensis,2013,35(2):290- 295.(in Chinese)
[18] 黃崇福.自然災害風險評價:理論與實踐[M].北京:科學出版社,2005:83,110-114.
Huang C F.Risk assessment of natural disaster:theory & practice[M]. Beijing:Science Press,2005:83,110-114.(in Chinese)
[19] 譚昌偉,杜穎,童璐,等.基于開花期衛星遙感數據的大田小麥估產方法比較[J].中國農業科學,2017,50(16):3101-3109.
Tan C W,Du Y,Tong L,et al.Comparison of the methods for predicting wheat yield based on satellite remote sensing data at anthesis[J].Scientia Agricultura Sinica,2017,50(16):3101- 3109.(in Chinese)
[20] 毛學剛,杜子涵,劉家倩,等.基于無人機LiDAR的天然林與人工林林隙提取[J].農業機械學報,2020,51(3):232-240.
Mao X G,Du Z H,Liu J Q,et al.Extraction of forest gaps in natural forest and man-made forest based on UAV LiDAR[J]. Transactions of the Chinese Society of Agricultural Machinery,2020,51(3):232-240.(in Chinese)
[21] 錢永蘭,侯英雨,延昊,等.基于遙感的國外作物長勢監測與產量趨勢估計[J].農業工程學報,2012,28(13):166-171.
Qian Y L,Hou Y Y,Yan H,et al.Global crop growth condition monitoring and yield trend prediction with remote sensing[J].Transactions of the CSAE,2012,28(13):166-171. (in Chinese)
[22] 王愷寧,王修信.多植被指數組合的冬小麥遙感估產方法研究[J].干旱區資源與環境,2017,31(7):44-49.
Wang K N,Wang X X.Research on winter wheat yield estimation with the multiply remote sensing vegetation index combination[J].Journal of Arid Land Resources and Environment,2017,31(7):44-49.(in Chinese)
[23] 孫擎,楊再強,楊世瓊,等.多種格點作物模型對中國區域水稻產量模擬能力評估[J].中國農業氣象,2019,40(4): 199-213.
Sun Q,Yang Z Q,Yang S Q,et al.Evaluations and projections of rice yield from multi-gridded crop model over China[J]. Chinese Journal of Agrometeorology,2019,40(4):199-213.(in Chinese)
[24] 朱婉雪,李仕冀,張旭博,等.基于無人機遙感植被指數優選的田塊尺度冬小麥估產[J].農業工程學報,2018,34(11): 78-86.
Zhu W X,Li S J,Zhang X B,et al.Estimation of winter wheat yield using optimal vegetation indices from unmanned aerial vehicle remote sensing[J].Transactions of the CSAE,2018, 34(11):78-86.(in Chinese)
[25] 劉溢健,任建宏,殷俐娜,等.馬鈴薯塊莖膨大期不同程度干旱后復水的源庫補償效應[J].應用生態學報,2019,30(11): 3777-3786.
Liu Y J,Ren J H,Yin L N,et al.Compensation effect of re-watering after different drought stresses on source-sink metabolism during tuber expansion period of potato[J]. Chinese Journal of Applied Ecology,2019,30(11):3777- 3786.(in Chinese)
Information Diffusion Model of Banana Yield Estimation Based on Vegetation Growth
CAI Da-xin,LIU Shao-jun,CHEN Hui-lin,TIAN Guang-hui
(1. Research Institute of Hainan Meteorological Bureau/Key Laboratory of Meteorological Disaster Preventing and Reducing of South China Sea, Haikou 570203, China)
Banana is an important tropical fruit in Hainan. Limited by meteorological disasters and the level of production technology, banana production has weak stability and large inter-annual fluctuations in Hainan. Remote sensing yield estimation is currently one of the most widely used crop yield estimation methods, especially suitable for large-area, uniformly distributed planting types. Therefore, carrying out research on banana yield estimation by remote sensing and accurately grasping the change trend of yield is of great significance to the planning and stable development of the banana planting industry. Based on Landsat-8 and MODIS data, the object-oriented method was first used to extract the spatial distribution of banana growing areas in Hainan Island, and then the Mahalanobis distance method based on the time series vegetation index was used for the second extraction, and finally the results of the two extractions were spatially overlaid. The method of field verification at random selected points was used to evaluate the classification accuracy. Aiming at the problem of the small number of regional yield estimation samples, the MODIS data from 2014 to 2015 and the banana regional yield data in 2015 were collected. The growth of banana throughout the growth period was used as an input variable to establish an information diffusion model for regional yield estimation. NDVI data was calculated by daily MODIS images, and synthesized to monthly data. The monthly composite values of NDVI was summed to obtain the cumulative value of NDVI throughout the growth period. Using the obtained vector files of banana planting areas, the cumulative NDVI values of bananas were extracted in 18 counties during the whole growth period. As the input and output variables of the information diffusion model, the cumulative value of NDVI and yield data were logarithmically normalized. The normal diffusion function was used to diffuse the sample information into the whole field, and an information matrix composed of information increments was established. Then the fuzzy relationship between the cumulative value of NDVI and the yield was obtained from the information matrix, that was the fuzzy relationship matrix. Finally, through the fuzzy approximate reasoning method, the simulated yield was obtained from the input samples. The cross-validation method was used to evaluate the accuracy of production estimation, and at the same time, the accuracy of the production estimation model for the simulation of production change trends was evaluated. Three kinds of information diffusion estimation schemes were constructed by combining multiple growth stages: scheme I was the NDVI cumulative value modeling scheme for the whole growth period; scheme Ⅱ was the scheme of joint input of vegetative growth stage and reproductive growth stage; scheme Ⅲ was the scheme of joint input during the budding stage and fruit development stage. The estimation accuracy of each plan was compared at last. The results showed that: (1) the comprehensive classification method using object-oriented and Mahalanobis distance had a higher accuracy. The total classification accuracy and Kappa coefficient were 82.5% and 0.7338 respectively, and the result of the consistency test was better. (2) The information diffusion model based on banana growth during the whole growth period had high yield estimation accuracy, with an average relative error of 26.0%, a coefficient of determination of 0.9216, and good explanatory power and stability; the accuracy of the estimation of inter-annual yield change trends reached 83.3%. (3) The univariate information diffusion estimation scheme based on the entire growth period had the highest accuracy, and the average relative error was reduced by 2.9 and 10.4 percentage point respectively compared with the other two multivariate modeling schemes. Based on the above results, it could be found that a fuzzy relationship was established with the information diffusion method between banana growth and yield by constructing a fuzzy set. The model was estimated with high accuracy, good explanatory ability and stability, and the accuracy rate for predicting the inter-annual yield change trend was also high, which could meet actual business needs. Through the establishment of a phase-by-growth yield estimation program to compare the impact of each developmental stage on the yield estimation accuracy, it was found that the effect of information diffusion model with whole growth period as the input variable was the best, which could take into account the impact of meteorological disasters and sensitive growth periods on yield. The accuracy of the yield estimation scheme II, which inputted both the vegetative growth period and the reproductive growth period, was higher than that of the program III, which only considered the reproductive growth period. The performance of information diffusion method with advantages in the processing of small sample data and ability to simulate nonlinear relationships was better. Applicability of yield estimation model based on full growth period in banana planting areas was judged satisfactory. The yield estimation model could be applied in the late stage of banana fruit expansion, and could also be used to carry out regular rolling forecasts after budding, to improve timeliness and provided scientific basis for agricultural departments and farmers to rationally arrange production and sales.
Information diffusion; Estimated model; Remote sensing; Cash crops; Banana
2019?12?03
國家自然科學基金(41765007;41465005;41675113);海南省基礎與應用基礎研究計劃(自然科學領域)高層次人才項目(2019RC359);海南省氣象局科研項目(HNQXMS201502)
蔡大鑫,E-mail:cdxxxhyn@126.com
10.3969/j.issn.1000-6362.2020.09.005
蔡大鑫,劉少軍,陳匯林,等.基于植被長勢的香蕉區域估產信息擴散模型[J].中國農業氣象,2020,41(9):587-596