嵇佳怡 俞徐苗 俞春暉 章宇超 李登秋


摘? ?要? ?準確獲取香榧林空間分布是進行合理經營管理的重要前提。以浙江香榧林主產區為研究對象,利用Landsat OLI遙感數據及地形數據,采用隨機森林模型提取了香榧林的空間分布,研究結果表明本文采用的方法總體精度為78%,明確了香榧林在各鄉鎮的分布,其中面積最大的為虎鹿鎮,種植比例最高的為雅璜鎮。
關鍵詞? ?香榧林;Landsat;遙感影像;隨機森林模型;空間分布
中圖分類號:S717.1? ? 文獻標志碼:A? ? DOI:10.19415/j.cnki.1673-890x.2018.34.027
近年來,隨著科學技術的進步和成功經驗的積累,加上香榧極高的栽植效益、繁育困難問題的突破,以及提高造林成活率技術的發展,浙江及周邊省份掀起了發展香榧的熱潮。然而人們對香榧的生長適應性認識仍有限并且缺乏定量化研究,由于規劃不合理、林分結構單一、管理不到位等問題,導致引種栽培的香榧產量低、品質差,影響周邊生態環境等,使得經濟效益和社會效益下降。準確提取香榧林種植的空間分布,研究其分布規律和生長情況,對于科學評價香榧林生態環境及合理經營管理具有重要意義。
隨著遙感技術的發展,利用遙感數據獲取地表信息成為區域尺度森林監測的重要手段。遙感影像具備豐富的空間信息,清楚地反映地物類型差異,并且具有幾何結構、紋理結構清晰的特點,已經廣泛應用于經濟建設和國防等多種領域,尤其在農業、森林、城市規劃方面作用顯著。從20世紀70年代出現民用資源衛星后,農業成為遙感技術最先投入應用和收益顯著的領域。隨著高空間、高光譜和高時間分辨率遙感數據的出現,農業遙感技術在農作物種類細分、田間精細農業信息獲取等關鍵技術方面取得了突破,農業生產向集約化方向轉變[1]。雖然目前采用遙感數據對地表各類信息進行了大量研究,但針對香榧林的提取研究還較少。
本文擬利用2016年的Landsat OLI影像數據和地形數據,并結合高分辨率遙感數據和野外觀測數據,利用隨機森林模型進行土地利用類型分類,對結果進行精度驗證和評價,進而獲得研究區主要土地利用類型的空間分布,并重點分析香榧林空間分布特征。
1 數據與方法
1.1 研究區狀況
以浙江省諸暨市東南部及周邊鄉鎮為主要研究區。諸暨市為全國香榧的主產地,利用和栽培香榧已有1 300多年歷史,地處浙中內陸,屬亞熱帶季風氣候區,年平均氣溫16.3 ℃,年平均降水量1 462 mm,年平均蒸發量882.1 mm,年均日照時數1 887.6 h。其主要森林植被類型有暖性針葉林、常綠闊葉林、落葉闊葉林、常綠落葉闊葉混交林、針闊混交林、竹林、經濟林、灌木林等。諸暨市擁有香榧種植面積
6 667 hm2,盛產2 667 hm2,香榧干果年產量750 t,產值達2.85億元,有百年以上香榧樹4.1萬株,由于種植香榧經濟效益顯著,帶動了周邊鄉鎮香榧大量發展。在2016年之前,谷來鎮、竹溪鎮、王院鎮、石璜鎮、雅璜鎮、通源鎮等香榧主要產地,人均香榧年已收入達到1萬元。
1.2 數據
通過USGS下載2016年9月20日覆蓋研究區的Landsat OLI數據,對Landsat 遙感影像數據進行預處理,主要包括幾何校正、大氣校正、研究區裁剪等,得到研究區反射率影像圖。根據研究區土地利用情況,將研究區土地利用類型分為建設用地、水體、農田、香榧林、裸地、灌木、闊葉林、針葉林、竹林共9種類型,通過外業調查,并結合Google Earth影像獲取了512個樣點數據(各類型樣本數見表1),用于隨機森林分類建模的訓練樣本和驗證樣本。
1.3 方法
1.3.1 數據處理
1)NDVI(歸一化植被指數)
NDVI也稱為生物量指標變化,能反映出植物冠層的背景影響,和植物的蒸騰作用、太陽光的截取、光合作用以及地表凈初級生產力等密切相關。
計算公式:NDVI=(NIR-R)/(NIR+R)
式中,NIR為近紅外波段反射值,R為紅波段處的反射率值。基于R語言,利用相應的算法公式計算研究區域的植被指數。
2)利用ASTER DEM數據獲得研究區30 m空間分辨率影像,并計算高程、坡度、坡向,結合NDVI數據用于隨機森林建模自變量。
1.3.2 利用隨機森林模型進行分類
隨機森林是一種數據挖掘模型,常用于分類預測,其中包含了多個樹形分類器,預測結果由多個分類器投票得出[2]。隨機森林建模與分類在R中進行。其主要原理是通過自助法(bootstrap)重采樣技術,從原始訓練樣本集N中有放回地重復隨機抽取k個樣本生成新的訓練樣本集合,然后根據自助樣本集生成k個分類樹組成隨機森林,新數據的分類結果按分類樹投票多少形成的分數而定。
具體實現過程如下:
1)原始訓練集為N,應用bootstrap法有放回地隨機抽取k個新的自助樣本集,并由此構建k棵分類樹,每次未被抽到的樣本組成了k個袋外數據;
2)設有mall個變量,則在每一棵樹的每個節點處隨機抽取mtry個變量,然后在mtry中選擇一個最具有分類能力的變量,變量分類的閾值通過檢查每一個分類點確定;
3)每棵樹最大限度地生長,不做任何修剪;
4)將生成的多棵分類樹組成隨機森林,用隨機森林分類器對新的數據進行判別與分類,分類結果按樹分類器的投票多少而定。
1.3.3 驗證
通過計算混淆矩陣來對香榧林覆蓋分類結果進行精度評價。總體分類精度和Kappa系數可以從誤差矩陣中計算出來,并用來對所選分類方法的整體效果進行評估;生產者精度和用戶精度可被用來評價每種地類的分類效果[3]。
2 結果與分析
2.1 分類結果的精度驗證
分類結果的精度驗證表明,基于隨機森林分類模型的總體精度為78%,其中香榧林的用戶精度為92%,生產者精度為88%,達到較好的分類效果(見表1)。但其中對于闊葉林和針葉林的分類精度較低,闊葉林用戶精度為64%,生產者精度為48%,針葉林用戶精度為72%,生產者精度為58%。分析原因,香榧林在遙感影像上呈現明顯的簇團形狀,而針葉林和闊葉林在影像上較為相似,且往往存在針闊混交,區分難度較大,導致精度較低。對數據進行Kappa系數的計算,得到Kappa為75%,說明總體分類結果一致性較好。
2.2 香榧林空間分布特征分析
從表2可見,2016年研究區香榧總種植面積為251.31 km2。其中:虎鹿鎮香榧種植總面積最大,為36.34 km2,占鄉鎮土地總面積的29.36%;雅璜鄉種植香榧密度最大,香榧面積占鄉鎮總面積的42.60%,竹溪鄉次之,香榧面積占鄉鎮總面積的35.73%;陳宅鎮香榧種植總面積最小,為2.99 km2,并且種植密度最低。
結合香榧的生長習性與當地的實際情況分析分布原因:
1)香榧為亞熱帶比較耐寒的樹種,喜溫濕潤、弱光涼爽的氣候環境下,朝夕多霧的溪流兩旁和直射光較少而散射光較多的山地是它最佳棲息地,適宜在長江中下游以南地區。諸暨市屬亞熱帶季風氣候區,四季分明,雨水較多,光照充足,年溫差大于同緯度鄰縣,小氣候差距顯著,屬于典型的丘陵山地氣候特征,十分適宜香榧的生長。同時,在研究區域具有會稽山脈,其主峰東白山在諸暨、嵊縣、東陽三縣交界處,屬虎鹿鎮境內,因此虎鹿鎮優越的地理條件使得其香榧種植面積最大。
2)近年來,隨著科學技術的進步和成功經驗的積累,繁育困難問題被突破,以及提高造林成活率技術的發展,為香榧林種植提供了技術保障,降低了種植培育難度,能夠支持大面積種植和管理香榧,并保證一定的收益。
3)政府這幾年的支持力度也是香榧林面積快速增長的主要原因。研究區作為浙江種植香榧的主要地區,其政府持續扶持推進香榧產業發展,做實產業規模;做優產業結構,實施支持發展產品精深加工和休閑旅游產業,優化結構、提高效益;做深產業開發,加大香榧產品開發,拓展香榧延伸產品,深入挖掘香榧文化。
3 結論
通過遙感數據結合隨機森林模型,提取了浙江香榧主產區土地利用類型空間分布圖,并對香榧林空間分布特征進行了分析,研究發現本文采用的方法能夠較好地提取香榧林的分布,提取結果表明香榧林分布相對集中,主要分布在諸暨、東陽、紹興三市的交界處,且香榧對生長環境要求較高,集中于稽東鎮、谷來鎮、璜山鎮、巍山鎮等地區。
參考文獻:
[1] 趙春江.農業遙感研究與應用進展[J].農業機械學報,2014,45(12):277-293.
[2] 趙北康.基于R語言randomforest包的隨機森林建模研究[J].計算機光盤軟件與應用,2015(2):152-153.
[3] 王亞杰.基于多源數據的香榧林分布信息提取及動態變化監測研究[D].杭州:浙江農林大學,2017.