999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機(jī)森林和Landsat8 OLI影像的 臍橙果園種植信息提取

2021-12-03 07:29:16娜,王偉*,王
地理空間信息 2021年11期
關(guān)鍵詞:分類特征

林 娜,王 偉*,王 斌

(1.重慶交通大學(xué) 土木工程學(xué)院,重慶 400074;2.重慶市地理信息和遙感應(yīng)用中心,重慶 401147)

臍橙因其可食性高、易貯藏和市場(chǎng)廣闊等特點(diǎn),在我國(guó)江西、福建、重慶等紅壤丘陵區(qū)被廣泛種植。重慶奉節(jié)是我國(guó)重要的臍橙生產(chǎn)區(qū),2009年被授予 “中國(guó)橙都”稱號(hào),臍橙果業(yè)發(fā)達(dá),品種豐富。20世紀(jì)以來(lái),地方政府整合資源大力發(fā)展臍橙產(chǎn)業(yè),極大地促進(jìn)了地方經(jīng)濟(jì)增長(zhǎng)。但是,大規(guī)模種植臍橙果園,對(duì)于地區(qū)生物多樣性和地表土壤的能量平衡都會(huì)產(chǎn)生一定影響。傳統(tǒng)果園種植模式的粗放性,不僅會(huì)造成土壤污染、土壤結(jié)構(gòu)破損,而且會(huì)引發(fā)較嚴(yán)重的水土流失現(xiàn)象,對(duì)地區(qū)生態(tài)環(huán)境構(gòu)成重大威脅[1-3]。傳統(tǒng)方法采取走訪調(diào)查的方式獲取果園種植信息,需耗費(fèi)大量的人力物力,且易受主觀因素的影響;而遙感技術(shù)具有重返快、覆蓋廣和成本低等特點(diǎn)[4],可實(shí)時(shí)準(zhǔn)確地獲取臍橙果園的空間分布信息,能為當(dāng)?shù)氐霓r(nóng)業(yè)政策制定提供支持。

目前,SVM、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林等機(jī)器學(xué)習(xí)分類算法已在遙感信息提取方面得到了廣泛應(yīng)用[5-7],其中,隨機(jī)森林算法具有人工干預(yù)少、運(yùn)算速度快、魯棒性強(qiáng)等優(yōu)點(diǎn)[8]。顧海燕[9]等利用WorldView-2高分辨率衛(wèi)星遙感影像構(gòu)建了基于隨機(jī)森林算法的分類模型,從而提取了地表覆蓋信息,并與SVM方法進(jìn)行了對(duì)比,結(jié)果表明該方法具有更快的運(yùn)算速度和更高的分類精度;呂杰[10]等將SVM、最小距離法、隨機(jī)森林算法3種分類模型應(yīng)用于GF-1號(hào)衛(wèi)星遙感數(shù)據(jù)的森林樹種分類研究中,結(jié)果表明隨機(jī)森林算法具有較高的適用性;馬玥[11]等基于隨機(jī)森林分類模型對(duì)齊齊哈爾地區(qū)的Landsat8 OLI數(shù)據(jù)進(jìn)行了土地利用信息分類研究,分類精度較SVM、MLC方法有較大的提 高;任傳帥[12]等利用GF-2號(hào)高分辨率影像和隨機(jī)森林算法成功提取了海南北部的香蕉林信息;宋榮杰[13]等結(jié)合小波紋理分析和隨機(jī)森林算法較好地提取了獼猴桃果園信息;王娜[14]等基于隨機(jī)森林算法和單變量特征選擇方法,利用多源信息綜合的分類方案,有效提取了實(shí)驗(yàn)區(qū)的主要農(nóng)作物;GAO T[15]等基于隨機(jī)森林算法,采用多時(shí)相光譜信息、多尺度紋理信息和地形因子對(duì)河北塞罕壩林區(qū)的樹種進(jìn)行了分類研究;WANG B[16]等基于多時(shí)相Landsat8 OLI影像和隨機(jī)森林算法提取了茶園信息,利用光譜信息、紋理信息、植被指數(shù)特征構(gòu)建了多層次的特征集,結(jié)果表明采用特征優(yōu)選法構(gòu)建的多季節(jié)優(yōu)選特征集具有最高的提取精度。

由上述研究可以看出,隨機(jī)森林算法具有提取精度高、魯棒性強(qiáng)等優(yōu)點(diǎn),但目前該算法在臍橙果園種植信息提取方面的研究仍相對(duì)較少。本文充分利用隨機(jī)森林算法的優(yōu)勢(shì),選取重慶奉節(jié)地區(qū)質(zhì)量較好的Landsat8 OLI影像數(shù)據(jù),綜合光譜特征、植被指數(shù)特征、紋理特征和地形因子構(gòu)建初始特征集和優(yōu)選特征集,探索能有效識(shí)別臍橙果園的分類特征與模型,以期為基于遙感技術(shù)快速、準(zhǔn)確獲取臍橙果園種植信息提供依據(jù)。

1 數(shù)據(jù)來(lái)源與研究方法

1.1 研究區(qū)概況與數(shù)據(jù)來(lái)源

奉節(jié)縣位于重慶市東部、三峽庫(kù)區(qū)腹心地區(qū)(圖1),地理坐標(biāo)為109e1′17″~109e45′58″E、30e29′19″~31e22′33″N。全縣總面積為4 087 km2,地勢(shì)南北高、中部低,海拔為135~2 123 m;屬中亞熱帶濕潤(rùn)季風(fēng)氣候,年平均氣溫為18℃,年降水量為769 mm,年平均無(wú)霜期為364 d,年平均濕度為67%,具有開展臍橙種植的優(yōu)越地貌與氣候條件。

圖1 研究區(qū)遙感影像圖

本文選取Landsat8 OLI多光譜影像作為主要數(shù)據(jù)源。Landsat8為美國(guó)航天局陸地衛(wèi)星計(jì)劃的第八顆衛(wèi)星,攜有OLI陸地成像儀和TIRS熱紅外傳感器,其中OLI陸地成像儀包括9個(gè)光譜波段,空間分辨率為 30 m。本文中的Landsat8 OLI產(chǎn)品數(shù)據(jù)下載于地理空間數(shù)據(jù)云,數(shù)據(jù)時(shí)相為2017-02-05、2017-11-04和2017-12-22;其他數(shù)據(jù)包括30 m分辨率DEM數(shù)據(jù)、同年土地利用數(shù)據(jù)、GF-1號(hào)衛(wèi)星影像數(shù)據(jù)和2017年實(shí)地調(diào)查數(shù)據(jù)。 本文主要利用EnMAP-BOX和ENVI軟件對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。首先根據(jù)矢量數(shù)據(jù)對(duì)初始影像進(jìn)行裁剪;再利用ENVI 5.3中的輻射校正模塊對(duì)影像進(jìn)行輻射校正,校正時(shí)需注意OLI陸地成像儀對(duì)應(yīng)的增益和偏移參數(shù);最后進(jìn)行快速大氣校正。

1.2 研究方法

本文以隨機(jī)森林算法為分類模型,基于光譜特征、紋理特征、植被指數(shù)特征、地形因子及其組合,對(duì)奉節(jié)縣臍橙果園種植的空間分布信息進(jìn)行提取??傮w技術(shù)流程如圖2所示。

圖2 總體技術(shù)流程圖

1.2.1 果園特征提取

1)紋理特征。影像判讀場(chǎng)景下,紋理特征可反映影像的均勻、細(xì)致、粗糙等情況。遙感影像可生成許多紋理指標(biāo),本文采用灰度共生矩陣計(jì)算相關(guān)紋理特征。其數(shù)學(xué)模型為:

式中,Z為該集合中元素的數(shù)目;f(x1,y1)=h表示影像(x1,y1)處像元的灰度值為h;d為兩個(gè)像元之間的距離,取值范圍為{1,2,3,4};θ為兩個(gè)像元之間的方向角,取值范圍為{0e 45e 90e 135e}。

本文選取均值、方差、協(xié)同性、對(duì)比度、相異性、熵、二階矩和相關(guān)性8個(gè)紋理特征對(duì)影像進(jìn)行定量分析。由式(1)可知,各紋理統(tǒng)計(jì)量均為關(guān)于方向的函數(shù),為消除角度帶來(lái)的影響,本文采用先疊加4個(gè)方向的統(tǒng)計(jì)量再求平均值的方法。由于多波段紋理分析會(huì)產(chǎn)生一定的信息交叉問題,因此本文在對(duì)原始影像進(jìn)行主成分分析后選取第一主成分波段來(lái)獲取上述 8個(gè)紋理特征[17-18]。

2)植被指數(shù)特征。植被指數(shù)是從多光譜數(shù)據(jù)中提取的、能有效度量地表植被狀況的數(shù)值,與植被覆蓋度、生物量均有較好的相關(guān)性[19]。本文采用歸一化植被指數(shù)(NDVI)、土壤調(diào)節(jié)植被指數(shù)(SAVI)、增強(qiáng)型植被指數(shù)(EVI)和比值植被指數(shù)(RVI)進(jìn)行分析研究。

式中,NIR為近紅外波段反射值;R為紅光波段反射值。

式中,L為樹冠調(diào)整系數(shù),本文設(shè)置L=0.5,該值能最大限度地減少土壤亮度的影響,且無(wú)需對(duì)不同土壤類型進(jìn)行重新設(shè)置。

式中,B為藍(lán)光波段反射值;E為增強(qiáng)因子;M1、M2分別為氣溶膠阻抗系數(shù)。L、M1、M2和E的經(jīng)驗(yàn)值分別為1、6、7.5和2.5。

3)地形因子。地形作為重要的環(huán)境因子,控制著水、光、土壤養(yǎng)分等資源的再分配,進(jìn)而影響植被的分布。本文利用ArcGIS 10.4軟件從研究區(qū)的DEM數(shù)據(jù)中提取坡度和坡向信息,將高程、坡度、坡向因子引入到研究區(qū)臍橙果園信息的提取研究中。

所有特征提取參數(shù)如表1所示。

表1 特征參數(shù)統(tǒng)計(jì)

1.2.2 隨機(jī)森林算法

隨機(jī)森林算法最早由Breiman L[20]提出,是一種基于分類與回歸決策樹(CART)的新型機(jī)器學(xué)習(xí)算法,可分析多達(dá)幾千個(gè)輸入特征的重要性,是目前應(yīng)用最廣泛的機(jī)器學(xué)習(xí)算法之一[21-22]。其主要思想是集成眾多決策樹的結(jié)果對(duì)分類任務(wù)進(jìn)行統(tǒng)籌分析,具體實(shí)現(xiàn)過(guò)程為:

1)構(gòu)建訓(xùn)練樣本集。采用隨機(jī)且有放回的方式從原始樣本集中抽取部分樣本構(gòu)成訓(xùn)練樣本集(Bootstrap法),重復(fù)N次即可得到N個(gè)訓(xùn)練樣本集。

2)建立N棵CART決策樹。以訓(xùn)練樣本集中的樣本為基礎(chǔ),首先從全部的輸入特征M中隨機(jī)選取m個(gè)特征(節(jié)點(diǎn)隨機(jī)分裂法),然后根據(jù)方差不純度指標(biāo)對(duì)m個(gè)特征進(jìn)行建樹。其計(jì)算公式為:

式中,wi為第i類的屬性;wj為節(jié)點(diǎn)N處屬wj樣本數(shù)占總樣本數(shù)的頻度;i為方差不純度。

預(yù)設(shè)一個(gè)方差不純度下降值的閾值,若分支后方差不純度的下降值小于該閾值,則停止分支。至此,N棵決策樹構(gòu)建完成。

3)統(tǒng)籌決策樹結(jié)果。將構(gòu)建好的所有決策樹組成隨機(jī)森林,利用隨機(jī)森林分類器進(jìn)行分類,最終通過(guò)投票的方式來(lái)確定分類結(jié)果。

在本文中,隨機(jī)森林算法不僅能對(duì)Landsat8 OLI影像進(jìn)行分類,而且能對(duì)輸入特征進(jìn)行重要性排序。在Bootstrap抽樣過(guò)程中,原始數(shù)據(jù)中約有1/3未被抽取到,這部分?jǐn)?shù)據(jù)稱為袋外數(shù)據(jù)(OOB)。通過(guò)OOB數(shù)據(jù)產(chǎn)生的OOB誤差可計(jì)算得到各輸入特征的重要性,從而進(jìn)行特征選擇[23]。特征重要性評(píng)估模型的表達(dá)式為:

式中,F(xiàn)E為特征重要性;M為特征總數(shù);N為分類決 策樹總數(shù);為對(duì)特征MA加入噪聲前第t棵分類決策樹的OOB誤差值;為對(duì)特征MA加入噪聲后 第t棵分類決策樹的OOB誤差值。若給特征MA加入噪聲后,OOB誤差顯著提高導(dǎo)致精度損失量較大,則說(shuō)明該輸入特征的重要性程度較高。

隨機(jī)森林算法中的兩個(gè)主要參數(shù)為分類決策樹數(shù)量N和建樹中隨機(jī)選取的特征數(shù)m。對(duì)于m值,本文選取總特征數(shù)的算術(shù)平方根作為實(shí)驗(yàn)值;對(duì)于N值, 其值越高其分類準(zhǔn)確率不僅達(dá)不到最高,而且運(yùn)算時(shí)間和內(nèi)存成本也會(huì)較高,本文經(jīng)多次試驗(yàn)發(fā)現(xiàn),N值設(shè)置為1 000時(shí),各方案的OOB誤差趨于穩(wěn)定。

1.2.3 精度評(píng)價(jià)

混淆矩陣也稱誤差矩陣,主要用于比較分類結(jié)果與實(shí)際類別值,并把分類精度顯示在矩陣?yán)?。本文采用選取隨機(jī)參考點(diǎn)的方法,將研究區(qū)分類結(jié)果與同期GF-2號(hào) 衛(wèi)星數(shù)據(jù)進(jìn)行對(duì)照,并獲取了研究區(qū)分類結(jié)果的混淆矩陣;再通過(guò)混淆矩陣計(jì)算得到總體精度、Kappa系數(shù)、錯(cuò)分誤差和漏分誤差,進(jìn)而對(duì)各方案進(jìn)行評(píng)價(jià)。

2 研究結(jié)果與分析

2.1 實(shí)驗(yàn)方案設(shè)置

為了取得最佳的提取效果,本文設(shè)計(jì)了5組實(shí)驗(yàn)方案進(jìn)行研究,如表2所示。設(shè)置這些實(shí)驗(yàn)方案主要是考慮到以下兩點(diǎn):①研究各特征對(duì)臍橙果園空間分布信息提取的重要性程度;②尋找提高臍橙果園空間分布信息提取精度的最佳方法。

表2 實(shí)驗(yàn)方案信息表

2.2 特征優(yōu)選分析

本文利用隨機(jī)森林算法計(jì)算方案D中63個(gè)特征變量的重要性得分,各特征得分如圖3所示,特征前的數(shù)字02、11、12分別表示2月、11月、12月的時(shí)相;B1~B6分別表示Landsat8 OLI影像的藍(lán)光、綠光、紅光、近紅外、短波紅外第一波段、短波紅外第二波段;PC1、PC2分別表示影像的第一主成分和第二主成分波段。

圖3 各特征重要性

由圖3可知,不同特征的重要性差異較大,最高的11-B1特征重要性高達(dá)13.94,最低的12-VAR特征重要性低至0.39。本文選擇重要性排在前1/4的特征構(gòu)成方案E優(yōu)選特征集[16]。方案E的13個(gè)特征變量如表3所示,其中光譜特征包括11月藍(lán)光波段、11月綠光波段、11月紅光波段、12月藍(lán)光波段、12月第二 主成分波段和12月短波紅外第二波段,植被指數(shù)特征包括11月NDVI、11月RVI、12月NDVI、12月RVI、12月EVI和12月SAVI,地形因子為DEM因子,說(shuō)明光譜特征和植被指數(shù)特征的作用較顯著,紋理特征和地形因子貢獻(xiàn)不大。將特征類型按季節(jié)來(lái)統(tǒng)計(jì)發(fā)現(xiàn),秋季有5個(gè),冬季有7個(gè),春季沒有,說(shuō)明秋、冬季時(shí)相對(duì)于臍橙果園信息提取較適合。

表3 優(yōu)選特征分布表

2.3 臍橙提取結(jié)果與精度分析

2.3.1 臍橙提取結(jié)果

所有實(shí)驗(yàn)方案的提取結(jié)果如圖4所示。由于本文主要的提取對(duì)象為臍橙,且為更好地展示臍橙種植在江河流域的特點(diǎn),因此圖中只顯示臍橙和水體對(duì)象,參與分類的耕地、建筑用地、林地和裸地統(tǒng)一歸為其他地物。通過(guò)目視解譯方法對(duì)比GF-1號(hào)衛(wèi)星影像發(fā)現(xiàn),方案A和方案C 中不同類別地物之間存在較多錯(cuò)分的情況,如影像右下的流域區(qū)域,林地區(qū)域被分成了臍橙。從目視解譯對(duì)比效果來(lái)看,基于光譜特征和植被指數(shù)特征綜合的方案B以及基于優(yōu)選特征組合的方案E的提取效果最佳,且后者的提取結(jié)果優(yōu)于其他實(shí)驗(yàn)方案。

圖4 各方案的臍橙提取結(jié)果圖

2.3.2 精度評(píng)價(jià)分析

為定量評(píng)價(jià)各方案臍橙果園空間分布信息的提取精度,本文利用驗(yàn)證數(shù)據(jù)計(jì)算混淆矩陣,選取總體精度、Kappa系數(shù)、錯(cuò)分誤差和漏分誤差作為評(píng)價(jià)指標(biāo),對(duì)比分析各方案的提取結(jié)果,評(píng)價(jià)方案的優(yōu)劣。具體結(jié)果如表4所示,可以看出,僅包含多時(shí)相光譜特征的方案A的總體精度為85.27%,Kappa系數(shù)為0.83;加入植被指數(shù)特征的方案B的總體精度和Kappa系數(shù)均略有提升,分別為86.71%和0.84;但反觀加入紋理特征的方案C,其總體精度和Kappa系數(shù)則有小幅下降,分別為83.04%和0.81,表明植被指數(shù)特征的加入將提高臍橙信息提取的精度,但紋理特征不一定能提高分類精度,反而會(huì)損失一些分類精度;涵蓋所有特征的方案D的總體精度和Kappa系數(shù)均大幅提高,但低于方案E;隨機(jī)森林特征優(yōu)選后的方案E的總體精度和Kappa系數(shù)達(dá)到最高,分別為90.71%和0.89。

表4 不同實(shí)驗(yàn)方案的精度對(duì)比

另外,對(duì)于錯(cuò)分誤差,除紋理特征外,各類特征的加入均有效改善了提取精度,表明植被指數(shù)特征和地形因子有效減少了臍橙錯(cuò)分的概率。在漏分誤差方面,紋理特征同樣對(duì)臍橙提取精度的改善不明顯,漏分現(xiàn)象較方案A未有效減輕。由錯(cuò)分和漏分誤差可知,優(yōu)選特征組合具有顯著的提升效果。

綜上所述,光譜特征中單獨(dú)引入植被指數(shù)特征時(shí),總體精度改善最顯著,而單獨(dú)引入紋理特征時(shí)總體精度略有下降,說(shuō)明植被指數(shù)特征在提取中具有顯著作用;優(yōu)選特征組合在精度上的改善最顯著,其提取精度高于其他兩兩類型特征組合的原因在于,它是各類型特征優(yōu)選子集的組合,具備多源信息的優(yōu)勢(shì),同時(shí)其提取精度亦高于所有特征綜合的方案,主要原因?yàn)楹笳咛卣鲾?shù)量多、數(shù)據(jù)間相關(guān)性強(qiáng),而優(yōu)選特征組合只保留了貢獻(xiàn)大的特征,降低了數(shù)據(jù)維度,減少了數(shù)據(jù)間的相關(guān)性。

3 結(jié) 語(yǔ)

針對(duì)目前臍橙果園遙感提取中存在的提取精度低的問題,本文綜合多時(shí)相光譜信息、植被指數(shù)特征、紋理特征和地形因子,利用隨機(jī)森林算法有效實(shí)現(xiàn)了臍橙果園信息的提取,克服了經(jīng)濟(jì)作物遙感提取特征較為單一的不足。利用隨機(jī)森林重要性排序算法獲取了輸入特征的重要性,有效構(gòu)建了優(yōu)選特征組合,不僅有效降低了數(shù)據(jù)維度,還改善了提取精度。由此可見,隨機(jī)森林算法在保證精度的同時(shí)還能提高運(yùn)算效率,是一種可行且高效的遙感提取算法。本文也為后續(xù)的經(jīng)濟(jì)作物擴(kuò)張以及生態(tài)環(huán)境評(píng)價(jià)系列研究提供了有效的數(shù)據(jù)參考。本文的不足之處是實(shí)驗(yàn)中隨機(jī)森林算法的決策樹棵數(shù)、特征變量數(shù)和優(yōu)選特征數(shù)均采用經(jīng)驗(yàn)值,后續(xù)研究可結(jié)合遺傳算法等參數(shù)尋優(yōu)算法來(lái)選取最優(yōu)參數(shù),以期進(jìn)一步提高提取效率;實(shí)驗(yàn)中只應(yīng)用了上述3類特征,后續(xù)研究將添加地理統(tǒng)計(jì)紋理或小波紋理等特征,以繼續(xù)尋找有助于臍橙果園信息提取的特征以及特征組合。

猜你喜歡
分類特征
抓住特征巧觀察
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
抓住特征巧觀察
主站蜘蛛池模板: 风韵丰满熟妇啪啪区老熟熟女| 中文字幕在线日本| 久久永久精品免费视频| 国产理论一区| 无码精品国产dvd在线观看9久| 国产真实自在自线免费精品| 国产毛片高清一级国语 | 在线免费亚洲无码视频| 香蕉视频在线精品| 国产日本一线在线观看免费| 国产精品无码AⅤ在线观看播放| 欧美不卡二区| 精品国产香蕉在线播出| 91久久精品国产| 日韩视频免费| 波多野结衣中文字幕一区| 精品人妻一区二区三区蜜桃AⅤ| 亚洲人成影视在线观看| 久久福利片| 亚洲第一黄色网址| 亚洲国产黄色| 欧美激情伊人| 午夜视频www| 91亚洲国产视频| 99久久精品久久久久久婷婷| 欧美a在线视频| 亚洲一区二区三区国产精品| 日本欧美精品| 亚洲AV永久无码精品古装片| 成年人视频一区二区| 日本91视频| 国产一级小视频| 二级毛片免费观看全程| 欧美精品高清| 欧美一区中文字幕| 婷婷激情亚洲| 在线观看免费人成视频色快速| 日韩精品成人在线| 精品福利网| 91视频精品| 国产鲁鲁视频在线观看| 亚卅精品无码久久毛片乌克兰| 伊人蕉久影院| 久青草国产高清在线视频| 婷婷午夜影院| 欧美日韩在线国产| 嫩草在线视频| 午夜激情婷婷| 综合网天天| 亚洲国产一成久久精品国产成人综合| 亚洲欧洲自拍拍偷午夜色| 啪啪啪亚洲无码| 欧美日韩久久综合| 欧美三级视频网站| 青青草国产精品久久久久| 91午夜福利在线观看精品| 波多野结衣AV无码久久一区| 欧美国产日产一区二区| 中文无码日韩精品| 国产玖玖玖精品视频| 操美女免费网站| 天天色综网| 亚欧成人无码AV在线播放| 欧美成人精品高清在线下载| 在线播放国产99re| 国产福利小视频在线播放观看| 88av在线| 红杏AV在线无码| 青青草原国产一区二区| 国产美女主播一级成人毛片| 鲁鲁鲁爽爽爽在线视频观看| 国产麻豆精品久久一二三| 国产95在线 | 2020最新国产精品视频| 亚洲男女在线| 91精品网站| 欧美精品高清| 热热久久狠狠偷偷色男同| 在线永久免费观看的毛片| 日韩av手机在线| 国产福利拍拍拍| 欧美人在线一区二区三区|