999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)驅(qū)動(dòng)的農(nóng)作物遙感分類地面樣本點(diǎn)布設(shè)

2023-05-15 05:27:48吳清瀅余強(qiáng)毅段玉林吳文斌
關(guān)鍵詞:分類研究

吳清瀅,余強(qiáng)毅,段玉林,吳文斌

·土地保障與生態(tài)安全·

數(shù)據(jù)驅(qū)動(dòng)的農(nóng)作物遙感分類地面樣本點(diǎn)布設(shè)

吳清瀅,余強(qiáng)毅※,段玉林,吳文斌

(中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所/農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)遙感重點(diǎn)實(shí)驗(yàn)室,北京 100081)

地面樣本點(diǎn)是農(nóng)作物遙感分類模型訓(xùn)練的基礎(chǔ),樣本點(diǎn)數(shù)量和質(zhì)量是影響模型分類精度的2個(gè)主要因素。該研究構(gòu)建了數(shù)據(jù)驅(qū)動(dòng)的樣本點(diǎn)布設(shè)方法,利用待分類影像的光譜、植被指數(shù)等特征構(gòu)造分層抽樣底圖,結(jié)合分層隨機(jī)抽樣方法進(jìn)行地面樣本點(diǎn)布設(shè),并分析不同抽樣策略對(duì)農(nóng)作物遙感分類結(jié)果的影響。采取基于-means聚類分析的數(shù)據(jù)驅(qū)動(dòng)方法,考慮6景哨兵2號(hào)影像提取的共78個(gè)分類特征,生成同一個(gè)最優(yōu)的聚類結(jié)果圖;設(shè)計(jì)等量分配和按面積比分配2種樣本量分配方式,樣本點(diǎn)數(shù)量為25、49、100、169、225的5個(gè)總樣本量;基于不同抽樣策略獲取地面樣本點(diǎn)信息,利用同一個(gè)支持向量機(jī)模型對(duì)待分類影像進(jìn)行監(jiān)督分類,并通過與139個(gè)樣本點(diǎn)的理論總樣本量和400個(gè)樣本點(diǎn)的傳統(tǒng)方式總樣本量對(duì)比分析,定量解析不同抽樣策略對(duì)分類精度的影響。結(jié)果表明:1)在數(shù)據(jù)驅(qū)動(dòng)非監(jiān)督聚類生成的底圖上進(jìn)行抽樣(按面積比分層抽樣法、等量分層抽樣法)獲得的樣本點(diǎn)質(zhì)量和分類精度明顯優(yōu)于沒有該底圖的抽樣策略(簡單隨機(jī)抽樣法、系統(tǒng)抽樣法);2)當(dāng)總樣本量低于理論總樣本量時(shí),等量分層抽樣法能獲取比按面積比分層抽樣法更高的分類精度。例如,當(dāng)理論樣本量為139時(shí),總樣本量為25、49和100時(shí)等量分層抽樣法的分類精度均值(75.5%、80.5%和86.0%)均明顯高于按面積比分層抽樣法的分類精度均值(48.4%、69.0%和83.0%),而當(dāng)總樣本量為169和225時(shí),兩種分層抽樣的分類精度均值都在90.0%左右;3)當(dāng)滿足總體精度需求時(shí),分層抽樣法所需的實(shí)際總樣本量小于理論樣本量,可極大提高抽樣效率。例如,等量分層抽樣法的實(shí)際樣本量為理論樣本量的約70%便可滿足85.0%的總體精度需求;當(dāng)分類精度與人工選取方式分類精度相同時(shí)(97.5%),等量分層抽樣法的實(shí)際樣本量僅為傳統(tǒng)方式樣本量的約90%。研究結(jié)果印證了分類精度及穩(wěn)定性隨著總樣本量的增加而增加這一普遍認(rèn)識(shí),但當(dāng)總樣本量超過一定值時(shí),精度增長速度變慢。該方法可以獲取類間均衡、類內(nèi)多樣化的樣本集,為農(nóng)作物遙感地面樣本點(diǎn)布設(shè)、快速高效分類提供參考。

農(nóng)業(yè);遙感;作物分類;樣本點(diǎn)布設(shè);抽樣底圖;聚類分析

0 引 言

地面樣本點(diǎn)信息是訓(xùn)練遙感分類模型的基礎(chǔ),樣本點(diǎn)的數(shù)量和質(zhì)量是影響模型分類效果的2個(gè)主要因素[1-2]:高質(zhì)量的樣本點(diǎn)可以顯著提高遙感分類精度[3],相反,樣本點(diǎn)的代表性弱[4]或樣本點(diǎn)數(shù)量不足[5]會(huì)增加分類誤差。有研究通過樣本點(diǎn)遷移[6]、特征提取[7]等方式來解決樣本點(diǎn)問題,但這類方法依然需要一小部分高質(zhì)量地面樣本點(diǎn)信息作為基礎(chǔ)輸入。現(xiàn)有高質(zhì)量樣本點(diǎn)數(shù)據(jù)集一般通過專業(yè)人員目視解譯得到[8],解譯成本與專業(yè)性要求高,導(dǎo)致現(xiàn)有高質(zhì)量樣本點(diǎn)數(shù)據(jù)集大多僅針對(duì)特定區(qū)域[9],地面真實(shí)訓(xùn)練樣本點(diǎn)數(shù)量不足、代表性差的問題依然未能得到徹底解決。

實(shí)地調(diào)查可更大程度保證地面樣本點(diǎn)信息的質(zhì)量。近年來,將空間分層抽樣理論結(jié)合遙感技術(shù)用于指導(dǎo)地面樣本點(diǎn)獲取[10],為遙感影像變化檢測(cè)[11]、空間數(shù)據(jù)產(chǎn)品精度驗(yàn)證[12]等研究中樣本點(diǎn)“去哪采”的難題提供了科學(xué)支撐。其中,制作底圖是抽樣設(shè)計(jì)的關(guān)鍵,好的底圖能大大提高分層抽樣調(diào)查效率。例如,以接近反映地物真實(shí)分布的遙感影像分類結(jié)果為底圖,能減少農(nóng)作物種植面積調(diào)查研究中外推估算面積的精度誤差[13-15]。當(dāng)分類對(duì)象變化不頻繁時(shí),通常可直接利用其歷史分布數(shù)據(jù)作為分類調(diào)查研究的抽樣底圖[3],例如WICKHAM等[8,16]利用歷史的土地利用數(shù)據(jù)產(chǎn)品作為當(dāng)年土地利用分類抽樣調(diào)查的分層依據(jù)。

然而,在農(nóng)作物遙感分類研究中,頻繁的農(nóng)戶田間活動(dòng)導(dǎo)致田塊大小變動(dòng)和種植作物種類更換,將歷史作物空間分布數(shù)據(jù)產(chǎn)品[17-18]作為當(dāng)季作物遙感分類的分層抽樣底圖是具有較大不確定性的[3]。一些學(xué)者在缺乏有效的當(dāng)季農(nóng)作物分布數(shù)據(jù)時(shí),會(huì)采用復(fù)雜規(guī)則并綜合各種輔助信息數(shù)據(jù)來間接構(gòu)造分層底圖,此時(shí)分層抽樣效率的高低往往取決于輔助信息數(shù)據(jù)選擇的好壞。例如FOODY等[19]根據(jù)土壤類型分布信息來約束農(nóng)田和作物類型制圖訓(xùn)練樣本點(diǎn)采集區(qū)域。也有研究表明相對(duì)于按行政區(qū)劃分層[20],利用歷史信息提取的作物種植頻率[21]可以更有效率的構(gòu)造分層抽樣底圖。然而,土壤類型和行政區(qū)劃數(shù)據(jù)與作物分布的相關(guān)性較弱;由作物種植頻率構(gòu)建的底圖難以擺脫對(duì)歷史信息完整性的依賴,并且對(duì)新作物和新種植模式的識(shí)別具有滯后性。以數(shù)據(jù)作為驅(qū)動(dòng)力的方法脫離了對(duì)專家知識(shí)的依賴,能夠“自下而上”地刻畫特征變量之間復(fù)雜的線性與非線性關(guān)系[22-23],因此,相較于利用輔助信息,通過挖掘和構(gòu)建遙感影像數(shù)據(jù)內(nèi)在關(guān)系,獲得能直接反映當(dāng)季調(diào)查作物的分布信息,從而大大減輕構(gòu)造分層底圖的工作量,獲取高質(zhì)量樣本點(diǎn),提高抽樣效率。

在沒有可直接使用的當(dāng)季作物分布數(shù)據(jù)前提下,本研究嘗試構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的樣本點(diǎn)布設(shè)方法體系,利用傳統(tǒng)的基于數(shù)據(jù)驅(qū)動(dòng)的無監(jiān)督聚類算法,生成可用于直接支撐抽樣的分層抽樣底圖;并驗(yàn)證此分層抽樣底圖與不同抽樣策略結(jié)合后的樣本點(diǎn)獲取效果,及其對(duì)遙感分類精度和效率的影響,以期通過“事前優(yōu)化”科學(xué)獲取類內(nèi)代表性和類間均衡性均較高的訓(xùn)練樣本點(diǎn),降低遙感作物分類樣本點(diǎn)信息冗余,提出提高抽樣方法效率的最佳抽樣策略。

1 試驗(yàn)區(qū)域及研究數(shù)據(jù)

1.1 試驗(yàn)區(qū)域

為測(cè)試生成的分層抽樣底圖對(duì)分類精度的提升效果,本研究以遼寧省鐵嶺市開原市的一個(gè)典型農(nóng)區(qū)為研究區(qū),研究區(qū)總面積為111.4 km2。開原市(123°43'43''E~124°48'55''E,42°6'55''N~42°53'23''N)位于鐵嶺市的東北部。冬季嚴(yán)寒干燥,夏季溫?zé)岫嘤辏募痉置鳎瑲夂驅(qū)僦袦貛Т箨懶约撅L(fēng)氣候。全市耕地面積1 183.72 km2,土地肥沃,主要種植一年一熟制玉米、大豆、水稻等農(nóng)作物,是國家重點(diǎn)產(chǎn)糧區(qū)和商品糧基地。

圖1 研究區(qū)位置

1.2 數(shù)據(jù)來源及預(yù)處理

1)鑒于多個(gè)研究表明中國自然資源部組織制作和發(fā)布的免費(fèi)使用的全球30 m地表覆蓋數(shù)據(jù)產(chǎn)品(GlobeLand30)[24]在中國局部空間精度評(píng)價(jià)中精度較高[25],本研究選擇了此數(shù)據(jù)產(chǎn)品2020年耕地?cái)?shù)據(jù)。

2)遙感影像數(shù)據(jù)來自歐洲航天局生產(chǎn)的哨兵2號(hào)衛(wèi)星遙感數(shù)據(jù),哨兵2號(hào)是高分辨率多光譜成像衛(wèi)星,地面分辨率分別為10、20和60 m,兩顆衛(wèi)星互補(bǔ)的重訪周期為5 d,可提供植被、土壤和水覆蓋等圖像,已經(jīng)被作為主要數(shù)據(jù)源應(yīng)用于作物分類研究。在Google Earth Engine(GEE)平臺(tái)[26]上篩選出2021年1—9月覆蓋研究區(qū)的云量較少的哨兵2號(hào)衛(wèi)星遙感數(shù)據(jù)作為試驗(yàn)數(shù)據(jù),并對(duì)影像進(jìn)行云掩膜、缺失值填補(bǔ)。最終研究選取了作物生育期內(nèi)所有可用的遙感影像數(shù)據(jù),時(shí)間點(diǎn)分別為2021年4月18日、5月18日、6月7日、6月12日、7月7日、9月10日。

3)驗(yàn)證地面樣本點(diǎn)來自于同步開展的地面調(diào)查。整個(gè)地面調(diào)查中發(fā)現(xiàn)該典型研究區(qū)的耕地分布集中,地塊規(guī)整,以一個(gè)縣需要2 000個(gè)樣本點(diǎn)為數(shù)量參考,篩選獲得研究區(qū)內(nèi)均位于地塊中心的80個(gè)真實(shí)地面樣本點(diǎn),其中水稻、大豆和玉米樣本點(diǎn)個(gè)數(shù)分別為30、20和30。

為排除非耕地像元對(duì)作物分類調(diào)查研究的影響[27],首先借助2020年GlobeLand30數(shù)據(jù)集提供的耕地分布(類型編號(hào)10)作為掩膜文件并重采樣到10 m,使其空間分辨率與哨兵2號(hào)遙感影像空間分辨率一致,對(duì)影像進(jìn)行掩膜得到農(nóng)田植被的總體分布數(shù)據(jù),在此基礎(chǔ)上進(jìn)行耕地作物抽樣底圖制作、作物識(shí)別和分類。

1.3 分類特征構(gòu)建和提取

利用哨兵2號(hào)影像數(shù)據(jù)的光譜信息、以及不同波段的組合指數(shù)信息提取作物信息,研究中使用的波段詳細(xì)數(shù)據(jù)及植被指數(shù)為:波段B2~B4為可見光波段;波段B5~B7常被用于監(jiān)測(cè)植被健康信息[28];波段B8和B8A分別為近紅外波段(寬)和近紅外波段(窄);波段B11~B12為短波紅外波段;歸一化差值植被指數(shù)(normalized difference vegetation index,NDVI)[29]、歸一化植被水分指數(shù)(normalized difference water index,NDWI)[30]、歸一化建筑指數(shù)(normalized difference built-up index,NDBI)[31],分別對(duì)植被、水體和建筑物體敏感。最后基于6景哨兵2號(hào)影像選取的原始光譜波段和植被指數(shù)的特征組合作為非監(jiān)督分類的分類特征。

2 研究方法

分層抽樣方法在一定程度上可提高抽樣效率,它是將總體劃分為不同層,以增加某一類總體的代表性。以數(shù)據(jù)為驅(qū)動(dòng)力的非監(jiān)督聚類算法可以根據(jù)數(shù)據(jù)本身特征,將數(shù)據(jù)劃分為不同的聚類簇。本研究在沒有可直接使用的當(dāng)季作物分布數(shù)據(jù)前提下,將預(yù)處理后的待分類遙感影像和提取到的分類特征作為先驗(yàn)知識(shí)引入抽樣底圖設(shè)計(jì),通過影像特征聚類的方法構(gòu)造分層抽樣底圖,以減輕抽樣設(shè)計(jì)工作量并提高遙感作物分類的效率,圖2所示主要步驟包括:1)基于已有先驗(yàn)知識(shí),采用非監(jiān)督聚類算法和手肘法實(shí)現(xiàn)研究區(qū)的空間最優(yōu)分層,并生成最佳抽樣底圖。2)給定總樣本量后,在同一分層抽樣底圖上為每種樣本分配方式創(chuàng)建了200個(gè)具有相同大小的不同樣本布設(shè)方案,以避免層內(nèi)隨機(jī)抽樣的偏差。3)使用同一個(gè)監(jiān)督分類器對(duì)每個(gè)抽樣策略的200個(gè)樣本布設(shè)方案所獲樣本點(diǎn)進(jìn)行訓(xùn)練,并建立不同抽樣策略與同一套驗(yàn)證地面樣本點(diǎn)的各精度評(píng)價(jià)指標(biāo)對(duì)應(yīng)關(guān)系,以探究實(shí)際總樣本量和理論總樣本量之間的關(guān)聯(lián),并對(duì)樣本質(zhì)量進(jìn)行評(píng)價(jià)。

圖2 基于遙感影像的地面樣本點(diǎn)布設(shè)框架圖

2.1 分層抽樣底圖生成方法

一般來說,分層數(shù)目越多,層內(nèi)差異越小,但分層層數(shù)過多會(huì)形成層數(shù)冗余。為得到最佳分層層數(shù)及其對(duì)應(yīng)的最佳抽樣底圖,本研究基于-means聚類分析的數(shù)據(jù)驅(qū)動(dòng)方法,利用光譜波段值和植被指數(shù)創(chuàng)建了聚類特征空間,在每輪聚類結(jié)束后,將誤差平方和數(shù)值作為反饋,形成“-means算法聚類-計(jì)算誤差平方和-修改聚類數(shù)值”的閉環(huán),直至值達(dá)到最大取值范圍停止,其中,通過手肘法判定的最優(yōu)值為聚類類別數(shù),利用最優(yōu)值聚類生成的原始土地覆蓋簇來構(gòu)造抽樣最佳抽樣底圖。此時(shí),最優(yōu)值對(duì)應(yīng)的聚類類別數(shù)被認(rèn)為是最優(yōu)層數(shù),每一個(gè)像素所屬的聚類類別即為分層抽樣中的所屬層。

2.1.1 構(gòu)造分層抽樣底圖

對(duì)于沒有類別標(biāo)簽的數(shù)據(jù),可以通過無監(jiān)督聚類算法將數(shù)據(jù)劃分為不同的簇[22]。-means算法[32]算法思想簡單,在對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行聚類分析時(shí)聚類效果較好且收斂速度較快,通常以歐式距離作為衡量數(shù)據(jù)對(duì)象間相似度的指標(biāo),相似度與數(shù)據(jù)對(duì)象間的距離成反比,即對(duì)象間距離越小,則相似度越大。在遙感分類中,種植同種作物的區(qū)域表現(xiàn)出高空間相關(guān)性,種植不同作物的兩個(gè)相鄰區(qū)域表現(xiàn)出高空間異質(zhì)性。本研究基于哨兵2號(hào)提取的78個(gè)光譜特征和植被指數(shù)特征,采用-means聚類的方式獲得分層抽樣底圖,其中聚類類別數(shù)量為地層數(shù)量,每一類簇所含的像元為每層的對(duì)象。

2.1.2 確定分層層數(shù)

根據(jù)聚類性能評(píng)估方法,誤差平方和代表該聚類中心對(duì)于所有在該類中的數(shù)據(jù)的偏差程度,通常該值越小代表聚類效果越好[33]。手肘法利用誤差平方和與值的關(guān)系圖來確定最優(yōu)值[34],該算法的核心思想是隨著聚類數(shù)值不斷增大,每個(gè)分組(簇)的聚合程度會(huì)不斷地提高,誤差平方和逐漸減小:當(dāng)值小于真實(shí)聚類數(shù)時(shí),隨著值的增大,誤差平方和值的變化比較大,關(guān)系圖顯示兩點(diǎn)之間的連線會(huì)比較陡峭;當(dāng)大于真實(shí)聚類數(shù)時(shí),隨著值的增大,誤差平方和值的變化較小,關(guān)系圖顯示兩點(diǎn)之間的連線會(huì)比較平緩。因此,可以在二維平面直角坐標(biāo)系中作兩者間曲線并尋找斜率變化率最大時(shí)的拐點(diǎn)來確定最佳值[35],誤差平方和S計(jì)算式如下:

式中C是第個(gè)簇,是C中的樣本點(diǎn)特征,mC的質(zhì)心(C中所有樣本點(diǎn)的均值)。

2.2 總樣本量和層內(nèi)樣本分配方式

理論上,樣本量越大,遙感影像的分類精度越高,但樣本大小往往受收集樣本數(shù)據(jù)的資源經(jīng)濟(jì)成本限制。已有研究將抽樣理論公式應(yīng)用于遙感分類精度評(píng)價(jià)中,并將此評(píng)價(jià)樣本點(diǎn)作為新的訓(xùn)練樣本點(diǎn)去訓(xùn)練分類器[2]。

針對(duì)簡單隨機(jī)抽樣的預(yù)期總體精度根據(jù)COCHRAN[36]方法計(jì)算:

式中為總樣本量;是預(yù)期總體精度;是置信區(qū)間的期望半寬度;是標(biāo)準(zhǔn)正態(tài)分布的百分位。

為了方便與不同抽樣策略進(jìn)行對(duì)照試驗(yàn),實(shí)際總樣本量取決于對(duì)照試驗(yàn)中系統(tǒng)抽樣法的總樣本量,以理論總樣本量作為參考值,來探討實(shí)際總樣本量、理論總樣本量和總體精度之間的關(guān)系。

確定總樣本量后,分別采用兩種層內(nèi)樣本分配方式進(jìn)行對(duì)比試驗(yàn):1)面積比分配方式,即將總樣本點(diǎn)數(shù)量按各層層像元面積比例分配得到各層的樣本點(diǎn)數(shù)量;2)等量分配方式,即將總樣本點(diǎn)數(shù)量平均分配到各層中,使各層分配得到樣本點(diǎn)數(shù)量相同。

對(duì)于每一層,采用簡單隨機(jī)抽樣的方法來獲取每一目標(biāo)類別的樣本點(diǎn),這不僅最大限度的保障樣本點(diǎn)間類別均衡,還保障了類內(nèi)每一點(diǎn)被抽取的概率相等。樣本點(diǎn)真實(shí)地類屬性通過目視解譯的方式確定。

2.3 遙感影像分類及其精度評(píng)價(jià)

支持向量機(jī)(support vector machine,SVM)在解決小樣本的非線性分類中有特別的優(yōu)勢(shì)[37]。因此,將分層樣本集作為訓(xùn)練樣本集,將每個(gè)樣本對(duì)應(yīng)的分類特征輸入到SVM分類器進(jìn)行監(jiān)督分類,并輸出監(jiān)督分類結(jié)果圖。

本研究使用獨(dú)立于訓(xùn)練樣本集的真實(shí)地面樣本集,通過混淆矩陣計(jì)算作物識(shí)別總體精度(overall accuracy,OA)、不同作物的制圖精度(producer accuracy,PA)和用戶精度(user accuracy,UA)[2],用于對(duì)抽樣策略效率進(jìn)行定量評(píng)價(jià),并分析總樣本量和層內(nèi)樣本分配方式對(duì)分類結(jié)果產(chǎn)生的影響。

2.4 樣本質(zhì)量評(píng)價(jià)

樣本點(diǎn)質(zhì)量對(duì)作物分類精度起積極作用。代表性可以衡量訓(xùn)練樣本點(diǎn)集能否很好地反映全局其余數(shù)據(jù)的特征,具體指樣本點(diǎn)在光譜空間中對(duì)其他待分類像素點(diǎn)的反映程度。本研究采用MOUNTRAKIS等[38]提出的基于訓(xùn)練集信息密度計(jì)算樣本集內(nèi)任一樣本點(diǎn)的代表性值C的計(jì)算方法。該方法已被WALDNER等[39]在農(nóng)田制圖采樣研究中證實(shí)了分類精度與樣本數(shù)據(jù)集的總體代表性值global之間是正向線性關(guān)系。本研究以代表性值來對(duì)樣本集進(jìn)行質(zhì)量評(píng)價(jià),為了在獨(dú)立于任何分類情景下量化每種抽樣策略所獲樣本集總體代表性值global,將樣本集內(nèi)所有樣本點(diǎn)的代表性值C求和取平均。

3 結(jié)果與分析

3.1 最佳分層抽樣底圖

將預(yù)處理后遙感影像內(nèi)的所有像元作為輸入,將取值范圍(2~10)作為循環(huán)條件,對(duì)每個(gè)值進(jìn)行聚類分析并繪制和誤差平方和及二者間斜率變化率關(guān)系圖。從圖3可以看出,隨著的增加,誤差平方和呈下降趨勢(shì),但是肘部并不明顯,故通過斜率變化率來定量判斷拐點(diǎn)肘部值。發(fā)現(xiàn)第一肘部對(duì)應(yīng)的值為4,第二肘部對(duì)應(yīng)的值為7。

圖3 聚類中心個(gè)數(shù)k值對(duì)應(yīng)分析結(jié)果

不同類型地物的光譜反射時(shí)序曲線特征不同。非植被地表的居民地道路裸地及河流湖泊的NDVI數(shù)值往往常年低于0.3;林草類植被由于沒有人工干預(yù)收割,全年的NDVI時(shí)序曲線呈平穩(wěn)的上升和下降;一年一熟制作物地類通常在3—5月份播種,NDVI時(shí)序曲線在6 —9月有比較高的數(shù)值,隨后在人工收割的干預(yù)下,NDVI數(shù)值會(huì)出現(xiàn)驟降。

第一肘部和第二肘部不同聚類類別的NDVI時(shí)序變化圖見圖4,從圖4a可以看出,第一肘部僅有兩個(gè)聚類類別的NDVI曲線呈作物生長曲線,另外兩類為非作物類型NDVI曲線;圖4b則表明第二肘部有5個(gè)聚類類別的NDVI曲線呈作物生長曲線,另外兩類為非作物類型NDVI曲線。因此,為了避免因聚類數(shù)過少或因引入的耕地?cái)?shù)據(jù)精度誤差而導(dǎo)致部分特征不突出的作物被漏分,不選擇第一肘部,而是選取第二個(gè)肘部對(duì)應(yīng)值的聚類結(jié)果作為最佳層數(shù)。

3.2 樣本點(diǎn)數(shù)量

根據(jù)式(2)可得,在置信水平為90%、取置信區(qū)間期望半寬度為0.05時(shí),計(jì)算簡單隨機(jī)抽樣預(yù)期總體精度為0.85時(shí)的理論總樣本量為139。

圖4 第一肘部(k=4)和第二肘部(k=7)不同聚類類別的NDVI時(shí)序變化圖

將本研究方法和系統(tǒng)抽樣法、簡單隨機(jī)抽樣法的分類精度做對(duì)比,實(shí)際的總樣本量由系統(tǒng)抽樣法的5×5、7×7、10×10、13×13和15×15個(gè)格網(wǎng)點(diǎn)確定,分別為25、49、100、169和225。相應(yīng)的,按面積比分配和等量分配方式分別得到的層樣本量見表1。可以看出,而當(dāng)總樣本量為25時(shí),面積占比最小的第七層所按面積比分配到的樣本點(diǎn)數(shù)量為1,第四層至第六層按面積比所分配到的樣本點(diǎn)數(shù)量為2,層間樣本數(shù)量具有明顯的不均衡性,進(jìn)而影響了分類效果和樣本點(diǎn)獲取質(zhì)量。

3.3 遙感影像作物分類結(jié)果及其精度評(píng)價(jià)

3.3.1 遙感影像作物分類結(jié)果圖

根據(jù)實(shí)地調(diào)查經(jīng)驗(yàn),人工選取400個(gè)樣本點(diǎn)得到傳統(tǒng)方式的分類精度,其中訓(xùn)練樣本點(diǎn)和驗(yàn)證樣本點(diǎn)的比例為8:2(總體精度:97.5%;kappa系數(shù):0.96)。在研究區(qū)內(nèi)選擇一個(gè)地塊較為破碎的局部地區(qū)以更好地對(duì)比不同抽樣策略的分類效果,傳統(tǒng)方式的整體及局部地區(qū)的分類結(jié)果見圖5。

表1 分層抽樣層內(nèi)樣本分配方式

注:按面積比分配方式中1~7層面積占比分別為0.35、0.26、0.11、0.09、0.08、0.06、0.05。

Note: Area ratios of stratum 1-7 are 0.35, 0.26, 0.11, 0.09, 0.08, 0.06, 0.05 in area-ratio sample allocation, respectively.

將本研究方法和系統(tǒng)抽樣法、簡單隨機(jī)抽樣法的分類精度做對(duì)比。除已經(jīng)固定樣本點(diǎn)位置的系統(tǒng)抽樣法外,記錄每個(gè)抽樣策略的200個(gè)樣本布設(shè)方案所獲樣本點(diǎn),并繪制各抽樣策略能達(dá)到最高分類精度的局部地區(qū)分類結(jié)果見圖6。

圖5 傳統(tǒng)方式分類結(jié)果

從圖6可以看出,除了總樣本量為25的系統(tǒng)抽樣法,其他抽樣策略在最高精度時(shí)均能明顯識(shí)別出玉米、水稻和大豆類,不同抽樣策略之間的差距主要體現(xiàn)在大豆類的識(shí)別上。當(dāng)總樣本量小于100時(shí),等量分層抽樣法能識(shí)別出局部地區(qū)內(nèi)分布破碎的大豆類,而簡單隨機(jī)抽樣和按面積比分層抽樣法則僅識(shí)別出種植規(guī)模較大、分布較集中的大豆田塊;當(dāng)總樣本量大于等于100時(shí),除系統(tǒng)抽樣法外的3種抽樣方法能達(dá)到的最高分類精度均十分接近傳統(tǒng)方式的分類精度。

注:圖中n為總樣本數(shù)量。圖6范圍為圖5中的局部放大圖。

為了定量反映不同抽樣策略的分類精度及其穩(wěn)定性,每個(gè)抽樣策略樣本布設(shè)方案的總體精度箱線圖見圖 7。可以看出,隨著總樣本量越多,3種抽樣方法的平均分類精度依次遞增,分類精度平均值和中位數(shù)之間的差距越小,上下邊緣之間的差距也越來越小,這表明隨著總樣本量增加,不同抽樣方法的抽樣效率和穩(wěn)定性增加,方法間的差異性減小。等量分層抽樣法的箱體較短,分類精度中位數(shù)較高,表示總體精度分布較為集中且都處于較高的精度水平上,當(dāng)理論樣本量為139時(shí),總樣本量為25、49和100時(shí)等量分層抽樣法的分類精度均值(75.5%、80.5%和86.0%)均明顯高于按面積比分層抽樣法的分類精度均值(48.4%、69.0%和83.0%),按面積比分層抽樣法和簡單隨機(jī)抽樣法在總樣本量為25和49時(shí)的箱體較長,分類精度中位數(shù)出現(xiàn)偏態(tài)現(xiàn)象且都偏向下四分位數(shù),異常值較多,表示總體精度分布不均勻且數(shù)值較低。因此,增加總樣本量對(duì)總體精度的提高是起積極作用但影響有限的,本研究在總樣本量達(dá)到169時(shí)開始趨于穩(wěn)定。相比之下,不同抽樣策略對(duì)總體精度的影響更大。

圖7 各抽樣策略作物分類總體精度評(píng)價(jià)

Fig7 Crop classification overall accuracy assessment of each sampling method

做精度85.0%和97.5%的水平線與各抽樣策略的平均分類精度的連線相交。記錄精度為85.0%時(shí)水平線相交縱坐標(biāo)對(duì)應(yīng)的總樣本量分別為152、138和96,是簡單隨機(jī)抽樣理論總樣本量139的109.4%、99.3%和69.1%;記錄精度為97.5%水平線相交縱坐標(biāo)對(duì)應(yīng)的總樣本量分別為438、418和374,是傳統(tǒng)人工選取方法樣本量400的109.5%、104.5%、93.5%。

3.3.2 各作物類用戶精度和制圖精度

為了探究分層抽樣樣本分配方式對(duì)總體精度的影響,各抽樣策略單一作物類別的用戶精度(UA)、制圖精度(PA)、用戶精度方差(UA)和制圖精度方差(PA)見表2。可以看出不論總樣本量為多少,簡單隨機(jī)抽樣法的水稻類的UA和PA小于0.08、UA和PA均值小于20.0%,等量分層抽樣法UA和PA均值均大于85.0%,UA和PA小于0.05,說明簡單隨機(jī)抽樣法的水稻分類效果總是很差,等量分層抽樣法的水稻分類效果表現(xiàn)優(yōu)異,當(dāng)總樣本量小于100時(shí),按面積比分層抽樣法的UA和PA均值較低,UA和PA較大,而當(dāng)總樣本量增至100時(shí),UA和PA均值超過90.0%,UA和PA小于0.01,這表明當(dāng)水稻獲取足夠樣本量時(shí),就能有較高分類精度;不論總樣本量為多少,簡單隨機(jī)抽樣法的大豆分類效果均好于分層抽樣法,其中,在總樣本量少于等于100時(shí),兩種分層抽樣法的UA和PA均值都低于70.0%,UA和PA較大,而當(dāng)總樣本量增長至100時(shí),等量分層抽樣法的大豆類精度和穩(wěn)定性顯著提高,至169時(shí),按面積比分層抽樣法的大豆類精度和穩(wěn)定性顯著提高并與等量分層抽樣法相當(dāng),說明獲得的樣本點(diǎn)數(shù)量和分類特征都是影響大豆分類精度的重要原因;隨總樣本量增長,3種抽樣方法的玉米類UA和PA增長趨勢(shì)一致,兩種分層抽樣法的UA和PA幾乎都小于0.05,簡單隨機(jī)抽樣法的UA和PA幾乎都大于0.05,說明分層抽樣法的分類效果較簡單隨機(jī)抽樣更為穩(wěn)定,且層內(nèi)樣本分配方式對(duì)玉米類的分類效果影響較弱。

表2 各抽樣策略單一作物類別精度評(píng)價(jià)

注:PA、UA 分別代表制圖精度、用戶精度。UAPA分別代表PA、UA方差。

Note: PA and UA represent the producer's accuracy and the user's accuracy.UAandPArepresent the variance of UA and the variance of PA.

結(jié)合3種作物類的分類結(jié)果,可以得到簡單隨機(jī)抽樣法在3種作物分類效果上表現(xiàn)不穩(wěn)定,且影響總體精度的主要因素是水稻和大豆被分配的樣本量:等量分層抽樣法能夠使研究區(qū)內(nèi)面積占比較小的類別獲得足夠的數(shù)量,而當(dāng)總樣本量足夠多時(shí),兩種分層抽樣法的差異并不明顯。

3.4 各抽樣方法所獲樣本點(diǎn)質(zhì)量評(píng)價(jià)

以總樣本量為225的等量分層抽樣法為例,針對(duì)200個(gè)樣本布設(shè)方案的單一作物類型,以全部代表性值Cglobal為自變量,以對(duì)應(yīng)制圖精度PA為因變量建立線性回歸模型結(jié)果見表3。從表中可以看出,global與PA之間的正向關(guān)系與已有研究的結(jié)論一致[38-39]:3個(gè)線性回歸模型的回歸系數(shù)大于0,值在0.05水平上顯著,決定系數(shù)R偏低,這是因?yàn)橐淮纬闃涌赡艿玫饺绺叽硇杂衩着c低代表性水稻、大豆的樣本點(diǎn)組合,從而影響了單一作物類別的制圖精度。

表3 單一作物類型代表值與制圖精度的回歸分析結(jié)果

樣本點(diǎn)代表性與樣本點(diǎn)數(shù)量和特征有關(guān),由于每個(gè)布設(shè)方案的同一類別樣本點(diǎn)數(shù)量均不同,對(duì)每個(gè)作物類型的global取平均值,通過均值代表性mean比較各抽樣方法的樣本獲取整體效果,結(jié)果見表4。從表4可以看出,在實(shí)際采樣過程中采集到的其他類樣本點(diǎn)由于其真實(shí)地類型復(fù)雜,mean小于0;不論總樣本量為多少,等量分層抽樣法大豆類和玉米類的mean一直處于較高水平,說明等量分層抽樣法的大豆和玉米樣本點(diǎn)質(zhì)量較好,其次是按面積比分層抽樣法,且不同抽樣方法的樣本點(diǎn)mean差距隨實(shí)際總樣本量的增加逐漸減小,與分類精度差距隨實(shí)際總樣本量增長而逐漸減小的趨勢(shì)一致;隨總樣本量的增加,所有類別的樣本點(diǎn)mean逐漸向0趨近,這可能是因?yàn)闃颖玖康脑龃筇岣吡藰颖军c(diǎn)的多樣性,降低了單個(gè)樣本點(diǎn)的代表性C,從而降低了樣本點(diǎn)集的global;對(duì)于面積占比很小的水稻地類,global計(jì)算受樣本點(diǎn)數(shù)量影響較大:當(dāng)實(shí)際樣本量非常小時(shí),3種抽樣方法只能獲得極個(gè)別甚至沒有水稻樣本點(diǎn),難以計(jì)算mean,而不論總樣本量多少,隨機(jī)抽樣獲得的水稻樣本點(diǎn)均遠(yuǎn)小于其他兩種分層抽樣方法,導(dǎo)致該水稻樣本點(diǎn)集的多樣性小,隨機(jī)抽樣法的mean比分層抽樣法高,等量分層抽樣法的mean高于按面積比分層抽樣法的mean。

表4 各抽樣策略的單一作物類別均值代表性Cmean

4 討 論

本研究以開原市的一個(gè)典型農(nóng)區(qū)試驗(yàn)區(qū)為例,分析遙感影像數(shù)據(jù)本身特征,利用聚類算法和手肘法確定分層層數(shù),獲得能反映不均勻數(shù)據(jù)分布的抽樣底圖以科學(xué)指導(dǎo)樣本點(diǎn)的采集。

數(shù)據(jù)驅(qū)動(dòng)生成的抽樣底圖可以通過提高樣本點(diǎn)類內(nèi)代表性來提高分類精度。由于作物種植區(qū)域、生長狀態(tài)不統(tǒng)一及遙感信息的不確定性,遙感影像上的“同物異譜”的現(xiàn)象反映在分層抽樣底圖中就是一個(gè)作物類別對(duì)應(yīng)多個(gè)地層。通過分析遙感影像數(shù)據(jù)本身特征,聚類生成的抽樣底圖將總體劃分為不同類別,該底圖能反映類別的真實(shí)分布情況,減少分類特征和空間混淆。相比于簡單隨機(jī)和系統(tǒng)抽樣,在每個(gè)地層內(nèi)抽取一定數(shù)量的樣本點(diǎn)能最大限度地保障樣本點(diǎn)類內(nèi)多樣性,提高分類效率。

在生成抽樣底圖的基礎(chǔ)上,不同分層抽樣樣本分配方式對(duì)類間均衡性產(chǎn)生不同的影響,進(jìn)一步影響了分類效率。多數(shù)分類研究會(huì)按面積比例獲取訓(xùn)練樣本點(diǎn)[40]。然而在少樣本時(shí),稀少類會(huì)因其極低的占比而缺乏足夠的樣本點(diǎn),這可能會(huì)出現(xiàn)總體精度較高而稀少類分類精度較低的情況。等量分配樣本點(diǎn)數(shù)量能增加每個(gè)面積占比較小類別的樣本量,使分布破碎且占比較少的作物類別在分類中得到更多的信息,增加類間的均衡性,通過提高面積占比較小類別的精度以獲取較高總體精度;隨著總樣本量增大,每個(gè)類別提取了更豐富的信息,不同樣本分配方式之間的差異變小,此時(shí)所有抽樣方法都具有可比性。由于增加樣本量對(duì)分類精度提高是有限的,基于此,在確定抽樣底圖后,有必要根據(jù)總樣本量和聚類類別占比去權(quán)衡樣本分配方式。

分類精度誤差來源通常包括使用的分類器性能、驗(yàn)證數(shù)據(jù)集、訓(xùn)練樣本點(diǎn)質(zhì)量等。研究結(jié)論是在使用SVM分類器的基礎(chǔ)上得出的,為探究研究結(jié)論在不同分類器之間是否具有普適性,僅將SVM分類器更改為隨機(jī)森林(forest random,RF)分類器,以相同的步驟進(jìn)行新一輪試驗(yàn)并作箱線圖見圖8,可看出改變分類器后的總體分類精度和穩(wěn)定性隨總樣本量增加而增加,呈現(xiàn)出與使用SVM分類器相同的變化趨勢(shì);驗(yàn)證樣本點(diǎn)受實(shí)際采集條件制約,大多分布在道路兩側(cè),根據(jù)這些樣本點(diǎn)驗(yàn)證得到的分類精度可能與真實(shí)分類精度有偏差;除樣本點(diǎn)的特征,樣本點(diǎn)代表性還與樣本點(diǎn)數(shù)量有關(guān),本研究是在特定總樣本量下去計(jì)算不同作物類型的代表性,每個(gè)樣本布設(shè)方案采集到的各類型作物樣本點(diǎn)數(shù)量均不相同,雖然研究使用的是均值代表性,但該步驟仍可能存在偏差。基于此,在評(píng)估多種抽樣方法樣本量和分類精度間關(guān)系的研究基礎(chǔ)上,未來還可嘗試評(píng)估樣本點(diǎn)代表性和分類精度、類別代表性和對(duì)應(yīng)樣本量之間的關(guān)系。

在作物制圖應(yīng)用中,實(shí)際野外調(diào)查往往還要考慮通行成本和道路交通可達(dá)性等問題,沿道路收集訓(xùn)練數(shù)據(jù)是一種常見的方式。然而,路邊隨機(jī)抽樣會(huì)降低了研究區(qū)的空間探索水平,對(duì)樣本點(diǎn)代表性的需求更高,已有研究證明未分層的傳統(tǒng)路邊采集方式的分類精度和穩(wěn)定性均低于全局隨機(jī)抽樣方式[39]。基于此,未來研究可以探究引入分層抽樣底圖對(duì)路邊抽樣策略分類效率的影響,并制定一個(gè)科學(xué)樣本點(diǎn)采集路線。

圖8 基于隨機(jī)森林分類器的各抽樣策略作物分類精度評(píng)價(jià)

5 結(jié) 論

數(shù)據(jù)驅(qū)動(dòng)方法重在數(shù)據(jù)挖掘,通過監(jiān)督與非監(jiān)督機(jī)器學(xué)習(xí)等方法自動(dòng)學(xué)習(xí)數(shù)據(jù)的參數(shù)特征,進(jìn)而實(shí)現(xiàn)對(duì)遙感影像數(shù)據(jù)的信息提取。為證明在沒有可直接使用的當(dāng)季作物分布數(shù)據(jù)前提下,遙感影像數(shù)據(jù)驅(qū)動(dòng)生成的抽樣底圖能科學(xué)指導(dǎo)抽樣設(shè)計(jì),本研究通過遙感技術(shù)、非監(jiān)督聚類算法與經(jīng)典抽樣方法相結(jié)合,在同一個(gè)-means聚類最優(yōu)值對(duì)應(yīng)的聚類結(jié)果圖上,設(shè)計(jì)等量分配和按面積比分配2種樣本量分配方式,樣本點(diǎn)數(shù)量為25、49、100、169、225的5個(gè)總樣本量,結(jié)合與139個(gè)樣本點(diǎn)的理論總樣本量和400個(gè)樣本點(diǎn)的傳統(tǒng)方式總樣本量對(duì)研究區(qū)作物分類的分類精度和抽樣效率進(jìn)行了對(duì)比分析,結(jié)果表明:

1)在數(shù)據(jù)驅(qū)動(dòng)非監(jiān)督聚類生成的底圖上進(jìn)行抽樣(按面積比分層抽樣法、等量分層抽樣法)獲得的樣本點(diǎn)質(zhì)量和分類精度明顯優(yōu)于沒有該底圖的抽樣策略(簡單隨機(jī)抽樣法、系統(tǒng)抽樣法)。

2)當(dāng)總樣本量低于理論總樣本量時(shí),等量分層抽樣法能獲取比按面積比分層抽樣法更高的分類精度。例如,當(dāng)理論樣本量為139時(shí),總樣本量為25、49和100時(shí)等量分層抽樣法的分類精度均值(75.5%、80.5%和86.0%)均明顯高于按面積比分層抽樣法的分類精度均值(48.4%、69.0%和83.0%),而當(dāng)總樣本量為169和225時(shí),兩種分層方式的分類精度均值都在90.0%左右。

3)當(dāng)滿足總體精度需求時(shí),分層抽樣法所需的實(shí)際總樣本量小于理論樣本量,例如,等量分層抽樣法的實(shí)際樣本量為其理論樣本量的69.1%時(shí)可滿足85.0%總體精度需求;當(dāng)分類精度與人工選取方式分類精度一樣時(shí)(97.5%),等量分層抽樣法的實(shí)際樣本量為傳統(tǒng)方式的93.5%。研究結(jié)果印證了分類精度及穩(wěn)定性隨著總樣本量的增加而增加這一普遍認(rèn)識(shí),但當(dāng)總樣本量超過一定值時(shí),精度增長速度變慢。

總之,本研究構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的樣本點(diǎn)布設(shè)方法體系,可以通過“事前優(yōu)化”科學(xué)獲取類間均衡、類內(nèi)多樣化的樣本點(diǎn),進(jìn)而提高分類精度與效率,為農(nóng)作物遙感地面樣本點(diǎn)布設(shè)、快速高效分類等提供參考。

[1] STEHMAN S, FOODY G. Key issues in rigorous accuracy assessment of land cover products[J]. Remote Sensing of Environment, 2019, 231: 111199.

[2] OLOFSSON, P, FOODY, G, HEROLD, M, et al. Good practices for estimating area and assessing accuracy of land change[J]. Remote Sensing of Environment, 2014, 148: 42-57.

[3] ZHANG C, DI L P, HAO P, et al. Rapid in-season mapping of corn and soybeans using machine-learned trusted pixels from Cropland Data Layer[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 102: 102374.

[4] 馮權(quán)瀧,陳泊安,李國慶,等. 遙感影像樣本數(shù)據(jù)集研究綜述[J]. 遙感學(xué)報(bào),2022,26(4):589-605. FENG Quanlong, CHEN Boan, LI Guoqing, et al. A review for sample datasets of remotesensing imagery[J]. National Remote Sensing Bulletin, 2022, 26(4): 589-605. (in Chinese with English abstract)

[5] EBRAHIMY H, MIRBAGHERI B, MATKAN A, et al. Per-pixel land cover accuracy prediction: A random forest-based method with limited reference sample data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 172: 17-27.

[6] GE S, ZHANG J, PAN Y, et al. Transferable deep learning model based on the phenological matching principle for mapping crop extent[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 102: 102451.

[7] WANG S, AZZARI G, LOBELL D. Crop type mapping without field-level labels: Random forest transfer and unsupervised clustering techniques[J]. Remote Sensing of Environment, 2019, 222: 303-317.

[8] WICKHAM J, STEHMAN S, SORENSON D, et al. Thematic accuracy assessment of the NLCD 2016 land cover for the conterminous United States[J]. Remote Sensing of Environment, 2021, 257: 112357.

[9] 馮權(quán)瀧,牛博文,朱德海,等. 土地利用/覆被深度學(xué)習(xí)遙感分類研究綜述[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(3):1-17. FENG Quanlong, NIU Bowen, ZHU Dehai, et al. Review for deep learning in land use and land cover remote sensing classification[J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(3): 1-17. (in Chinese with English abstract)

[10] 任旭紅,潘瑜春,高秉博,等. 類別輔助變量參與下的土壤無偏采樣布局優(yōu)化方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2014,30(21):120-128. REN Xuhong, PAN Yuchun, GAO Bingbo, et al. Optimization method of unbiased soil sampling and layout using categorical auxiliary variables information[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE),2014, 30(21): 120-128. (in Chinese with English abstract)

[11] 厲芳婷,張過,石婷婷,等. 耕地“非農(nóng)化”遙感解譯樣本分類體系及應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022,38(15):297-304. LI Fangting, ZHANG Guo, SHI Tingting, et al. Classification system and application of remote sensing interpretation samples of cultivated land non-agriculturalization[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(15): 297-304. (in Chinese with English abstract)

[12] 李若溪,周翔,呂婷婷,等. 植被異質(zhì)性樣區(qū)真實(shí)性檢驗(yàn)的優(yōu)化采樣策略[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(8):177-186. LI Ruoxi, ZHOU Xiang, Lyu Tingting, et al. Optimal sampling strategy for authenticity test in heterogeneous vegetated areas[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(8): 177-186. (in Chinese with English abstract)

[13] 譚建光,張錦水,高晨雪,等. 基于結(jié)構(gòu)規(guī)模的冬小麥種植面積遙感抽樣估算[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(23):114-122. TAN Jianguang, ZHANG Jinshui, GAO Chenxue, et al. Winter wheat area estimation based on structure and scale using remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(23): 114-122. (in Chinese with English abstract)

[14] 吳金勝,劉紅利,張錦水. 無人機(jī)遙感影像面向?qū)ο蠓诸惙椒ü浪闶杏蛩久娣e[J]. 農(nóng)業(yè)工程學(xué)報(bào),2018,34(1):70-77. WU Jinsheng, LIU Hongli, ZHANG Jinshui. Paddy planting acreage estimation in city level based on UAV images and object-oriented classification method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(1): 70-77. (in Chinese with English abstract)

[15] 王迪,仲格吉,張影,等. 空間自相關(guān)性對(duì)冬小麥種植面積空間抽樣效率的影響[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(3):188-197. WANG Di, ZHONG Geji, ZHANG Ying, et al. Effects of spatial autocorrelation on spatial sampling efficiencies of winter wheat planting areas[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(3): 188-197. (in Chinese with English abstract)

[16] WICKHAM J, STEHMAN S, GASS L, et al. Thematic accuracy assessment of the 2011 National Land Cover Database (NLCD)[J]. Remote Sensing of Environment, 2017, 191: 328-341.

[17] YOU N, DONG J, HUANG J, et al. The 10-m crop type maps in Northeast China during 2017–2019[J]. Scientific Data, 2021, 8(1): 1-11.

[18] LIANG S, WU W, SUN J, et al. Climate-mediated dynamics of the northern limit of paddy rice in China[J]. Environmental Research Letters, 2021, 16(6): 64008.

[19] FOODY G, MATHUR A. Toward intelligent training of supervised image classifications: Directing training data acquisition for SVM classification[J]. Remote Sensing of Environment, 2004, 93(1/2): 107-117.

[20] 曹志冬,王勁峰,李連發(fā),等. 地理空間中不同分層抽樣方式的分層效率與優(yōu)化策略[J]. 地理科學(xué)進(jìn)展,2008,27(3):152-160. CAO Zhidong, WANG Jinfeng, LI Lianfa, et al. Strata efficiency and optimization strategy of stratified sampling on spatial population[J]. Progress in Geography, 2008, 27(3): 152-160. (in Chinese with English abstract)

[21] 楊倩倩,靳才溢,李同文,等. 數(shù)據(jù)驅(qū)動(dòng)的定量遙感研究進(jìn)展與挑戰(zhàn)[J]. 遙感學(xué)報(bào),2022,26(2):268-285. YANG Qianqian, JIN Caiyi, LI Tongwen, et al. Research progress and challenges of data-driven quantitative remote sensing[J]. National Remote Sensing Bulletin, 2022, 26(2): 268-285. (in Chinese with English abstract)

[22] 代浩,金銘,陳星,等. 數(shù)據(jù)驅(qū)動(dòng)的應(yīng)用自適應(yīng)技術(shù)綜述[J]. 計(jì)算機(jī)研究與發(fā)展,2022,59(11):2549-2568. DAI Hao, JIN Ming, Chen Xing, et al. Survey of data-driven application self-adaptive technology[J]. Journal of Computer Research and Development, 2022, 59(11): 2549-2568. (in Chinese with English abstract)

[23] BORYAN C, YANG Z, WILLIS P, et al. Developing crop specific area frame stratifications based on geospatial crop frequency and cultivation data layers[J]. Journal of Integrative Agriculture, 2017, 16(2): 312-323.

[24] CHEN J, CHEN L, CHEN F, et al. Collaborative validation of GlobeLand30: Methodology and practices[J]. Geo-spatial Information Science, 2021, 24(1): 134-144.

[25] 陳逸聰,邵華,李楊. 多源土地覆被產(chǎn)品在長三角地區(qū)的一致性分析與精度評(píng)價(jià)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(6):142-150. CHEN Yicong, SHAO Hua, LI Yang. Consistency analysis and accuracy assessment of multi-source land cover products in the Yangtze River Delta[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(6): 142-150. (in Chinese with English abstract)

[26] Gorelick N, Hancher M, Dixon M, et al. Google Earth Engine: Planetary-scale geospatial analysis for everyone[J]. Remote Sensing of Environment, 2017, 202(12):18-27.

[27] 劉園,蔡澤江,余強(qiáng)毅,等. 從作物輪作角度評(píng)價(jià)華南典型赤紅壤農(nóng)區(qū)耕地質(zhì)量空間差異[J]. 農(nóng)業(yè)資源與環(huán)境學(xué)報(bào),2021,38(6):1051-1063. LIU Yuan, CAI Zejiang, YU Qiangyi, et al. Spatial variation evaluation of cultivated land quality from the perspective of crop rotation for a typical lateritic red soil farming area in South China[J]. Journal of Agricultural Resources and Environment, 2021, 38(6): 1051-1063. (in Chinese with English abstract)

[28] ZHAO Y, POTGIETER A, ZHANG M, et al. Predicting wheat yield at the field scale by combining high-resolution Sentinel-2 satellite imagery and crop modelling[J]. Remote Sensing, 2020, 12(6): 1024.

[29] DEVENTER V, WARD A, GOWDA P, et al. Using thematic mapper data to identify contrasting soil plains and tillage practices[J]. Photogrammetric Engineering and Remote Sensing, 1997, 63: 87-93.

[30] MCFEETERS S. The use of the Normalized Difference Water Index (NDWI) in the delineation of open water features[J]. International Journal of Remote Sensing, 1996, 17(7): 1425-1432.

[31] 查勇,倪紹祥,楊山. 一種利用TM圖像自動(dòng)提取城鎮(zhèn)用地信息的有效方法[J]. 遙感學(xué)報(bào),2003,7(1):37-40. ZHA Yong, NI Shaoxiang, YANG Shan. An effective approach to automatically extract urban land-use from TM imagery[J]. National Remote Sensing Bulletin, 2003, 7(1): 37-40. (in Chinese with English abstract)

[32] ANCHANG J, ANANGA E, PU R. An efficient unsupervised index based approach for mapping urban vegetation from IKONOS imagery[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 50: 211-220.

[33] 王洋,丁志剛,鄭樹泉,等. 一種用戶畫像系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 計(jì)算機(jī)應(yīng)用與軟件,2018,35(3):8-14. WANG Yang, DING Zhigang, ZHENG Shuquan, et al. Design and implementation of a user portrait system[J]. Computer Applications and Software, 2018, 35(3): 8-14. (in Chinese with English abstract)

[34] 王建仁,馬鑫,段剛龍. 改進(jìn)的k-means聚類k值選擇算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2019,55(8):27-33. WANG Jianren, MA Xin, DUAN Ganglong. Improved k-means clustering k-value selection algorithm[J]. Computer Engineering and Applications, 2019, 55(8): 27-33. (in Chinese with English abstract)

[35] 姬鵬飛,孟偉娜,楊北方,等. 基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的農(nóng)業(yè)機(jī)械數(shù)據(jù)預(yù)測(cè)研究[J]. 中國農(nóng)機(jī)化學(xué)報(bào),2020,41(2):200-205. JI Pengfei, MENG Weina, YANG Beifang, et al. Research on prediction of the number of agricultural machinery data based on an improving method of BP neural network[J]. Journal of Chinese Agricultural Mechanization, 2020, 41(2): 200-205. (in Chinese with English abstract)

[36] COCHRAN W.Sampling Techniques (3rd ed. )[M]. New York: John Wiley & Sons, 1977.

[37] CORTES C, VAPNIK V. Support-Vector Networks. [J]. Machine Learning, 1995, 20(3): 273-297.

[38] MOUNTRAKIS G, Xi B. Assessing reference dataset representativeness through confidence metrics based on information density[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 78: 129-147.

[39] WALDNER F, BELLEMANS N, HOCHMAN Z, et al. Roadside collection of training data for cropland mapping is viable when environmental and management gradients are surveyed[J]. International Journal of Applied Earth Observation and Geoinformation, 2019, 80: 82-93.

[40] NDAO B, LEROUX L, GAETANO R, et al. Landscape heterogeneity analysis using geospatial techniques and a priori knowledge in Sahelian agroforestry systems of Senegal[J]. Ecological Indicators, 2021, 125: 107481.

Data-driven field sample location approach for crop classification using remote sensing

WU Qingying, YU Qiangyi※, DUAN Yulin, WU Wenbin

(,,,100081,)

The field sample points can be directly input into the crop classification models using remote sensing. Therefore, the quantities and quality of sample points can dominate both the classification accuracy and mapping. In this study, a data-driven approach was established for sampling strategies using the features of spectral bands and vegetation indices from image classification. A field sample points approach was carried out to combine a few stratified random sampling, and then followed by the multiple evaluation metrics, according to the dependence of the crop remote sensing classification upon the varied sampling. A data-driven approach based on-means unsupervised clustering was used to generate a graph of clustering with the same optimal, considering 78 classification features extracted from the 6-phase Sentinel-2 images. The comparison experiments consisted of two intra-stratified sample allocation strategies with equal and area-ratio sample allocation, five total sample sizes of 25, 49, 100, 169 and 225, one theoretical total sample size of 139 and one traditional method of total sample size of 400. The accuracy of the mapping was also evaluated by the Support Vector Machine (SVM) classification model. The experimental results showed: 1) Sampling on the data-driven basemap generated by unsupervised clustering (area-ratio, and equal stratified sampling) obtained the better quality sample dataset, which was significantly higher classification accuracy than that without the basemap (simple random, and systematic sampling); 2) In cases where the total sample size was less than the theoretical total sample size, the equal stratified sampling performed better than the area-ratio stratified sampling. For example, when theoretical sample size was 139, mean accuracies of classification with the equal stratified sampling method (75.5%, 80.5% and 86.0%) at total sample sizes of 25, 49 and 100 was significantly higher than that with the area-ratio stratified sampling method (48.4%, 69.0% and 83.0%), while mean accuracies of classification with the two stratified methods at total sample sizes of 169 and 225 were all around 90.0%; 3) The actual total sample size by stratified sampling was smaller than the theoretical sample size, in order to fully meet the overall requirement of accuracy, indicating the great improvement in the sampling efficiency. For example, equal stratified sampling was required about one-seventh of the theoretical sample size to satisfy the overall accuracy requirement of 85.0%. The classification accuracy was equal to that of the manual selection (overall accuracy=97.5%), and the actual sample size of the equal stratified sampling was about one-ninth of the traditional one. Therefore, the classification accuracy and stability increased with the total sample size and then tended to saturate at the end, even if the sample size continued to increase. A well-balanced inter-class and diverse within-class sample set can be expected to obtain for an optical field sample distribution using crop remote sensing classification

agriculture; remote sensing; crop classification; sample point distribution; sampling basemap; cluster analysis

10.11975/j.issn.1002-6819.202210229

S127

A

1002-6819(2023)-06-0214-10

吳清瀅,余強(qiáng)毅,段玉林,等. 數(shù)據(jù)驅(qū)動(dòng)的農(nóng)作物遙感分類地面樣本點(diǎn)布設(shè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2023,39(6):214-223.doi:10.11975/j.issn.1002-6819.202210229 http://www.tcsae.org

WU Qingying, YU Qiangyi, DUAN Yulin, et al. Data-driven field sample location approach for crop classification using remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2023, 39(6): 214-223. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.202210229 http://www.tcsae.org

2022-10-27

2023-02-14

國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2019YFE0125300);現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系北京市數(shù)字農(nóng)業(yè)創(chuàng)新團(tuán)隊(duì)“數(shù)字大田應(yīng)用場(chǎng)景建設(shè)”項(xiàng)目(BAIC10-2022-E06)

吳清瀅,研究方向?yàn)檗r(nóng)業(yè)遙感。Email:wuqingying@caas.cn

余強(qiáng)毅,副研究員,研究方向?yàn)檗r(nóng)業(yè)遙感。Email:yuqiangyi@caas.cn

猜你喜歡
分類研究
FMS與YBT相關(guān)性的實(shí)證研究
2020年國內(nèi)翻譯研究述評(píng)
遼代千人邑研究述論
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
主站蜘蛛池模板: 在线观看热码亚洲av每日更新| 国产h视频免费观看| 国产香蕉在线视频| 91免费国产在线观看尤物| 日本不卡视频在线| 国产区福利小视频在线观看尤物| 九色在线视频导航91| 亚洲天堂视频在线播放| 久久久久人妻精品一区三寸蜜桃| 欧美日韩91| 亚洲国产精品一区二区第一页免| 久久综合色88| 1024国产在线| 无码精品国产dvd在线观看9久| 国产一在线观看| 亚洲国产精品日韩av专区| 天堂网亚洲系列亚洲系列| AV无码国产在线看岛国岛| 四虎影视无码永久免费观看| 伊人精品视频免费在线| 亚洲日本韩在线观看| 久久精品视频一| 天天干伊人| 天堂成人在线视频| 国产导航在线| 成人夜夜嗨| 伊人成人在线视频| 黄片在线永久| 亚洲国产高清精品线久久| 久久久久人妻一区精品色奶水| 欧美a网站| 欧美日韩激情| 毛片网站观看| 精品人妻无码中字系列| 国内熟女少妇一线天| 日本一本正道综合久久dvd | 欧美精品在线视频观看| 91国内在线观看| 免费人成在线观看成人片| 亚洲熟女偷拍| 国产高清毛片| 广东一级毛片| 狠狠躁天天躁夜夜躁婷婷| 久久久久亚洲AV成人网站软件| 亚洲成在人线av品善网好看| 亚洲 欧美 中文 AⅤ在线视频| 9啪在线视频| 欧美人在线一区二区三区| 91亚瑟视频| 国产精品部在线观看| 福利国产微拍广场一区视频在线| 精品一区二区无码av| 欧美 国产 人人视频| 一级毛片在线播放| 高潮爽到爆的喷水女主播视频| 熟妇无码人妻| 毛片a级毛片免费观看免下载| 欧美午夜视频在线| 国产成人高清精品免费| 无码在线激情片| 日本精品中文字幕在线不卡| 亚洲欧美成人| 3p叠罗汉国产精品久久| 国产超碰在线观看| 91麻豆国产视频| 久久6免费视频| 97国产精品视频人人做人人爱| 青青青视频91在线 | 国产美女在线观看| 亚洲男女天堂| 亚洲免费黄色网| 亚洲日韩高清无码| 日日拍夜夜嗷嗷叫国产| 中文字幕亚洲专区第19页| 国内自拍久第一页| 欧美精品v| 欧美综合一区二区三区| 2021亚洲精品不卡a| 久久亚洲精少妇毛片午夜无码| 国产乱人伦偷精品视频AAA| 免费国产在线精品一区| 免费看的一级毛片|