錢 鑫,李培顯,2,謝宏全,郜薇薇,王 楊,劉付程
(1.江蘇海洋大學海洋技術與測繪學院,江蘇連云港 222005;2.山東金田測繪地理信息有限公司,濟南 250000)
作物種植結構信息是農業灌溉用水預測、農業產量估算、農業補貼定損和區域水資源分配的重要參考指標。自從18 世紀開始,英美等國采用田測法與筒測法等原始方法進行預測農作物需水的研究。隨后世界各國開始進行小面積農業試驗田的需水量研究[1],當時認定太陽輻射是影響蒸發的主要因子。1948年Penman 基于太陽輻射因子對裸土水面牧草等提出了其蒸發估算公式[2],1963年Monieith 將地表阻力作為影響因子,提出了Penman-Monteith(P-M)公式[3]。1970年M.E.Jensen通過觀測對比實際蒸發蒸騰量與潛在蒸發蒸騰量之間聯系,提出了土壤水分修正系數[4]。1972年Priestley 和Talylor 首先提出了蒸散發在濕潤氣候條件下的估算公式[5]。自20世紀后期以來,隨著計算機技術的不斷發展與更新換代,GIS、遙感等現代地理技術進入農業測量領域,大大推動了作物需水量研究的進程[6-9]。Kumar 利用Penman-Monteith 公式以及印度比哈爾邦Sabour 區和Patna 區的水稻、玉米、小麥、綠豆的作物系數估算了各作物在兩區的需水量,并根據作物在生育期的有效降雨量估算了不同作物的灌溉用水量[10]。王景雷等將主成分分析(PCA)及地理加權回歸(GWR)方法結合一起對華北地區的冬小麥作物需水量空間分布進行了估算,結果表明該方法可以分析出不同位置不同影響因子對農作物需水量的影響[11]。李志新等基于GA-Elman 神經網絡模型在對逐日參考作物需水量預測時有良好的精度性能及穩定性,而且隨機選取進行測試后,其相對誤差絕對值均值為7.24%[12]。隨著空間技術的不斷發展,多傳感器、多時間分辨率和多空間分辨率的遙感數據已廣泛應用于農作物種植結構遙感提取,無論是在理論和技術方法方面,還是在實踐方面都取得了長足的進展[13]。國內外學者發展了許多不同的方法來提高基于遙感識別農作物的精度,為政府相關部門了解農作物種植情況提供了大量的參考與輔助信息[14,15]。由于遙感數據繁雜、分類方法多樣、尺度敏感性等問題,使得農作物種植結構遙感提取研究尚未系統地梳理,難以開展普適性研究和廣泛應用。遙感技術在農業研究中具有廣闊的前景,與此同時,遙感農作物識別方法也存在著一些不足:①相關研究者在進行遙感影像地物識別分類過程中,根據研究的重點在實際操作過程中對其數據處理的相關理論和方法不盡相同;使用的源數據影像、分類算法模型和處理軟件也是有所區別;處理結果的精度也有所差異。②由于誤差因素的存在,在研究過程中對其數據誤差與精度評價方面需要系統性分析和進一步的完善。③由于數據空間分辨率的限制,部分較小的地塊或者相鄰分布的作物無法區分,分類精度很難提高。
本文研究的空間尺度較大、時間跨度較長,如果使用高空間分辨率影像和高光譜分辨率影像作為遙感數據源,可以獲取整個流域種植信息較豐富的鑲嵌影像;同時黑河流域耕地地塊破碎、農作物種植結構復雜,如果以MODIS、SPOT 等影像作為遙感數據源,其伴隨的混合像元現象會嚴重影響分類精度。因此,根據本研究的特點,最后選定的高分辨遙感數據源如哨兵數據(Sentinel)。針對這些問題,本文基于遙感多光譜影像利用多種分類方法相結合的思路,利用Google Earth Engine(GEE)對黑河流域的農作物識別利用多種分類方法,克服混合像元的影響,確保分類精度,探究適合該區域的分類方法,加入TEM 數據與日照時序數據,更好的分析影像分類結果,對祁連山內陸河中的黑河流域農作物信息進行遙感識別及需水量預測分析。
黑河流域是我國境內深居西北地區的第二大內陸河流域,其經緯度范圍介于97°30′~102°5′E,37°44′~42°41′N 之間,橫跨青海省、甘肅省及內蒙古自治區以及我國重要的國防科研基地東風場區[16]。黑河流域地處歐亞大陸西北要地,且周圍多高山環繞,致使附近海域的濕潤氣流長時間無法到達,屬于典型溫帶大陸性干旱氣候[17]。上游祁連山地區山高林密,降水多,年降水量大致為250~500 mm,大部分的水源都來自于上游。中游河西走廊地區屬于溫帶干旱區,全年降水稀少,僅有100~250 mm[18]。下游地區主要是內蒙古的荒漠區,屬于極端干旱區,年降水量少之又少,只有不到50 mm[19]。
(1)Sentinel-2 影像數據。“哨兵”(Sentinel)系列衛星是歐空局為滿足歐洲安全需求專門為實現哥白尼計劃而設計的一組衛星群。高分辨率的Sentinel-2A/B 雙星搭載多光譜成像裝備,主要監測土地環境。其特點具有覆蓋面積廣、重訪周期短等觀測優勢[20]。該衛星設備涵蓋了可見光、近紅外到短波紅外等13 個波譜,其波譜范圍在0.4~2.4μm 之間,且在紅邊范圍處含有3 個波段,分別為B5、B6、B7 波段。此外,哨兵影像還有QA10、QA20、QA603 個質量波段,而QA60 波段廣泛應用于影像去云[21]。
(2)DEM 數據。本文的DEM 數據來源于GEE 平臺中30 m空間分辨率的全球數字高程。該數據集是Farr 等依靠航天飛機雷達地形項目而生產制作的數字高程數據[22]。利用GEE 重采樣函數將其轉換成10 m 分辨率的高程數據,然后按照黑河流域的邊界進行裁剪獲取數據。
(3)其他數據。柵格數據是2011-2015年黑河流域的作物分類結果[23,24]。樣本點數據是基于高分辨率影像的作物分類情況,目視解譯選取樣本點得到矢量數據圖層,其數量為大麥256 個、小麥200 個、玉米307 個、油菜96 個、林地296 個、草地246個、水體243個、人工建筑物407個、裸地418個。
(1)光譜特征。通過前期數據準備及預處理,得到黑河流域的Sentinel-2 影像,其中包括13 個原始光譜波段信息,在GEE 平臺中利用遙感專題指數計算的公式編寫代碼,完成陸地表面水分指數(Land Surface Water Index,LSWI)、歸一化差異水體指數(Normalized Difference Water Index,NDWI)和歸一化建筑指數(Normalized Difference Built-up Index,NDBI)。所得的指數作為獨立的波譜加入原始影像中,與13個原始波段作為特征構建中的基礎元素。
(2)紋理特征。由于種植結構和種植密度以及影像同譜異物現象,僅利用光譜特征進行作物分類會造成混分,因此選擇加入遙感影像的紋理特征。灰度共生矩陣是對圖像紋理特征統計使用最頻繁的方法[25,26],針對圖像中的一些具有某種空間位置關系的像素亮度值不同組合的概率分布。本文利用Sentinel-2 影像的圖像亮度值通過遙感云計算紋理特征的glcmTexture(size)函數,得到18個因子[27]。
在紋理特征計算前,需將RGB影像轉換成Gray影像。參考彩色轉灰度的心理學公式,本文中所使用得轉換公式為:

式中:Gray表示灰度值,值域范圍為0~255;R表示紅光波段;G表示綠光波段;B表示藍光波段。
(3)地形特征。由于不同時空分辨率及多源影像,在遙感分類過程中針對不同數據源選擇地形特征作為分類依據之一,添加地形屬性參數對作物遙感識別的分類結果精度的提高有至關重要的作用。利用GEE 平臺中的ee.Algorithms.Terrain(srtm)函數獲得海拔高度、坡度、坡向和山體陰影等屬性信息,再對數據進行重采樣,輸出地形特征。
作物需水量計算原理是基于作物系數與參考作物蒸散量的乘積進行確定的。而潛在蒸發量的計算是利用P-M[4](Penman-Monteith)公式計算得到,其公式為:

式中:ET0表示參考作物蒸散量;G表示土壤熱通量,逐日計算G的取值為0;Rn表示植物的凈輻射;T表示平均氣溫;γ表示溫度表常數;Δ表示曲線斜率;U2表示高于地表2m 處的風速;es表示飽和水氣壓;ea表示實際監測的水氣壓。
本文依據作物不同階段的作物系數計算需水量,公式為:

式中:ET0表示參考作物蒸散量;Kc表示作物系數;ETc表示作物需水量。
在GEE 平臺中計算敏感性,基于隨機森林特征優選,計算出每個特征的敏感性強度值并完成特征敏感性的排序并獲取前15個特征(圖1)。

圖1 一級分類特征重要性Fig.1 Importance of primary classification features
通過樣本集數據訓練及驗證,選擇特征重要性最大的15個分類特征作為分類依據,其中13個光譜特征、1個紋理特征和1個地形特征。利用隨機森林分類器完成對研究區內土地一級地類解譯,獲取得到黑河流域的土地利用情況。
在一級土地分類的基礎上細化耕地,分為玉米、小麥、大麥和油菜4個二級類。通過GEE計算分析的二級分類特征重要性(圖2)。基于逆序排序函數篩選出前15 個特征重要性大的特征,其中光譜特征8個、紋理特征6個和地形特征1個。

圖2 二級分類特征重要性Fig.2 Importance of secondary classification features
特征優選結束后,分別進行支持向量機(Support Vector Machine,SVM)、隨機森林(Random Forest,RF)和決策樹(Decision Tree,DT)的單一和多種分類器的分類算法。通過對比隨機森林、決策樹與支持向量機對作物分類的敏感性獲取分類精度,從而評價不同分類器的分類效果。
利用GEE 平臺中計算并輸出各種評價指標,即不同分類器分類結果的總體精度、Kappa 系數、用戶精度和制圖精度結果(表1)。從表1可以得出:利用RF 分類器對油菜及玉米的識別精度較好,尤其是油菜的制圖精度,其制圖與用戶精度均高于其余分類器,但該算法對大麥與小麥的識別精度不是很高。采用DT 分類器,利用回歸決策樹原理,改變了對大麥小麥的識別效果,使其精度比RF 分類算法高,而且對玉米油菜的識別精度也較高,總體精度在多種分類器對比中也達到了最高。

表1 精度驗證結果Tab.1 Accuracy verification results
利用搜集到的黑河流域的相關數據估算出當地主要農作物的ET0和CWR。首先,完成第一模塊ET0數據的獲取,即氣象數據相關參數的導入,包括氣象數據五大參數,通過CROPWAT8.0 軟件計算得到凈輻射(Rad)與ET0值,并獲取其平均值。
完成ET0的計算分析后,點開第二模塊Rain,將逐月降雨量數值依次輸入對應月份的降雨量。在Crop 模塊中依次輸入農作物名稱、初播日期、作物系數Kc及各個生長周期天數等數據,其中分為初始生育期、快速發育期、生育中期、成熟期。通過CROPWAT模型結合各種數據計算分析得出玉米、大麥、小麥、油菜的作物需水量。
在對ETc分析計算過程中主要考慮氣候條件的影響,因此通過CROPWAT模型計算站點的數據,獲得站點的各種作物的需水量。
4.2.1 不同區域作物的需水量分析
通過CROPWAT 模型計算出的數據確定4 個作物生長期的需水量,并分別繪制成圖(圖3),作物主要以小麥為例分析各個站點的ETc變化特征。依據圖3可知:各站點小麥的需水量差異性不大,生長中期差值最大,約為100 mm;生長初期差值最小,約為3 mm。綜合考慮小麥各階段的ETc大致為:生長初期各站點的值相近,約為21 mm。隨著幼苗長大,在生長發育期ETc約在85~100 mm 范圍內,均值為91.3 mm。作物到達生長中期需水量達到最大,約為343.1 mm。成熟期需水量逐漸減少,約為190.6 mm。

圖3 作物各站點需水量Fig.3 Water demand of crop stations
通過對作物的需水計算,獲得作物不同生育階段的ETc。基于作物生長周期分析了不同作物、不同周期需水量情況,從總體情況分析可知:玉米各個周期內的需水量區別較大,其生長中期的需水量大于其他3個階段總的需水量;小麥和大麥的各階段需水量整體相似,需水量均為生長中期驟增;油菜在周期內的需水量差異性較小,對水的需求量平滑過渡。
4.2.2 不同作物的逐月需水量分析
由于每月的氣溫、降雨量不同,致使作物生長周期中的每月需水量分布差異明顯,見表2和圖4。結合表2和圖4以小麥為例進行分析各個站點的逐月ETc變化特征。

圖4 不同站點作物逐月需水量Fig.4 Monthly water demand of crops at different stations

表2 作物的ETc逐月百分比%Tab.2 Monthly percentage of ETc of crops
小麥三月為播種期,ETc是最低值,在20.1~23.0 mm 之間,平均值為21.4 mm;4月份為苗期,小麥的ETc逐漸增長到85 mm以上;5月份是拔節期,ETc迅速增長到180 mm;6月份是抽穗期,ETc增長至200 mm 左右,該時段ETc達到最高值;7月份是成熟期,平均值為118.0 mm,ETc需求逐漸下降。因此了解作物的整周期的逐月需水量變化情況,為保證作物的正常生長,在每月農田旱情時,加大灌溉力度及次數。
利用CWR(Crop Water Requirements)模塊結合各要素對灌溉用水量(圖5)進行估算。圖5展現了針對各個站點其附近不同作物的灌溉需求。依據中游區域氣象數據估算出的ETc和逐日采集的降雨量獲取灌溉用水量。當地農業發展歷史為灌溉農業型,一年中作物的生育所需的水大部分來源于農業灌溉,而大氣降雨屬于輔助補給水源,因此可以認為灌溉用水量為作物需水量與大氣降水量的差值,從而獲取有效降雨量就能得出灌溉用水量。

圖5 灌溉用水量Fig.5 Irrigation water demand
為使作物在生長周期得到應有的水分滋養,以10 d 為一個時段。對作物各時段灌溉用水量分析,小麥自3月中旬4月初(假設3月10日開始)播種算起,到7月底8月初收割(本文假設定為7月27 為收獲日),共計15 個時段,將4 種作物各時段所需灌溉水量、作物需水量及作物系數變化情況繪制成圖(圖6)。本文以小麥為例,圖6可以看出小麥整周期分為15 個時段,在8~12 時段,Kc曲線平滑成直線,而灌溉用水量幾乎每個時段達到最多,這是小麥拔節到灌漿期,ETc也相應達到最大值,CWR 大約每時段需要55 mm 左右,因此在此時段加大農業用水灌溉力度,保證其自身的生長發展。最終基于CROPWAT 分析各個作物CWR,估算作物全周期的用水量。其中大麥、小麥、玉米與油菜的每公頃灌溉用水量為4 500~6 000、4 500~6 750、6 000~7 500、3 000~4 500 m3。

圖6 小麥、玉米、大麥和油菜逐時段灌溉需求Fig.6 Irrigation demand of wheat,corn,barley and rape period by period
通過估算作物的ETc,分別從作物生長周期及月度需水量進行了分析,發現不同作物之間,在不同發育期需水量存在很大的差異性。其表現在整個作物生長過程中,前期水需求量較小,中間階段需水量達到頂峰,后期需水量逐漸減少。生長發育時期,一般是在作物的需水臨界期間,對水的需求程度較高,事關作物產量。例如在作物的抽穗期,對田地間的缺水性問題敏感程度最高,特別是拔節到乳熟階段。若該時段作物很大程度上缺水,對作物的生長極為不利,造成大幅度減產,因此根據天氣原因,確保水分的供給。
本文利用遙感云計算平臺對黑河流域的作物進行識別提取,并選用CROPWAT模型完成作物需水量分析,得到的主要研究成果如下:從氣候影響因子、模型等方面總結了作物需水量分析的研究,表明在我國選用CROPWAT模型對作物需水量進行研究的適用性較強;基于RF、DT 及Ensemble3 種分類算法對作物識別提取,通過對比分析發現基于DT 分類精度較高;基于CROPWAT模型,依據降水量估算出大麥、小麥、玉米與油菜的全周期每公頃地灌溉用水量分別為4 500~6 000、4 500~6 750、6 000~7 500、3 000~4 500 m3,依據當地旱情及灌溉條件,為當地農作物需水量提供有效的數據支撐。