杜樂山,劉海鷗,劉文慧,王槐睿,張 穎,全占軍*
1.北京林業大學經濟管理學院,北京 100083
2.中國環境科學研究院生態研究所,北京 100012
3.海南省輻射環境監測站,海南 海口 571126
生態系統服務是指人類從生態系統中獲取的惠益,包括供給服務、調節服務、文化服務和支持服務四大類[1].水源涵養服務作為生態系統調節服務的重要組成部分,直接關系到生態系統的韌性和社會經濟可持續發展[2].如何科學識別水源涵養服務重要區域,量化水源涵養服務及其時空演變規律[2-4],一直是學術界討論與研究的熱點.早期主要基于觀測數據定量分析水源涵養服務,研究方法包括水量平衡法、降水貯存法、年徑流法、林冠截留剩余法、土壤蓄水能力法等,這類方法往往需要大量的定點觀測數據,僅適用于小尺度研究;近年來大量基于模型的水源涵養服務量化方法脫穎而出,如SWAT 模型[5-6]、InVEST 模型[2,7-8]、LPJ 動態模型[9]等,特別是InVEST 模型所需的數據易獲取、參數調整靈活、評價結果可空間化表達,得到了學術界的廣泛認可[10-11].值得注意的是,不同學者界定的水源涵養服務內涵、選取的評估模型與使用的本底數據不同,往往導致水源涵養服務估算結果出現較大差異[12],因此,基于不同生態系統類型,采用不同方法與評估模型得出的結果往往不具備可比性,但對同一區域開展水源涵養服務時空動態演變分析,對系統掌握區域水源涵養服務情況具有重要意義[13-14].
近年來,海量數據的出現以及機器學習算法的快速發展,極大提升了機器學習在數據分析中的應用,越來越多的機器學習算法在特定領域甚至超過人類,成為眾多領域解決現實問題的有效工具.在生態環境領域,支持向量回歸模型(support vector regression,SVR)[15-16]、BP 神經網絡[17-18]和LSTM[19-20]等機器學習算法已被廣泛應用于大氣污染預測,隨機森林模型[21-22]、神經網絡模型[23]也被應用到生態系統服務驅動因素分析并取得了良好效果.在機器學習算法中,基于Adaboost 算法[24-25]和梯度提升樹(Gradient Boosting Decision Tree,GBDT)[26]的集成學習法應用則更為廣泛;尤其是GBDT,通過逐步訓練組合多個決策樹來實現分類或回歸任務,具有高度可解釋性、魯棒性強、可擴展性好的優點而被優先選用.LightGBM(grandient boosting machine)是實現GBDT 算法的優化版本[27],具有訓練速度快、內存消耗低、準確率高且可以快速處理海量數據等優點,而被廣泛認可并應用于健康管理、災害防控等方面,但在環境領域應用較少[28].
海南熱帶雨林國家公園位于海南島中部,地理位置108°44 ′32 ″E~110°04 ′43 ″E、18°33 ′16 ″N~19°14′16″N,涉及五指山、瓊中、白沙、東方、陵水、昌江、樂東、保亭、萬寧9 個縣(市),總面積4 269 km2,約占海南島總面積的12.1%.國家公園最高點位于五指山,海拔1 867 m;最低點位于吊羅山區域都總河,海拔僅45 m(見圖1).該區光照充足,熱量條件優越,年均氣溫在22.5~26.0 ℃之間;年降水量大,雨水充沛,多年平均降水量為1 759 mm,但時空分布不均勻,干濕季節明顯;臺風活動頻數多、強度大、時間長,臺風帶來的強風、暴雨和風暴潮等對該區域有較大影響.全區森林覆蓋率為95.86%,其中,以熱帶雨林為主體的天然林占76.56%.

圖1 海南熱帶雨林國家公園數字高程Fig.1 Digital elevation model of Hainan Tropical Rain Forest National Park
采用InVEST 模型對2000-2020 年海南熱帶雨林國家公園的產水深度和水源涵養量進行評估.InVEST 模型是由斯坦福大學、大自然保護協會(TNC)與世界自然基金會(WWF) 于2007 年聯合開發的,通過地形系數、土壤飽和導水率以及流速系數對產水量進行修正獲得水源涵養量[31].InVEST 模型產水模塊基于水量平衡原理,認為柵格單元的降水量減去實際蒸散發后的水量即為產水量,在產水量的基礎上再考慮土壤厚度、滲透性、地形等因素的影響,計算水源涵養量.模型主要算法如下:
式中:Yil為 柵格單元i中 土地利用類型l的年產水量,mm;AETil為柵格單元i中 土地利用類型l的年均蒸散發量,mm;Pi為柵格單元i的年均降水量,mm.其中,(實際蒸散量與降水量的比值) 是依據Zhang等[32]在Budyko 曲線基礎上發展而來,其表達式如下:
式中:wi為柵格單元i中修正的植被年可利用水量與降水量的比值,是描述自然氣候與土壤性質的參數;AWCi為柵格單元i的植物有效含水量,由土壤質地和土壤有效深度決定,是田間持水量和萎蔫點之間的差值,mm;Zh為Zhang 系數,是表征降水特征的常數;Ril為柵格單元i中 土地利用類型l的Budyko 干燥指數,表示潛在蒸發量與降水量的比值;pi為柵格單元i的潛在蒸散量,由氣候條件決定,mm;kil為 柵格單元i中土地利用類型l的植被蒸散系數,是不同發育期中作物蒸散量(ET)與 潛在蒸散量(ET0)的比值,由植被類型決定.
從時間尺度對水源涵養服務的演變規律進行研究,構建水源涵養服務變化指數(water conservation index,WCI) 對水源涵養服務的波動情況進行刻畫,用以指征水源涵養服務的相對增益或損失[33].WCI=0表明水源涵養服務沒有變化,即無增益無減損;WCI<0表示有減損;WCI>0 表示有增益[34].計算公式:
式中:WCIi為柵格單元i水源涵養服務變化指數;WCcur為待估年份的水源涵養量,m3;WChis為初始年份的水源涵養量,m3.
空間自相關分析是研究物體在空間變量分布是否具有聚集性和相互作用的重要方法,包含全局空間自相關和局部空間自相關兩種[35],分別揭示空間單元性質與鄰近空間上其他屬性值在全局空間和局部空間上的相關性[36].采用全局莫蘭指數(Moran′s I)描述水源涵養服務的空間自相關特征,當Moran′s I>0 時,說明WCI 具有正向空間自相關,值越大表示正向自相關性越強;當Moran′s I<0 時,說明具有負向空間自相關,值越小表示負向自相關性越強;當Moran′s I=0時,說明沒有相關性,即呈隨機分布[37].Moran′s I 指數計算公式如下:
一個詞的意義發生演變,與整個社會的發展分不開。由于詞匯是語言三要素中與客觀世界聯系最為緊密的部分,因此客觀世界的發展變化會影響詞匯產生發展變化。在這一變化過程中,詞義的演變是必然的。
式中:WCi和 WCj分別為柵格單元i和j的水源涵養量,m3;n為研究區樣本總量;為區域水源涵養量的平均值,m3;wij為柵格單元i和j基于距離函數鄰接關系建立的空間權重矩陣.
空間聚類分析(local indicators of spatial association,Lisa)用于研究區域內水源涵養服務的空間分異規律.Lisa 計算公式[38]:
式中:wij為空間權重矩陣,xi為柵格單元i的屬性值,為所有屬性值的平均值,n為區域單元的總數.Lisa>0 表示空間單元的水源涵養服務是高-高值或低-低值的空間聚集;相反,Lisa<0 表示空間單元的水源涵養服務為高-低值或低-高值的空間聚集[39].在此基礎上,利用ArcGIS 10.2 軟件空間分析中的熱點分析工具(hotspot analysis,基于Getis-Ord Gi*統計指數),通過計算各斑塊之間的得分Z(標準偏差)和概率P,檢測具有統計顯著性的熱點和冷點空間聚集區域,并繪制局部自相關指標Lisa 分布圖[40].
為進一步研究海南熱帶雨林國家公園水源涵養服務的影響因素,參考已有文獻[11,39,41-42],選取自然因素和人類活動兩大類共12 個具體指標(見表1).將各柵格數據的空間投影坐標統一為CGCS2000 高斯投影坐標系,通過ArcGIS 10.2 的“值提取至點”工具,將不同分辨率的數據重采樣為30 m 分辨率并對齊柵格[11],對土地利用類型(LULC)指標做類別變量轉換,其他指數進行歸一化處理.基于ArcGIS 10.2 軟件對2000 年、2005 年、2010 年、2015 年和2020 年每年生成2 000 個隨機點,5 期共計10 000 個樣本,基于Python 語言對數據進行清洗,去除空值后剩余9 135個樣本.采用LightGBM 構建決策樹,對樣本集采用隨機且有放回地抽取,并將樣本集的80%劃分為訓練樣本、20%作為驗證樣本,研究各驅動因子對海南熱帶雨林國家公園水源涵養服務的貢獻,并基于Shape 包對模型進行解釋性分析.

表1 海南熱帶雨林國家公園水源涵養服務驅動因素及數據來源Table 1 Driving factors of water conservation and their sources of Hainan Tropical Rain Forest National Park
2000-2020 年,以5 年為一個時間段,通過InVEST 模型評估得到海南熱帶雨林國家公園的產水深度和水源涵養量.總體而言,海南熱帶雨林國家公園產水深度和水源涵養量波動較大,呈現“先下降、后上升”的趨勢(見圖2 和圖3).其中,2000 年、2005 年、2010 年、2015 年和2020 年的產水深度分別為1 264.85、998.72、927.19、950.39 和1 023.28 mm(見圖3).2000-2010 年水源涵養量逐期下降,從5.36×109m3降至3.93×109m3,降幅為26.7%;2010-2020 年水源涵養量逐期上升,從3.93×109m3升至4.34×109m3,升幅為10.37%(見圖2).

圖2 海南熱帶雨林國家公園2000—2020 年水源涵養量和產水深度的年際變化Fig.2 Annual changes of water conservation and water yield from 2000 to 2020 in Hainan Tropical Rain Forest National Park

圖3 海南熱帶雨林國家公園2000—2020 產水深度的空間分布Fig.3 Distribution of water yield in Hainan Tropical Rain Forest National Park from 2000 to 2020
采用InVEST 模型評估得到2000-2020 年海南熱帶雨林國家公園的產水深度在927.19~1 264.85 mm 之間,水源涵養量在4.37×109~5.96×109m3之間,水源涵養量非常大,這與該地區是昌化江、萬泉河、太陽河、陵水河等河流的發源地相吻合.本研究結果與21 世紀初的部分研究結果[43-45]存在數量級差異,與近期李昂等[29]和張翠萍等[46]的研究結果相近.從表2 可以看出,采用不同方法與模型得到的水源涵養量往往存在較大差異,即使采用同樣的模型,使用參數不同也會導致結果存在差異,這是目前學術界面臨的普遍問題[55].但這并不影響筆者所得結果的可靠性,筆者通過相同的方法、模型與參數得出的水源涵養服務,在時間和空間上具有可比性,對指導國家公園保護規劃編制及綜合管理具有參考價值.另外,劉賢詞等[53]研究發現南渡江流域水源涵養量在2005-2010 年呈下降趨勢,張翠萍等[46]研究發現海南中部山區在1998-2013 年水源涵養量則呈先上升后下降的趨勢,韓念龍等[11]研究發現海南島水源涵養量在1996-2020 年出現下降,李昂等[29]研究發現海南熱帶雨林國家公園水源涵養量在2000-2018 年先上升后下降(見表2).上述研究均發現海南島部分區域水源涵養量的時間波動性,與筆者得出海南熱帶雨林國家公園2000-2020 年水源涵養量呈現先下降后上升的結論部分吻合,水源涵養量除了與降水量密切相關以外,還與21 世紀前10 年自然生態系統面積持續減少[51]、黨的十八大以來森林生態系統面積持續增長有直接關系[56].

表2 海南省部分研究區域水源涵養服務相關研究結果對比Table 2 Comparison of research results of water conservation of some research areas in Hainan Province
利用ArcGIS 10.2 軟件將海南熱帶雨林國家公園產水深度進行空間可視化,結果表明,產水深度的空間分布格局差異較大,呈現出自北向南逐漸增加、自西向東逐漸增加的分布特點,并且這種空間分布特點在不同年份之間具有較好的一致性(見圖3).
海南熱帶雨林國家公園水源涵養服務總體呈現“東高西低、南高北低”的分布特點,特別是自西向東明顯減少,與張翠萍等[46]對海南中部山區的研究結果一致,也與海南島降水量的分布基本一致,這是因為海南島屬于熱帶季風海洋性氣候,受海南島中部高海拔的影響,多年平均降水量由東到西遞減[11];實際蒸散發受降水量及土地利用類型的綜合影響,林地是海南熱帶雨林國家公園的主要生態系統類型,國家公園東部和南部是天然林分布的主要區域[46],植被和土壤截留的降水相對較多,導致區域水源涵養量較高[11];西部靠近工業園區,天然林相對較少,橡膠園等人工植被覆蓋面積較大[46],植被的實際蒸散發相對較高,導致被截留的降水較少,使其水源涵養量偏低[11].
綜合空間異質性表達能力和運算工作量,確定1 km×1 km 格網作為研究區水源涵養服務驅動分析的空間單元.由圖4 可知,2000-2020 年海南熱帶雨林國家公園水源涵養服務的空間Moran′s I 指數均大于0.93,Z得分大于2.58(均通過1%顯著性檢驗),表明海南熱帶雨林國家公園水源涵養服務有較強的空間正相關性,空間聚集特征明顯(見表3 和圖4).

表3 海南熱帶雨林國家公園水源涵養服務Moran′s I 指數與冷熱點分析Table 3 Moran′s I and hot spot analysis of water conservation in Hainan Tropical Rain Forest National Park

圖4 海南熱帶雨林國家公園2000—2020 水源涵養服務冷熱點分布Fig.4 Distribution of hot spot of water conservation in Hainan Tropical Rain Forest National Park from 2000 to 2020
對海南熱帶雨林國家公園的水源涵養服務進行局部空間差異性分析,通過空間聚類分析圖(Lisa)可以明顯看出,西部地區出現空間冷點(“低-低”型),而東部地區出現空間熱點(“高-高”型),且這種分布特征在不同年份之間呈現較好的一致性(見圖4).與以往研究結果[11]類似,“高-高”型主要分布在國家公園東部,與水源涵養服務高值區分布一致;“低-低”型主要聚集在國家公園西部,該區域靠近工業園區,疊加降水較少及實際蒸發較高等因素,水源涵養能力較弱;“高-低”型和“低-高”型分布較為零散.另外,2000-2020 年空間熱點區域面積基本表現出“先上升后下降而后上升”的趨勢,空間冷點區域面積呈現縮小的趨勢(見表3),這與我國近年來逐步加大以國家公園為主體的自然保護地體系保護力度密不可分.
基于LightGBM 模型,對2000-2020 年海南熱帶雨林國家公園的水源涵養服務進行決策分析,以確定各驅動因子在水源涵養服務方面的貢獻.結果顯示,各影響因子對水源涵養服務的解釋度達98.98%.為進一步解析各驅動因素對水源涵養服務的貢獻,將所有采樣點通過蜂窩圖進行展示,結果如圖5 所示.

圖5 海南熱帶雨林國家公園水源涵養服務驅動因素蜂窩圖Fig.5 Shap plot of factors driving water conservation in Hainan Tropical Rain Forest National Park
從蜂窩圖可以清晰看出,降水量(Pre)、蒸發量(Pet)、土地利用類型(LULC)對海南熱帶雨林國家公園水源涵養服務的邊際貢獻度最高,是主要影響因素;水源涵養能力與降水量呈顯著正相關,與蒸發量呈顯著負相關,同時受土地利用類型影響較為顯著.其他因素的邊際貢獻度從大到小依次為數字高程(DEM)、坡度(Slope)、凈初級生產力(NPP)、歸一化植被指數(NDVI)、人類足跡指數(Hii)、人口密度(Pop)、溫度(Tem)、人均GDP 和夜間燈光(Dmsp).從圖5 可以清晰看出,除土地利用類型外,其他人類活動如人類足跡指數(Hii)、人口密度(Pop)、人均GDP、夜間燈光(Dmsp)對水源涵養服務的影響都不大(見圖5).
研究發現,自然因素中降水量、蒸發量,以及人類活動中的土地利用類型是海南熱帶雨林國家公園水源涵養服務的主要驅動因素,這與以往利用地理探測分析得出的降水量、實際蒸散發和土地利用類型對水源涵養時空變化分布具有密切關系[11]的結論一致,也與我國太湖[57]、三江源[58]等其他地區研究結論類似.LighGBM 模型分析同時發現,其他人類活動,如人類足跡指數(Hii)、人口密度(Pop)、人均GDP、夜間燈光(Dmsp)對水源涵養服務的影響不大,一方面是因為自然因素對生態系統服務影響更大[4],另一方面也說明近年來國家加大對國家公園保護與管控力度,保護區內人類活動稀少導致對水源涵養服務影響不大.本研究引入LightGBM 模型探究海南熱帶雨林國家公園水源涵養服務的驅動因素,研究結果對國家公園精細化管理具有重要參考價值;但考慮到影響水源涵養服務時空演變的因素錯綜復雜,除本研究選取的因素外,生態系統演替階段、林齡[59]以及其他政策制度、保護規劃、價值觀念等難以量化的因素也會直接影響水源涵養服務[39],還需要在未來的研究中進一步探討.
a) 從時間維度來看,2000-2020 年海南熱帶雨林國家公園水源涵養量波動較大,呈現“先下降、后上升”的趨勢,2000 年、2005 年、2010 年、2015 年和2020 年水源涵養量分別為5.36×109、4.23×109、3.93×109、4.03×109、4.34×109m3.
b) 從空間關系來看,2000-2020 年海南熱帶雨林國家公園水源涵養量的空間格局差異較大,呈現“東高西低、南高北低”的分布特點,且空間分異在不同年份之間具有較好的一致性.總體來看,2000-2020 年Moran′s I 指數均大于0.93,Z得分大于2.58(均通過1%顯著性檢驗),表明水源涵養服務呈較強的空間聚集模式;西部地區出現空間冷點,而東部地區出現空間熱點,且這種分布特征在不同年份之間呈現較好的一致性.
c) 從驅動力分析來看,本文引入LightGBM 機器學習系統研究海南熱帶雨林國家公園水源涵養服務驅動因素,發現降水量(Pre)、蒸發量(Pet)和土地利用類型(LULC)對水源涵養服務的邊際貢獻度最高,其中,水源涵養服務與降水量呈正相關,與蒸發量呈負相關,同時受土地利用類型影響較為顯著;其他因素的邊際貢獻度從大到小依次為數字高程(DEM)、坡度(Slope)、凈初級生產力(NPP)、歸一化植被指數(NDVI);其他人類活動,如人類足跡指數(Hii)、人口密度(Pop)、人均GDP、夜間燈光(Dmsp)對水源涵養服務的影響不大.
水是連結生態系統過程與人類活動的重要紐帶,水源涵養服務在生態系統服務中占據中心地位.研究發現,海南熱帶雨林國家公園水源涵養服務具有時間波動性和空間差異性,且受自然因素(主要為降水量和蒸發量)與人類活動(主要為土地利用類型)影響較大.為提升海南熱帶雨林國家公園水源涵養服務,提出如下建議:
a) 對國家公園進行整體性保護與區域差異化管理.每年海南熱帶雨林國家公園水源涵養量為3.93×109~5.36×109m3,對保障海南島飲用水安全和可持續發展至關重要,必須對國家公園進行統籌規劃與整體保護,并以國家公園為中心,協同推進構建全島水生態安全屏障.同時,基于國家公園水源涵養服務的時空異質性特征,在水源涵養量較高的東部地區繼續落實嚴格保護措施,對西部水源涵養量相對較低且出現“低-低”分布特征的地區,建議在不影響自然演替進程的同時適當開展森林撫育措施,以達到國家公園水源涵養最大化的目的.
b) 深入開展氣候變化與人類活動監測及其對水源涵養服務的影響研究.國家公園水源涵養服務的時空變化是自然因素(主要為降水量和蒸發量)和人為活動(主要為土地利用類型)共同作用的結果.基于全球氣候變化大背景,建議有效利用大數據及人工智能(機器學習)等先進技術,準確把握自然因素波動對水源涵養服務的影響,提前預判水源涵養服務的時空變化趨勢并提出保障措施.同時,對國家公園核心區域進行嚴格保護才能維持源源不斷的水源供給,建議充分利用好“五基”協同生態遙感監測體系,集成可見光、紅外、雷達、激光等多種傳感器[60-61],全方位做好國家公園人類活動監督管理工作,切實保障海南島的飲用水安全.
c) 注重方法的科學性與評估的延續性.從科學研究的角度來講,水源涵養服務評估模型及研究方法多樣化更有利于推動學科發展,基于不同研究目的可選用不同方法;但從精細化管理的角度,必須進一步明確研究的規范性、方法的科學性和模型參數的一致性,從而對不同尺度開展時空演變分析,指導保護管理與決策制定.同時,建議對國家公園等重點區域,開展常態化監測和評估以保證結果的延續性,為國家公園科學保護與精細化管理提供決策支撐.