楊 光,粟曉玲
(西北農林科技大學 水利與建筑工程學院,陜西 楊凌712100)
基于隨機森林的黑河中游地下水埋深變化及成因
楊 光,粟曉玲
(西北農林科技大學 水利與建筑工程學院,陜西 楊凌712100)
研究黑河中游地下水埋深變化規律及其成因,可為該流域地下水合理開發利用提供參考。根據黑河中游33個觀測井1985—2010年的地下水埋深資料,利用地統計學方法分析了地下水埋深變化規律;采用隨機森林法研究了埋深變化的成因。結果表明:黑河中游地下水埋深自南向北減少;甘州區和臨澤縣的地下水埋深變化趨勢分別在2001年和2004年前呈增大趨勢,之后又逐年減小,高臺縣北部地區埋深呈持續減小趨勢,而東部地區呈增大趨勢;地統計學分析表明地下水埋深具有中等的空間相關性,且空間各向異性有增強的趨勢;影響黑河中游地下水埋深變化的主要因素是渠系水利用系數、地下水開采量、地表水引用量及蒸發能力。
黑河中游;地下水埋深;隨機森林法;地統計學
地下水系統的時空分布與演變規律,既受天然條件,如地質環境、氣候環境、水環境和生態環境等因子控制,又受農業灌溉、工業化、城市化等人類各種經濟活動的影響[1],地下水的補給和排泄發生動態變化,從而引起地下水埋深的時空演變。我國北方地區,降雨稀少,水資源短缺,地下水過度開采,已導致生態環境惡化,如石羊河流域、黑河流域。研究地下水埋深的時空變化規律和變化成因,對合理利用地下水以及保障區域社會經濟持續發展具有重要的指導意義。
目前對于地下水位空間變異規律的研究多采用地統計學方法,如周劍等[2]采用地統計學中的普通克里金方法研究黑河中游土地利用變化對地下水位時空間變異性的影響。魏智等[3]將地統計理論應用于黑河中游分水前后的地下水位及儲量的比較分析;對地下水位(或埋深)變化的成因分析方法主要有主成分分析法,如張素芳[4]采用主成分分析法研究影響咸陽地下水動態變化的驅動因子。陳伏龍等[5]將主成分分析法運用于分析影響莫索灣灌區地下水埋深的因素。但主成分分析法存在不能單一地去評價某一研究對象的某種性能的問題[6]。甚至有學者指出主成分分析法在綜合評價函數中對各主成分使用貢獻率加權是錯誤的[7]。本文采用的隨機森林法(random forest)具有在運算量沒有顯著增加的前提下提高預測精度的優點,被譽為目前最好的算法之一[8]。近年來,被廣泛應用于醫學臨床及生物研究[9-10]。但應用于地下水方面的研究較少。Peters等[11]用隨機森林法分析地下水位在不同種類植被下的響應;Baudron等[12]運用隨機森林法對提取的地下水按離子成分進行分類,精度達到90%以上。
黑河中游是水資源的耗散區,其對地下水的利用方式決定了黑河流域中游地下水的補排方式和生態環境的演變[13]。本文基于ArcGIS地統計分析方法以及隨機森林法分析黑河中游地下水埋深的時空演變規律及其變化成因。
黑河流域是我國西北干旱區較大的內陸河流域之一,位于祁連山和河西走廊的中段。研究區黑河中游流域位于99°20′—100°50′E,38°40′—39°59′N,其行政區分為甘州區、臨澤縣、高臺縣,總面積1.07萬km2。黑河流域中游盆地開闊平緩,地勢南高北低,東部略高于西部,在南部祁連山麓盆地邊緣海拔為1 800~2 000 m,北部黑河沿岸海拔為1 400~1 500 m,面積約為6 375.86 km2[14]。研究區內多年平均降水量58~216 mm,多年平均潛在蒸發能力為860~1 160 mm,地下水類型主要有潛水及承壓水,潛水埋藏淺且易于開采,是農業用水的主要來源。承壓水一般埋深約在100 m以下,不易開采。本次研究對象主要為潛水。
2000年以前,黑河中游人口和灌溉面積大幅度增加。為滿足用水需求,中上游大量截引或滯留河水。因此進入下游水量常年不足,導致河道斷流加劇,湖泊干涸[15]。為改善黑河下游干旱狀況,國務院審批通過了黑河中下游分水方案[水政資(1997)496號],2001年2月確定實施黑河近期治理,通過灌區節水改造、退耕還林還草和經濟結構調整等措施,實現當黑河上游來水15.8億m3時,向下游下泄9.5億m3水的流域分水目標。隨著分水方案的實施,中游地下水開采量逐年增加,地下水的補排條件也發生了變化。
1.2.1 數據來源及處理 地下水埋深數據來源于黑河中游1985—2010年33眼地下水位動態觀測井,其空間分布見圖1。

圖1 研究區地下水觀測井空間分布
1.2.2 地統計學方法 克里金插值是地統計學的主要內容之一,是以變異函數理論和結構分析為基礎,在有限區域內對區域化變量進行無偏最優估計的一種方法[16]。
1.2.3 隨機森林法 隨機森林(random forest)是由Breiman和Cutler在2001年借鑒貝爾實驗室的Ho所提出的把分類樹組合成隨機森林的方法[17]。本文以地下水埋深為因變量,將6個影響地下水埋深演變的因素作為自變量,計算影響因素的重要性,從而獲得黑河中游地下水埋深演變的主要因素。
隨機森林計算步驟[18]:(1)根據Bootstrap自助法最原始的樣本里的數據中有放回的隨機抽出N(如70%)個研究的樣本后,作為N棵樹,樹的數量即為N。(2)在不同樹生成的時候,在研究的全部變量中平均選取變量數量為M,隨后在M中挑選分類能力最強的一個變量,分類原理見圖2。(3)在上述抽取樣本的過程中沒有被抽中的剩余數據(如30%)作為本研究的測試集,以此來對每棵樹的相應性做出一定的評價。(4)由自變量的重要性評分來分析地下水變化的成因。(5)查看模型的標準殘差值及預測誤差值。隨機森林法可以通過R語言等工具實現。R語言是一個自由、免費、開源的軟件,是一個具有強大統計分析功能和優秀統計制圖功能的統計軟件[19]。R語言中有Random Forest軟件包可以運行隨機森林。
根據至黑河干渠垂直距離近、較近、遠以及數據的完整程度,選取高臺縣羅成鄉及正遠鄉、甘州區小滿鄉及梁家墩鄉、臨澤縣東南角及新華鄉的觀測井作為典型井。

圖2 隨機森林分類原理
從圖3分析可知,位于高臺縣北部的羅成鄉呈減小趨勢,而東部的正遠鄉地下水埋深的變化趨勢則大幅度增加。甘州區1985—2001年地下水埋深逐漸增加,而在2001—2010年埋深逐年減少。臨澤地區在1985—2004年間地下水埋深持續增加,在2004年埋深達到最大值,此后地下水埋深略有減小。
2.2.1 樣本統計分析 以2004年為例,在經過對數變換后的正態QQ plot中數據靠近表示正態分布的直線且離群現象不太明顯,基本滿足正態分布。對黑河中游地下水埋深統計分析,結果見表1。由于數據不完整,導致典型年的井數不一致。經對數變換后,各年份的偏度系數接近于0,同時峰度系數接近2,表明樣本數據在空間上基本滿足對數正態分布[20]。

圖3 典型井地下水埋深年際變化

表1 1985-2010年地下水埋深統計分析成果
2.2.2 地下水埋深空間變異特性 以2004年為例分別采用球狀模型、指數模型及高斯模型模擬灌區地下水埋深,各模型交叉驗證結果見表2。由表2可知,球狀模型擬合得較好。球狀模型不同半方差函數模型內插參數設置見表3。地下水位的空間相關性可以根據塊金值與基臺值比值的大小進行劃分,塊金系數小于25%時,空間相關性強;在25%~75%時,空間相關性中等;大于75%時,空間相關性弱[21]。由表3可知,除1987年地下水埋深為較強的空間相關性,其他典型年的塊金系數為25%~75%,說明具有中等的空間相關性;長軸所在的角度大致為100°,短軸變程與長軸變程比值逐年減小,說明空間各向異性略有增強。
2.2.3 地下水埋深的空間分布 結合典型井地下水埋深年際變化,參考數據的完整程度,將典型年設為1987年、1992年、1998年、2001年、2004年、2010年。利用ArcGIS軟件中克里金法對黑河中游地下水埋深進行插值,繪制典型年地下水埋深空間分布圖(圖4)。由圖4可知,黑河中游地下水埋深自南向北減小。高臺縣北部地下水埋深在波動減小,而東部明顯增大。用圖3(典型井地下水埋深的年際變化)校核圖4的準確性,比較可知變化趨勢一致。

表2 2004年不同模型交叉驗證統計值
2.3.1 主要影響因素的變化過程 綠洲區地下水系統的補給項主要來源于降水量、河道及渠系滲漏補給、灌溉入滲補給,排泄項包括地下水開采量及潛水蒸發。本文選擇降水量、地表水引用量、地下水開采量、渠系水利用系數、蒸發能力及鶯落峽來水量6項因素,各因素的變化過程見圖5。甘州區、臨澤縣、高臺縣的降水量年際變化波動較大,2000年后有上升趨勢;地表水引用量在逐年下降,甘州區下降明顯;地下水開采量呈增加趨勢,甘州區和高臺縣1998年以后增加顯著,這是由于為應對分水帶來的“政策缺水”和更加嚴峻的新一輪水資源危機,采取遍地開花式的集中打井灌溉[22],從2004年起甘州區開采量又有所下降;渠系水利用系數整體呈增加趨勢,其中臨澤縣和高臺縣波動較大,原因是渠道老化失修以及渠道凍脹破壞嚴重[23-24],后來加以修復;3個縣區的蒸發能力(用參考作物蒸發蒸騰量)呈波動上升趨勢;鶯落峽來水量的年際變化較大,波動頻繁,2001年之后明顯增加。

表3 不同半方差函數模型內插參數設置

圖4 黑河中游地下水埋深空間分布
2.3.2 重要性評分 利用隨機森林模型獲得影響因素的重要性排序,結果見表4。由表4可知,各縣區地下水埋深變化的影響因素不完全相同,甘州區地下水埋深呈增加趨勢的主要原因是蒸發能力的增加、渠系水利用系數的提高以及地表水引水量的減少;臨澤縣地下水埋深變化的原因是渠系水利用系數的提高、地下水開采量的增加以及地表水引水量的減少;高臺縣地下水埋深變化的原因是地下水開采量的增加、蒸發能力的增加以及地表水引用量的減少。但總體上渠系水利用系數、地下水開采量、地表水引用量及蒸發能力是影響黑河中游地下水埋深演變的主要因素。
2.3.3 隨機森林法預測值與實測值的比較 基于隨機森林法對黑河中游地下水埋深進行預測,預測值與實測值擬合效果較好(圖6),預測誤差均在7%以內,標準殘差值較小,甘州區、臨澤縣和高臺縣分別為0.633,1.234,0.034 m。說明隨機森林法的預測能力較強,結果可信。

表4 黑河中游地下水演變驅動因素的重要性評分

圖5 影響因素年際變化

圖6 預測值與實測值的比較及預測誤差
(1)黑河中游地下水埋深年際變化在各縣區不同。高臺縣部分井的地下水埋深持續減小,另一部分則相反。甘州區在2001年埋深達到最大值,臨澤縣在2004年埋深達到最大值,此后地下水埋深又逐年減少。
(2)球狀模型能較好擬合黑河中游各年地下水埋深,空間分布表明埋深自南向北減少,高臺縣北部地下水埋深波動減小,東部明顯增大。地下水埋深樣本具有中等的空間相關性,樣本空間呈現幾何各向異性,且空間各向異性呈增大趨勢。
(3)影響黑河中游地下水埋深變化的主要因素為渠系水利用系數、地下水開采量、地表水引水量及潛在蒸發能力。隨機森林法模擬地下水埋深的擬合效果較好,模擬能力較強,結果可信。
[1]張光輝,劉少玉,謝悅波,等.西北內陸黑河流域水循環與地下水形成演化模式[M].北京:地質出版社,2005.
[2]周劍,李新,王根緒,等.黑河流域中游地下水時空變異性分析及其對土地利用變化的響應[J].自然資源學報,2009,24(3):498-506.
[3]魏智,金會軍,藍永超,等.基于Kriging插值的黑河分水后中游地下水資源變化[J].干旱區地理,2009,32(2):196-203.
[4]張素芳.基于主成分分析法的咸陽市區地下水動態驅動因子分析[J].水利與建筑工程學報,2012,10(2):126-129.
[5]陳伏龍,鄭旭榮,何新林,等.莫索灣灌區1998—2007年地下水埋深變化及影響因素[J].武漢大學學報:工學版,2011,44(3):317-320.
[6]包磊,雷進生,劉瓊.基于主成分分析法的地鐵系統安全綜合評價[J].三峽大學學報:自然科學版,2011,33(4):57-59.
[7]王學民.對主成分分析中綜合得分方法的質疑[J].統計與決策,2007(8):31-32.
[8]Iverson L R,Prasad A M,Matthews S N,et al.Estimating potential habitat for 134 eastern US tree species under six climate scenarios[J].Forest Ecology&Management,2008,254(3):390-406.
[9]洪燕珠,周昌樂,張志楓,等.基于隨機森林法的慢性疲勞證候要素特征癥狀的選擇[J].中醫雜志,2010,51(7):634-638.
[10]孫雪蓮,舒清態,歐光龍,等.基于隨機森林回歸模型的思茅松人工林生物量遙感估測[J].林業資源管理,2015(1):71-76.
[11]Peters J,De Baets B,Samson R,et al.Modelling groundwater-dependent vegetation patterns using ensemble learning[J].Hydrology and Earth System Sciences Discussions,2007,4(5):3687-3717.
[12]Baudron P,Alonso-Sarría F,García-Aróstegui J L,et al.Identifying the origin of groundwater samples in a multilayer aquifer system with Random Forest classification[J].Journal of Hydrology,2013,499(9):303-315.
[13]趙潔,徐宗學,周劍.黑河中游過去20年地下水位空間變異性分析[J].干旱區資源與環境,2011,25(8):172-178.
[14]李江,郝新梅,范琳琳,等.黑河中游綠洲地下水位空間變異性研究[J].水力發電學報,2015,34(11):106-115.
[15]李啟森,趙文智,馮起,等.黑河流域及綠洲水資源可持續利用理念及對策[J].自然資源學報,2005,20(3):370-377.
[16]侯景儒,黃競先.地質統計學的理論與方法[M].北京:地質出版社,1990.
[17]李欣海.隨機森林模型在分類與回歸分析中的應用[J].應用昆蟲學報,2013,50(4):1190-1197.
[18]凌俐,陳麗,謝兆莉.隨機森林法用于分析阿糖胞苷致不良反應發生的影響因素[J].中國藥房,2015,26(8):1091-1093.
[19]閆朝暉.R軟件在多元統計分析教學中的應用研究[J].科技創新導報,2011(1):157-158.
[20]韓業珍,魏曉妹,李立.基于地統計學的地下水位時空變異特征研究[J].人民黃河,2010,32(5):52-53.
[21]胡曉利,盧玲.黑河中游張掖綠洲地下水時空變異性分析[J].中國沙漠,2009,29(4):777-784.
[22]米麗娜,肖洪浪,朱文婧,等.1985—2013年黑河中游流域地下水位動態變化特征[J].冰川凍土,2015,37(2):461-469.
[23]李吉超,繆建新.臨澤縣發展節水灌溉途徑探討[J].甘肅農業,2002(4):40-41.
[24]張漢軍.聚苯乙烯保溫板在渠道襯砌中防凍脹應用技術[J].甘肅水利水電技術,2003,39(4):294-295.
Change of Groundwater Depth and Its Causes in Middle Stream of the Heihe River Basin Based on the Random Forest
YANG Guang,SU Xiaoling
(College of Water Resources and Architectural Engineering,Northwest A&F University,Yangling,Shaanxi712100,China)
In order to provide useful references for the reasonable development and utilization,the distribution characteristics of groundwater depth and its causes in middle stream of the Heihe River Basin was examined.Based on the local groundwater depth data of 33 observation wells from 1985 to 2010,the spatiotemporal distribution characterisitcs of the groundwater depths were analyzed by using the geostatistics.The random forest method was used to investigate the change causes of groundwater depth.The results showed that the groundwater depths of the middle stream of the Heihe River Basin reduced from the south to the north.Before 2001 in Ganzhou District and 2004 in Linze County,the groundwater depths had an increase trend,respectively,afterwards both reduced.The groundwater depth of the northern Gaotai County presented the continuous decrease trend,but groundwater depth of the eastern Gaotai region increased.Moreover,according to the analysis of geostatistics,the sample of the groundwater depths had spatial correlations with middle-level,and its spatial anisotropy had enhancement tendency.In addition,the main factors influencing the groundwater depth in the middle stream of the Heihe River Basin were the utilization coefficient of canal system water,the exploitation quantity of the groundwater,surface water diversion quantity and evaporative capacity.
middle stream of the Heihe River Basin;groundwater depth;the random forest method;geostatistics
P641.8;S273.4
A
1005-3409(2017)01-0109-06
2015-12-22
2016-03-10
國家自然科學基金(91425302;51279166)
楊光(1990—),女,遼寧撫順人,碩士研究生,研究方向為地下水演變與可持續利用。E-mail:1007153730@qq.com
粟曉玲(1968—),女,四川開江縣人,教授,博士,博士生導師,主要從事水資源規劃與管理研究。E-mail:suxiaoling17@126.com