那 靜
(華北水利水電大學,河南 鄭州 450046)
地下水作為廣泛、穩定、優質的供水資源,是社會持續發展的重要保障。泰萊盆地位于魯中地區,研究區地下水多年平均供水量超過40%,由于工農業對地下水的不合理開發利用及城鎮用水量的增加,局部地區地下巖溶水存在超采現象,引發了地表沉降、水質惡化等地質環境災害[1]。近年來,山東省在水利部的統一部署下,完成全省超采區評價工作,并采用科學方法嚴格管理地下水,逐步壓減地下水超采量,地下漏斗已經得到明顯的改善。根據《山東省水安全保障總體規劃》,2030年正常年份山東省總需水量達356.6億m3,枯水年份、特枯水年份需水量達364.2億m3,均超出國家下達至山東省的用水總量控制指標。地下水位是地下水可用性的直接衡量標準,為保證地下水的可持續利用,開展泰萊盆地地下水位變化機制研究迫在眉睫。
近年來,眾多學者對泰萊盆地地下水資源變化進行了研究。宋云峰[2]等人運用MODFLOW研究了降水量對泰安市地下水水位的影響,建立了研究區地下水預測模型。李軍[3]通過繪制2020年與多年逐月埋深和降雨關系圖,提出降雨量和地下水位呈正相關的變化趨勢。張秀娟[4]等通過對地下動態監測井數據,結合研究區地形地貌及降水量分析得出地下水水位影響因素的復雜性及地下水位變化的滯后性。
前人對地下水水位變化的研究主要基于相關性分析、數值模型法,但這些方法具有一定的局限性,它們無法全面研究相關因素對地下水動態變化的影響[5-7]。近些年,機器學習在地下水位預測及影響因素等方面已經非常成熟,機器學習具有成本低、高效、精準的特點,彌補了上述研究方法的不足[8-9]。劉琦[10]等人通過隨機森林回歸模型發現流量、距河道和水庫的距離是影響塔里木河流域下游地下水位變化的關鍵因素。Sadik Mahammad[11]等人使用機器學習對達莫達爾扇三角洲下水位變化進行預測及分析,結果表明地下水位變化與降水量及人口變化關系最為密切。
綜上,本次研究將以觀測站2016—2020年泰萊盆地逐月代表站點徑流量數據作為樣本集,在分析研究區地下水位變化規律的基礎上,利用隨機森林算法,以氣象因素、地表因素、含水層水力學特性及人為因素的作為驅動因子,建立回歸模型,進而分析研究區地下水水位變化的主控因素,為泰萊盆地地下水資源管理提供科學建議。
泰萊盆地地處山東省中南部,北倚五岳獨尊的泰山,南鄰孔子故里曲阜,行政區范圍主要涉及萊蕪市萊城區、鋼城區和泰安市岱岳區、泰山區,如圖1所示。泰萊盆地地處泰萊凹陷帶內,整體上西部較為開闊,其余三面均為丘陵山區,海拔高度范圍為200~500m,盆地中部為相對平坦的沖洪積平原,海拔高程在80~100m[1]。盆地整體地勢類似簸箕狀向西南傾斜,河流整體向盆地西南部匯集、排泄。

圖1 研究區范圍
泰萊盆地屬暖溫帶大陸性季風氣候,四季分明,年平均氣溫13.2℃,極端最高氣溫40.4℃,極端最低氣溫-21.4℃。初凍最早見于11月,解凍最晚在3月,凍土層一般小于0.5m。降水年際變化較大,歷年降水量豐枯差異明顯,年平均降水量720.8mm。該地區降水量年際變差可達4.7倍,最大降水量是1990年的1236.9mm,最小降水量是1989年的263.1mm。年內降水量分配不均,降水有明顯的季節性,降水多集中在6月下旬—9月下旬,占年平均降水量的70%左右。
研究區內地表水系發育,其主干河流為大汶河兩大主流之一的牟汶河,為季節性河流,起源于濟南市鋼城區汶源街道辦事處臺子村,自東向西流經整個盆地,其兩岸分布呈樹枝狀的支流數十條,南北兩岸的支流具有不對稱性,河流長度南短北長,河床坡度南陡北緩。其中較大的支流包括瀛汶河(匯河)、石汶河、方下河、嘶馬河、滂河等。盆地的地下水資源豐富,存在多個地下水水源地[12]。
本次建模從利用山東省國土空間生態修復中心2016—2020年典型觀測孔逐月地下水位數據作為擬合標簽,建立地表水資源演變機制隨機模型的特征變量共4大項12小項,見表1。其中,降水入滲量和蒸發強度來自國家氣象站,氣溫、濕度、NDVI、地形坡度、高程數據來自NASA衛星遙感解譯數據,解譯精度為30m×30m。地下水開采量數據來自泰安市和萊蕪市的水資源公報。距離河道距離通過GIS測量。給水度和滲透系數根據數值模型給定。

表1 典型漏斗演變機制隨機森林分類模型數據集
大汶河為研究區主要的地表水體,河流與地下水之間的交換量可由下式計算:
QRIVnb=CRIVnb(HRIVnb-hn)hn>RBOTnb
QRIVnb=CRIVnb(HRIVnb-RBOTnb)hn≤RBOTnb
式中,QRIVnb—為河流與地下水之間的交換量,正值表示河流補給地下水,m3;HRIVnb—為河流段下單元節點處的地下水位,m;RBOTnb—為河流底部高程,m;Knb—為河床材料的水力導電性;Lnb—為流經單元格的河段長度;Wnb—為河流寬度;bnb—為河床層厚度;CRIVnb為河流—含水層互連的水力導度,可由下式進行計算:
大汶河入滲量計算結果見表2。

表2 2016—2020年大汶河入滲量計算結果 單位:萬m3
隨機森林模型是一個高度靈活的機器學習方法,能夠處理大型、不均勻的數據集,也可用于評估模型性能的不確定性指標生成穩健而準確的預測。隨即森林屬于集成學習中的Bagging算法,它通過有放回的抽取樣本來訓練決策樹,并根據樣本屬性作為決策樹節點的分類屬性,不斷循環以上步驟形成決策樹,直到無法分裂,最終形成隨機森林,最終由一系列決策樹的判斷和分類,將投票次數最多的類別作為隨機森林模型的輸出[13-14]。
本次研究將通過建立隨機森林回歸模型,模擬影響地表水和地下水資源演變各特征要素的變化情況,分析各要素對地下水位變化的作用方式和影響程度。利用標準化處理后的特征數據集,按0.2的比例將數據樣本分為訓練集和測試集。
利用隨機森林預測模型計算得出的整體精度為74%,RMSE值為2.33m。整體模擬效果如圖2所示。從擬合效果可以看出,建立的隨機森林回歸模型可以用于分析泰萊盆地地下水資源量的變化機制。

圖2 地下水位隨機森林模型擬合效果
對于地下水資源演變機制研究同樣采用以重要度特征分布和SHAP解釋圖進行解釋分析。
由圖3—4可知,降雨入滲是淺層地下水主要補給來源。從單因素角度看,影響地下水位變化的要素較多,主控因素是降水入滲量,降水入滲是研究區第四系松散含水層的主要補給來源,其影響重要程度為16%,降水入滲量與地下水位變化呈現較好的一致性。其余因素貢獻度較小。

圖3 地下水影響要素重要度分布

圖4 地下水特征要素SHAP值分布圖
高程和坡度影響著潛水面的變化,高程越高,坡度越大,地下水位也隨之越高,越接近山前地區,從而也能夠更好的接受山前側向的補給,因此高程和坡度在泰萊盆地體現了地下水天然徑流特征,其重要程度均超過10%。其余各項對研究區整體水位變化影響較小,NDVI反映了研究區植被覆蓋程度,植被覆蓋率越高地下水獲得地表水水體和降水補給的能力越強[15],貢獻度為8%。地下水距河流越遠,河道對地下水的補給量越少,越近補給能力越強,大汶河補給量的增加主要能夠相對提升河道周圍附近地下水水位,其對全區影響程度較小,為5%。
滲透系數和給水度作為含水層固有水力學特性指標主要反映著含水層接受側向補給的能力,主要控制著地下水水平運動能力。滲透系數的大小與組成含水層的沉積物巖性有關,也就與沉積環境和構造特點相關,在山前和大汶河上游地區粗顆粒物為主的地區地下水位結構補給條件較好,而在大汶河中下游地區巖性以細顆粒或粘性土為主接受補給條件較差。給水度則主要控制水位和水量的關系,可以看出給水度越大,單位厚度上含水層能夠給出的水量越多,水位下降越不明顯,而給水度越小,水位變化響應越靈敏。
人類活動影響主要指地下水開采量。地下水開采是泰萊盆地的第四系地下水的主要排泄途徑,水位隨開采月份開采量的增加而降低,呈負相關關系,開采對水位變化的影響為13%。
(1)從單因素角度看,降水量是造成泰萊盆地淺層地下水位變化的主要影響因素,其影響重要度達16%,其次為下水開采量,重要度達13%;從多因素角度看,地表各類要素影響最大,總占比達41%,但各分項重要程度較低。
(2)泰萊盆地地下水動態類型為降水-開采類型,地下水的開發利用與當地的生態環境密切相關,建議根據當年降水條件進行水資源優化配置,也可以通過調節地下水開采量對地下水位和水資源進行一定程度的控制。
(3)隨著機器學習的廣泛應用,GBZT、xgboost、人工神經網絡等算法在水資源研究方面的研究已經成熟,通過不同機器學習模型的對比可以尋求最優模型,對于不同模型性能的比較,還有待進一步的深入研究。