常利偉,程 磊,陳 進,韓東陽,張 櫓,劉 攀,常劍波
(水資源工程與調度全國重點實驗室(武漢大學),湖北 武漢 430072)
我國水資源時空分布十分不均,人均水資源量不足世界平均水平的1/4,是水資源極端匱乏的國家之一,而且旱澇災害頻發等現象危及著廣大人民的生命和財產安全,嚴重阻礙國家與地區的經濟發展[1]。修建水庫是興水利、除水害最有效的手段之一,大型水庫直接貢獻了全球糧食產量的12%~16%[2]。經過多年的發展,我國的水庫建設事業取得了巨大的成就[3],截至2019 年底,全國已建成各類水庫98 112 座[4],其中大型744 座,中型3 978 座,小型93 390 座,水庫總庫容8 983 億m3。這些水庫發揮了防洪、發電、供水、航運、灌溉、旅游、養殖等綜合利用功能,具有重要的經濟和社會效益。水電作為低碳、靈活的可再生能源,在全球能源轉型上發揮著越來越重要的作用。我國預計到2030年水電裝機容量約為5.2 億kW,到2060年,水電裝機約為7.0 億kW[5]。隨著“雙碳”目標的提出,水庫及其配套的發電設施將在中國扮演更加重要的角色。
大壩指可以攔截河水的人工建筑物,水庫指通過建壩攔截河流或湖泊等自然水體形成人工水域。水庫的蓄水活動改變了流域的自然水循環過程,會對氣候、水文、泥沙、水質、地質、土壤、生物等自然因素產生影響,同時也能造成健康、移民、景觀淹沒等社會影響[6]。此外,河道中低水頭的水壩和水閘通常不形成水庫,但也會對水和沉積物的自然流動造成影響,進而改變河流生境。準確的水庫和大壩的數量、大小和位置信息對于研究水循環、水生態系統和農業等方面的問題十分重要,例如:基于河流上大壩的分布規律可以用來評估人類活動對自然生態的影響[7];依據水庫的規模和營養狀態可以估算全球水庫碳排放量[8];探究不同的水庫群布局可以改善區域水資源利用效率[9];在水文模型中增加水庫變量可以顯著提高模型性能[10]。然而,編制水庫和大壩數據庫的工作繁冗復雜,需要耗費巨大的人力物力。同時,水庫和大壩信息在許多國家和地區并不公開,而是由專業部門管理,多數可以獲取的數據集中只提供水庫和大壩的大概位置描述,而沒有坐標和水庫邊界等地理信息,所以公開且具有地理信息的水庫和大壩數據集十分匱乏。針對以上問題,一些學者利用已有資料結合遙感技術取得突破,并公開發表了他們所編制的數據集,如:全球水庫和大壩數據集(Global Reservoir and Dam database, GRanD)[11]、全球大壩地理參考數據集(GlObal geOreferenced Database of Dams,GOODD)[12]、全球河道障礙物數據集(Global River Obstruction Database, GROD)[13]、含地理坐標的全球大壩和水庫數據集(Georeferenced global Dams And Reservoirs dataset, Geo-DAR)[14]、中國大型大壩、水庫和湖泊數據集(China Large Dams, Reservoirs, and Lakes dataset, China-LDRL)[15]、中國水庫數據集(China Reservoir Dataset, CRD)[16]。已有數據集包含了全球或中國數量眾多的水庫和大壩的位置以及規模等信息,為相關研究提供了寶貴的數據支撐。由于數據來源和生產方式的不同,已有數據集之間存在差異,明確各個數據集的特征,是開展水庫和大壩研究的前提,但目前針對水庫和大壩數據集的比較的文章還很匱乏。
水庫和大壩數據集是包含水庫和大壩的地理位置、規模、運行方式等信息的一種數據庫,它為眾多的研究提供了數據輸入。由國際大壩委員會(International Commission on Large Dams, ICOLD)創立和維護的世界大壩登記冊(World Register of Dams, WRD)[17]是目前最全面的數據庫,它包含了中國23 841 座大壩的資料,但不包含地理位置信息,這使得它在實際應用中十分不便。聯合國糧農組織(Food and Agriculture Organization of the United Nations, FAO)記錄了全球超過14 000座大壩的信息,但只有部分的大壩具有經緯度坐標[18]。隨著技術的發展,地理信息化的水庫和大壩數據集應運而生。GRanD提供了蓄水量超過0.1 km3的水庫的空間位置及其50 多個屬性值,最新版本(v1.3)包含了全球7 320 座水庫/大壩,累計容量為6 881 km3,其中包含了921座中國的水庫信息。GOODD 從谷歌地球圖像中描繪了38 667 座大壩的位置,其中包括中國的9 238 座,但不包含對應水庫的屬性信息。GROD基于谷歌地球引擎(Google Earth Engine)高分辨率影像描繪了全球30 549 處河道上的障礙物,中國有8 067 處。GeoDAR v1.1 通過對WRD中記錄的水庫進行地理匹配,并結合了已有的水庫數據集,共獲得了24 783 個水庫/大壩位置,其中包括4 859 座中國的水庫,但因為版權的原因,該數據集并未直接提供WRD 中水庫的屬性,而是通過一一對應的編號供讀者查詢。China-LDRL 包含了中國表面積大于1 km2的2 194 座水庫/大壩的地理信息,但是不包含水庫的屬性,所有水庫都是通過谷歌地球圖像人工識別的。CRD 包括兩個版本,第一個是來源于文獻資料和其他水庫數據集中記錄的水庫(CRD_record),共5 143 座,包含水庫位置、庫容、等級、用途等屬性信息;另一個版本(CRD_all)包含97 435 座水庫,除有記錄的水庫外,還包括大量的小型水庫,這些水庫則不包含完整的屬性記錄。
6個公開的水庫和大壩數據集的發表年份、數據量、是否包含大壩坐標與水庫邊界、屬性的比較如表1 所示。由于部分數據集提供的屬性過多,無法全部列出,表1只展示了每個數據集的主要屬性內容,其中GeoDAR 和CRD 中有記錄的水庫的屬性信息部分來源于GRanD,相當于GRanD 的包含版本。圖1 展示了各數據集在中國的部分。

圖1 水庫和大壩數據集在中國的部分Fig.1 The reservoir and dam data sets in Chinese section

表1 水庫和大壩數據集的基本信息Tab.1 Basic information of reservoir and dam data sets
建立水庫和大壩地理信息數據集的總體思路是獲取大壩的準確坐標,并生成其對應的水庫邊界,水庫和大壩的數據來源主要分為文獻資料和遙感影像兩種。文獻資料包括WRD、國家統計年鑒、水利部門登記冊、國家地理數據庫、地圖等。這些資料的使用方式包括:
(1)通過搜集資料,人工編制水庫屬性表,并根據記錄的經緯度生成大壩坐標及繪制水庫邊界。這種方法的優點是可以提供較多的屬性信息,如壩高、庫容、特征水位等,同時多種數據源之間可以相互驗證,提高準確性,如GRanD 和CRD_record是根據這種方法建立的。
(2)當資料中不包含具體的坐標時,通過地理編碼的方式,依據水庫登記冊提供的信息(如:水庫名稱、省、市、縣),在地圖軟件上搜索匹配的位置坐標。對于有坐標但缺乏位置信息或名稱的水庫,還可以使用反向地理編碼,通過坐標來查詢對應水庫的屬性。地理編碼的過程中需要進行人工的質量控制,因為多數時候不能保證登記冊上的水庫信息與地圖上的地名是完全一致的,一般可以通過模糊搜索增加匹配幾率,同時要避免“一對多”和“多對一”的情況,如GeoDAR 和CRD_all 都使用了這種方法。
遙感衛星對地觀測的影像數據為水庫和大壩提供了另一種信息來源,如谷歌地球上的高分辨率影像,這種數據的應用方式包括:
(1)通過對高分辨率影像逐個區域進行人工掃描,目視尋找大壩,點繪大壩的坐標,并繪制水庫的邊界或使用已有水體邊界數據集與大壩點進行圖形配對。這種方式獲得的坐標和邊界一般具有較高的精度,但通常難以獲取水庫和大壩的其他屬性,如壩高、庫容、用途、特征水位等,如GOODD、GROD 和China-LDRL均使用了這種方法。
(2)基于遙感圖像的對象識別技術,使用已有大壩樣本來訓練模型,然后掃描圖像中的水體的形狀,以實現自動識別潛在的大壩。另一種方式是基于水體數據集,通過使用模型學習水庫和天然湖泊在反射光譜特征或形狀上的差異,以實現湖泊和水庫的自動劃分。相關研究僅在區域尺度上開展或只研究了大型的水庫(表面積>10 km2),總體精度為80%~91%[19,20],目前還沒有依據這種方法建立的水庫和大壩數據集。
大壩的類型和功能是大壩的重要特征,不同類型的大壩對河流自然生境的影響程度不同。關于大壩的分類,不同數據集間存在差異。GROD 中包含了6 種河流障礙物,第一類是橫斷河流的障礙物,包括大壩、水閘和低水頭壩,第二類是跨越部分河道的障礙物,包括渠道大壩、超過和不超過河寬50%的大壩。除GROD外,其余數據集均未對大壩進行分類。
大壩的位置是開展空間地理研究的基礎,大壩坐標的確定方法與數據來源有密切關系。GRanD 將水庫邊界與Hydro-SHEDS 的網格化累計流量值圖層疊加,采用邊界內最大流量值的點作為水庫的控制大壩的坐標,從而可以應對一座水庫受多個大壩控制的情況。GeoDAR 的大壩坐標是通過匯總已有的數據或通過地理編碼得到的。GOODD、GROD 和China-LDRL 的大壩坐標均是在谷歌地球圖像中目視解譯的,這種方式可以保證大壩的坐標具有很高的精度。然而,為了計算每個大壩的匯水區域,GOODD 中的大壩位置被校正到了HydroSHEDS 的數字河網上,數據集中的大壩坐標可能與它的實際位置存在偏差。分析指出GOODD 中的大壩只有12.52%±3.87%與衛星影像提取的水面積相交,相比之下,China-LDRL 的大壩坐標據稱是十分準確的[15]。但是兩種策略可能各有優劣,基于數字高程模型(Digital Elevation Model, DEM)建立的數字河網并不總是反映真實的河流網絡,但可以提供高程或集水面積等河流特征;基于衛星圖像的位置具有很高的分辨率,但沒有構建河流網絡所需的高程和流域信息。GOODD 經過校正后的大壩和配套的河網可以直接在分布式水文模型(如:ArcSWAT)中使用,而省去了重新校正的工作[21];China-LDRL 則更適用于需要大壩的真實地理坐標的研究。
多數數據集包含了水庫的邊界信息,明確的邊界可以幫助研究人員區分水庫與非水庫區域,這在空間分析中是十分重要的。GRanD 使用了來源于航天飛機雷達地形測繪任務(Shuttle Radar Topography Mission, SRTM)的水體數據集(SWBD)作為可用的水庫邊界,這個數據集擁有30 m 的分辨率,足以描繪大多數水體的細節,但是SRTM 是在2000 年完成的,對于那些2000 年之后建成的水庫,GRanD 使用其他來源的水體邊界,而這些圖形通常是更加粗糙的。GeoDAR 繼承了GRanD 已有的水庫多邊形,未包含在GRanD 中的水庫則從其他兩個全球水體數據集(HydroLAKES 和UCLA Circa 2015)中檢索邊界多邊形。China-LDRL 基于從衛星影像提取的2019 年中國地表水體圖層,為每一個大壩分配了邊界圖形,該數據集使用的是全年出現頻率超過0.75 的水體面積,對應于較枯的情況,所以水庫的面積相對較小。CRD 合并了來自全球地表水體數據集(Global Surface Water dataset, GSWD)[22]的歷史最大水面積圖層和馬里蘭大學全球地表變化分析團隊的水體數據集(Global Land Analysis and Discovery, GLAD)[23],得到了所有水庫的最大水域面積邊界。其中GSWD 最初是基于Landsat 衛星提取的1984 年至今的月度水體面積數據,同時根據月度歷史數據產生了年永久水/季節水、歷史最大水面積、水體出現頻率等多個圖層,具有廣泛的應用場景。GLAD 描述了1999-2018 年期間的地表水變化范圍,可以提供永久水域、季節性水域、消失水域、新水域等多個變量。水庫和大壩數據集生成水庫邊界時所用到的水體數據集的名稱和基本信息匯總于表2中。

表2 水庫和大壩數據集生成水庫邊界時所用水體數據集的名稱和基本信息Tab.2 Names and basic information of water bodies data sets used in the reservoir boundary generation of reservoir and dam data sets
不同數據集在中國區域包含的水庫和大壩數據量有較大的差異,總體來說,最近發布的數據集在數量上有所提升。現有數據集均只包含了中國的部分水庫,其中CRD_all 中包含中國水庫多達97 435 座,最接近真實水平,但它不包含水庫的屬性信息,如壩高、庫容、特征水位等。對于水庫的屬性信息,全國第一次水利普查清查了水庫的20多種屬性[24],但現有數據集受限于資料的匱乏和遙感技術的局限,水庫的許多屬性難以獲得。相比而言,雖然GRanD 包含的水庫數量最少,但屬性記錄更為全面。圖2展示了水庫和大壩數據集在中國九大流域的分布圖,總體來說,中國的水庫主要分布在東南部,其中長江流域最多。GRanD 在各個流域中記錄的水庫是最少的;GOODD 在長江流域、珠江流域、浙閩臺河流區的數據記錄最多,而在其余流域則沒有顯著優勢;GROD 在各個流域都具有較多的數據;China-LDRL 在東南部的流域中包含的水庫數量比其他數據集少,卻在黑龍江流域和內陸河湖區表現良好;GeoDAR 和CRD_record 表現相似,而GeoDAR 在藏南滇西河流區具有最多的數據記錄。

圖2 水庫和大壩數據集在中國九大流域的數據量對比Fig.2 Data volume of reservoir and dam data sets in 9 Chinese catchments
為了更好比較不同數據集在描繪中國水庫數量及規模上的差異,本研究對不同面積區間下水庫的數量和總面積進行了統計(圖3)。總體上,不同數據集對于面積>10 km2的大型水庫的描繪是相似的,在數量和面積上差別不大,但CRD_all都擁有最高的值。大型水庫在數量上是最少的,但是卻貢獻了最多的水庫面積。對于面積<10 km2的水庫,CRD_all 在數量和面積上有明顯的優勢,除此之外,CRD_record 和GeoDAR 在數量和面積上相似,China-LDRL 在面積1~10 km2的水庫數量上有優勢。GRanD 和China-LDRL 基本不包含<0.1 km2的水庫,且他們在0.1~1 km2的水庫的數量也較少。可見各數據集的差別主要體現在小型水庫的數量上,在這方面的表現,CRD 和GeoDAD 優于China-LDRL和GRanD。

圖3 各數據集在不同面積區間下的水庫數量和總面積Fig.3 The amount and area of reservoirs in different area intervals of data sets
當前中國在建和規劃中的水庫還有很多,中國最新建設的水庫在這些數據集中的包含情況存在差異。金沙江上游的蘇洼龍水電站于2021年1月31號下閘蓄水,代表了中國水庫建設的最新成果。研究選取了部分于2014-2021 年期間建成的水庫,以驗證各個數據集是否包含最新的數據,結果展示在表3中。CRD_record 記錄了中國幾乎所有最新建成的水庫;GRanD和GeoDAR 具有一致的結果,它們只包含了2015 年之前建成的水庫;GOODD 和China-LDRL 相似,它們均不包含2019 年之后建成的水庫;GROD 對2021 年建成的水庫包含不完整,但包含全部2021 年之前建成的水庫。隨著中國水庫建設事業的穩步推進,還將有更多的水庫出現,水庫數據集的更新也是一項十分重要的任務。

表3 部分于2014-2021年建成的中國大型水庫在各數據集中的包含情況Tab.3 The inclusion rate about part China's large reservoirs completed in 2014-2021 of each data set
對大壩的不明確分類可能造成水庫和湖泊之間的混淆。一般的研究認為是否存在顯著的人工大壩是區分水庫和湖泊的標準[25],但湖泊中建設的控制閘會使這種定義出現分歧,因為雖然控制閘是具有一定規模的人工建筑物,但它的建設不會發生顯著的土地利用變化,只是在一定程度上改變了湖泊的蓄泄節律。以洪澤湖為例,其出口處建有兩個控制閘門——三河閘于1953 年建成,二河閘于1958 年建成,具有防洪、抗旱、灌溉、供水和通航的作用,這讓洪澤湖具有了水庫的特征,但其也被稱為“中國第四大淡水湖”。與此同時,水庫名稱的變化也會造成和湖泊的重復問題,比如具有旅游資源的水庫為了吸引游客而更名為“湖”,或者退役的水庫由于用途發生改變,轉化為當地景觀的一部分,也往往更名為“湖”,這種情況存在于世界上的許多國家。水庫和湖泊的重復定義造成的影響是:當數據集被用來區分湖泊和水庫時,相同的水體可能被分為不同的類別。對于洪澤湖,GRanD、GeoDAR 和China-LDRL 均將其定義為水庫,而CRD則不包含在數據集內(圖4)。此外,不同數據集對大壩的選擇也是不同的,GRanD 和GeoDAR 認為三河閘是洪澤湖的控制大壩,而China-LDRL 認為是二河閘。同樣的情況還發生在兩個大壩數據集中,其中GOODD 只繪制了三河閘,而GROD中兩者都不包含,卻繪制了二河閘下游3個更小的閘門。

圖4 洪澤湖數據集Fig.4 Hongze Lake data sets
將Zhang等[26]繪制的全國湖泊數據集與每個水庫和大壩數據集進行空間疊合,統計了重復定義的多邊形數量和面積列于表4 中。該全國湖泊數據集是從遙感水體邊界中識別的,包含了中國2 407 個面積>1 km2的湖泊,總表面積達74 395 km2。結果顯示,GRanD、GROD和GeoDAR中重復定義的水庫/大壩數量較少;CRD_record 中重復定義的水庫面積最小;China-LDRL 和CRD_all 中重復定義的大壩數量和水庫面積都較多,兩者重復面積分別占各自總面積的21.8%和8.1%。由于定義的差別導致的水庫和湖泊之間的重復并不代表精度上的優劣,但值得注意的是,同時使用這些水庫數據集和湖泊數據集時應進行審查,以避免潛在的重復。

表4 各水庫和大壩數據集與湖泊數據集重復定義多邊形的數量和面積Tab.4 The amount and area of repeating shape between reservoir and dam data sets and lake data set
水庫邊界的不同生產方式導致不同數據集在計算水庫面積上的巨大差異。圖5 繪制了CRD_record、GeoDAR 和China-LDRL 三個數據集中相同水庫的不同邊界及面積的比較,其中GeoDAR是GRanD的完全包含版本,兩者表現一致。

圖5 CRD_record、GeoDAR和China-LDRL中水庫面積的比較Fig.5 Comparison of reservoir area in CRD_record、GeoDAR and China-LDRL
對比來看,China-LDRL 中水庫的面積較小,CRD_record 最大,GeoDAR介于兩者之間。3個數據集中共同包含的水庫的總面積更加突出了這一點(圖5b),China-LDRL 的總面積為8 701.7 km2,GeoDAR 為12 964.3 km2,CRD_record 為18 189.1 km2。CRD_record 超過了China-LDRL 的兩倍。使用了不同水體邊界的數據源是不同數據集之間產生差異的主要原因。同時,河道型水庫淹沒范圍的上游截止位置也會帶來影響。河道中建壩后,其影響的上游范圍很難通過目視的方式確定,一般的方法是認為水庫正常蓄水位海拔以下的部分為河道受影響范圍,據此作為水庫的邊界。但這些數據集中水庫的上游范圍存在明顯差異。在以水庫邊界為研究范圍的研究中,需重視不同數據集對水庫面積表示的差別。
空間明確、屬性完備的水庫和大壩數據集是開展水庫和大壩相關研究的重要基礎。一方面水庫數據集為水庫提供了明確的水面邊界,是構建水庫的動態水面積和容量變化的依據,為研究水庫的蒸發[27]、水溫[28]、污染[29]、碳排放[30]等提供數據基礎。另一方面水庫和大壩的數量、位置、容量等信息是構建區域經濟合作[31]、評價水資源配置能力[32]、衡量人類影響強度[7]的重要指標。此外,考慮水庫影響的水文建模是變化環境下水循環研究的重點和難點問題,不少學者嘗試將水庫納入模型中以提高徑流模擬精度或探究對自然水循環的影響[33,34]。水庫和大壩數據集的應用主要包括以下幾個熱點研究問題:
水庫的水體表面是水庫與大氣進行水和能量交換的介質。水庫的水面積變化對估計水庫的水面蒸發、評估水生態要素的變化具有重要作用,也為計算水庫蓄水量動態提供了基礎。水庫和大壩數據集中的水庫邊界為使用遙感影像反演水庫水面積提供了明確的研究范圍,高時空分辨率的衛星影像可以捕捉地表水的月度甚至周尺度的動態變化,但由于云層的影響,有效觀測數據的比例很低。研究人員開發了一種基于水體出現頻率復原受云污染的影像數據的方法,Zhao 和Gao[35]基于GRanD 改進了全球6 817 個水庫的水面積時間序列,平均數據可用性提高了81%。Donchyts 等[36]使用了相似的方法,基于GRanD、GOODD 和GeoDAR 等產品提供的水庫數據,重建了全球7萬多個中小型水庫的水面積變化。
高效的地表水動態監測有助于支持水資源管理,以應對氣候變化環境下加劇的全球地表水文循環變化。水庫的高時空分辨率水面積動態數據能夠為水文和氣象研究提供更有效的數據輸入,例如,動態的水面積相比于靜態水面積,可以使水面蒸發的計算更加準確。Tian 等[37]利用基于GRanD 的月度水面積數據,改善了過去基于年度水面積的蒸發量估算,估計1985年至2016 年期間全球7 242 個水庫每年的蒸發損失量約339.8 km3,并以每年約2.0 km3的速度顯著增加,其中80%的增量由中等收入國家貢獻,而主要原因是新建水庫的激增。Zhao等[38]利用HydroLAKES 和GRanD 提供的湖泊和水庫邊界反演了全球142 萬個水體的月度水面積歷史,并估計了它們的長期平均蒸發量,發現水庫雖然僅占全球湖泊(自然湖泊和水庫)蓄水量的5%,卻貢獻了16%的蒸發量。
使用水庫和大壩數據集重建的高時間分辨率的水庫水面積數據,對于改善水資源管理和水文氣象模擬十分重要。隨著水庫和大壩數據集的進步,越來越多的水庫可以重建水面積的頻繁觀測,這將有助于應對氣候變化情況下水資源高效管理的需求。
水庫通過調節天然徑流過程,發揮了防洪、灌溉、發電等的多種效益,在區域或全球尺度上開展水庫效益的評估,可以明晰水庫和大壩在水資源配置中發揮的重要作用,水庫和大壩數據集為大范圍和系統性的研究提供了數據基礎。Boulange等[39]以GRanD為基礎,使用水文模型和流體動力學模型進行了全球洪水模擬,發現到21 世紀末,對于代表性濃度路徑(RCP)2.6 和6.0,如果沒有水庫,每年暴露于洪水的平均人數分別為9.1 和1 530 萬;考慮到水庫的存在,暴露于洪水的人數相應減少了20.6%和12.9%。對于灌溉效益,Biemans等[32]利用GRanD中的水庫信息進行全球模擬,發現水庫對許多地區的灌溉供水貢獻巨大,在北美、非洲和亞洲比沒有水庫的情況下多供水40%。Rufin 等[40]從GRanD 和FAO 大壩數據庫收集了具有灌溉用途的水壩,在全球范圍內,與雨養農業區相比,灌溉區的農作物種植頻率平均高出16%,他們強調通過減少調水距離和輸送時的損失來增加水壩灌溉提高種植頻率的潛力。Zeng 等[41]依據多源水庫和水電數據探究了全球發電和灌溉用水的競爭關系,發現全球54%的水電裝機容量與灌溉競爭,存在這種競爭的地區包括美國中部、北歐、印度、中亞和大洋洲。
目前,水電占世界發電量的近1/5,占全球可再生發電量的一半以上[42]。van Vliet 等[43]基于世界電廠數據集模擬了全球24 515 座水電廠和1427座火電廠,以評估氣候變化對水電和熱電系統的影響。結果顯示在未來情景下,全球徑流增加,水電可用容量在加拿大、北歐、中非、印度和中國東北部的總體增長,然而,大多數水電站位于預計徑流量將大幅下降的地區,導致水電可用容量平均減少。對大多數國家而言,將水力發電廠的總效率提高10%能夠完全抵消氣候變化下水資源限制的增加。由于世界電廠數據集中未包含電廠的確切位置,研究人員通過發電廠的名稱估算了緯度和經度,這無疑增添了工作量,隨著水庫和大壩數據集的完善,篩選出的發電型水庫可能會產生替代作用。
對水庫效益的評估要求準確的水庫容量及用途等信息,目前可用數據集中具有完整屬性記錄的水庫數量不足,這可能造成評估結果的精確性降低,未來需要進一步完善水庫的屬性記錄,以提高實際可模擬水庫數量。
將水庫耦合到水文模型中可以估計水庫對水文循環的影響,是認識和適應水庫和大壩對區域物質、能量影響的重要手段。水庫和大壩數據集可以為模型提供水庫的深度和體積等基礎屬性,還可以根據水庫的用途匹配合適的大壩運行規則。常用的有水庫模擬能力的水文模型,如水土評估工具模型(Soil and Water Assessment Tool, SWAT)和可變滲透能力模型(Variable Infiltration Capacity, VIC)通常簡化了大壩的運行過程,將水庫看作定流量或線性出流的蓄水池。最近新開發的組件改善了這種情況,VIC-ResOpt 是用于在VIC 匯流模型中模擬水庫運行的軟件包,它可以實現水庫依據調度線或調度規則的運行過程[44]。然而,想要收集每一個水庫的調度規程并不容易,一些研究設計了通用的水庫模擬運行規則(Generic Operating Rules),即根據當前水位和水庫特征水位(死水位、正常蓄水位、防洪高水位)的關系確定水庫出流量[45,46],如:當水位高于死水位而低于正常蓄水位時,水庫根據當地需水量出流;當水位超過正常蓄水位而低于防洪高水位時,水庫應以最大的流量出流,且不超過下游河道可接收的最大流量;當水庫有發電任務時,下泄流量優先通過發電機組。Dong等[47]基于通用模擬運行規則將中國3 547 個水庫納入水文模型中,發現水庫水儲量的平均季節變化約為陸地總水儲量的19%,水庫對水循環的調節作用從1980 年以來呈現增強的趨勢。Hanazaki 等[48]使用防洪模擬運行規則將來自GRanD中的2 169 座水庫納入到洪水調節計算中,發現考慮水庫可以改善41.2%的實驗地區的流量模擬,水庫的存在使一些流域的洪水淹沒深度顯著減少了0.5 m 或更多,同時使全球受洪水影響的人口減少了約10%。
除了對徑流、洪水的直接影響,水庫建設導致的土地利用變化(即水面代替陸地)也會對水循環造成間接影響。Vanderkelen 等[49]基于GRanD 提供的水庫信息,使用社區土地模型(Community Land Model, CLM)探究了全球水庫建設對氣候的影響,發現水庫建設對局部地區氣候影響較大,而對全球影響較小,主要表現為反照率減小、晝夜溫差減小、季節性溫差減小,進而導致局部水循環變化。
關于水庫對自然水循環的影響,考慮水庫的水文建模提供了許多量化的認識,但相關研究的完整性依賴于可模擬的水庫數量,以及準確的水庫屬性信息,如水庫的各個特征水位。最新的水庫和大壩數據集中雖然水庫數量有了增長,但水庫的屬性還有待完善。隨著數據集的進一步完善,未來的建模工作將更加便利。
理解陸面水域碳循環過程是認識全球氣候變化的重要基礎。大壩的建設和運行使得有機質被淹沒和截留在水庫中,這些有機質的分解推動著CO2和CH4的排放,并受到水庫表面積、溫度、有機質的質量、水庫年齡和季節性的水位波動的影響,導致水庫成為了全球淡水溫室氣體排放的熱點區域[50]。水庫的碳儲量和溫室氣體排放量已經在全球尺度上進行了估算[51,52],水庫數據集在其中扮演了重要角色。
對水庫溫室氣體排放量的全球估計主要包括對全球水庫表面積和單位面積碳通量的估計。Johnson 等[53]基于GRanD 和GOODD 計算了全球水庫水面積,并特別對水庫和受管制湖泊加以區分,以獲取準確的水庫CH4排放速率。他們綜合考慮了水庫凍融、年排放期長度、排放速率的晝夜校正等,算得了全球水庫的CH4排放量。Bridget等[8]基于帕累托分布將GRanD數據外推得到了全球水庫表面積,利用觀測的水面碳通量數據計算得到全球水庫水面每年釋放的溫室氣體約為0.8 (0.5~1.2) Pg CO2。研究還指出葉綠素a 濃度與全球水庫CH4的排放量具有最佳相關關系,換言之,水庫的營養狀態在很大程度上影響了碳排放。然而,Bridget 等[8]使用了靜態的水面積和水庫營養水平數據,沒有考慮到它們的動態變化,這使得結果中存在不確定性。Keller等[54]使用水庫水面積的月度動態變化數據劃分水面和消落帶,結果顯示消落帶面積平均占水庫最大淹沒面積的15%,利用已公布的數據,為水面和消落帶區域分配不同的二氧化碳和甲烷排放率,新的估算方式使當前全球水庫CO2排放增加了53%。目前,最新的水庫和大壩數據集提供了全球數以萬計的水庫信息,結合這些信息和遙感圖像可以反演水庫的動態水面積和營養水平,以準確估計水庫碳排放。
水庫同時具有碳排放和碳埋藏的作用,Mendon?a等[52]估計全球水庫每年的有機碳埋藏量為0.06 Pg C,但水庫碳埋藏量的計算受到水庫信息和碳埋藏原位觀測缺乏的限制。Mendon?a等[52]強調水庫中每單位面積的有機碳埋藏率平均比天然湖泊高6 倍,同時,小型水庫受到高水體富營養化程度的影響,可能具有極高的碳埋藏率。由此可見,對水庫更加全面的統計是衡量全球水庫碳收支的重要基礎。已有水庫和大壩數據集擴展了小型水庫的數量,這有助于改進之前研究對水庫碳收支的估算,但缺乏原位觀測的碳排放或埋藏速率依舊是難以解決的問題,雖然可以通過水庫的位置、大小和類型近似估計其碳收支,但多數數據集缺乏小型水庫的屬性描述,這可能會影響估計的精度。隨著未來水庫和大壩數據集的發展,更加完善的水庫統計將會促進對水庫碳循環過程的理解。
水庫大壩改變了河流上下游流動狀態,延長了河流的水力停留時間,也使河流中各種懸浮物質在水庫中沉積,如泥沙和碳、氮、磷、硅等營養物質。水庫和大壩數據集為計算大壩截留效應提供了數據基礎,其中水庫和大壩的數量、規模和類別都會對截留效應的估計產生影響。
Vorosmarty 等[55]指出全球633 個大型水庫截留了全球河流流量的40%,同時大部分水庫截留了當地河流超過50%的沉積物,從1950-1968年期間,全球大型水庫的沉積物截留量增加了兩倍,從5%增加到15%,到1985 年又翻了一番,達到30%并趨于穩定。為了驗證相對較小的水庫在截留沉積物上的作用,Vorosmarty 等[55]使用大型水庫的統計特征預測了剩余超過44 000 個小型水庫的作用,對于全球整體而言,考慮小型水庫會使僅考慮大型水庫估計的16%截留率再增加12%,小型水庫對全球懸浮物截留貢獻了約40%。此外,單個小型水庫的截留比例可能比大型水庫更大。Cheng 和Basu[56]計算了水庫中總氮、硝酸鹽、總磷和磷酸鹽的截留率常數。發現單位體積截留率與平均水力停留時間之間明顯存在強反比關系。而水力停留時間一般和水庫規模成正比,這表明水庫的截留作用受到水庫尺寸的強烈控制,小水庫在全球營養沉積中發揮著不成比例的大作用。
與此同時,水庫類型也會影響截留作用。河道大壩促進營養物質的沉積,在一定程度上可以緩解河口處的富營養化程度,但營養物總量的減少并不全是好處,事實上水庫帶來的影響可能更加復雜。Maavara等[57]使用GRanD 中的水庫數據模擬了有無水庫情況下河流中氮磷的含量,發現水庫截留磷的比例高于氮,這種作用使得河流中的氮磷比偏離正常水平,進而造成許多環境問題。但這種影響也受到水庫類型的影響,在近景未來,隨著發電型水庫的繁榮,全球水庫的平均水力停留時間會被縮短,屆時水庫對氮磷沉積的影響將會下降。
過去關于水庫截留作用的研究多基于有限的大型水庫的信息,最新的水庫和大壩數據集對小型水庫的描述將促使大壩截留效應的估算逐步精確化,此外,過去的研究還未將除蓄水壩外的其他河道障礙物納入考慮,這些新的內容可能為截留效應的計算帶來新認識。
大壩等水工建筑物限制了河流的自由流動,會影響到河湖生態系統的生物多樣性和水生態系統功能,因此,水庫和大壩的數量、規模、特征等數據是分析河流破碎度及其對水生態環境影響的基礎。Grill 等[7]基于GRanD、GOODD 評估了全球1 200 萬km 河流的縱向(河道)連通狀況,揭示了大壩和水庫造成的河流破碎性和對流量的調節是導致全球河段連通性喪失的主要原因。Belletti 等[58]考察了36 個歐洲國家的629 955 個河道障礙物的記錄,除大型蓄水壩外,還包含了眾多經常被忽視的小結構,其中68%的高度不到兩米。研究計算的河流破碎性表明歐洲平均每公里河流有0.74 個障礙物,雖然只有大型蓄水壩會改變河流水文狀況,但幾乎所有障礙都會影響沉積物運輸、水生生物的運動以及河流群落的結構。然而,Grill 等[7]和Belletti等[58]對河流的破碎性的估計可能都不全面,前者通過大壩上下游流量的改變程度計算破碎度,這種方法忽視了低水頭堰或河道中部分建筑物的作用,因為它們并不會改變河道流量;后者以每公里的障礙物數量衡量破碎性,卻忽視了不同障礙物的規模帶來的影響。事實上目前還沒有兼顧大壩的類型和規模的水庫和大壩數據集,大多數不包含完整的大壩類型,GROD 的誕生對河流破碎性研究具有巨大的推動作用,它對河道障礙物的分類可以使研究人員考慮不同類型障礙物對河流自然流動的影響,這在一定程度上彌補了之前對于大壩類型描述的不足,從而計算更加精確的河流破碎度。
本 文 介 紹 了GRanD、GOODD、GROD、GeoDAR、China-LDRL 和CRD 這6 個公開發表的數據集,綜述了水庫和大壩數據集的一般數據來源,以及大壩坐標和水庫邊界的產生方式,比較了現有數據集在中國的數據量、時效性、重復定義、水庫面積大小等方面的差異,闡述了應用水庫和大壩數據集開展的相關熱點研究問題。總體來說,數據集之間的差異主要是生產方式和數據源的不同導致的,以文獻資料為基礎的數據集可以提供較多的屬性信息,如壩高、庫容、特征水位等,且準確性較高,但數據量有限;基于衛星影像的數據集包含數據較多,且獲得的坐標和邊界一般具有較高的精度,但通常難以獲取水庫和大壩的其他屬性。現有的數據集中多數沒有對大壩進行分類,且存在湖泊和水庫的不明確定義問題。在中國,水庫和大壩主要分布在東南部,其中長江流域最多。對于水庫數量,各數據集的差別主要體現在小型水庫上,CRD_all 中包含的水庫最多,但GRanD 屬性記錄更為全面;對于數據時效性,CRD_record 表現最佳,記錄了中國幾乎所有2014-2021年新建成的水庫;對于水庫邊界,CRD 提供了每個水庫的歷史最大面積,在所有數據集中是最大的。水庫和大壩數據集為開展水庫和大壩相關研究提供了重要基礎,具體包括6個熱點問題:構建高時間分辨率的水庫水面積,水庫防洪、發電、灌溉效益評估,水庫大壩的水文效應模擬,水庫碳效應研究,大壩的截留效應研究,河流的破碎度評估。水庫和大壩數據集的發展極大地提高了相關研究的全面性和準確性。
近年來,多個數據集的出現極大地改善了之前數據來源單一的問題。新發表的數據集無論是在數量上,還是質量上都產生了巨大的進步。然而,要實現水庫和大壩的完全統計與分類,還有很多工作要做。以中國為例,一方面,全國已有水庫達9 萬多座,而現有數據集中以大型水庫為主,小型水庫較少,大型水庫可用的屬性記錄比較全面,而小型水庫多沒有完備的信息。除了水庫的大小和位置這些基本信息,水庫的主要用途、調節類型、運行方式、水力停留時間等也為相關研究提供了重要的輸入,改進數據記錄的完整性是未來值得關注的。另一方面,不同數據集的生產方式之間還存在諸多的差異,如大壩的位置、大壩的分類、水庫的邊界等,協調各數據集的差異以降低使用數據集時的學習成本十分重要。對于大壩的分類,GROD已經根據規模進行區分,這為未來數據集的開發提供了好的思路;同時GROD 還將水閘納入到數據集中,在中國,流量大于5 m3/s水閘已經超過9 萬座,這在很大程度上塑造著河流的流動,完善水閘數據是對河流完全模擬的必經之路,但任重道遠。其次,比較突出的問題是難以協調數字河網和衛星觀測之間的不匹配,為地表水和海洋地形學(Surface Water and Ocean Topography, SWOT)衛星設計的河流矢量產品(SWORD)有助于改善這一情況,它耦合了來自衛星觀測的河流中心線和來自DEM的流域信息[59],這為解決衛星觀測和水文建模中的不一致提供了有益的框架。中國的水庫建設事業還在不斷進行當中,開發空間明確、屬性完備、與時俱進的水庫和大壩數據集是服務水庫管理、促進水庫研究、推動社會進步的重要支撐。