王筱譯,呂海深,2,朱永華,2,王建群,2,蘇建賓
(1. 河海大學水文水資源學院,南京 210098;2. 河海大學水文水資源與水利工程科學國家重點實驗室,南京 210098)
降水是水文循環的重要組成部分,準確降水估計對洪水預報、旱情監測和水資源管理等十分關鍵[1]。地面降水觀測網絡是獲取降水資料的常規方法,但是囿于地形和經濟等因素,站網布設很難做到密集且分布均勻,這極大限制了區域尺度降水量和時空分布估計的準確性[2,3]。近年來,隨著遙感觀測技術的進步和基于衛星數據反演算法的改進,衛星降水數據以其寬廣的空間覆蓋和高時空分辨率,逐漸成為水文研究中的重要數據源。
作為應用最為廣泛的衛星降水產品,TRMM在歷經17 a的數據收集后于2015年4月8日正式退役,而且TRMM的多源衛星降水分析產品(TMPA)也只能繼續服役到2018年初[4]。作為TRMM的繼任者,2014年2月27日,美國宇航局(NASA)和日本宇航局(JAXA)在日本種子島衛星發射基地成功發射了全球降水觀測計劃衛星(GPM),鑒于GPM計劃的核心觀測衛星搭載的DPR傳感器在寒冷和干旱區域具有更好的性能,考慮到渭河流域的氣候特征——以干旱半干旱為主,文章使用了基于GPM最新的IMERG日尺度產品。但是,近期國內外學者們就IMERG產品的精度驗證進行了一系列的科學研究表明,IMERG產品的質量依然有很大的提升空間,其中Tang G.等[5]通過系統評估GPM在中國大陸的性能表現,發現IMERG產品在高緯度、高海拔和干旱地區表現不佳,特別是在降水強度低的干旱區域。Kiyoung Kim等[6]對IMERG數據在東亞地區不同地形和季節進行評估,研究顯示IMERG數據精度在復雜地形存在不足,特別在黃河沿岸地區會出現異常的高估,并且指出IMERG數據識別河流沿岸地區無雨日的能力欠佳。這限制了IMERG產品在水文研究工作中的應用。
土壤可以看作“天然雨量計”,土壤濕度的變化對降雨的反饋在干旱半干旱地區十分敏感[7]。Brocca等人以歐空局發布的土壤濕度產品Climate Change Initiative(CCI)數據集為基礎,使用水量平衡方程通過土壤含水量變化估算降雨發布了SM2RAIN-CCI數據集[8]。該數據集被證明可在全球尺度上作為降水數據的補充,特別是在無資料地區有重要的使用價值。
多源數據融合是水文研究在降雨分析工作中的有效方法,其旨在通過數學方法和一定準則將不同觀測數據源加以校準綜合,吸取不同源的優勢部分,從而獲得相對完整、可靠的高時空連續性和分辨率的網格數據[9]。為了提升IMERG數據的質量,本文以渭河流域為研究區域,使用簡單的加權最小二乘方法將“自上而下”的IMERG數據和“自下而上”的SM2RAIN-CCI數據進行融合。以地面實測數據為參證數據,分別對原始IMERG數據和融合數據在統計學指標上進行評估,結果表明融合數據較原始數據有明顯提升。
渭河發源于甘肅并流經陜西,是黃河最大的支流。渭河流域呈不對稱的扇形,北靠黃土高原,南鄰秦嶺山區,地勢西高東低,流域面積13.5 萬km2,干流全長818 km(見圖1)。該地區氣候類型以溫帶大陸性季風氣候為主,流域年均氣溫為7.8~13.5 ℃,多年平均降水量約610 mm,其中大約有80%的降水集中在6-10月,多年平均徑流量約為104 億m3,降水和徑流具有明顯的年內和年際變化特征,7-10月的徑流量大約占年徑流量的65%,流域內多年平均蒸發量為800~1 200 mm[10]。

圖1 渭河流域站點分布Fig.1 Density distribution of the weather stations over the Weihe River basin
本研究主要用到數據包括:渭河流域內及周邊的地面實測站點數據,IMERG降水數據集和SM2RAIN-CCI數據集。
(1)地面實測站點數據選取來源于中國氣象數據網(http:∥data.cma.cn/)的日尺度v3.0數據集,選取渭河流域及其周邊地區68個氣象站點2014年4月至2015年12月的降水序列,其中研究區內氣象站點26個(見圖1)。
(2)IMERG-v04數據集通過美國宇航局戈達得太空飛行中心(NASA-GSFC)獲取(https://pmm.nasa.gov/data-access),收集2014年4月至2015年12月的日尺度降水序列,覆蓋范圍為60°S~60°N,空間分辨率為0.1°×0.1°。
(3)SM2RAIN-CCI是將SM2RAIN算法應用在歐洲航天局氣候變化中心(ESA-CCI)土壤水分產品(SM-v03.1)得到的降水數據集[11],同樣采用2014年4月至2015年12月的日降水序列,范圍覆蓋全球,空間分辨率為0.25°×0.25°。
本研究旨在通過數據融合提升IMERG產品在渭河流域的質量。數據融合思路是統一2種衛星產品和地面實測數據的空間分辨率,再通過加權最小二乘估計得到融合數據集[12]。主要步驟如下。
(1)數據預處理。由于SM2RAIN-CCI數據集的分辨率低于IMERG數據,為統一分辨率,需要將IMERG數據的空間分辨率重采樣到0.25°×0.25°。同樣,這里采用流域內及周邊共計68個地面觀測站點數據在MATLAB中進行線性插值到0.25°×0.25°分辨率。
(2)計算原始數據RMSE。本研究以插值后的站點觀測數據為參考數據,分別計算IMERG和SM2RAIN-CCI數據集與對應實測站點插值網格的均方根誤差。文中插值后的站點觀測數據可以看作是真實降水的無偏估計,因此原始數據的RMSE代表原始數據的不確定性。

(1)
用矩陣可表示為:
(2)
假設每個衛星數據集與降水真值間的誤差都是零均值且相互獨立,那么衛星降水數據誤差的協方差矩陣為:
(3)


(4)
需要指出,由于SM2RAIN-CCI數據集缺測網格較多,所以在計算SM2RAIN-CCI和地表實測數據之間的均方根誤差時剔除缺測值所對應地面實測數據插值網格中的值。
為了定量比較融合數據相對原始IMERG產品的性能,本研究主要應用3個統計學指標進行評估:皮爾森相關系數(CC),相對誤差(BIAS)和均方根誤差(RMSE),見表1。CC表示2種數據集的一致性,反映衛星數據(融合數據)與地表實測值的線性相關程度;BIAS描述了衛星降水估計的系統偏差程度,正值表示高估,負值表示低估;RMSE代表數據的平均誤差程度,RMSE越小,表明衛星數據越趨近于實測值。

表1 統計誤差指標Tab.1 List of the statistical metrics used in the evaluation and comparison

選取渭河流域內及邊界附近的26個站點,并在0.25°×0.25°的空間分辨率下找到IMERG和融合數據對應的網格,對網格值和站點實測值進行日序列統計誤差分析(見表2)。

表2 IMERG數據和融合數據與流域各站點實測值統計誤差Tab.2 Statistical indices of IMERG and fusion data at the 26 weather stations over the Weihe River basin
注:*表示該站點對應網格的SM2RAIN-CCI數據缺測,融合數據的統計指標移用IMERG數據的統計誤差值。
從表2可以看出,融合數據較IMERG數據在相關性上呈現明顯改進,IMERG數據在同心、華家嶺、岷縣、佛坪和鎮安與站點實測數據的相關系數均在0.2以下,其中華家嶺和岷縣的CC低至0.081和0.055,而經過融合的新數據在各個站點的相關性都有不同程度的提高,特別在海原、西峰鎮、平涼、長武和涇河的CC均提升0.15左右,分別為0.248(0.415)、0.270(0.444)、0.269(0.409)、0.442(0.596)和0.218(0.366),說明融合數據在河道交叉口的相關性改善良好,這可能是因為在河道交叉口匯流量大,附近土壤水分變率大,由SM2RAIN算法反演得到的降水數據偏高,從而影響到融合數據與站點實測數據的相關性;在相對偏差方面,有12個站點的融合數據有所提升,占臺站總數(剔除定邊和臨洮2個站點)的50%,其余站點除了海原、平涼和商州[34.633(6.682)、22.828(3.844)和-52.855(-19.091)]BIAS有明顯偏離外基本相當,這表明融合數據在降水總量的離散程度上優于IMERG數據;而融合數據在均方根誤差方面的性能良好,在26個站點均有顯著降低,尤其在延安、蒲城和華山站點,RMSE分別降低了2.432、2.625和2.245,剩余站點的降低范圍也大多為0.9~2.0。考慮到統計的是日尺度的RMSE,所以融合數據在分量離散程度上顯然是令人滿意的。
統計流域及其附近26個站點2014年4月至2015年12月的日降水數據集,采用算術平均法計算各站點和站點對應網格的衛星數據(IMERG數據和融合數據)的流域逐日平均降水量,作散點圖觀察IMERG數據和融合數據與站點實測數據的離散情況(見圖2)。

圖2 IMERG數據和融合數據逐日流域平均降水量對比Fig.2 Scatterplots of mean precipitation comparisons over the Weihe River basin at daily scale between IMERG (the first one) and fusion data (the second one)
通過圖2統計誤差分析,3項統計指標均有明顯提升。其中IMERG數據集的CC為0.617,而融合數據的CC為0.699,說明融合對于改善IMERG數據的相關性有著積極作用;此外2個數據集的BIAS差異更加明顯,由原始IMERG數據集的-10.080提升到融合后的-0.589,這表明融合數據對IMERG數據集低估流域逐日平均降水的情況有明顯改善(其中低估情況可能與遙感降水產品的衰減校正和降水估計方法不確定性有關[13]);衡量2個數據集的均方根誤差,融合數據(RMSE=2.562)相較IMERG數據(RMSE=3.241)有一定的降低,數據點的離散程度明顯減小,特別是對于在地面實測值為10 mm附近明顯高估和20 mm附近明顯低估的數據點,這在一定程度顯示了融合方法對IMERG數據在估計流域逐日平均降水量級的改進。依據上述分析,融合數據較IMERG數據與地面實測值在估計流域逐日平均降水量上具有更好的質量。
在水文應用方面,該結果理論上對于集總式水文模型的徑流模擬具有積極影響。集總式水文模型的基本原理是把流域作為一個整體進行徑流模擬[14],更加精確的流域降水數據輸入有助于提高徑流模擬的精度,當然最終結果的好壞與流域面積、支流河道長短、合理劃分匯流單元出口等都密切相關[15]。
圖3反映了IMERG數據和融合數據統計誤差的空間分布對比情況。圖3(a)可以看到IMERG數據與實測數據的相關性在渭河流域的地勢方面密切相關,在地勢高的西北區域,IMERG數據的相關性很差,有些地方甚至在0.2以下,隨著地勢向東南走低,IMERG數據集的相關性有了明顯提升,特別在流域的中部區域,CC為0.4~0.6,但在渭河流域南部邊緣,由于南鄰秦嶺山區,地勢走高,CC又處于較低的水平。圖3(b)同樣反映了上述關系,但是值得注意的是,融合數據的相關性總體優于IMERG數據,大部分為0.4~0.6,少數地區能夠達到0.6以上,而且融合數據在流域邊界地區(山區)的相關性也有了很大提升。
在相對偏差的空間分布方面,2者的BIAS分布均表現出明顯的地域差異性。在圖3(c)中,結合渭河流域自東南向西北遞減的降水分布特征[16],其中在降雨稀少的西北區域BIAS均為負值,即IMERG數據集對降水出現了明顯低估,而融合后的BIAS[圖3(d)]在西北大部分區域均提升到0附近;此外,隨著降水向東南增多,IMERG數據與站點插值網格的BIAS也逐漸升高,特別是在涇河附近BIAS的值異常偏高,甚至達到150%以上,這可能與太平洋暖濕氣流在爬越秦嶺的同時給北坡帶來降水[17]和站點空間插值方法選擇有關,而融合數據的表現在此區域同樣不盡人意[圖3(d)],甚至在東南區域出現了更多BIAS高于100%的網格。造成這種融合效果不佳的原因可能是涇河周邊地勢平坦,并且地處河流交匯區,附近土壤濕度變率大,由土壤水分反演的SM2RAIN-CCI降水數據偏高導致的。

圖3 IMERG和融合數據統計誤差空間分布對比Fig.3 Spatial distributions of statistical metrics for IMERG (the first column) and fusion data(the second column) daily precipitation at 0.25°×0.25°resolution over the Weihe River basin
均方根誤差的空間分布方面,從圖3(e)中可以看到,IMERG數據的均方根誤差值自西向東遞增,特別是在東北和東南大部分地區RMSE達到7 mm,而在西部RMSE大概為4~6 mm,出現該情況的原因可能與地勢和降水分布有著很大關系。而圖3(f)表明,融合效果有明顯提升,總體RMSE趨于減小,尤其渭河流域中部地區的RMSE大多為2~4 mm。此外,融合數據在改善流域邊界(山區)的RMSE方面提升明顯。
綜上分析,在渭河流域,融合數據通過與IMERG數據比對相關統計學指標,雖然BIAS整體提升有限,但是在CC和RMSE方面表現優異,特別是在流域中低緯度地區,總體上融合數據的質量在整個流域上是有明顯改善的。
本文基于IMERG日尺度降水,利用加權最小二乘融合方法,融合“自下而上”的土壤水分反演SM2RAIN-CCI,在統計指標測算上極大地提升了IMERG產品在渭河流域的綜合性能,具體如下。
(1)在站點尺度、逐日平均降水和面尺度上,采用加權最小二乘的融合方法能夠實現2種遙感產品的融合,融合數據的質量較原始IMERG產品在統計指標上有明顯提升,特別是CC和RMSE改善明顯。此外,由于流域逐日平均降水精度的有效提高,理論上有助于提升集總式水文模型的數據輸入可靠性,從而可能對徑流模擬的結果產生積極作用。
(2)考慮到SM2RAIN算法的原理,地處半干旱區的渭河流域土壤濕度對降水敏感度高,而且河流交匯區附近土壤變率大,反演可能獲得的SM2RAIN-CCI降水數據偏高,又因為IMERG數據在渭河流域總體低估降水,因而2者融合后更接近實測值。
以上結論有助于發揮IMERG數據探測范圍廣、空間分辨率高等優勢,并且有利于水文研究人員開展對無資料(資料稀缺)地區的研究工作。但是降水數據融合結果影響因素較多,依據當地的地形、海拔、氣候類型、植被覆蓋和土壤特性等自然條件,選擇合適的輔助數據,同時考慮不同融合方法與降水數據之間的影響,是進一步提升IMERG產品可靠性的關鍵。
□