權晨 趙彤 何杰 沈曉燕 申燕玲
(1 青海省氣象科學研究所,青海省防災減災重點實驗室,西寧 810001;2 中國科學院青藏高原研究所,北京 100101)
青海省地處青藏高原東北部,擁有“中華水塔”三江源區、“聚寶盆”柴達木盆地,同時也是氣候變化的敏感區和生態環境脆弱區。因此,研究青海省的氣候變化、水文過程、生態演變以及陸氣相互作用能夠為區域經濟和社會發展、清潔能源規劃和利用、生態保護和國家公園建設等方面提供重要支撐。
陸面驅動數據作為陸面模式的輸入,是開展氣候、水文、生態等過程的模擬,進而揭示地表與大氣交換的物理及生物化學過程不可或缺的數據[1]。根據不同的科研需求,陸面系統模式對其輸入數據的要求也不盡相同,但隨著模式技術的發展,進行長時間、高分辨率的數值模擬是必然趨勢,也是各國科研機構開發長時間序列、高時空分辨率模式輸入數據的一個主要動機[2]。目前,用于數值模式輸入的再分析資料有很多,其中使用最為廣泛的是美國生產的NCEP/NCAR再分析資料[3]和MERRA-2再分析資料[4]、歐洲中期天氣預報中心的ERA5再分析資料[5],以及日本的JRA-55再分析資料[6]。除此之外,還有旨在用于陸面數值模式的Princeton驅動數據[7],專注于描述大氣輻射狀況的GEWEX-SRB數據[8],以及根據TRMM衛星遙感數據和其他衛星數據反演得到的降水數據產品[9]等。國內再分析或陸面驅動數據取得了重大進展,主要有中國氣象局中國全球大氣/陸面再分析數據集(CMA-RA)[10-11]和CMA陸面數據同化系統(CLDAS)近實時產品數據集[12],以及中國區域近地面氣象要素驅動數據集(CMFD)[13]。這些數據產品中的大多數都覆蓋了全球范圍,或至少覆蓋了地球表面的大部分,但這并不意味著同一產品中的數據在不同的區域都具有相同的可信度。由于全球范圍觀測數據的分布不均,以及數據同化系統自身存在缺陷等原因,數據產品中可能出現區域性的系統偏差。青藏高原地區地形復雜、站點稀少,各類數據集往往存在較大偏差或空間分辨率較低。劉婷婷等[14]對ERA5降水與實測數據的相關系數評估得出高原地區整體低于0.40,無法滿足該地區格點化氣象分析以及水文、生態模型的應用需求。
因此,為了滿足陸面數值模擬工作的需要,有必要消除既有資料中的偏差,開發出一套適用于青海高原區域的長時間序列、高時空分辨率的陸面模式驅動數據(QMFD),以求獲得更好的模擬結果。該數據集主要采用陽坤團隊研發的中國區域氣象要素驅動數據集(CMFD)研制方法[13],融合了青海省氣象局1980—2003年1日4次(時間分辨率為6 h)和2004—2018年國家氣象站(50個站)逐小時氣壓、氣溫、降水、相對濕度、風速,以及日平均氣溫、日最高氣溫、日最低氣溫等高時空分辨率氣象觀測數據制作而成,其時間分辨率為3 h,水平空間分辨率0.01°×0.01°,包含近地面氣溫、地表氣壓、近地面空氣比濕、近地面全風速、地面降水率共5個要素(變量)。該數據集實現了青海區域較高時間和空間分辨率,且數據質量不低于國內外主流陸面驅動數據集,能夠很好地滿足高原地區中小區域內生態水文過程模擬以及氣象資料分析,相對于主流數據集具有不可替代的作用。各氣象要素見表1所示。

表1 各氣象要素物理意義及單位Table 1 Physical significance and units of meteorological elements
1.1.1 地面氣象觀測數據
地面氣象站觀測數據包括青海省1980—2003年1日4次(時間分辨率為6 h)和2004—2018年國家氣象站(50個站)逐小時氣壓、氣溫、降水、相對濕度、風速,以及日平均氣溫、日最高氣溫、日最低氣溫。
1.1.2 TRMM衛星降水數據
采用2004—2018年TRMM衛星降水再分析數據(3B42),時間分辨率為3 h,空間分辨率為0.25°。TRMM降水數據的準確度已經成為國際公認的事實,TRMM 3B42數據在本工作中不僅起到了為插值提供“背景”的作用,而且是作為判斷某時刻某格點上是否出現降水的依據。這種通過衛星遙感數據判斷降水是否發生的方法極大地克服了純數學插值方法在格點上產生虛假降水的難題。區域內40°N以北地區,TRMM數據未覆蓋地區由APHRODITE(Asian Precipitation-Highly Resolved Observational Data Integration Towards Evaluation of Water Resources)降水數據集替代,該數據集是由日本綜合地球環境研究所(RIHN)和日本氣象廳氣象研究所(MRI/JMA)整編了亞洲各國家和地區的雨量站觀測資料建立的一套逐日高分辨率網格化降水數據集[15]。
1.1.3 GLDAS同化數據
GLDAS(Global Land Data Assimilation System)是描述全球陸地信息的模型,該模型包含了全球降雨量、水分蒸發量、地表徑流、地下徑流、土壤濕度、地表積雪的分布以及溫度和熱流分布等數據[16]。模型的空間分辨率有1°×1°和0.25°×0.25°,時間分辨率為逐3 h、逐日、逐月不等。
1.1.4 Princeton陸面模式驅動數據
Princeton陸面模式驅動數據是由Princeton大學陸面水文研究組開發的一套旨在用于陸面過程數值模擬的格點資料[7]。其時間序列覆蓋了1948—2006年的近60年長度,時間分辨率為3 h,水平空間分辨率為1.0°。文中采用近地面氣溫、地表氣壓、近地面空氣比濕、近地面全風速這4個變量。
1.1.5 評估數據
利用青海省不同區域、不同海拔高度的30個區域氣象站觀測資料對生成的柵格數據進行評估(表2)。該數據在柵格數據生成過程中未參與融合。

表2 數據集評估所需區域氣象站信息Table 2 Information of regional meteorological stations for dataset evaluation
1.2.1 總體方案
氣象臺站觀測數據準確,因此,制作柵格數據產品最簡單的思路是直接用臺站觀測數據進行空間插值,但在觀測站點稀少地區,通過簡單數學插值方法將站點數據插值至格點會產生巨大的偏差。再分析或遙感格點產品雖具有區域性的系統偏差,但其時空分布連續性好,其空間分布可作為空間插值的參考信息。因此,為了得到高時空分辨率的氣象要素柵格數據產品,就必須將這兩類數據融合,使其優點相結合。如:降水數據采用TRMM衛星降水數據、GLDAS同化數據以及地面站點數據;氣溫、氣壓、全風速、比濕等要素則采用Princeton陸面模式驅動數據和地面氣象觀測數據。
本數據集采用CMFD的研發思路[13],即先假定所需的Princeton陸面模式驅動數據、GLDAS同化數據和TRMM衛星遙感數據相對于氣象站觀測數據的偏差在空間上是連續分布的,在每個站點對應的位置上求出該氣象要素的偏差并將其插值到格點上,再訂正原始的再分析資料或衛星遙感數據中的偏差,最終實現再分析或衛星遙感柵格資料與氣象站點觀測數據的融合。其中,在近地面氣壓、氣溫、全風速、比濕和降水率等5個要素數據集的建立過程中,采用“差值法”來表示再分析資料相對于觀測數據的偏差,在向下短波輻射數據中采用“比值法”來描述。空間降尺度方面,選擇ANUSPLIN插值工具來將站點數據插值到0.01°空間分辨率格點,對于氣溫、氣壓等對地形高度比較敏感的變量,利用高分辨率的地形數據來提供高空間分辨率的信息。
1.2.2 時間降尺度過程中的質量控制
為了避免在制作的數據產品中出現物理上不合理的數值,如負降水量、大于100%的相對濕度等情況,必須對插值結果進行質量控制。防止插值“過界”的最簡單辦法就是確定變量的變化閾值,并且將插值結果中超出閾值的數值校正到合理范圍之內。對于提供了日變化極值的變量,采用觀測的日變化極值作為該變量在當天的變化閾值。對于氣象站資料中沒有提供日變化極值的變量,則根據該變量的物理意義來確定閾值,如:降水量不可能為負,那么降水量的最小閾值就是0;相對濕度不可能超過100%,則相對濕度的最大閾值就是100%。此外,為變量設定閾值并不是避免插值結果出現不合理數值的唯一途徑,采用了Logistic變換的方法來避免出現相對濕度超過100%的情況。
1.2.3 空間插值中地形高度處理
氣溫、氣壓變量的數值隨高度的變化是十分顯著的,因此在對這兩個變量的數據進行空間插值時必須考慮地形高程的影響。首先將Princeton格點再分析數據和氣象站點觀測數據中的氣溫和氣壓數據統一訂正到海平面高度上,然后使用海平面氣溫、氣壓數據來完成校正和降尺度過程,最后再將校正后的數據訂正回地形高度上,得到最終數據產品。
數據評估采用直接對比氣象站點值和與其空間對應的柵格格點值方法,對氣象站點實測值與柵格數據估測降水值進行對比,方法主要包括均方根誤差(RMSE)、相關系數(R)、平均絕對誤差(MAE)、標準偏差(BIAS)。具體公式如下:
式中,n是數據記錄的總個數;i是全體數據中的第i個數據;xi是柵格數據提取的值;yi是臺站觀測的值。
利用青海省50個國家氣象站和30個區域氣象站對氣溫、降水、風速、濕度、氣壓這5個要素的月值進行了評估。
2.2.1 國家站數據評估
對1978—2018年50個國家氣象站的評估結果(表3)可以看出,柵格數據與地面氣象站間的相關系數總體較高,其中氣溫的各站平均相關系數高達1.00;降水次之,為0.97;風速相關系數達到0.81;氣壓相關系數為0.74;相對濕度最低,但也達到了0.69。從各要素RMSE、MAE以及BIAS來看,風速數據相對最好,其次為氣溫數據。

表3 國家氣象站月尺度數據評估結果Table 3 Monthly-scale data evaluation results of national meteorological stations
2.2.2 區域站數據評估
對2016—2018年30個區域氣象站進行評估(表4),可以看出,柵格數據與地面氣象站間的相關系數總體較高,其中氣溫相關系數高達1.00;相對濕度次之,為0.92;降水相關系數為0.85;氣壓相關系數為0.82;風速最低,為0.74。從各要素RMSE、MAE以及BIAS來看,風速數據相對最好,其次為氣溫數據。

表4 區域氣象站月尺度數據評估結果Table 4 Monthly-scale data evaluation results of regional meteorological stations
2.3.1 國家站數據評估
對1978—2018年50個國家氣象站的日數據評估結果(表5)可以看出,柵格數據與地面氣象站間的相關系數相差較大,其中氣溫相關系數高達0.98;相對濕度次之,為0.79;風速、降水、氣壓相關系數均<0.60。從各要素RMSE、MAE以及BIAS來看,氣溫數據相對最好,其次為相對濕度數據。

表5 國家氣象站日尺度數據評估結果Table 5 Daily-scale data evaluation results of national meteorological stations
2.3.2 區域站數據評估
對2016—2018年30個區域氣象站日數據進行評估(表6),可以看出,柵格數據與地面氣象站間的相關系數相差很大,其中氣溫相關系數高達0.96;相對濕度次之,為0.61;風速相關系數為0.26;降水和氣壓相關系數分別為0.17和0.02。從各要素RMSE、MAE以及BIAS來看,氣溫數據相對最好,其次為相對濕度數據。

表6 區域氣象站日尺度數據評估結果Table 6 Daily-scale data evaluation results of regional meteorological stations
挑選2018年6月和9月NCEP、ERA5、CLDAS這3類數據集與青海長序列高分辨率氣象要素柵格數據集進行評估對比,提取了青海省30個區域氣象站月數據,結果(表7)顯示,青海長序列高分辨率氣象要素柵格數據集氣溫數據與觀測數據的相關系數分別為0.84和0.74,明顯高于ERA5和NCEP數據集,RMSE和MAE明顯低于其他數據,而且時空分辨率方面亦有優勢。對于降水數據,亦采用相同的評估方法,結果(表8)顯示,青海長序列高分辨率氣象要素柵格數據集降水數據相關系數分別為0.61和0.51,明顯高于除CLDAS外其他數據集,RMSE和MAE明顯低于其他數據,同樣,時空分辨率方面亦有優勢。

表8 青海長序列高分辨率氣象要素柵格數據集(QMFD)與其他同類數據集降水評估結果對比Table 8 Comparison of precipitation evaluation results between QMFD and other similar datasets
1)構建了1979—2018年長達40 a的青海省近地面氣壓、氣溫、風速、降水率、相對濕度5個氣象要素逐3 h的0.01°×0.01°柵格數據集,彌補了空間上無站點地區的氣象數據,為氣候變化、生態評估、水資源評估提供基礎數據。
2)月數據評估結果顯示,數據集與地面氣象站觀測數據間的相關系數總體較高,其中氣溫相關系數最高,達1.00;相對濕度次之,為0.92;降水相關系數為0.85;氣壓相關系數為0.82;風速最低,為0.74。日數據評估結果顯示,氣溫相關系數為0.96,相對濕度為0.61,其他要素較差。總體上,青海長序列高分辨率氣象要素柵格數據集在月尺度上相關系數、均方根誤差及標準偏差指標方面表現較好,氣溫和相對濕度在日尺度上優于其他要素。
3)與NCEP、ERA5、CLDAS幾類數據集評估結果對比顯示,青海長序列高分辨率氣象要素柵格數據集氣溫數據相關系數超過0.74,降水數據相關系數超過0.51,明顯高于除CLDAS外其他2個數據集,而且時空分辨率方面亦有優勢。
Advances in Meteorological Science and Technology2023年4期