孟令遠
(煙臺市水文中心,山東 煙臺 264000)
煙臺位于中國東部山東省南部,地理坐標介于36°24'~38°23'N、119°18'~121°57'E,行政面積為13 756 km2,其中陸地、海域分別占56.36%、43.64%。屬于暖溫帶半濕潤季風氣候,氣候溫和濕潤,年平均氣溫為12.8 ℃,降水量為700 mm,年日照時數2 500-2 600 h,無霜期為200-240 d,積溫4 000 ℃~4 200 ℃。受副熱帶季風與海陸位置影響,該地降水量分配不均衡,7-9 月降水約占70%以上,具有強度大、集中性特點,易受臺風天氣影響。該區屬魯南山地向黃海過渡帶,海拔介于0~1 548 m,地勢自北向東南傾斜,受地貌影響,區域河流短促而流速急,流域面積達1 714 km2,年均徑流量為1.32億m3。
此研究使用的主要數據來源是研究區2019年GPM衛星降雨數據和地面雨量站資料,數據源自GPM 官網氣象站點降雨量數據來源于中國氣象局(China Meteorological Administration,CMA)的氣象科學數據中心(http://data.cma.cn/),共收集到研究區19個站點資料。
高斯過程回歸(GPR)是一種基于貝葉斯理論的空間插方法,其基本思想是將空間數據看作多元高斯分布,通過分析樣本數據的各自位置之間的空間相似性,建立出空間位置與對應變量之間的協方差函數,從而根據觀測數據和協方差函數,計算未知位置上預測值和方差。對于變量集合X={x1,x2…xn},設其滿足高斯(GP)分布,則有:
模型y=f(x)+δ2,δ2=N(0,),y為因變量,δ2為協方差,對于測試點x*,對應的y*的后驗分布:
式中:υ*、∑*、In分別為均值、總方差、n維矩陣。經研究表明,平方指數核函數能夠較好促進GPR模型收斂,其形式如下:
利用氣象站點點位提取預測得到的降水柵格面對應位置處降水量y',以地面觀測值為真值y,計算二者之間相對誤差,進而評價區域降水量空間預測精度,計算公式如下:
式中:y、y'分別是GPR預測降水量、地面降水量值,i=1,2…n為樣本數量。R2、MAE和RMSE分別為決定系數、平均絕對誤差、均方根誤差。
研究區GPM衛星降水資料見圖1,圖中10 km×10 km空間分辨率的GPM 像素值初步描述了區域降水量分布特征,其最大、最小值分別為802 mm、1 054 mm,空間平均值為894 mm,覆蓋區域總像素數為137 個。但其柵格面呈現明顯機械性特征,鄰域之間降水量存在不平滑漸變。據煙臺19 個氣象站點2019年降水量統計特征,其統計最大值出現在棲霞區南部,達1 012 mm,最小值為萊州市西部的795 mm,全部站點平均值為867 mm,離差系數達19.49%。并且這些樣點數據通過了0.05水平整體分布檢驗。

圖1 研究區GPM降水量特征圖
為評估所選的環境變量對區域降水量空間分布預測的有效性,利用Pearson 相關性系數分析了環境變量與地面觀測降水量之間線性關系。依圖2可見,除坡向、坡度外,降水量與其他環境因子之間呈現顯著線性關系,其中與經度、緯度和經緯度乘積的相關性系數依次達到-0.49、-0.28、-0.49,表明區域降水量呈現一定程度自西向東遞增、自南向北減少、自西南向西北遞減的特征,這反映了該地降水分布受海陸位置影響。與DEM呈負的顯著性關系,相關系數為-0.41,說明海拔高程控制著降水量在局域尺度上分布。而GPM降水量值與地面觀測降水量之間呈極顯著相關性(P<0.05),相關系數為0.51,表明GPM 衛星降水量產品在該地具有良好替代性,因此可作為新的有效環境變量預測區域降水量分布。

圖2 環境變量與地面觀測降水量之間相關性圖
GPR模型有兩個超參數:scale,控制高斯核函數相關性,決定了樣本之間相似度;degree決定了高斯核函數在每個樣本點的方差,即噪聲水平。這些超參數的組合配置直接影響了模型擬合及預測能力。為避免過擬合或欠擬合,采用grid方法自動化尋優(圖3),可見當scale 和degree 參數均取0.1 時,模型RMSE最小,此時具有良好擬合能力。

圖3 GPR模型超參數優化過程圖
在上述基礎預測了煙臺市降水量柵格面,并利用站點降水量進行獨立驗證。可見,降水量預測值與實際值之間具有良好相關性,二者隨機分布于1:1 直線兩側,總體離散度低。具體來看,模型R2達0.71,MAE和RMSE僅為32.81 mm、39.99 mm,表明GPR算法利用協變量較好擬合了區域降水量空間分布規律,該預測模型精度擬合能力好,預測精度可靠。
煙臺市2019 年降水量空間分布格局,與圖1 中GPM 衛星降水量值基本一致。可見,空降尺度上降水量分布范圍介于728~963 mm之間,空間平均值為823 mm,標準差為267 mm,離差系數僅有32.44%,表明局域降水量分布存在明顯異質性。具體來看,東南海岸線地區降水量偏少反而在海岸線內側產生降水中心。這是由于海洋對降水蒸發作用,使得海濱風向上空空氣中蒸汽含量大,容易形成云團而產生降水,但易缺少地表粗糙度對運移遲滯影響,進而使降水中心偏離海岸。而在內陸的煙臺西部地區降水量,主要是距海洋水汽較遠、受西伯利亞高壓控制,加之局部山地阻擋影響,導致空氣濕度較小,降水量相對較少。需指出的是,該分布圖并未出現傳統降水量插值過程中出現機械性條帶、“牛眼”特征等,在刻畫降水量分布漸變特征方面具有良好平滑性,因而更符合區域實際。
此研究對煙臺市2019 年降水量數據進行空間預測研究,分析了預測精度,主要結論如下:①煙臺市2019年GPM年降水數據與地面站點觀測數據具有良好一致性,整體相關系數達0.51,盡管其空間分辨率粗糙,但初步揭示了區域降水量分布實際特征。②基于GPR算法建立的非線性模型可較好擬合降水量與地形、海陸位置因子之間關系,進而幫助預測區域其他位置上降水量分布,預測結果展示了平滑分布特征,總體可信度較高。③GPR模型的精度R2達0.71,反映了該算法較好應用能力。但文中仍存在不足,首先,文中僅有19 個站點資料,這在建模時可能由于樣本數據不足導致模型訓練不充分而產生不確定性;其次,研究區下墊面環境和風向強度復雜,在構建降水量預測模型時未納入這些因子,進而降低了預測精度。后續考慮引入其他對區域降水敏感的環境協變量,進而建立更復雜、系統性的預測模型。