姚寶寬,周愛兆,仇春平
(1.江蘇省地質(zhì)礦產(chǎn)局第三地質(zhì)大隊,江蘇鎮(zhèn)江 212000;2.江蘇科技大學土木工程與建筑學院,江蘇鎮(zhèn)江 212000;3.中國礦業(yè)大學環(huán)境與測繪學院,江蘇徐州 221116)
大氣水汽是全球水循環(huán)中最活躍的因子和天氣、氣候的主要驅(qū)動力,也是影響災害性天氣形成和發(fā)展的關鍵性因子[1-7]。當前,以我國北斗導航衛(wèi)星系統(tǒng)(BDS)為代表的全球衛(wèi)星導航系統(tǒng)(Global Navigation Satellite System,GNSS)快速發(fā)展,為精確測量大氣可降水量(Precipitable Water Vapor,PWV)進而提高暴雨、霧霾、臺風等災害天氣預警水平正在發(fā)揮重要作用[4]。因此,PWV特征分析及其建模研究引起了眾多學者的關注。文獻[1]~[3]分析了不同地區(qū)的PWV 時間特征,文獻[4]~[6]分析了不同技術條件下的PWV 時序精度變化特征,文獻[7]~[9]研究了PWV 時序建模以及應用于天氣預報產(chǎn)品的可行性分析。
上述研究結果表明,PWV 時間序列表現(xiàn)出了顯著的非等精度特征,而且該特征與時間、空間的相關性復雜。然而,在現(xiàn)有PWV 時間序列建模研究中,均是采用單位權隨機模型。換言之,現(xiàn)有研究工作較少考慮PWV 時間序列建模中的定權問題。鑒此,本文先介紹PWV 常用的函數(shù)模型與最小二乘參數(shù)估計方法,在此基礎上分析了PWV 時間序列的數(shù)據(jù)密度分布特征,從而提出了利用數(shù)據(jù)密度加權的PWV 建模方法。最后,在全球范圍內(nèi)選取了代表性的4 個測站PWV 時間序列,對所提方法進行了方案對比和結果分析,驗證了所提方法的正確性和可靠性。
PWV 時間序列建模一般采用包含線性項、年周期和半年周期的諧波模型[10]。

式中:Yt-歷元t 的PWV 值;β-時間序列的線性速度項;μ-整個時間序列的常數(shù)項;aj、bj、ωj-周期幅值和頻率;vt-噪聲項。
當 PWV 時序長度為 n 時,即 t∈[1,n],記參數(shù)向量為 X、設計矩陣為B、觀測值向量為Y、誤差向量為V,則根據(jù)式(1)可以建立如式(2)所示的誤差方程:

為了分析PWV 時間序列的數(shù)據(jù)密度特征,在全球選取了BAKO、ALGO、ALBH、BRMU 四個代表性的測站。四個測站的時序長度分別為 5558d、6317d、6460d、5793d,均在 15 年以上的時間序列長度。繪制的數(shù)據(jù)密度分布圖如圖1 所示。
分析圖1 可知,四個測站的數(shù)據(jù)密度分布表現(xiàn)出顯著的差異。其中,測站BAKO 呈現(xiàn)為右側尖銳、測站ALGO 呈現(xiàn)左側尖銳、測站ALBH 呈現(xiàn)正態(tài)型、測站BRMU 呈現(xiàn)平峰型。由此分析可知,不同測站的數(shù)據(jù)密度分布差異較大,若直接采用單位權則會因隨機模型不準確而導致估計結果不合理。因此,以P 表示權陣,文中利用數(shù)據(jù)密度的定權方法為:

式中:ρt-PWV 數(shù)據(jù)密度。
結合式(2)和式(3),利用最小二乘原理可得PWV 模型參數(shù)及其精度估計式:

圖1 PWV 時間序列的數(shù)據(jù)密度分布

式(3)~式(5)構成了本文的利用數(shù)據(jù)密度加權的PWV 建模方法。從推導過程可以看出,通過數(shù)據(jù)密度分布特征考慮了PWV時間序列的非等精度特征,以便更加合理地利用PWV 數(shù)據(jù)并降低建模誤差。進一步地,當權陣為單位時,本文方法則退化為現(xiàn)有文獻方法。因此,本文方法包含了單位權最小二乘方法,適用范圍更廣。
為了檢驗本文方法的正確性和有效性,仍采用1.2 節(jié)四個測站的PWV 數(shù)據(jù)進行建模精度分析。比較方案為P,方案1 采用單位權進行參數(shù)最小二乘估計方法,方案2 采用數(shù)據(jù)密度加權的參數(shù)最小二乘估計方法,計算結果見表1。

表1 不同方案結果比較
表1 統(tǒng)計了四個測站的中誤差和相對誤差計算結算。從該表可以看出,方案2 較方案1 的中誤差提高了大約2mm;其次,方案2 較方案1 的相對誤差提高了5~15 個百分比。由此可以驗證,本文所用的數(shù)據(jù)密度加權的PWV 建模方法精度更高。為了進一步對比方案1 和方案2 的建模誤差,圖2 顯示了測站BAKO的自相關誤差分布圖。

圖2 測站BAKO 的自相關誤差分布
圖2 對比了測站BAKO 的自相關誤差分布。從該平面分布圖可以看出,方案1 的誤差分布呈現(xiàn)非常扁長的橢圓形狀,表明誤差和自相關誤差存在顯著的相關性;方案2 的誤差分布呈現(xiàn)聚中化的標準圓形狀,表明誤差和自相關誤差呈現(xiàn)隨機性、不存在相關特性。由此可以得出,方案2 優(yōu)于方案1 的計算結果。因此,無論從中誤差、相對誤差的精度衡量指標,還是從誤差分布的角度進行對比分析,方案2 均優(yōu)于方案1 的計算結果,從而驗證了本文方法的正確性和有效性,并能夠有效改善PWV 時間序列建模精度。
本文通過分析了大氣可降水量PWV 在時間與空間變化的復雜性,指出了在PWV 時間序列建模過程中僅僅考慮單位權隨機模型難以顧及PWV 的非等精度特性。由此,在給出包含線性項、年周期和半年周期的諧波模型基礎上,通過四個測站15 年以上的PWV 時間序列數(shù)據(jù)密度分布特征分析,提出了通過數(shù)據(jù)密度分布定權的模型參數(shù)估計方法。最后,通過PWV 建模中誤差、相對誤差以及自相關誤差分布分析,驗證了所提方法的正確性和合理性,為提高PWV 時序建模精度提供了可行的新思路。