999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Prophet模型在GNSS坐標時間序列中的插值分析

2021-04-08 12:23:50魯鐵定賀小星
大地測量與地球動力學 2021年4期
關鍵詞:方向方法模型

李 威 魯鐵定 賀小星 劉 瑞

1 東華理工大學測繪工程學院,南昌市廣蘭大道418號,330013 2 華東交通大學土木建筑學院,南昌市雙港東大街808號,330013

在GNSS坐標數據處理中,數據缺失較為常見,不同的缺失情況對GNSS坐標時間序列的分析會產生不同的影響[1]。拉格朗日方法適用于連續缺失數據在3個以內的插值[2],但隨著測量精度的提升,可能會出現插值效果不如簡單線性插值的情況[3]。武艷強等[4]提出的三次樣條法能夠在一定程度上解決數據缺失較多的問題,但在數據連續缺失過多時,插值精度會大幅下降;邱榮海等[5]使用奇異譜迭代的插值方法提高了插值效率,但處理較為復雜,需要對嵌入窗口的插值階數進行大量驗證;尹玲等[6]使用神經網絡進行插值,該方法在觀測值缺失較多的情況下依然能夠得到較好的插值數據,但操作較為繁瑣;蘇利娜等[7]提出的基于模型和噪聲間相關性的插值方法對長空缺數據有良好的插值效果,并發現數據空缺對周期性的影響較大,但該方法需要對時間序列具備大量的先驗知識;蔡曉軍等[8]提出的多通道奇異譜插值方法不需要坐標時間序列先驗信息也能得到較高精度的插值數據,但交叉驗證模型的參數且缺失數據需要用0填充可能帶來一定偏差。

本文針對GNSS坐標時間序列中的插值問題,提出使用Prophet模型對 GNSS坐標時間序列進行插值。該方法不需要關于時間序列的大量先驗知識,并能在各種缺失情況下快速得到高精度的插值數據。

1 模型原理與數據處理

1.1 Prophet模型

Prophet模型插值的本質是對缺失數據進行預測,即在擬合的過程中自動填補缺失值從而達到插值的效果[9]。Prophet模型克服了傳統插值方法的缺陷與限制,其在處理缺失值與異常值時魯棒性極強[10]。當坐標時間序列中存在缺失值時,Prophet模型能夠較好地確定GNSS坐標時間序列的組成成分,并同時對具有多個季節性的周期數據進行模擬[11],使得到的插值數據能夠較好地契合時間序列的變化規律。

Prophet模型基于貝葉斯方法的曲線擬合來實現預測[11],其可用廣義加法模型表示:

y(t)=g(t)+s(t)+h(t)+ε(t)

(1)

式中,g(t)為趨勢項,表示時間序列中非周期部分的變化趨勢;s(t)為周期項或季節項,通常以周或年為單位;h(t)為假日項,表示假日對1 d或多天內不規則變化的影響;ε(t)為殘差項,表示模型未預測到的趨勢。

g(t)由邏輯回歸函數(logistic function)和分段線性函數(piecewise linear function)組成。由邏輯回歸函數表示g(t)為:

g(t)=C/(1+e-k(t-m))

(2)

式中,C為曲線的最大漸近值,即g(t)隨著t的增加趨于C;k為曲線的增長率;m為曲線的偏移量。

s(t)使用傅里葉級數對其進行構造,表達形式為:

(3)

式中,T為期望時間序列具有的規則周期,當T=365.25、N=10時,表示以年為周期;當T=7、N=3時,表示以周為周期。

h(t)可用來反映時間序列中某時刻的特殊變動,Prophet模型根據每個假日項在不同時刻下產生的影響構建獨立的模型,并為各個假日項設置不同的前后窗口期,以及產生相應的虛擬變量[10]。h(t)的表達形式為:

Z(t)=[1(t∈D1),…,1 (t∈DL)]

h(t)=Z(t)k,k~normal(0,γ)

(4)

式中,i為節假日,Ki為節假日的影響范圍;Di為i對應的虛擬變量,表示第i個節假日的前后一段時間;L為時間序列中含有的節假日個數。

IGS基準站的坐標時間序列包含著測站的長期線性變化趨勢,以及測站受地球物理效應等外界因素影響造成的非線性變化,使測站位置產生周期性的震蕩變化[12-13]。所以當坐標時間序列中存在缺失值時,傳統的插值方法無法兼顧時間序列的周期變化。而Prophet模型能夠對數據中大量潛在的突變點進行識別與監測,再對趨勢變化的幅度進行稀疏先驗(與 L1 正則化效果相同),并且Prophet模型采用的傅里葉級數可構造適應周期性變化的模型[14],這使得Prophet模型在擬合時間序列的同時,能夠得到適應時間序列周期變化的插值數據。圖1為Prophet模型對BJFS站坐標數據的擬合圖,散點表示原始數據,曲線為擬合數據,陰影區域表示置信區間。由圖1可以看出,Prophet模型能夠較好地表現數據的變化趨勢以及坐標時間序列的周期性,且沒有過度擬合原始數據,使得模型對粗差與離散點有較好的抵抗能力,這為得到高精度的插值數據提供了可能。

圖1 Prophet模型對BJFS站的數據擬合Fig.1 Data fitting of BJFS station using Prophet model

1.2 模擬數據的生成

幾乎所有的GNSS坐標時間序列都表現出一個季節性的位移周期,它可以被模擬成一個周期項為1 a或0.5 a的4項傅里葉級數序列。最常見的軌跡模型是使用恒定的速度趨勢,在這種情況下,模擬數據遵循式(5):

(5)

式中,xR為參考位置;tR為任意的參考時間,通常設置為平均觀測時間;v為測站的速度向量,可假定為常數;H為單位步長函數;向量bj表示在時間tj上產生跳躍的方向和幅度,nJ為跳躍的次數;sk與ck為角頻率ωk的諧波傅里葉系數(每個位置向量對應一個);nF為不同頻率的數量;角頻率ωk=2πτk,τk為角頻率對應的周期。為了模擬年位移周期,選擇基本周期τ1=1 a,高次諧波周期τk=1/ka,這樣可確保由nF個正弦和nF個余弦構成的循環每年僅重復一次。根據式(5),分別模擬東、北、高程3個方向上的坐標時間序列。通常GNSS坐標時間序列的噪聲組成不能由單一的噪聲模型描述[15],故模擬數據中包含線性趨勢+季節性信號,噪聲選用白噪聲與閃爍噪聲(WN+FN)的組合,且垂直分量大于水平分量。

2 Prophet模型插值實驗

由于實測的GNSS坐標數據包含各種誤差以及復雜的噪聲模型組合,需要通過模擬數據來檢驗Prophet模型的插值能力。針對短周期和長周期的坐標時間序列,以及隨機缺失和連續缺失等情形,設計3組模擬實驗。模擬實驗1、2分別是在短周期和長周期的坐標時間序列中對隨機剔除的數據進行插值,模擬實驗3則對不同長度的連續缺失數據進行插值。在實測數據實驗中,分別進行數據隨機缺失和連續缺失的插值實驗。各實驗均使用均方根誤差(RMSE)與平均絕對誤差(MAE)作為插值精度的評價指標。

2.1 模擬實驗1

模擬實驗1主要針對短周期坐標時間序列中隨機缺失的數據插值。根據式(5)得到模擬測站S1東、北、高程3個方向連續4 a共1 461 d的模擬數據。圖2為S1站3個方向的坐標時間序列圖,將各方向時間序列隨機剔除5%、10%、15%的數據,再分別用3種方法對缺失數據進行插值,并將得到的插值數據分別與缺失的原始數據進行對比。

由表1中的精度指標可以看出,3種方法在東向與北向的坐標時間序列插值中都能保持較高的精度;而在高程方向上,盡管各方法的精度都有所下降,但仍能保持良好的插值效果。3種方法在3個方向上的插值精度并沒有隨著缺失比例的增加而出現明顯的降低,表明3種方法在短周期的時間序列中都有較好的插值效果。其中Prophet模型的插值精度最高,三次樣條法次之,拉格朗日法最差。

表1 S1站3種方法插值精度對比

2.2 模擬實驗2

模擬實驗2主要針對中長周期坐標時間序列隨機缺失的數據插值。由式(5)生成模擬測站S2東、北、高程3個方向連續10 a共3 653 d的模擬數據。圖3為S2站在3個方向上的時間序列圖,將各方向時間序列隨機剔除5%、10%、15%的數據,再分別采用拉格朗日法、三次樣條法與Prophet模型對缺失數據進行插值,并將3種方法得到的插值數據與缺失的原始數據進行對比。

圖3 S2站3個方向的坐標時間序列Fig.3 Time series of three-dimensional coordinate at S2 station

從表2中的精度指標可以看出,針對較長周期的坐標時間序列,3種模型都能較好地對缺失數據進行插值。但拉格朗日法的插值精度波動較大,這可能是由于當缺失點較多時,拉格朗日插值多項式的次數增高,導致插值數據不穩定;而Prophet模型與三次樣條法依然能夠提供高精度的插值數據。與模擬數據實驗1的結果相同,Prophet模型在3種方法中插值精度最高。

表2 S2站3種方法插值精度對比

2.3 模擬實驗3

模擬實驗3主要檢驗Prophet模型在數據連續缺失時的插值效果。由式(5)得到模擬測站S3東、北、高程3個方向連續6 a共2 192 d的模擬數據。圖4為S3站在3個方向上的時間序列圖,由于拉格朗日法對連續缺失數據的插值效果較差,故實驗中不使用該方法。以2003-01-01為起點,分別剔除連續7 d、30 d、60 d、0.5 a、1 a、2 a共6種時間長度的數據,再采用三次樣條法與Prophet模型對連續缺失數據進行插值,并將2種方法得到的插值數據與缺失的原始數據進行對比。由于三次樣條法在60 d時的插值精度已經較低,故在缺失時間為0.5 a、1 a、2 a時只檢驗Prophet模型的插值精度。

圖4 S3站3個方向的坐標時間序列Fig.4 Time series of three-dimensional coordinate at S3 station

由表3的精度指標可知,2種模型在東向與北向的插值精度都要優于高程方向。其中,三次樣條法在數據連續缺失7 d和30 d時,能夠提供可用的插值數據;當連續缺失數據為60 d時,其插值精度會大幅度下降。而Prophet模型在3種不同的缺失長度下都能夠保持極高的插值精度;在缺失時間為0.5 a、1 a、2 a時,Prophet模型的插值精度并沒有隨著缺失時間的增加而明顯降低,仍能得到高精度的插值數據。

表3 S3站2種方法對連續缺失數據插值的精度

2.4 GNSS實測高程坐標時間序列插值實驗

為進一步檢驗Prophet模型插值方法的可靠性,將處理后得到的BJFS站(2008~2014年)高程方向坐標時間序列(圖1)進行插值研究與分析。數據來源于中國地震局GNSS數據產品服務平臺(http://www.cgps.ac.cn/),數據采樣間隔為1/365.25 a,采樣頻率為1/365.25 Hz。該站的時間跨度為6 a共2 192 d。按照5%、10%、15%的比例隨機剔除數據,然后對比Prophet模型、拉格朗日法以及三次樣條法對實測數據的插值效果。

由表4可知,3種插值方法在數據隨機缺失比例為5%、10%、15%時,對高程方向實測數據的插值都能保持較高的精度,且插值效果十分穩定。其中,Prophet模型的插值精度最高。

表4 BJFS站高程方向3種方法插值精度對比

當BJFS站高程方向的實測數據連續缺失時,與模擬實驗3相同,只選用Prophet模型與三次樣條法對缺失數據進行插值。以2010-01-01為起點,分別剔除7 d、30 d、60 d、0.5 a、1 a、2 a共6種時間長度數據,同樣在缺失時間為0.5 a、1 a、2 a時只檢驗Prophet模型的精度(表5)。

表5 BJFS站高程方向2種方法對連續缺失數據插值的精度

由表5可知,Prophet模型與三次樣條法在實測數據連續缺失7 d時,都能夠得到較高的插值精度;而當實測數據連續缺失30 d和60 d時,2種方法的插值精度都有不同程度的下降,但Prophet模型的插值精度遠高于三次樣條法;在連續缺失時間為0.5 a、1 a、2 a時,Prophet模型的精度只有小幅度下降,且表現得十分穩定。

圖5是Prophet模型與三次樣條法對BJFS站高程方向上連續缺失數據的插值對比圖。可以看出,三次樣條法在連續空缺較多時插值數據會偏離原始數據,從而產生較大的偏差;而Prophet模型得到的插值數據更加符合原始數據的變化。圖6(2010年)是使用Prophet模型在連續缺失0.5 a、1 a、2 a時的插值圖。可以看出,在缺失量較大時,Prophet模型的插值效果依然穩定,并能夠較好地體現原始數據的趨勢變化與周期性。

圖5 BJFS站不同方法的插值對比Fig.5 Interpolation comparison of different methods at BJFS station

圖6 BJFS站高程方向的Prophet模型插值Fig.6 Prophet model interpolation of elevation direction at BJFS station

2.5 Prophet模型的靈活度

使用Prophet模型插值時,時間序列趨勢的變化靈活性不足(即擬合不足)或過于靈活(即過度擬合),導致模型的默認參數(默認靈活度為0.05)有時不能得到最優的插值數據,這時需要手動調整模型的靈活性以調整稀疏先驗的程度。

以模擬測站S1與BJFS站高程方向坐標時間序列為例分析靈活度對Prophet模型插值的影響。按照15%的比例隨機剔除數據,再選擇常用的靈活度參數得到Prophet模型在不同靈活度下的插值數據,最后將每次得到的插值數據與原始數據對比得到相應的RMSE。圖7中,x軸表示選取的靈活度參數,y軸為對應的RMSE。可以看出,通常在靈活度為0.001時模型的插值效果最差,當靈活度上升到0.05時插值效果會有較大提升。插值精度往往會隨著靈活度的上升而提高;但達到一定的精度后,即使靈活度上升,精度也不再提高,而是逐漸趨于平穩甚至有小幅下降。

圖7 Prophet模型靈活度對精度的影響Fig.7 The influence of the flexibility of the Prophet model on accuracy

3 結 語

1)在建模過程中,由于Prophet模型不會過度擬合原始數據,所以能夠降低粗差或離群值對模型的影響。Prophet模型在GNSS坐標時間序列中具有較好的適用性,這為Prophet模型的高精度插值提供了可能性。

2)Prophet不是單純的數學模型,它能夠兼顧數據的趨勢變化,從而提供良好的插值效果。Prophet模型在短周期與中長周期的坐標時間序列中都能保持良好的插值效果。而當數據連續缺失時,Prophet模型較傳統模型優勢更明顯。在小比例和非連續缺失的情況下,仍可選用拉格朗日法與三次樣條法進行插值,但Prophet模型通常能夠提供更高精度的插值數據。

3)Prophet模型的優勢在于簡便性與快捷性,其不需要太多關于時間序列的先驗知識,盡管它可以根據專業需求來調整模型以達到更好的效果,但在默認設置下仍能給予較好的反饋。所以處理數據時不用過多地關注模型的選擇,而可以將重點放在對數據的分析中。

4)當對數據插值的精度要求較高時,Prophet模型有時不能一次得出理想的結果,這時需要不斷調整模型的靈活度,而模型本身又無法自動給出最優解,所以盡管可以根據經驗較快地鎖定最優靈活度的范圍,但仍會增加數據處理的時間。

猜你喜歡
方向方法模型
一半模型
2022年組稿方向
計算機應用(2022年2期)2022-03-01 12:33:42
2021年組稿方向
計算機應用(2021年4期)2021-04-20 14:06:36
2021年組稿方向
計算機應用(2021年1期)2021-01-21 03:22:38
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 福利片91| 中文字幕伦视频| 四虎亚洲国产成人久久精品| 丁香五月婷婷激情基地| 国产色图在线观看| 亚洲高清国产拍精品26u| 欧美日本一区二区三区免费| 国产极品美女在线播放| 女人一级毛片| 永久免费AⅤ无码网站在线观看| 在线观看免费黄色网址| 又粗又硬又大又爽免费视频播放| 在线日韩日本国产亚洲| 欧美一道本| 呦女亚洲一区精品| 精品国产美女福到在线直播| 97视频免费看| 亚洲视频免费在线| 国产对白刺激真实精品91| 亚洲三级成人| 国产第一页屁屁影院| 亚洲精品va| 农村乱人伦一区二区| 日韩二区三区无| WWW丫丫国产成人精品| 人妻丝袜无码视频| 欧美人在线一区二区三区| 亚洲欧美日韩另类| 国内精品伊人久久久久7777人| 狠狠色香婷婷久久亚洲精品| 欧美啪啪网| 亚洲日韩精品伊甸| 91久久国产综合精品| 亚洲三级电影在线播放| 亚洲国产一成久久精品国产成人综合| 亚洲人成网7777777国产| 国产人成在线视频| 丁香五月激情图片| 在线观看网站国产| 国产成人成人一区二区| 热99精品视频| www.狠狠| 成人午夜久久| 尤物成AV人片在线观看| 国产91在线免费视频| 九九视频免费看| 亚洲第一视频网站| 99re视频在线| 99精品免费在线| 亚洲福利网址| 精品91视频| 国产美女在线观看| 久久亚洲精少妇毛片午夜无码| 国产精品福利尤物youwu| 综合色88| 国产精品主播| 欧美成人一区午夜福利在线| 99视频国产精品| 亚洲综合极品香蕉久久网| 97国产在线播放| 国产精品久久久免费视频| 国产香蕉在线| 一级一级一片免费| 91黄视频在线观看| 国产精品永久免费嫩草研究院| 欧美精品1区| 国产精品丝袜在线| 激情综合图区| 欧美特黄一免在线观看| 亚洲日韩AV无码一区二区三区人| 久青草国产高清在线视频| 国产一区成人| 草逼视频国产| 国产一区二区人大臿蕉香蕉| 亚洲国语自产一区第二页| 午夜啪啪网| 精品国产成人a在线观看| 一本一道波多野结衣一区二区 | 国精品91人妻无码一区二区三区| 欧美亚洲欧美区| 国产欧美日韩资源在线观看| 久久免费精品琪琪|