文化立,金澤林,范榮雙,王崇兵,李浩然,劉依倫
HKDE-EEMDAN的CORS站高程時間序列分析方法
文化立1,2,金澤林3,范榮雙2,王崇兵1,2,李浩然1,劉依倫1
(1. 遼寧工程技術大學測繪與地理科學學院,遼寧 阜新 123000;2. 中國測繪科學研究院,北京 100036;3. 中國能源建設集團遼寧電力勘測設計院有限公司,沈陽 110000)
針對傳統整體經驗模態分解(EEMD)方法進行信號分解時整體平均的結果未能完全消除隨機噪聲影響使分解信噪比降低、信號重構效果差的問題,結合距離評價函數和熵的聚類算法提出了一種改進的噪聲自適應整體經驗模態分解方法。在經驗模態分解處理時,添加白噪聲分解的模態分量并對迭代過程中各階本征模函數(IMF)分量進行聚類分析。采用該方法和EEMD方法對2個連續運行參考站(CORS)站近20 a高程時間序列進行分解,基于信噪比、正交指數以及均方根誤差指標對2種方法的分解精度進行分析比較。實驗結果表明:該方法提高信噪比5%以上,提高分解精度26%以上,降低重構信號均方根誤差21%以上,降低了隨機噪聲對時間序列分解和信號重構的影響。
自適應噪聲;聚類分析;高程時間序列;信息熵;信號重構
全球衛星導航系統(global navigation satellite system, GNSS)連續運行參考站(continuously operating reference stations, CORS)運動特征分析是維持我國2000國家大地坐標系(China geodetic coordinate system 2000, CGCS2000)現勢性和動態性的重要基礎[1-2]。CORS站坐標時間序列高程方向表現為復雜的周期和非線性運動。目前常采用固定模型描述CORS站高程坐標時間序列,這種方法限制了測站本身的運動規律,可能會偏離甚至違背其實際運動情況[3-4]。因此,找到一種基于序列本身的方法對序列進行分析更具實際意義[5]。
文獻[6]采用經驗模態分解(empirical mode decomposition,EMD)的思想[7],先對獲取到的預報電離層總電子含量(total electric contents,TEC)時間序列采取分解變換,然后對分解得到的時間序列進行模型的建立,通過模型可以提升對TEC時間序列值預測的精度。文獻[8]在EMD基礎上提出了整體經驗模態分解(ensemble empirical mode decomposition,EEMD)方法;該方法采用白噪聲的統計特性,使信號在其真解鄰域內發生擾動,達到目的后又進行自消,最終得到真實的結果;該方法在信號分析領域得到廣泛應用。文獻[9]將自適應時序分析技術引入衛星導航定位基準站高程時間序列分析領域,并對該方法進行了一定程度的改進,但存在著某些不足。
本文結合距離評價函數和熵的聚類(hierarchical-means clustering algorithm based on distance evaluation function and entropy, HKDE)算法[10]提出了一種改進的噪聲自適應整體經驗模態分解(ensemble empirical mode decomposition of adaptive noise,EEMDAN)方法,即HKDE-EEMDAN方法,并用2個CORS站20 a的高程時間序列對該方法的適用性進行驗證。
EEMD是在EMD的基礎上提出的改進算法,該算法是一種引用白噪聲輔助的數據分析方法,其核心是有限次地向原始時間序列中添加等長有限幅值的白噪聲構成新的待分解信號,并對新生成的待分解信號獨立進行EMD分解為

假設添加隨機白噪聲構成待分解信號的次數為,對次待分解信號分別進行EMD分解,得到次分解的各階IMF分量后,取相同階數的IMF分量均值作為EEMD分解的IMF分量,即


式中:為EEMD分解得到的IMF的個數;()為EEMD分解后的殘余分量。
相關研究表明,EEMD較好地彌補了EMD方法的不足,但由于信號中間歇性高頻信號的影響,整體平均的結果未能完全消除隨機高斯白噪聲的影響[11-14],使得分解后序列信噪比(signal noise ratio, SNR)降低、模態混疊現象明顯、進而影響了信號重構效果。
HKDE算法[10]是針對傳統聚類算法聚類準確度低且對噪聲敏感的問題提出的一種基于距離評價函數和熵的聚類算法。該方法首先構建距離評價函數算法確定最佳聚類數,其次利用熵這種相似度衡量指標指導簇的合并,能有效地降低噪聲和孤立點對聚類效果的影響。
本文提出的HKDE-EEMDAN方法主要思想:①添加白噪聲后經過EMD分解僅獲取一階分量IMF1,對次分解得到的IMF1分量集進行聚類分析。首先,基于距離評價函數確定最優分類數完成劃分聚類;其次,以信息熵為相似度評價標準進行層次聚類;最后,保留樣本數最多的一類取均值作為HKDE-EEMDAN方法的IMF1分量。②從原始序列中剔除IMF1得到剩余信號,向剩余信號中添加白噪聲經EMD分解的IMF分量后再進行分解,同樣只分解出一階模態分量并進行聚類分析,直至求解出所有的IMF分量。本文方法主要步驟如下。




保留樣本數最多(記樣本數為1)的一類IMF1進行均值處理,得到經過HKDE-EEMDAN方法獲得的IMF1分量為



4)為獲取原始信號()的第階IMF重復上述步驟直至求解出各階IMF分量,則原始信號可表達為

可以看出,HKDE-EEMDAN方法的改進主要有:①利用自適應白噪聲調節參考尺度,消除高斯白噪聲對序列的影響;②采用聚類分析方法降低了隨機添加白噪聲時產生的孤立點數據對整體平均結果的影響[15]。
判斷CORS站高程時間序列分解方法的優劣程度需要采用一定指標進行定性、定量分析,可以從3個方面進行考慮:①信號分解后各階IMF分量中是否存在明顯的模態混疊現象;②相鄰IMF分量間的正交指數(index of orthogonality, IO)分析;③利用部分IMF分量進行信號重構后求解重構信號的均方根誤差(root mean square error, RMSE)及信噪比。
衡量分解后各分量間正交性常用指標為正交指數。正交指數越小,說明分量間正交性越好,即分解精度越高。在HKDE-EEMDAN分解結果中,任意2個IMF分量間的正交指數計算公式為

信噪比是指信號序列與噪聲序列的比值大小。信噪比越高,則說明序列中信號所占的比例較大,得到的有用信息較多。CORS站高程時間序列的信噪比計算公式為
均方根誤差反映了重構信號與原始序列的差異性。均方根誤差數值越大,則說明重構信號效果越不理想;數值越小,則說明重構信號效果越理想。均方根誤差由重構信號和原始時間序列定義為

本文實驗選取斯克里普斯軌道和常駐陣列中心(Scripps Orbit And Permanent Array Center, SOPAC)網站提供的BJFS站和LHAZ站2000—2020年Clean產品中高程方向時間序列進行實驗,該序列經數據中心處理已經剔除了粗差,并且不存在明顯的階躍突變。但大量研究表明該數據中仍存在粗差信號[16-17],因此對原始信號利用3倍中誤差法剔除粗差,利用3次樣條插值法進行插值,并進行去常數處理。BJFS站和LHAZ站的原始高程時間序列如圖1所示。本文對2個測站分別進行EEMD和HKDE-EEMDAN實驗。

圖1 CORS站原始高程時間序列
根據文獻[17],本文實驗設置EEMD與HKDE-EEMDAN方法中添加白噪聲與信號標準差之比為0.1,添加噪聲次數為100次。圖2、圖3為2個測站分別采用2種方法的分解結果,本文僅給出分解得到的中低頻部分IMF分量,余項表示為residual。
圖2和圖3中,可以直觀看出2種分解方法均得到了明顯的周期變化項。為分析高程時間序列中主要周期運動的貢獻項,統計中低頻IMF分量的方差貢獻率為判斷指標,如表1所示。
BJFS站的結果為:EEMD分解所得分量中IMF6與IMF7所占的方差貢獻率分別為9.00%和37.78%,是周期運動的主要貢獻項,IMF6和IMF7分別呈現出季節性和年周期變化;HKDE-EEMDAN分解所得分量中IMF7與IMF8所占的方差貢獻率分別為9.53%和43.29%,是周期運動的主要貢獻項,IMF7和IMF8分別呈現出季節性和年周期變化。2種方法均判定BJFS站主要表現為季節性和年周期運動形式。
LHAZ站的結果為:EEMD分解所得分量中IMF6與IMF7所占的方差貢獻率分別為10.11%和38.53%,是周期運動的主要貢獻項,IMF6整體呈現出半年周期變化,IMF7整體呈現出年周期變化;HKDE-EEMDAN分解所得分量中IMF7與IMF8所占的方差貢獻率分別為13.50%和36.55%,是周期運動的主要貢獻項,IMF7整體呈現出半年周期變化,IMF8整體呈現出年周期變化。2種方法得到的結論一致,LHAZ站的周期運動形式主要表現為季節性半年周期和年周期。

圖2 BJFS站分解中低頻IMF分量

圖3 LHAZ站分解中低頻IMF分量

表1 BJFS和LHAZ站IMF6至IMF11方差貢獻率
計算2種方法分解得到的IMF分量中相鄰兩項的正交指數,以衡量EEMD和HKDE-EEMDAN的分解精度。正交指數如表2所示。

表2 正交指數統計
HKDE-EEMDAN方法得到的周期運動主要貢獻項滯后于EEMD方法,分別以2種方法主要周期運動的貢獻項間正交指數衡量分解精度。BJFS站經HKDE-EEMDAN處理得到的正交指數78相較于EEMD方法67減少39.8%,LHAZ站經HKDE-EEMDAN處理得到的正交指數78相較于EEMD方法67減少26.8%。
GNSS連續運行導航定位基準站高程時間序列經2種方法分解后得到一系列頻率由高到低的IMF分量,BJFS站和LHAZ噪聲主要分布于高頻分量IMF1至IMF5中。本文以主要周期項IMF6為信噪分界點進行信號重構,重構信號如圖4所示。

圖4 重構信號效果
圖4中黑色實線為HKDE-EEMDAN部分IMF重構序列,帶有“+”標記符的虛線為EEMD部分IMF重構序列,可以看出HKDE-EEMDAN重構效果更貼近原始時間序列的變化趨勢。為定量分析高程時間序列重構效果,計算重構信號的信噪比和均方根誤差如表3所示。

表3 信噪比和均方根誤差
由BJFS站和LHAZ站20a的高程時間序列重構信號經2種分解方法處理后的信噪比和均方根誤差值對比可知:HKDE-EEMDAN方法處理下的信噪比明顯大于EEMD方法,兩站分別提高5.2%和7.7%;HKDE-EEMDAN方法處理下的均方根誤差明顯小于EEMD方法,兩站分別降低31.6%和21.7%。采用HKDE-EEMDAN方法對CORS站高程時間序列處理后,信號重構的效果優于EEMD方法。
1)本文結合距離評價函數和熵的聚類算法提出了一種改進的噪聲自適應整體經驗模態分解方法。2個CORS站近20a高程時間序列實驗結果表明,該方法改善了傳統EEMD方法進行信號分解時整體平均的結果未能完全消除隨機噪聲影響使分解信噪比降低、模態混疊現象明顯、影響信號重構效果的問題。
2)本文提出方法還原了CORS站高程時間序列的真實運動情況,為高程方向非線性建模奠定了基礎,但算法計算效率較低,如何提高算法計算效率并對序列中的噪聲進行定性和定量分析是進一步研究的課題。
[1] 姜衛平. GNSS基準站網數據處理方法與應用[M]. 武漢: 武漢大學出版社, 2017.
[2] 程鵬飛, 成英燕, 秘金鐘, 等. 2000國家大地坐標系建立的理論與方法[M]. 北京: 測繪出版社, 2014.
[3] 張鵬, 蔣志浩, 秘金鐘, 等. 我國GPS跟蹤站數據處理與時間序列特征分析[J]. 武漢大學學報(信息科學版), 2007,32(3): 251-254.
[4] 徐健, 周志祥, 唐亮, 等. 基于總體平均經驗模態分解算法的自適應改進[J]. 振動與沖擊, 2017, 36(11): 215-223.
[5] 武曙光. 區域 CORS 站坐標時間序列特征分析[D]. 武漢: 武漢大學, 2017.
[6] 湯俊, 姚宜斌, 陳鵬, 等. 利用EMD方法改進電離層TEC預報模型[J]. 武漢大學學報(信息科學版), 2013, 38(4): 408-411, 444.
[7] WU Z H, HUANG N E. A study of the characteristics of white noise using the empirical mode decomposition method[J]. Proceedings of the Royal Society of London Series A: Mathematical Physical & Engineering Sciences, 2004, 460(2046): 1597-1611.
[8] WU Z H, HUANG N E. Ensemble empirical mode decomposition: a noise-assisted data analysis method[J]. Advances in Adaptive Data Analysis, 2009, 1(1): 1-41.
[9] 張恒璟, 齊昕, 文漢江. 基于均值聚類EEMD的CORS高程時間序列信號分析方法[J]. 大地測量與地球動力學, 2019, 39(10): 1053-1057.
[10] 李鵬. 基于層次均值的聚類算法的研究[D]. 哈爾濱: 哈爾濱工程大學, 2015.
[11] 明鋒, 楊元喜, 曾安敏, 等. 中國區域IGS站高程時間序列季節性信號及長期趨勢分析[J]. 中國科學(地球科學), 2016, 46(6): 834-844.
[12] 李忠盼, 趙冬青, 向民志, 等. 一種加速GNSS信號捕獲的短時傅里葉變換算法[J]. 測繪科學技術學報, 2019, 36(1): 23-27.
[13] 雷亞國, 孔德同, 李乃鵬, 等. 自適應總體平均經驗模式分解及其在行星齒輪箱故障檢測中的應用[J]. 機械工程學報, 2014, 50(3): 64-70.
[14] 李長偉, 雷文平, 龐博, 等. 基于EEMD的相關排列熵的滾動軸承故障診斷[J]. 組合機床與自動化加工技術, 2020(8): 1-4.
[15] 唐東明. 聚類分析及其應用研究[D]. 成都: 電子科技大學, 2010.
[16] 羅權. GPS坐標時間序列的功率譜分析研究[D]. 武漢: 武漢大學, 2017.
[17] 張恒璟. 國家CORS基準站高程時間序列非線性時變研究[D]. 阜新: 遼寧工程技術大學, 2013.
Time series analysis method of CORS station elevation based on HKDE-EEMDAN
WEN Huali1,2, JIN Zelin3, FAN Rongshuang2, WANG Chongbing1,2, LI Haoran1, LIU Yilun1
(1. School of Geomatics, Liaoning Technical University, Fuxin, Liaoning 123000, China; 2. Chinese Academy of Surveying and Mapping, Beijing 100036, China;3. China Energy Engineering Group Liaoning Electric Power Survey and Design Institute Co., Ltd., Shenyang 110000, China)
To address the problem that the impact of random noise cannot be completely eliminated when the traditional Ensemble Empirical Mode Decomposition (EEMD) method is used for signal decomposition and the signal noise ratio is reduced and the effect of signal reconstruction is not satisfactory, this paper proposed an improved ensemble empirical mode decomposition of adaptive noise using clustering algorithm based on distance evaluation function and entropy. In the Empirical Mode Decomposition (EMD) processing, the modal components of white noise decomposition were added, and clustering analysis was implemented on the Intrinsic Mode Function (IMF) components of orders in the iterative process. This method and the EEMD method were used to decompose the elevation time series of two Continuously Operating Reference Stations (CORS) for the past 20 years. Based on the signal noise ratio, index of orthogonality and root mean square error index, the decomposition accuracies of these two methods were analyzed and compared. The final experimental result showed that this method could increase the signal noise ratio by more than 5%, improve decomposition accuracy by more than 26%, and reduce the root mean square error of reconstructed signal by more than 21%, thus it was capable of reducing the impact of random noise on time series decomposition and signal reconstruction.
adaptive noise; cluster analysis; elevation time series; information entropy; signal reconstruction
P228
A
2095-4999(2021)06-0077-07
文化立,金澤林,范榮雙,等. HKDE-EEMDAN的CORS站高程時間序列分析方法[J]. 導航定位學報, 2021, 9(6): 77-83.(WEN Huali, JIN Zelin, FAN Rongshuang, et al. Time series analysis method of CORS station elevation based on HKDE-EEMDAN[J]. Journal of Navigation and Positioning, 2021, 9(6): 77-83.)
10.16547/j.cnki.10-1096.20210612.
2021-01-25
國家重點研發計劃項目(2016YFC0803100);遼寧省教育廳遼寧省高等學校基本科研項目(LJ2017QL008)。
文化立(1994—),男,河南濮陽人,碩士研究生,研究方向為空間大地測量數據處理與GNSS高程非線性運動、地理信息系統應用。
金澤林(1996—),男,遼寧撫順人,碩士,研究方向為大地測量學與工程測量學。