湯 俊 李垠健 高 鑫
1 華東交通大學土木建筑學院,南昌市雙港東大街808號,330013 2 華東交通大學土木工程國家實驗教學示范中心,南昌市雙港東大街808號,330013
GNSS變形監測具有測站間無需通視和全天候自動觀測等優點[1],被廣泛應用于工程結構的健康監測。由于數據采集過程中易受天氣、樹木遮擋、多路徑效應等多種因素影響,GNSS變形序列中常包含測量噪聲,這些噪聲會嚴重影響測量精度,導致監測物的變形信息不準確。因此,有必要對監測數據進行濾波處理。常見的變形監測數據濾波方法有小波去噪[2-3]、Kalman濾波[4]、經驗模態分解[5-8](empirical mode decomposition, EMD)等。GNSS變形監測受背景噪聲影響具有非平穩、高頻率、重復性強等特點,EMD及其改進方法在處理該類信號時具有明顯優勢。本文針對EMD分解中的噪聲傳遞以及真實信號缺失等問題,提出基于EMD的改進方法——CEEMDAN,在分解過程中加入有限次自適應白噪聲,可有效避免模態混疊和信號失真。通過比較CEEMDAN、EMD和小波去噪方法的去噪效果,利用仿真數據與GNSS邊坡實測監測數據進行實驗分析,驗證該方法的有效性和可靠性。
EMD在構建包絡線時使用三次樣條法,無法判斷信號兩端是否為極值點,所以會產生端點效應。在分解過程中,EMD采取遞歸分解,在頻率尺度不連續時,無法正確分離不同尺度的信號,從而造成模態混疊現象。針對該問題,EEMD分解時在序列中間斷加入高斯白噪聲,由于白噪聲具有均值為0的特點,因此在加入數量足夠多的情況下白噪聲會相互抵消,從而在一定程度上避免模態混疊問題,但分解后的單個IMF仍存在殘余噪聲,導致殘余噪聲在高階IMF和低階IMF中傳遞。
CEEMDAN算法是在EEMD基礎上發展而來的,針對EEMD分解過程中的噪聲傳遞問題,CEEMDAN在各個分解階段添加自適應高斯白噪聲,得到模態分量后立即進行加總平均計算,同時在后續分解中執行同樣操作。該算法可實現在較少的平均次數下,保證重構誤差為0,從而有效避免噪聲傳遞的問題。 CEEMDAN方法的具體步驟如下:
1) 在原始信號x(t)中添加I組均值為0的自適應白噪聲ωi(t),第i次信號可表示為:
xi(t)=x(t)+ωi(t)
(1)
式中,i為實驗次數1,2,…,I。采用EMD算法對xi(t)進行分解,得到第1個模態分量,然后立即對其進行加總平均計算,得到:
(2)
將原始信號減第1個模態分量得到殘余分量:
r1=x(t)-IMF1
(3)
2) 求解第2階模態分量IMF2,在殘余分量r1中繼續加入白噪聲ωi(t),構成新的待分解信號:
R1(t)=r1(t)+ωi(t)
(4)
進行i次實驗(i=1,2,…,I),然后對R1(t)進行EMD分解,得到第2個模態分量:
(5)
殘余分量可表示為:
r2=x(t)-IMF2
(6)
3) 重復執行步驟1)和2),直到信號不能再被分解,即信號單調為止,從而得到k個IMF,信號x(t)可表示為:
(7)
排列熵(permutation entropy, PE)[9]、樣本熵和模糊熵等概念相同,是衡量時間序列復雜程度的指標,在計算子序列之間復雜程度的同時可引入排列的思想。排列熵具有運算效率高、抗干擾能力強、輸出結果簡潔等優點,適用于非線性、不規則的信號,對區分IMF頻率具有很好的適用性。時間序列越規則,其值越??;時間序列越復雜,即包含噪聲越多,其值越大。計算排列熵的基本步驟如下:
1) 設時間長度為N的時間序列X(1),X(2),…,X(n),重構時間序列,每個子序列以x(i)表示,得到以下序列矩陣:

(8)
式中,m為嵌入維數,λ為時間延遲,j=1,2,…,k。
2) 將矩陣中每一行元素組成向量,按升序排列,即
X(i)={x(i+(j1-1)λ)≤x(i+(j2-1)λ)
≤…≤x(i+(jm-1)λ)}
(9)
如果其中有2項相等,則按照ji的下標i進行排序,得到新的符號序列:
S(l)=(j1,j2,…,jm)
(10)
式中,l=1,2,…,k,共產生m!種不同排列,即所有m維子序列X(i)都被映射到m!種不同排列中。
3) 計算所有符號的概率分布,用Pj表示,時間序列的排列熵可表示為:
(11)

HP=H(m)/ln(m!)
(12)
式中,Hp的取值范圍為[0,1]。模糊隸屬度為模糊集合中研究對象介于0~1之間的某個值,使用模糊隸屬度區分高低頻分量可得到較為合理的結果。本文基于IMF的特點,經過大量實驗,參考文獻[10]將PE值的模糊隸屬度設定為0.6。當時間序列PE值大于0.6時,可認為是包含噪聲的高頻信號;PE值小于0.6時,則看作干凈信號。計算每一個IMF的PE值,可以篩選出低頻信號進行重構。
使用CEEMDAN將原始信號分解為不同頻率的IMF分量,可避免EMD模態混疊和端點效應問題,分解得到的IMF分量能更清晰地表達自身特征。根據GNSS變形監測序列噪聲高頻率、周日重復的特點,可認為噪聲主要存在于高頻分量中,如果直接舍棄則可能喪失其中的真實信息。本文方法對高頻分量繼續進行小波去噪,使高頻分量中的低頻信息能得到很好地保留。首先需要找出高頻分量與低頻分量的分界點K,常用方法有相關系數法、標準化模量累計均值法、平均周期與能量密度乘積法等。本文根據IMF的特性,引入排列熵的概念來區分高頻噪聲,計算每個IMF的PE值;然后篩選出高頻分量,并將其看作噪聲信號,將低頻分量看作干凈信號;對高頻分量繼續采用小波分析的方法進行去噪,同時對去噪后的高頻分量與干凈信號進行重構,得到去噪后的信號。具體步驟見圖1。

圖1 CEEMDAN方法流程Fig.1 Flow diagram of CEEMDAN method
為驗證本文方法的有效性,構造模擬變形信號對本文方法進行實驗。模擬信號由3個正弦函數疊加組成,在該信號的基礎上加入高斯白噪聲,其函數為:
yt=4sin(2πt/1 000)·sin(2πt/400)+
2sin(2πt/600)+sin(2πt/300)+noise
(13)
式中,noise是信噪比為2 dB的高斯白噪聲,采樣數為3 000,采樣間隔1 s,仿真信號及加噪后信號如圖2所示。

圖2 仿真信號序列Fig.2 Simulation signal sequence diagram
采用CEEMDAN算法對加噪后信號進行分解,得到11個IMF分量和1個殘余項,各IMF分量如圖3所示。從圖中可以看出,隨著分解次數的增加,信號越來越平滑,表明高斯白噪聲主要分布在高頻分量上。

圖3 基于CEEMDAN方法的分解圖Fig.3 Decomposition diagram based on CEEMDAN method
利用排列熵理論確定高頻噪聲,計算各IMF分量的PE值,結果見表1。由表1可知,前3個IMF分量的PE值大于0.6,可將其看作高頻噪聲,使用小波變換進行去噪處理。經過多次實驗,小波基選擇去噪效果較好的db7小波,分解層數為3,選取Heursure(啟發式閾值)進行軟閾值處理。將去噪后的分量與第4~11個低頻分量和殘余項進行重構,得到去噪后信號。

表1 各IMF分量排列熵
為驗證CEEMDAN方法的去噪效果,對原始信號分別采用小波去噪、EMD、CEEMDAN方法進行去噪,利用信噪比、均方根誤差和相關系數3個指標評價去噪效果:
(14)
(15)
(16)
式中,SNR為信噪比,RMSE為均方根誤差,R為相關系數,s(i)為原始信號,s′(i)為去噪后信號,L為信號長度。具體去噪效果見表2,從表中可以看出,小波去噪和EMD方法均能起到一定的去噪效果。與之相比,CEEMDAN方法去噪后的信噪比、相關系數均有所提升,均方誤差有所降低,表明本文方法具有有效性。

表2 仿真數據去噪效果對比
為進一步驗證該方法的可靠性,利用某邊坡GNSS變形監測數據進行實驗分析。該邊坡布設0001、0007、J001、J002共4個監測點,采樣頻率為1 Hz。實驗利用09-01~11-30共91 d的監測數據,選取間隔1 h,截取2 000個歷元進行去噪處理。由于篇幅所限,僅展示0001監測點的去噪結果,原始序列和去噪后序列如圖4所示,表3為0001監測點N、E、U方向3種去噪方法的效果對比。

圖4 實測數據去噪效果Fig.4 Denoising effect of measured data

表3 實測數據降噪效果對比
從圖4和表3可以看出,原始監測序列局部呈不平穩態勢,具有很大隨機性,說明其受到很大的噪聲污染。通過分析3個方向的信噪比和相關系數可知,新方法與小波去噪方法相比,信噪比分別提高7.41%、3.15%和6.22%,相關系數分別提高19.6%、27.34%和23.13%;與EMD方法相比,信噪比分別提高6.86%、2.31%和5.97%,相關系數分別提高16.67%、15.64%和21.22%,表明新方法相比于傳統方法可提取更多的變形量,與原始序列更接近。從均方根誤差來看,3個方向上,新方法與小波去噪方法相比分別減少47.37%、36%和40%,與EMD方法相比分別減少6.86%、2.31%和5.97%,表明新方法的去噪效果更穩定,能更清晰地表達變形趨勢。
本文構建了一種自適應完備集合經驗模態分解的去噪方法,引入排列熵理論確定高低頻分界值K。該方法結合多種方法的優點,可有效解決EMD分析的端點效應和模態混疊問題,通過排列熵理論準確劃分高低頻,對高頻噪聲進行精細處理,使其GNSS變形監測的真實信息得到有效保留。仿真和實測數據實驗表明,CEEMDAN方法的去噪精度顯著優于EMD和小波去噪方法,證明了其有效性和可靠性。