李 杰
(華北理工大學礦業工程學院,河北 唐山 064000)
變形監測對于大壩安全狀態的評估有著重要的作用,因此確保監測點的數據具有可靠性和良好的精度是非常有必要的[1-2]。但在實際的測量中,不可避免地會受到外界因素或人為因素的影響,由此產生的粗差會對整體數據的評估造成很大影響,此時再用經典最小二乘法會使實驗數據的精度受到粗差的影響,使結果不可靠。而穩健估計法通過對粗差不斷進行降權,具有很強的抗差性效果。因此采用穩健估計對大壩監測點的數據進行處理具有非常大的價值。
目前已有諸多學者使用穩健估計法來降低數據采集過程中產生的粗差對實驗數據的影響。甄龍等[3]選用了多種穩健估計的方法對GPS中帶有的粗差進行評估,得出結論:當在對獨立變量進行處理時,穩健估計能得到較好的結果。陳開瑞[4]提出了穩健的總體最小二乘回歸方法,對地鐵監測點的沉降進行建模,結果預測精度大大提高,證明了該方法在地鐵監測中使用的可行性。王剛等[5]利用穩健估計對重慶草堂隧道地表觀測點進行研究,證明了穩健估計能很好地剔除誤差,且Huber權函數較其他權函數有更好的抗差性。本文將運用最小二乘法和穩健估計法,在MATLAB環境中對大壩的變形監測數據在含有粗差時和不含粗差時進行處理,并對其中誤差和決定系數進行對比分析,得出兩種方法的優缺點及適用范圍。
在雙江口水電站大壩變形監測中,觀測數據的精度尤其重要。原始測量由于測量人的疏忽和外部環境的干擾等,測量數據里往往帶有粗差[6]。如果直接對數據做平差處理,得到的結果往往不可靠。因此,為了降低粗差對整體觀測數據的影響與干擾,在數據處理時調用權函數,使獲得的實驗結果盡可能地接近真值的有效估計。
如果實驗數據中存在自變量x1,x2,x3,…,xn與因變量Y,且因變量與自變量xk(k=1,2…n)有如下線性關系:
由于本次實驗只涉及時間變化與大壩高程變化兩個變量,因此采用的回歸模型為一元線性回歸模型,即:
式中:Y——大壩高程變化量;
x1——時間變化;
β0——回歸方程常數項;
β1——回歸系數;
ε——隨機擾動項,ε~N(0,σ2)。
根據測量數據與回歸函數對應的擬合值,列出誤差方程式:
式中:V——觀測值的改正數;
B——自變量的系數矩陣;
——未知參數的近似值;
L——觀測值Y的列向量。
最小二乘準則為:
穩健估計可以在有粗差的條件下,盡可能大地減小粗差對實驗數據的影響,得出正常模式下的最佳預測[7-8]。其基本原則就是在平差處理的過程中,通過多次迭代反復計算其權值大小,對有效數據進行充分利用,對觀測數據里精度不高的數據進行降權[9],或對含有粗差的觀測數據不斷進行降權直到接近于零,以消除粗差對實驗數據的影響。此時可求出參數估值,此時的參數估計具有穩健性,接著可求得回歸方程。設觀測值的誤差方程為:
限制條件為:
式中:P——觀測權陣(權因子初始值都為1);
p——密度函數。
對公式(6)求導,得Ф(Vi)=?p/?Vi,則有:
令權因子Wi=Ф(Vi)/Vi,等價權元素,則有則可求出:
式(5)和式(8)為第一次迭代時殘差的估值和參數的估值,再通過V構造新的等價權P,并計算法方程,得第二次迭代求出的參數和殘差V的估值。依照此迭代不斷地進行下去,直到前后兩次的差值滿足限差[10]。此時可依此求出參數的第k次迭代的估值為:
研究使用了該大壩在2018 年6 月至2020 年5 月每月中旬的數據,監測點觀測數據如下表1所示。
表1 大壩監測點原始觀測數據統計表
由于原始數據的變化主要在毫米級上,以2018年6月1 號的原始數據高程(Z=2290.3507m)為最初點的數據,將其余原始數據處理為保留到毫米級的水庫點的累積變形量,如表2所示。
表2 處理為毫米級的累計沉降量統計表
將原始各時期累積沉降量數據Z代入MATLAB 軟件中,對Z變化量進行離散值的檢驗,結果如圖1所示。
圖1 原始數據累積沉降量殘差圖
從圖1可以看出,原始數據中沒有離散值,說明原始數據是可靠的。接著,分別使用最小二乘回歸法與穩健估計法對原始采樣數據進行建模,得出各方法的回歸曲線,如圖2所示。
圖2 原始數據累積沉降量回歸曲線
此時最小二乘線性回歸方程為:y=5.8355-0.6662x;中誤差σ1=3.2024;R2=0.6934;穩健估計回歸方程為:y=5.7743-0.6648x;中誤差σ2=3.4279;R2=0.7653;由以上實驗結果可知,在沒有粗差時,最小二乘法和穩健估計法的結果非常接近。
接著在第22期數據中對累積沉降量Z中加入粗差,對帶有粗差時的累積沉降量數據的進行分析,如圖3所示。從圖3中可知第22期數據為粗差,會對整體數據精度造成影響,需要被剔除。帶粗差數據累積沉降量回歸曲線如圖4所示。
圖4 帶粗差數據累積沉降量回歸曲線
從圖4中可以看出,此時最小二乘線性回歸方程為:y=4.7453-0.52x,其中誤差σ1=4.7936,R2=0.3808;穩健估計回歸方程為:y=5.4264-0.62x,其中誤差σ2=3.9471,R2=0.7562。
通過以上數據結果分析可知,對處理有粗差的數據,穩健估計的中誤差明顯更小,且它的R2也明顯優于最小二乘線性回歸,與沒有粗差時的值接近。說明穩健估計已自動對粗差進行了降權,使得粗差對整體數據的影響較小,也就是穩健估計具有良好的抗差性。
通過對比原始數據與加入粗差后的數據可以看出,當原始數據集中沒有粗差時,最小二乘法與穩健估計法的中誤差和方程都比較相似;當原始數據集中有粗差后,使用經典最小二乘回歸擬合出來的結果明顯偏向粗差,偏離真實值。而帶有粗差的數據集中,穩健估計能通過對粗差降權,使粗差對整體數據集的影響降低,它有更小的中誤差和更高的精度表現。總之,采用經典最小二乘法和穩健估計法的計算結果表明,穩健估計法具有良好的抗差性作用。