張景會,范博偉
(1.雅礱江流域水電開發有限公司,成都 610051;2.中國長江三峽集團有限公司 流域樞紐運行管理中心,湖北 宜昌 443134)
混凝土壩變形監測過程中,受到傳感器、變形數據采集單元、計算機、配套軟件以及監測儀器工作環境等多種因素的綜合影響,所采集的變形監測數據不可避免地存在著粗差等數據污染問題,因而降低了監測信息的有效性,干擾了對混凝土壩變形性態的準確評估,也給混凝土壩變形預測帶來困難[1-2]。傳統的粗差識別方法主要包括過程線法、統計檢驗法等,這些方法主要基于經驗建模,通過擬定指標識別粗差,對于具有顯著突跳特征的粗差識別效果較好,但對不明顯的粗差易產生漏判和誤判的問題[3-4]。
為此,本文在克服傳統粗差識別方法缺點的基礎上,結合變形監測統計分析模型與Fast-LTS算法,提出一種基于最小截平方和估計的混凝土壩變形監測粗差識別方法,并通過實例應用,驗證該方法的有效性。
已有壩工知識與經驗表明[1-2],混凝土壩上任一點在時刻t的變形效應量,主要受上下游水位(水壓)、溫度及時間效應(時效)等因素影響,因此其監測統計模型可通過水壓H、溫度T和時效θ等環境量的高次多項式表征。混凝土壩變形監測統計模型的一般形式為:

(1)

最小截平方和估計(LTS估計)是Rousseeuw(1984)[5]提出和發展的,適用于線性模型穩健回歸,具備高崩潰值特性。對于具有一個被解釋變量yt和K個自變xl的多元線性回歸模型:
yt=xlβ+εt,t=1,2,…,n
(2)
式中:β為待估回歸系數;εt為隨機誤差項。

(3)

(4)
式(4)中的參數h稱為截常數,最大崩潰點對應的h取決于:
h=[n/2]+[(K+1)/2]
(5)
為了提升建模效率,通常引入Fast-LTS算法[6],求解最小截平方和估計問題,具體過程如下:
1)在樣本數量為n的總樣本序列N中,隨機抽取k個互不相同的子樣本M1,M2,…,Mk,確保各子樣本數量均為m,對子樣本實施以下步驟:
①從樣本Mk中抽取容量為hm=int[m·h/n]的子樣本Hm1。

③將殘差平方由小到大排序:
(6)
④取前h1=int[(m+p+1)/2]項殘差平方對應的Mk中的數據,記為樣本Hm2。

(7)

2)將上述樣本M1,M2,…,Mk合并成一個新的樣本,記作Mnew,樣本數量為k·m。
②將殘差平方升序排列:
(8)
③取前h2=int[(t·m+p+1)/2]項殘差的平方對應的Mnew中的數據,記為樣本Mnew1。

(9)


根據上述方法和模型,提出一種基于最小截平方和估計的混凝土壩變形監測粗差識別方法。首先,基于最小截平方和估計,建立混凝土壩變形監測統計分析模型,挖潛變形監測序列與水壓H、溫度T、時效θ等環境影響因子間的關系。其次,劃分正常測值序列和疑似粗差測值序列。最后,針對疑似粗差序列采用數理統計方法,逐一甄別,直至判別出所有粗差。
本文所提出方法的實現流程見圖1。具體步驟如下:

圖1 基于最小截平方回歸的混凝土壩變形監測粗差識別方法流程
Step1:混凝土壩變形的主要影響因素H、T、θ與變形監測序列構成樣本集合N。
Step2:基于2.2一節所述Fast-LTS算法,構建變形監測統計分析模型,據此將整體變形監測序列N劃分為參與建模的正常測值序列N_normal與未參與建模的疑似粗差測值序列N_abnormal兩部分。
Step3:正常測值序列N_normal直接認定為是正常監測值。
Step4:疑似粗差測值序列N_abnormal,需結合式(10)-式(12)的數理統計判別準則進行甄別,直至識別出所有粗差。
1)計算正常測值序列N_normal的殘差均方根,其表達式為:
(10)
2)將粗差測值序列N_abnormal中的變形監測數據ym,逐一加入正常測值序列N_normal,構建新的變形監測統計模型,新模型的殘差均方根計算公式為:
(11)
3)確定第m個疑似粗差樣本的殘差比,其表達式為:
(12)
若ratiom時,則判定變形監測值ym為粗差測值;否則,認為構建監測統計模型時發生“淹沒”現象,實際上ym為正常測值。
選取某混凝土拱壩拱冠梁壩段1 060m高程處的正垂測點AL22-PL-04為例,在其2017年8月20日至2020年2月16日的徑向位移測值序列中,人為構造4段粗差,分別是臺坎段A(2018年1月17日至2018年2月6日)、振蕩段B(2018年10月29日至2018年11月23日)、突跳點C(2019年6月1日)和臺階段D(2019年12月18日至2020年1月7日),具體見圖2。
應用本文方法識別粗差測值時,首先基于Fast-LTS算法,建立變形測值序列與水壓H、溫度T、時效θ影響因子的統計分析模型,并據此將原始變形測值序列劃分為參與建模的正常測值序列N_normal和未參與建模的疑似粗差測值序列N_abnormal兩部分。測點AL22-PL-04的最小截平方和估計統計分析模型具體見式(13),測值序列劃分結果見圖3。
(13)

圖3 測點AL22-PL-04變形監測序列劃分結果
從圖3可以看出,式(13)LTS統計分析模型劃分得到的疑似粗差測值序列N_abnormal,已涵蓋了全部的粗差測值,但由于Fast-LTS算法反復迭代導致的數據淹沒問題,仍存在著將正常測值誤判為粗差的情況。為此,需結合式(12)定義的疑似粗差測值殘差比ratiom作進一步甄別,最終得到測點AL22-PL-04的粗差識別結果見表1。

表1 某拱壩測點AL22-PL-04變形監測序列粗差識別結果
結果表明,本文方法可準確識別出包括臺坎段A(2018年1月17日至2018年2月6日)、震蕩段B(2018年10月29日至2018年11月23日)、突跳點C(2019年6月1日)以及臺階段D(2019年12月18日至2020年1月7日)在內的全部粗差測測值。而利用傳統方法識別粗差時,拉依達準則失效,格拉布斯準則與羅曼諾夫斯基準則僅能識別出突跳點C(2019年6月1日)。通過對比,表明本文方法的適用性與有效性。
1)本文充分利用Fast-LTS算法的高崩潰點、穩健估計特性,結合監測統計模型,提出了一種基于最小截平方和估計的混凝土壩監測粗差識別方法。通過對某混凝土拱壩AL22-PL-04測點長時序變形監測序列“臺坎段”、“振蕩段”、“突跳點”、“臺階段”類型粗差的識別試驗,驗證了本文方法的有效性,識別成功率達100%,明顯優于拉依達法則、格拉布斯準則與羅曼諾夫斯基準則等傳統統計理論檢驗方法。同時,本文方法也為混凝土壩變形監測粗差識別提供了一種新途徑。
2)本文方法可結合混凝土壩安全數學模型構建理論,選用不同的環境量影響因子形式,將其推廣并應用到滲流類監測效應量、應力應變類監測效應量的粗差識別中,具備一定的泛化能力與可行性。