花勝強,胡少英,羅孝兵,高 磊,鄭健兵
(南瑞集團公司(國網電力科學研究院),江蘇南京211106)
大壩位移監測中的粗差剔除方法
花勝強,胡少英,羅孝兵,高 磊,鄭健兵
(南瑞集團公司(國網電力科學研究院),江蘇南京211106)
針對大壩位移監測中常用粗差剔除法存在的問題提出了一種新型的粗差剔除方法。首先,根據層次分析法得到Dixon準則、Grubbs準則、Chauvenet準則、四分點準則的權重系數,并設定好粗差判定閾值;其次,根據原始觀測資料建立大壩位移的偏最小二乘回歸模型,得出樣本對應的殘差序列;然后根據四個準則依次判定出所有疑似粗差的測值;最后,按照此4種準則的權重系數,加權綜合得到每個測值的粗差概率值,并與粗差判定閾值對比,得到最后的粗差集并剔除。該方法綜合考慮了多種粗差數據識別方法,權衡了誤判和漏判的可能性,為剔除大壩位移數據中的粗差提供了一種更為科學合理的方法。
大壩位移監測;粗差剔除;Dixon準則;Grubbs準則;Chauvenet準則;四分點準則
大壩的位移量是大壩安全監測的主要指標之一,在大壩整體性態評估中具有十分重要的意義,其異常測值尤其應受到特別的重視和分析,而由測量系統和人為操作等因素引起的異常值,應將其視為粗差予以剔除,以避免干擾后續的分析和評估[1]。
所謂粗差,是指在大壩位移量的時間序列中,與相鄰時間的測值存在明顯差異的突變點,其成因一般與大壩的真實性態和環境量的變化無直接關聯。當前粗差剔除的常用方法按照原理主要分為統計分析法、有限元法和專家經驗法。其中,統計分析法主要基于已有的觀測數據,分析門檻較低,易于實現[2]。
目前業界內普遍的粗差剔除方法,主要包括專家經驗法和統計模型法。專家經驗法主要依賴水工安全監測專家的工程經驗來判定粗差,過于偏重歷史經驗和專家知識,缺乏客觀依據,定量分析說明不足,且效率底下,在重復性大數據量工況下難以勝任;統計模型法主要依賴于某一種確定的策略,例如根據極值、變幅、與擬合值殘差的大小等,對數據的利用不夠全面和深入,存在較大誤判和漏判的風險,且對工程經驗和專家知識利用不足,精度有待提升。
本文提出了一種新型大壩位移數據的粗差剔除方法。首先,根據層次分析法得到Dixon準則、Grubbs準則、Chauvenet準則、四分點準則的權重系數,并設定好粗差判定閾值。其次,根據原始觀察資料建立大壩位移的偏最小二乘回歸模型,得出樣本對應的殘差序列,并計算位移序列的均值和標準差。然后,根據Dixon準則、Grubbs準則、Chauvenet準則、四分點準則依次判定出所有疑似粗差的測值。最后,按照此4種準則的權重系數,加權綜合得到每個測值的粗差概率值,并與粗差判定閾值對比,得到最后的粗差集并剔除,詳細步驟說明如下[3-5]:
(1)基于層次分析法得出各個準則,并設定粗差判定閾值。首先,構造Dixon準則、Grubbs準則、Chauvenet準則、四分點準則這4種準則的判斷矩陣Q,其中各元素值Qij的取值定義見表1。為保證相對重要性的傳遞一致性,需要對判斷矩陣Q進行檢定,以防止相對重要性出現不自洽的現象。檢定方法是歸一化判斷矩陣Q,并求出Q的最大本征值λmax及對應的本征向量M,從而計算一致性系數
CR=(λmax-n)/[(n-1)×RI]
(1)
式中,n為矩陣的階,值為4;RI為矩陣平均隨機一致性指標,取值為0.9。本文提出的方法以CR取值不大于0.1作為判斷權重分配合理的標準;如果不滿足,應調整判斷矩陣Q中相關元素的取值,直至滿足為止,這樣所得到的本征向量M的4個元素的絕對值,即為對應的4個準則的權重系數。其次,設定判斷一個測值為疑似粗差的閾值,范圍應小于4個準則的權重系數和。這樣,對于每個測值,如果在某種準則下的判定結果為疑似粗差,則累加該準則對應的權重系數,最后得到該測值的權重系數和,與粗差判定閾值對比,達到或者超過即為粗差。4個準則的相對重要性及粗差閾值的設定機制,可靈活的根據實際樣本的數據特性和質量來調整,并能更好地結合專家知識和歷史經驗,提高對于不同工程的在地化判定精度。

表1 判斷矩陣Q中元素的取值定義
(2)計算位移序列的均值、標準差及基于回歸模型的殘差序列。首先,根據原位移測值序列,計算其均值和標準差。其次,確定回歸模型的樣本空間,根據大壩水平位移基礎成因理論,影響大壩位移的因子包括庫水位H、氣溫T、時效t等,效應量即為位移量數據,使用偏最小二乘法進行回歸擬合,得到回歸模型及對應的擬合值序列,并和原始位移值作差從而計算出相應的殘差序列。最后,相對于正常值,粗差的殘差通常更為顯著,因此可以根據殘差來判定測值是否為粗差。
(3)根據Dixon準則判定疑似粗差。對于原位移測值序列升序排序,得到新的序列X,記D=(Xn-Xn-2)/(Xn-X3),對于序列中第k個測值,如果滿足D (4)根據Grubbs準則判定疑似粗差。對于每個測值對應的殘差V,當和原位移序列的標準差S滿足|V|≥G(n,a)×S時,即判定該測值為疑似粗差。其中,n為原位移測值的總長度;a為顯著性水平,一般采用0.05;G(n,a)值則通過查Grubbs臨界值表得出。 (5)根據Chauvenet準則判定疑似粗差。對于每個測值對應的殘差V,當和序列的標準差S滿足|V|≥Z(n)×S時,即判定該測值為疑似粗差。其中,n為原位移測值的總長度;Z(n)通過查肖維勒系數表可得。 (6)根據四分點法則判定疑似粗差。對于殘差序列按照升序進行排序,記Q1為新序列中值,Q2為新序列首值到Q1的中值,Q3為Q1到新序列末值的中值,則每個測值對應的殘差V滿足V≥4×Q3-Q1,或V≤4×Q1-3×Q3時,即判定該測值為疑似粗差。 (7)4種準則的判定結果綜合加權。對于每一個測值,都有4個疑似粗差判定結果,將結果為疑似粗差的準則的權重系數相加,再與粗差判定閾值相比,達到或者超過,即判定該測值為粗差。這樣可以綜合Dixon準則、Grubbs準則、Chauvenet 準則、四分點準則這4種準則來剔除粗差,權衡了漏判和誤判的風險,達到最佳精度。 以湖南某混凝土壩2012年汛期壩頂某點的水平位移自動化監測為例,共有325條有效原始記錄。設定4個準則的相對重要性均為1,閾值為2。選取的回歸因子包括:①水位H,分別取當日至昨日平均、前2~4天平均、前5~10天平均3個時段的H、H2、H3、H4共12個因子。②溫度T,分別為當日至昨日平均,溫度諧波因子sin(2πt/365)、cos(2πt/365)、sin(4πt/365)、cos(4πt/365)共5個。③時效t及lnt共2個。通過偏最小二乘回歸得到回歸方程,并計算出均值為0.093 mm、標準差為1.29,以及對應殘差序列。4個準則的執行結果分別為,Dixon準則過濾出6條,Grubbs準則過濾出10條、Chauvenet準則過濾出14條、四分點準則過濾出4條,符合條件的共有10條。 此外,分析可以發現,Chauvenet準則與Grubbs準則的接受域相對較窄,在本例中,符合四分點準則粗差判斷的均符合此兩種法則。因此,在樣本數量較大并傾向于較為寬松的粗差剔除時,可以降低二者的相對重要性系數,否則可以提高。 新型大壩位移數據的粗差剔除方法綜合考慮了多種粗差識別方法,權衡了誤判和漏判的可能性,為剔除大壩位移數據中的粗差提供了一種科學、合理的方法,其流程和特點總結如下: (1)可以根據專家經驗來設定4個粗差判定準則的相對重要性系數及粗差判定閾值,并在后續的實踐中加以訓練而得到調優。 (2)計算出位移序列的均值、標準差,以及基于回歸分析的殘差序列,分別使用Dixon準則、Grubbs準則、Chauvenet準則、四分點準則從多個角度來衡量和篩選疑似粗差。 (3)根據預先設定的各個準則的權重系數,來綜合投票得出每個測值可能為粗差的概率,達到或者超過粗差閾值即判定為粗差。 綜上所述,該方法能更充分的利用專家知識、歷史經驗和測量數據,更全面地權衡粗差剔除中的誤判和漏判風險,且算法清晰,易于實現,魯棒性好,能成為大壩安全管理中更為可靠的決策輔助手段。 [1] 吳中如. 水工建筑物安全監控理論及其應用[M]. 北京: 高等教育出版社, 2003. [2] 錢小剛, 蔣波, 陳健. 大壩安全信息管理系統改進與應用[J]. 水力發電, 2014, 40(8): 25- 27. [3] 周元春, 甘孝清, 李端有. 大壩安全監測數據粗差識別技術研究[J]. 長江科學院院報, 2011(2): 16- 20. [4] 李嘯嘯, 蔣敏, 吳震宇, 等. 大壩安全監測數據粗差識別方法的比較與改進[J]. 中國農村水利水電, 2011(3): 102- 105. [5] 景繼, 顧沖時. 數學形態濾波在大壩安全監控數據粗差檢測中的應用[J]. 武漢大學學報, 2009(9): 1126- 1129. AGrossErrorEliminationMethodforDamDisplacementMonitoring HUA Shengqiang, HU Shaoying, LUO Xiaobing, GAO Lei, ZHENG Jianbing (NARI Group Corporations (State Grid Electric Power Research Institute), Nanjing 211106, Jiangsu, China) A new method for gross error elimination of dam displacement monitoring data is proposed. Firstly, the weight coefficients of Dixon criterion, Grubbs criterion, Chauvenet criterion and four-point criterion are obtained according to analytic hierarchy process, and the threshold of gross error judgment is set. Secondly, the partial least squares regression model of dam displacement data is established based on original observation data and corresponding residual sequence is obtained. Thirdly, all the suspected gross errors are determined by the four criterions. Finally, the gross error set is gotten and eliminated by the weighted sum of gross error probability of each criterion result compared to the threshold. This method comprehensively considers a variety of gross error data recognition methods, and weighs the possibility of miscarriage of justice and missed judgment, that provides a more scientific and reasonable method to eliminate the gross error of dam displacement monitoring data. dam displacement monitoring; gross error elimination; Dixon criterion; Grubbs criterion; Chauvenet criterion; four-point criterion TP698.1 A 0559- 9342(2017)09- 0110- 03 2017- 01- 18 花勝強(1982—),男,江蘇靖江人,高級工程師,主要研究方向為數據挖掘和大壩安全監測. (責任編輯焦雪梅)3 實 例
4 結 語