朱 斯 楊,李 艷 玲,盧 祥,劉 可 心
(1.四川大學 水力學與山區河流開發保護國家重點實驗室,四川 成都 610065; 2.四川大學 水利水電學院,四川 成都 610065)
隨著監測技術、網絡通訊技術和計算機技術的不斷發展,工程安全監測的測點個數和觀測頻次也隨之增多,監測數據量增長明顯[1],精確識別出監測數據序列中的異常值,提高監測數據的有效性,對科學準確分析工程安全性態具有重要意義[2]。目前應用于異常數據識別的方法很多,包括四分點法[3]、統計學方法[4]等,其中3σ準則因為使用簡便而應用較廣[5],但由于其識別效果對數據序列正態分布特性依賴嚴重,因而對工程安全中經常出現的“臺階型”、“振蕩型”等含有較多離群點的數據序列極易出現異常識別漏判的問題。毛亞純[6]和趙鍵等[7]基于3σ準則提出了數據跳躍法來識別異常數據;許貝貝[8]等將3σ準則與分位數方法結合起來,利用關聯分析法分析測點位移空間關系識別異常數據;Li等[9]基于3σ準則采用自學習和平滑處理來識別異常數據,但這些方法均不適用于含離群點較多的數據序列,因此識別精度較低。為此,本文基于隸屬云模型,通過逆向隸屬云發生器計算每個云滴的期望和帶寬,利用3b準則進行初步識別離群嚴重的數據,以云滴群期望和帶寬序列的均值代替3σ準則中的均值和標準差進行構造控制函數進行識別,并將該方法應用于龔嘴水電站不同類型的測點序列,將結果與傳統3σ準則對比,結果發現該方法對含離群點較多的“臺階型”和“振蕩型”數據序列識別效果很好,對正常數據序列識別效果與傳統方法一致。
隸屬云是定性概念與定量表示之間相互轉化的一種轉換模型,它能反映出數據的隨機性和模糊性。本文將隸屬云應用于大壩安全監測領域,原理如下:設U是一個用精確數值表示的定量論域,F是U上的定性概念。若定量值x∈U,且x是定性概念F的一次隨機實現,x對F的確定度CF(x)∈[0,1]是一個具有穩定傾向性的隨機數,即:CF(x):U→[0,1],?x∈X(X?U),x→CF(x)。
則X在論域U上的分布稱為云,每一個x稱為一個云滴[10]。
隸屬云通過期望Ex、帶寬b和云方差σmax3個數字特征值來表示概念的隨機性與模糊性。期望Ex反映了云滴分布的中心位置,是工程安全監測數據信息的中心值;帶寬b表示隸屬云相對于期望值的離散程度,是對工程安全監測數據結果可行度的一種反映;云方差σmax用來度量帶寬的不確定性,是帶寬的方差,可以表示監測水平偏離正常的程度,綜合反映了監測儀器、監測人員的素質和監測環境等因素對監測水平的影響程度。
在隸屬云模型中,根據云滴群對定性概念的貢獻度,發現有貢獻的云滴主要集中在區間[Ex-3b,Ex+3b]內,該區間外的云滴幾乎沒有貢獻,可表征為異常信息,這被稱為隸屬云的3b準則[11]。
隸屬云發生器是實現數據序列與隸屬云相互轉化的數學模型,本文提出的方法使用逆向隸屬云發生器將監測數據轉換為隸屬云的數學特征值,具體算法步驟如下[12]:
(1) 計算數據樣本期望Ex,二階中心距c2和四階中心距c4。
(1)
(2)
(3)
(2) 再計算樣本數據的帶寬b和云方差σmax。
(4)
(5)
傳統的3σ準則是以均值和標準差構造控制函數來判斷測值是否異常,當數據序列中出現較多離群點,使其不再服從正態分布時,其均值和標準差將會嚴重偏離實際情況,使其出現漏判現象。
隸屬云異常識別算法的第一步是依次將待測數據序列X中的前j(j=1,2,3,…,n)個測值輸入到逆向云發生器中,得到每個測值對應的數字特征期望Exj和帶寬bj,之后利用隸屬云的3b準則對每個測值進行初次篩選,對篩選出的異常測值進行修正,消除一些明顯的離群點的不利影響。第二步是將初篩后的云期望序列Ex的均值M作為總體尺度參數,初篩后的帶寬序列b的均值B作為總體位置參數構造控制函數進行異常識別,加強了正常數據的權重影響,使計算所得的控制限更加符合實際情況。
隸屬云異常識別算法的實現流程如圖1所示。

圖1 隸屬云異常識別算法流程Fig.1 Anomaly recognition algorithm flow of membership clouds
龔嘴水電站壩址位于四川省樂山市沙灣區與峨邊縣交界處的大渡河中游下段,攔河壩為混凝土重力壩,其監測項目主要包括揚壓力監測、滲流監測、變形監測、環境量監測等,于2005年已實現自動化觀測。變形監測數據變化平穩、周期性規律好,故本文選取規律性稍差、含離群點較多的揚壓滲流典型測點LSY03(振蕩型)、LSY12(振蕩型)、YY10101(臺階型)和位移測點JGBX15(正常序列)為例進行對比分析,各測點基本信息如表1所示。

表1 典型測點基本信息Tab.1 Basic information of typical measuring points
用本文方法計算上述典型測點的控制限,并將其與傳統的3σ準則控制限對比,進行異常識別,各測點實測值和控制限過程線如圖2~5所示。

圖2 LSY03測值過程線及控制限對比(振蕩型)Fig.2 Comparision of measured data process line and the control limit LSY03(oscillatory type)

圖3 LSY12測值過程線及控制限對比(振蕩型)Fig.3 Comparision of measured data process line and the control limit LSY12(oscillatory type)

圖4 YY10101測值過程線及控制限對比(臺階型)Fig.4 Camparision of measured data process line and the control limit YY10101(step type)

圖5 JGBX15實測值過程線及控制限對比(正常數據)Fig.5 Comparision of measured data process line and the control limit JGBX15(normal sequence)
可以看出:當監測數據序列中離群點較多時,數據序列不再符合正態或近似正態分布,根據傳統3σ準則計算所得的控制上下限將被拉向離群點而偏離正常范圍,使得傳統3σ準則不能準確識別異常,出現漏判問題。如測點LSY03在2016年7月7日出現的測值14.10,測點LSY12在2018年9月25日出現的測值275.59以及測點YY10101在2018年9月25日出現的測值500.31,采用傳統的3σ準則時均為被識別為正常點,而采用本文提出的方法首先通過初篩消除了離數據序列中心較遠的離群點影響,用初篩后的云期望序列Ex的均值作為總體尺度參數,初篩后的云帶寬序列b的均值作為總體位置參數構造控制函數,加強了正常數據在計算控制限的影響,消減了離群點的不利影響,使其計算的控制限更加符合實際情況,提高了異常識別的精度,計算結果如表2所示。而對于不含離群點的正常數據序列,兩種方法計算所得的異常控制限差異很小,識別結果相同。

表2 異常識別效果對比Tab.2 Comparison of abnormal identification effect
為進一步驗證數據異常識別的效果,將該方法應用于龔嘴水電站所有位移及滲流測點,發現對于周期性好、變化平穩的位移測點,結果一致;而對于周期性差,含離群點的揚壓滲流測點,本文方法的漏判率較傳統方法下降明顯,結果如表3所示。

表3 異常識別效果對比結果Tab.3 Comparison results of abnormal recognition effect
綜上所述,本文方法能有效抵抗離群點的干擾,解決了傳統方法無法識別“臺階型”和“振蕩型”數據中離群點的問題,識別精度顯著提高,同時也適用于正常數據序列,適用性強。
本文針對傳統3σ準則無法準確識別工程安全監測中“臺階型”和“振蕩型”序列中離群點的漏判問題進行了研究,通過對隸屬云模型的應用,為安全監測數據異常識別提供了一種簡單高效的方法,將其應用于龔嘴水電站,得到如下結論。
(1) 基于隸屬云的識別算法通過初篩消除了部分明顯的離群點對數據序列分布特征的不利影響;利用隸屬云期望序列和隸屬云帶寬序列的均值構建控制函數,加強了正常數據的權重影響,使得控制限設置更加符合實際情況。
(2) 通過對比分析兩種方法對龔嘴水電站監測測點的異常識別效果發現,本文方法能有效減少因實際監測數據序列含離群點較多時偏離正態分布時異常值漏判的問題;對于正常監測數據,兩種方法識別結果相同。