田勁松 ,田文峰
(1.安徽農業大學 理學院,安徽 合肥 230036; 2.黃山市黟縣宏村鎮人民政府,安徽 黃山 245500)
工程基坑開挖過程中,在重復測量時間間隔較短且連續變形測量時,測量數據常包含由各種因素(例如:儀器、外界環境等)引起的誤差。因此,在變形分析前必須對所獲數據進行識別,以確定該批測量數據是否受周期性誤差的干擾。要識別測量數據的周期性誤差,傳統解決方法是利用數理統計中的統計檢驗方法。但是,統計檢驗方法在結論的可靠性方面,存在著諸多缺點,致使結論的正確性可疑。國內許多學者力求在該方面從方法和手段上得以突破,并且做了不少工作。探討利用模式識別理論的思想和方法解決識別測量數據周期性誤差問題,無論是統計檢驗還是模式識別最終解決的都是測量數據有沒有周期誤差的問題。將基坑監測數據確定為含周期性誤差類和不含周期性誤差類。統計檢驗法的分類方法是在一定顯著水平的情況下確定類別,模式識別分類法是基于貝葉斯風險函數最小為基本思想來確定類別的,其結果的誤判概率總是最小且可以給出分類判別結果錯誤率,具有很大的優點[1]。本文利用模式識別的思想和方法分析基坑土體傾斜監測數據是否含有周期性誤差問題。
模式識別方法主要有決策理論方法和句法方法。決策理論方法又稱為統計方法,是發展較早也比較成熟的一種方法。把識別對象變換為適于計算機處理的數字信息。在數字化環節之后進行預處理,除去混入的干擾信息并減少某些變形和失真。隨后進行特征抽取,即從數字化后或預處理后的輸入模式中抽取一組特征。所謂特征是選定的一種度量,它對于一般的變形和失真保持不變或幾乎不變,并且只含盡可能少的冗余信息。特征抽取過程將輸入模式從對象空間映射到特征空間。這時,模式可用特征空間中的一個點或一個特征矢量表示。這種映射不僅壓縮了信息量,而且易于分類。在決策理論方法中,特征抽取占有重要的地位,通過分析具體識別對象決定選取何種特征。特征抽取后進行分類,即從特征空間再映射到決策空間。為此而引入鑒別函數,由特征矢量計算出相應于各類別的鑒別函數值,通過鑒別函數值的比較實行分類。
依據《建筑變形測量規程》(JGJ/T83 -2007)、《建筑基坑工程監測技術規范》(GB 50497 -2009)、《工程測量規范》(GB 50026 -2007),基坑監測主要含有水平位移監測、土體沉降監測、深層土體測斜監測和地下水位監測、周圍建筑物沉降監測等[2],不管哪種類型的監測,都是在一定周期內對監測對象進行重復測量。
根據技術設計要求,測量間隔是一天或幾天。設重復測量的數據是等時間間隔,每個監測點的觀測周期為n,周期序號為m,將觀測數據組成如下矩陣形式:

如果觀測數據存在周期性誤差,觀測數據矩陣中同列內部各測量數據差別很小,但不同列測量數據之間差別較大;如果觀測數據不存在周期性誤差,各測量數據之間的差別主要由偶然誤差因素引起。利用統計方法中的方差分析法進行特征選取,即計算各列之間數據平方和W外與同列內平方和W內,由列間平方和W外與列內平方和W內分別作統計分析,得到統計量S內和S外,在誤判概率很小的情況下,利用模式識別的分類方法,如果能將S內和S外分為兩類,說明數據矩陣中存在周期性誤差的影響。列間平方和W外與列內平方和W內統計計算公式分別為:

由列間平方和W外與列內平方和W內分別作統計分析,得到統計量S內和S外分別為:

一系列基坑觀測數據,并不知道是否受到周期性誤差的影響,但不管怎樣的結果,都只有兩種情況:一是僅受偶然誤差的影響(規范允許),二是雖然含偶然誤差但周期性誤差的影響較明顯(規范不允許),把第一種情況稱為Ⅰ類模式,第二種情況稱為Ⅱ類模式。如果經模式識別后,在一定可靠性的基礎上能將S內和S外分開,則該系列觀測數據含周期性誤差且影響較明顯,屬于Ⅱ類模式,否則,屬于Ⅰ類模式,要得到以上的結果,必須確定模式識別分類準則函數[3,4]。
(1)分類準則函數
分類準則函數反映模式類別的可分性和衡量分類方法對分類的有效性。參考選取散度JD準則,因為散度JD準則是基于貝葉斯決策理論的最大似然化判決規則,反映模式類別的可分性,散度JD的計算模型為[3,4]:

式中,P(x/ωi)、P(x/ωj)為兩類ωiωj的類概率密度;Ed為x 的值域空間;x 為特征變量,即為S內或者S外向量。
討論基坑監測數據,不管是沉降(高程)、水平位移(偏移量)等都是一維問題且特征變量為χ2分布,在自由度較大時可以近似看成正態分布,所以,將散度JD的計算模型轉化為[3,4]:
正態分布時:

兩類的協方差矩陣相等時:

式中,μi、μj為兩類模式的均值矩陣。
根據具體的實測數據確定散度JD的基準θD,基準θD的計算模型為:

式中,JD為散度,α 為F 檢驗的置信度,一般情況下α=95%。如果,則說明S內和S外可分,識別結果為該系列觀測數據含周期性誤差且影響較明顯,屬于Ⅱ類模式;如果,則說明S內和S外不可分,識別結果為該系列觀測數據不含周期性誤差,屬于Ⅰ類模式。
(2)識別結果的錯誤率
無論采用哪種分類方法,識別結果都存在誤判的情況,在利用模式識別方法對基坑監測數據進行識別和判斷后,識別結果的可靠性判斷也是非常重要的問題。識別結果的錯誤率可以近似采用如下模型進行解析計算[3,4]:

式中,JD為該條件下的散度準則。
該工程位于安徽省淮北市黎苑路以北,南湖路以東,為礦務局機關宿舍,均為7 棟Ⅰ類高層住宅。根據地質勘察報告,土質為粉質粘土;地下水位穩定在31.0 m,場地自然地面標高在32.5 m ~33.8 m之間(平均33.15 m)。基坑土方最深需下挖8.9 m,施工期間,通常應降水至基底0.5 m ~1.0 m,降水后水位標高23.25 m,降水深度7.75 m。基坑周邊設置20 個基坑沉降監測點(編號為CJ01 -CJ20),20 個土體水平位移監測點(編號為SP01 -SP20),15 個深層土體位移監測點(編號為CX01 - CX15),埋管深度為7.5 m,監測點設置如圖1所示。

圖1 測斜監測點布置圖
基坑監測項目較多,包含支護結構的沉降監測、土體水平位移監測、深層土體傾斜監測、周圍建筑沉降監測等[5,6],選取編號為CX01 深層土體位移監測點的測斜數據為例進行分析,利用模式識別模型,判斷測量數據是否含有周期性誤差,取置信度為95%,CX01 監測點觀測數據如表1所示,CX01 監測點的本期傾斜量和累計傾斜量見圖2所示。分別采用模式識別方法和F統計檢驗方法對觀測數據進行分析。

表1 土體傾斜觀測數據

圖2 位移曲線圖
(1)確定特征變量S內和S外:觀測數據組成如下矩陣后,行n=15,列m=15。

列內自由度為[m(n -1)]=182,列間自由度(m-1)=14,所以特征變量(子樣方差)S內和S外則為:

(2)散度準則JD及可靠性
計算時,母體均值和方差用子樣均值和方差來代替,則散度準則JD為:
散度JD的基準
在mathematica 軟件中計算得到:

(3)模式識別結論
用F 檢驗法對同批土體傾斜監測數據進行檢驗,統計分析檢驗分析是否含周期性誤差。子樣方差分別為:,方差小于,所以計算得到F 值為:分別服從于自由度為[m(n -1)]=182 和(m -1)=14 的χ2分布,置信度為95%,經查表,F0.05=1.0。F >F0.05,說明數據存在顯著性差異,判斷這批數據受周期性誤差影響顯著,與模式識別的結論一致。
(1)模式識別的思想和方法可以解決判斷同一對象重復多次觀測后是否受周期性誤差的影響。
(2)模式識別分類法是基于貝葉斯風險函數最小為基本思想來確定類別的,其結果的誤判概率總是最小且可以準確給出分類判別結果錯誤率。
(3)統計檢驗方法與模式識別方法解決此類問題的最大區別在于判別結論的可靠性方面。統計檢驗方法是在一定顯著水平的基礎上確定類別和計算的,是統計學上的結論,可靠程度存疑。模式識別方法依靠一定的數學模型,得到判識結果的錯誤率。文中案例,借助模式識別方法,判斷這批土體傾斜觀測數據受周期性誤差的影響顯著,且模式識別結果的錯誤率為0.0006。
(4)基坑水平位移監測數據存在周期性誤差主要是由外界因素造成的,比如天氣、溫度、基坑開挖進度、基坑周邊的地下水等對測量數據產生周期性的干擾。對存在周期性誤差的監測數據,具體應用時對數據進行判識和分析,消除誤差的影響。
[1]獨知行,靳奉祥,趙君毅.工程變形監測模型與方法[M].北京:測繪出版社,2009.
[2]GB50497 -2009.建筑基坑工程監測技術規范[S].
[3]獨知行,靳奉祥.重復測量周期性誤差的模式識別方法[J].四川測繪,1999,22(1):11 ~13.
[4]獨知行,靳奉祥,王同孝.基于散度J_D 準則的位移量顯著性模式識別方法[J].勘察科學技術,1998(6),43 ~47.
[5]李明峰,蔣輝.基坑支護結構變形監測數據的聯合處理[J].測繪通報,2003(9):48 ~55.
[6]李明峰,陳國興,安慶軍.顧及模型誤差的基坑位移監測數據處理方法[J].防災減災工程學報,2005,25(4):468 ~470.
[7]于中偉,花向紅,張偉等.廈門機場路深基坑工程變形監測與數據分析[J].測繪信息與工程,2008,33(5):22 ~24.
[8]獨知行,靳奉祥,王同孝.測繪模式識別研究的幾個問題[J].東北測繪,1998,21(2):3 ~4.