李化云,范洪海,胡 端
(1.西華大學建筑與土木工程學院,四川成都610039;2.西華大學綠色建筑與節能重點實驗室,四川成都610039;3.中國港灣工程有限公司,北京100027;4.西南交通大學交通隧道工程教育部重點實驗室,四川成都610031)
巖土小樣本參數區間估計方法探討
李化云1,2,范洪海3,胡 端4
(1.西華大學建筑與土木工程學院,四川成都610039;2.西華大學綠色建筑與節能重點實驗室,四川成都610039;3.中國港灣工程有限公司,北京100027;4.西南交通大學交通隧道工程教育部重點實驗室,四川成都610031)
巖土參數分布區間的計算是可靠度分析方法中的一項基礎性工作。在實際工程中,受采樣數量的限制,巖土參數多為小樣本。在探討3σ法則、考慮偏度的分布區間修正法以及非參數Bootstrap法等現有的巖土小樣本參數區間估計方法的適用情形及存在的不足的基礎上,結合巖土工程參數區間估計的特點,提出了一種適用于小樣本巖土參數區間估計的改進灰自助法。算例表明,在不同的參數分布情形及樣本數量下,改進方法優于已有方法。
巖土工程;小樣本;參數;區間估計
近年來,以可靠度分析方法為代表的不確定分析方法在巖土工程領域得到快速發展。巖土參數分布區間的計算是可靠度分析方法中的一項基礎性工作,但由于取樣數目受試驗周期、難度以及費用等因素的限制,通常僅能獲取少量的樣本。通過小樣本合理地確定巖土參數分布區間,對發展和完善可靠度分析方法體系有著重要意義[1-5]。為此,研究者們發展了多種方法,如將正態分布中著名的3σ法則用于巖土參數分布區間估計,該方法是以巖土參數服從正態分布為前提的,而實際中的巖土參數常常并不滿足正態分布,而且該方法沒有考慮實際分布具有一定偏度的特點;宮鳳強和黃天朗等[6]提出了一種考慮偏度的分布區間修正法,在一定程度上改善了3σ法的不足;駱飛等[7]則將對領域區間進行擴展的改進非參數Bootstrap法用于求解參數分布區間,但當樣本容量過小時,其擴展范圍是很有限的;此外,還有諸如t分布等理論概率方法也被用于確定巖土參數分布區間。一般來說,在巖土工程中,實測巖土參數分布區間[xmin,xmax]應包含在估計區間[a,b]內,而上述方法所得結果常常并不滿足,且目前仍然缺乏有效的方法確定區間[a,b]的上下限。
鑒于目前該問題研究存在的不足,本文將灰自助法用于確定巖土參數分布區間,并針對巖土參數的特征,對灰自助法進行了改進,提出了巖土參數區間估計的改進灰自助法。
1.1 正態分布(3σ法)
該方法以巖土參數服從正態分布為前提,通過正態分布中常用的3σ法則確定a,b,即

(1)
式中,u為均值,σ為方差。
理論上,若參數服從正態分布,則該方法的置信概率為99.74%,即參數取值分布在該區間的概率為99.74%。然而,大量的統計結果表明,巖土參數并非都服從于正態分布,如有學者認為粘聚力和內摩擦角服從對數正態分布。此外,理論正態分布的概率密度曲線具有分布對稱的特征,巖土參數的實際分布卻具有一定的偏度,且直接采用式(1)計算可能會得出負值,這與巖土參數物理意義不符。
1.2 考慮偏度的分布區間修正法
為避免經典的3σ法不能考慮偏度的不足,宮鳳強等提出了一種考慮偏度的分布區間修正法,其計算式如下

(2)
式中,c表示偏度,且當u-(3-c)σ<0或u-3σ<0,取a=0。該方法所得估值區間比式(1)要大。筆者認為,雖然該方法考慮了偏度的影響,但其仍然更適合于正態分布情形。
1.3 Bootstrap法
已經證明,Bootstrap法是處理小樣本數據的一種行之有效的手段。其中,非參數Bootstrap法已被用來解決巖土參數區間估計問題。該方法實質上是將小樣本數據通過放回抽樣等擴展為大樣本數據。標準的非參數Bootstrap法完全通過放回抽樣對樣本進行擴展,從而完成區間估值。因而得到的分布區間[a,b]往往包含在[xmin,xmax]之內,這顯然不能直接用于巖土工程中的區間估計問題。駱飛等[7]通過改進的非參數Bootstrap法完成對分布區間的擴展,一定程度上避免了上述不足,但當樣本容量很少時,其擴散范圍是很有限的。
由于標準的非參數Bootstrap法完全通過放回抽樣,對樣本進行擴展從而完成區間估值。自助樣本完全由原樣本產生,當已知樣本容量較小時,自助樣本與已知樣本極為相似,得到的結果偏離真實分布,存在較大的誤差。本文給出一種簡單的改進非參數Bootstrap法。
設試驗所得巖土參數數據為x1,x2,…,xn(已將參數升序排序)。按下式對抽樣數據進行擴展
xs=xi+rand(xi+1-xi)
(3)
式中,i=1,2,…,n-1。式(3)實質上是對經驗分布函數進行插值。按式(3)進行抽樣,得到1個Bootstrap樣本,重復多次,即可得到多個Bootstrap樣本。
對每個Bootstrap樣本進行升序排序,通過灰色預測模型得到每個Bootstrap樣本的下1個預測值xn+1,該預測值可以看作是對Bootstrap樣本的右區間的延伸。同理,對每個Bootstrap樣本降序排序,通過灰色預測模型又可以得到1個預測值x0,將該預測值視為Bootstrap樣本的左區間的延伸。由此可以完成對每個Bootstrap樣本的區間邊界的擴展。值得說明的是,該擴展方法是建立在灰色預測模型對小樣本數據良好的適應性之上的,能夠避免人為主觀進行擴展的不足。灰色模型的建立與求解描述如下[8-9]:
對每個Bootstrap樣本進行累加生成并按均值生成法構造背景值,即
(4)
式中,Y為x1,x2,…,xi相加的和,Z為背景值函數。
建立白化方程

(5)

[ab]T=(BTB)-1BTA
(6)
從而可得到式(5)的時間響應序列解為

(7)
通過累減還原的方法可以得到預測值。
將m個Bootstrap樣本右區間延伸值的集合記為{xn+1(i)}(i=1,2,…,m);左區間延伸值的集合記為{x0(i)}(i=1,2,…,m)。考慮到在巖土工程中,實測巖土參數分布區間[xmin,xmax]應包含在估計區間[a,b]之內,按如下方式確定估計區間:
(1)右邊界。判斷xn+1(i)與xmax的大小,取出{xn+1(i)}中所有大于等于xmax的元素,組成1個新集合{xnew(i)},取新集合元素的平均值作為b的估計。
(2)左邊界。判斷x0(i)與xmin的大小,取出{x0(i)}中所有小于等于xmin的元素,組成1個新集合{xnew1(i)},取新集合元素的平均值作為a的估計。
3.1 不同分布情況下的參數區間估計
分別比較在正態分布、對數正態分布、威布爾分布、貝塔分布、均勻分布情況下幾種方法的區間估計效果。取孔隙比、液限、粘聚力、酸蝕巖體強度、塑限等5個巖土參數的實測數據作為區間估計的樣本。孔隙比的樣本容量為26個,滿足正態分布,各實測值分別為0.802、0.964、1.041、1.057、1.105、1.185、1.195、1.206、1.215、1.224、1.227、1.244、1.246、1.263、1.278、1.297、1.325、1.328、1.343、1.390、1.394、1.454、1.492、1.537、1.641、1.699;液限的樣本容量為26個,滿足對數正態分布,各實測值分別為36.9%、37.2%、37.9%、42.1%、44.7%、45.2%、47.2%、47.3%、48.5%、48.5%、48.5%、48.5%、48.6%、48.7%、51.0%、52.0%、52.6%、53.5%、53.8%、55.3%、56.0%、56.0%、57.5%、58.9%、66.5%、69.5%;粘聚力的樣本容量為21個,滿足貝塔分布,各實測值分別為7.2、8.8、9.1、9.2、9.2、10.8、12.3、12.3、12.8、15.4、15.4、16.0、16.4、16.9、16.9、16.9、17.6、19.1、20.0、21.6 kPa和23.1 kPa;酸蝕巖體強度的樣本容量為19個,滿足威布爾分布,各實測值分別為134、153、119、156、122、146、107、120、114、128、148、141、142、147、130、92、167、113 MPa和127 MPa;塑限的樣本容量為23個,滿足均勻分布,各實測值分別為18.9%、19.4%、20.8%、20.8%、21.3%、21.6%、22.1%、22.6%、22.9%、23.3%、23.3%、24.1%、24.4%、25.2%、25.5%、25.5%、26.1%、26.5%、27.5%、28.2%、28.3%、28.4%、28.7%。分別應用本文方法、3σ法以及考慮偏度的分布區間修正法對數據進行參數區間估計,所得結果見表1。為了進行直觀對比,圖1給出了各種方法的計算上下限和實測參數的上下限的對比。由表1和圖1可知,通常情況下,3σ法則和考慮偏度的分布區間修正法得到的估計區間大于實測參數區間,且這2種方法得到的估計區間差別不大。相比之下,本文方法得到的估計區間略大于實測參數分布區間而又小于其他2種方法所得的估計區間。此外,在正態分布情形下,3σ法及考慮偏度的分布區間修正法得到的估值區間較實測參數區間差別不大,但當處于其他幾種分布情形下時,這2種方法得到的估值區間都較實測區間有較大差距,尤其是在貝塔分布情形下,這2種方法的計算結果較實測參數上下限差別最大。相比之下,本文的方法無論在哪種情形下的計算結果都能與實測參數較為保持一致。
3.2 不同樣本數量的參數區間估計
為了檢驗幾種方法在不同樣本數量的參數區間估計時的應用效果,分別取不同數量的巖土參數內摩擦角正切值實測數據。組1的樣本容量為25個,各實測值分別為0.21、0.25、0.24、0.18、0.20、0.23、0.22、0.24、0.23、0.28、0.29、0.31、0.38、0.38、0.48、0.41、0.46、0.49、0.42、0.36、0.32、0.38、0.37、0.37、0.52;組2的樣本容量為42個,各實測值分別為1.14、1.19、1.06、1.80、1.48、1.48、1.55、0.94、0.68、0.78、1.44、1.30、0.76、1.00、0.88、0.58、0.87、1.12、0.59、0.51、0.63、0.80、0.87、1.01、0.80、0.73、0.70、1.06、0.80、0.79、0.67、1.10、0.60、1.02、0.65、0.52、0.85、0.38、0.81、0.38、0.60、0.63;組3的樣本容量為63個,各實測值分別為0.38、0.48、0.41、0.43、0.46、0.37、0.34、0.46、0.33、0.42、0.46、0.44、0.31、0.43、0.37、0.30、0.38、0.44、0.42、0.37、0.39、0.42、0.41、0.41、0.41、0.42、0.45、0.34、0.41、0.39、0.39、0.42、0.36、0.35、0.42、0.40、0.49、0.43、0.41、0.41、0.38、0.41、0.38、0.52、0.39、0.44、0.42、0.37、0.39、0.43、0.42、0.44、0.51、0.48、0.44、0.39、0.52、0.51、0.49、0.43、0.42、0.58、0.51。幾種方法的計算結果見表2。由表2可以看出,本文方法計算結果介于真實參數區間和其他2種方法的計算結果之間。
劉恒等[10]指出,對于小樣本區間估計的優劣應該以區間位置和區間寬度來衡量,區間位置由區間界限表征,區間寬度由區間上下界差的絕對值表征,且區間寬度越小,表明估計方法越有效。按照這2項指標的定義,本文方法估計出來的區間在各種分布類型以及樣本數量下顯然優于3σ法以及考慮偏度的分布區間修正法。結合巖土工程中的實際情況得出的估計區間應該包含實測巖土參數分布區間[xmin,xmax]。本文改進方法結合該要求對原有的灰自助法進行了一定的改進,通過對灰色模型的預測步長進行調整,避免了原有灰色自助法得出的估計區間不滿足巖土工程要求的不足,該方法的建立不借助于統計理論,理論上能適應各種分布類型的數據。

表1 計算結果

圖1 計算結果對比

表2 計算結果
通過研究比較現有的多種小樣本巖土參數區間估計方法,指出已有方法存在的不足,并提出了一種適用于小樣本巖土參數區間估計的改進灰自助法,得出以下結論:
(1)在現有巖土參數區間估計方法中,3σ法通常只適用于正態分布情形,雖然考慮偏度的分布區間修正法對該方法進行了一定改進,但仍然更適用于正態分布情況,且多數情況下,這2種方法估計區間很接近。
(2)結合巖土工程的實際要求,即估計區間應該包含實測巖土參數分布區間[xmin,xmax],對灰自助法中的灰色預測步長自動調整,從而避免估計區間不包含實測巖土參數分布區間[xmin,xmax]的不足。
(3)從文中算例可以看出,無論是在何種分布以及樣本數量下,改進方法估計的區間始終優于3σ法以及考慮偏度的分布區間修正法。
[1]宮鳳強, 黃天朗, 李夕兵. 巖土抗剪強度參數的最優概率分布函數推斷方法[J]. 巖土工程學報, 2016, 38(z2): 204- 209.
[2]宮鳳強, 黃天朗, 李夕兵. 巖土參數最優概率分布推斷方法及判別準則的研究[J]. 巖石力學與工程學報, 2016, 35(12): 2452- 2460.
[3]宮鳳強, 侯尚騫, 李夕兵. 巖土參數截尾分布的正態信息擴散推斷方法[J]. 武漢大學學報: 工學版, 2016, 49(5): 661- 673.
[4]孟慶山, 雷學文. 土工參數的統計方法及其工程應用[J]. 武漢冶金科技大學學報, 1999, 22(4): 414- 417.
[5]姜立春, 杜衛衛. 受酸腐蝕巖體強度分布特征研究[J]. 昆明理工大學學報: 理工版, 2010, 35(4): 6- 10.
[6]宮鳳強, 黃天朗, 李夕兵. 巖土參數最優概率分布推斷方法及判別準則的研究[J]. 巖石力學與工程學報, 2016, 35(12): 2452- 2460.
[7]駱飛, 羅 強, 蔣良濰, 等. 小樣本巖土參數的Bootstrap估計及邊坡穩定分析[J]. 巖石力學與工程學報, 2017, 36(2): 370- 379.
[8]劉義, 王國玉, 柯宏發.一種基于灰色距離測度的小樣本數據區間估計方法[J]. 系統工程與電子技術, 2008, 30(1): 116- 119.
[9]沈展鵬, 肖世富, 劉信恩, 等. 基于小樣本信息的區間邊界估計方法研究[J]. 應用力學學報, 2012, 29(6): 692- 698.
[10]劉恒, 梅衛, 單甘霖. 小樣本數據的三種區間估計方法性能分析[J]. 系統工程與電子技術, 2014, 36(10): 1929- 1933.
(責任編輯 楊 健)
Discussion on Interval Estimation Method for Small Sample Parameters of Rock and Soil
LI Huayun1,2, FAN Honghai3, HU Duan4
(1. School of Architecture and Civil Engineering, Xihua University, Chengdu 610039, Sichuan, China;2. Key Laboratory of Green Building and Energy Saving, Xihua University, Chengdu 610039, Sichuan, China;3. Chinese Harbour Engineering, Beijing 100027, China; 4. Key Laboratory of Transportation Tunnel Engineering of Ministry of Education, Southwest Jiaotong University, Chengdu 610031, Sichuan, China)
The calculation of the distribution range of geotechnical parameters is a fundamental work in reliability analysis method. In actual project, as the number of samples is limited, the geotechnical parameters are mostly small sample. By comparing existing geotechnical parameter interval estimation methods of small sample (3σlaws, considering of skewness distribution range correction method and non-parametric Bootstrap method), the application and the deficiencies of above three methods is discussed. By combining the characteristics of interval estimation of geotechnical parameters, an improved gray self-help method is proposed for interval estimation of geotechnical parameters. The results show that the improved method is superior to existing method by comparing the distributions of different parameters and the number of samples.
geotechnical engineering; small sample; parameter; interval estimation
2017- 05- 31
國家青年科學基金項目(51608450);西華大學綠色建筑與節能重點實驗室開放基金項目(szjj2015- 075)
李化云(1982—),男,江西吉安人,講師,博士,主要從事巖土及地下工程研究.
TU43
A
0559- 9342(2017)08- 0044- 04