摘 要:針對爆破振動速度回歸分析中穩健回歸分析作用被高估產生疑問,以最小二乘回歸和穩健回歸和兩種方法在爆破振動速度公式參數確定中的應用對比為研究對象,首先介紹了回歸分析中特異值的分類和在回歸分析前如何用帽子值、權重對觀測數據進行分析,并在此分析結果基礎上選擇最小二乘和穩健回歸的依據。
關鍵詞:最小二乘回歸;穩健回歸;爆破振速;帽子值;權重
1引言:
對于爆破振動分析,各國如美國、日本等提出了基于大量爆破觀測數據統計分析出的振速計算公式。其中最為經典在國內實際應用較多的還是前蘇聯薩道夫斯基提出的計算公式: (1),其中Q為炸藥量,kg;R為炸源至測點間距離,m;m為藥量指數,m= 或 ,《爆破安全規程》(GB6722—2003) 推薦m取 ;K,α為與爆破點地形,地質條件有關的系數和衰減指數。Q,R都可以根據爆破計劃得出準確數據,而K,α取值《爆破安全規程》都只有推薦范圍,帶有很大的經驗性和主觀性,此時對公式進行回歸分析,根據已經得到爆破振速監測數據,得出符合現場條件K,α值,指導后續爆破設計施工很有必要。
回歸分析最常用的是最小二乘回歸,其最大缺點就是抗異常值干擾能力太低,也就是異常值的出現就有可能破壞回歸分析的準確性,針對這一點 “穩健”回歸分析被提了出來,此法在巖石力學 ,煤炭開采 地震振動 等 領域有著廣泛應用。但在爆破領域對“穩健”這一概念似乎有些過于拔高 ,穩健回歸在有些情況下效果并不如最小二乘有效簡便。本文就爆破振動數據分析中如何選用回歸分析提出一些意見。
2最小二乘回歸分析(OLS回歸)與穩健回歸分析特點
2.1最小二乘回歸分析及其特點
線性回歸方程 ,OLS回歸就是使殘差平方和最小即 ,將OLS回歸應用到求解爆破振動公式(1)中參數K,α:
①將公式(1)線性化,兩邊取對數: ,令
,則(1)變成:
② (2)
③(2)式成立的必要條件: 即
整理得: (3)
④令D= ,
若D≠0則(3)有唯一解即: , ,再由變量代換關系,求得 ,
線性模型的經典統計推論基于如下幾個誤差項的假定:
① y與x之間的關系為線性關系。也就是說,在給定x值的情況下,ε的期望值為0, 。②在所有x值下,誤差項的方差恒定, 。③誤差項 相互獨立, ,其中i≠j。
2.2穩健回歸
當我們面對特異值束手無策時,也就是說它們不能被重新編碼,也無法通過進行形式變換或在模型中納入新因素的方式得到處理時,穩健回歸就是OLS回歸之外的合適選擇。很多穩健回歸的共同目標都是提供不受特異值或偏態殘差分布影響的無偏估計。一個文件估計量必須滿足兩個條件:①數據的微小改動,將不會造成估計的劇烈變化;②在各種條件下估計都有高度的效率。
3 OLS估計及穩健回歸分析選擇
3.1特異值類型
為了更好理解特異值如何對估計量產生影響,首先將特異值進行分類:①回歸特異值:X值處于主體正常數據取值范圍內,而Y值與主體數據相差很遠的值,回歸特異值顯著特點就是殘差大,但是殘差大并不會影響回歸直線斜率估計,也就是它并不會影響回歸直線趨勢,而只是將回歸直線平行拉向自己。②“好”杠桿點,一個特異點如果X值離主體平均值越遠,則杠桿效應越明顯,但卻不一定對回歸直線的影響越明顯,因為如果此時Y值也異常且恰好落在回歸直線周圍,那么此異常對回歸結果還會產生有利影響,這種情況仍采用OLS估計才顯明智。③“壞”杠桿點,XY值均異常,且會回歸直線斜率改變,使其偏向自己。
3.2回歸特異值的探測
①帽子值 : ,指示了對應第i個案例的X值偏離整體X均值的大小,它只能指示杠桿效應,帽子值與其他數據差別較大的值應引起關注,此值有可能是“壞”的杠桿點。
②權重 :穩健回歸時每個觀察值都會被賦予不同的權重 ,它表示每個值的異常程度,權重越小則表示觀察案例越異常。
4穩健回歸M-估計簡介
4.1M-估計
最小二乘回歸時是最小化殘差平方和。穩健回歸M估計最小化一個遞增效率較低的殘差函數之和:
(4), 為引入的目標函數,目的是給分布尾部越靠外的觀測值的權重越小,常用 估計目標方程:
,其中 ,c通常取1.345。相應賦予每個觀察案例的權重為 (5)
為了使(4)中的 具有尺度不變性,引入尺度參數 ,中位絕對離差(MAD)常用,MAD常被用來計算尺度測量S,定義 ,得到S估計 。
(4)式應用到解析薩道夫斯基公式參數: (6)
要使(5)式成立等價于: ,即 (7)
5結論
⑴有“壞”杠桿效應異常值存在情況下,由于最小二乘回歸賦予每個觀測值相同權重,無法消除異常值的影響,使得回歸模型與正常觀測值間的誤差較大。而穩健回歸分析則通過賦予異常值較小權重減小異常值影響,得到回歸模型準確性增大。⑵在有異常值存在但為“好”杠桿效應點時,應該最好選擇最小二乘回歸分析,此法正是通過賦予異常值與正常值相同權重,恰好將通過此異常點反應的實際工況考慮進了回歸模型,此異常值并不會對回歸直線斜率產生太影響,但降低了估計的標準誤差,因為它擴大了估計的x范圍。
參考文獻
[1] GB6722-2003, 爆破安全規程[S].
[2] 張耀平,曹平,董隴軍.巖石抗剪強度計算的穩健回歸模型及其應用[J]. 科技導報,2010,28(7):92-95.
[3] 周莉. 巖土抗剪強度參數模糊穩健回歸分析[J]. 黑龍江科技學院學報,2007,17(2):90-93.
[4] 郭廣禮,李逢春,張連貴. 綜放開采地表移動參數的穩健回歸分析[J]. 測繪通報,2011,10(3):22-24.
[5] 楊馬陵,曲延軍,王海濤,溫和平. 地震前兆數據的穩健回歸與建模[J]. 西北地震學報,1999,21(4):399-406.
[6]武永猛,史秀志,唐禮忠,黃 敏. 爆破振動速度衰減公式的穩健回歸分析[J].爆破,2012,29(4):122-126.
[7]WOLFGANG HARDLE. Robust Regression Function Estimation[J]. JOURNAL OF MULTIVARIATE ANALYSIS,1984,14:169-180.
[8]M.C.PINAR. Duality in Robust Linear Regression Using Huber's M-Estimator[J]. Pergamon,1997,10(4):65-70.
作者簡介:張鳴(1987-),男,四川攀枝花人,碩士研究生,從事隧道及地下工程爆破方面的研究工作.