黃時浩 潘鐵柱



摘 要:針對木結構承重設計時難以直接獲取或測量批次木材密度的問題,提出了一種抽取批次木材試樣的迭代加權最小二乘估計總樣本密度的方法。設計了試樣密度的頻數統計方法,計算了樣本密度的期望平均估計,選取了具有無偏估計性質的期望平均估計作為初始均值,并設計了權系數為樣本密度的頻數與估計誤差距離的倒數之乘積。通過批次木材抽取的樣本數據,對比了木結構質量實際測量與基于總樣本密度估計的木結構質量計算結果,驗證了總樣本密度估計方法的可行性,其具有對期望平均估計微調至最優和迭代任意收斂的性質。
關鍵詞:木材密度;加權最小二乘法;批次采樣;參數估計式
中圖分類號:TH113 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2016.16.081
木材密度的測定一般依據《木材密度測定方法》(GB/T 1933—2009)標準實施,但該標準中未涉及一批木材如何由抽取試樣密度估計該批木材總樣本密度的方法,且也沒有相關文獻解決此問題。由于木材密度離散性較大、測量誤差非常小,傳統的回歸分析方法不適用于上述需求,因此,由該批木材制作木結構的質量估算準確性會受到很大的影響。
在密度估計中,算術平均值估計量是全納偽估計量。算術平均值估計量即最小二乘估計量或正態分布的極大似然估計量,是建立在所有觀測值只含偶然誤差基礎上的一種估計方法。如果觀測值中含有較大離散分布值,這種估計由于是按平均分配誤差原則來處理數據的,會導致估計結果納偽。
中位數估計又可定名為“和極大似然估計”,由于它是根據隨機變量概率事件之和為最大而導出未知參數估計式的,具有徹底的抗差性,觀測值的較大離散分布或粗差都不會對估計結果產生影響。但由于具有徹底的排他性,進而使中位數估計排除了所有的多余觀測,因此,帶來了全棄真的估計性質,屬于徹底的抗差估計方法。
在有限樣本容量的條件下,上述2種平均估計均為有偏估計,中位數估計可以克服密度分布離散度大的情況而算數平均無法克服。期望平均估計因考慮了樣本密度出現頻數(概率密度的離散數據統計結果),估計具有既不納偽,也不棄真的估計性質,即在有限樣本容量的條件下此平均估計為無偏估計。
本文基于木材批次隨機抽取試樣,采集各試樣的體積、質量等批次數據,計算密度的期望平均估計,再通過加權最小二乘迭代估計批次密度,通過多組批次采樣數據與方法估計得到一批木材總樣本的密度,通過實際測量與估計結果對比加以驗證,證明了該方法的有效性和準確性。
1 迭代加權最小二乘估計方法設計
1.1 木材各試樣密度的計算方法
由一批木材隨機抽取試樣(需要具有代表性,樣本的數量應占總樣本的25%以上,且不少于20個),按照GB/T 1933—2009中的標準測量出各試樣的體積Vi和質量gi(i為試樣的序號,i=1,2,…,n)。
第八步,判斷|σk2-σk-12|≤δ(δ為設定的閾值)。如果不滿足條件,則轉入第二步繼續加權最小二乘迭代估計計算;如果
滿足條件,則結束并輸出密度估計值 .
本木材密度測定方法的運算流程如圖1所示。
2 木材密度估計試驗設計與方法驗證
2.1 木材密度測量樣本數據采集
由一批木材抽取的樣本如表1所示。
表1中,樣本測量值如圖2中的a,密度如圖2中的b分布。
2.2 試樣密度的頻數統計
由表1中的樣本密度值可確定出密度區間為[0.19,0.31],由經驗公式m≈[1.85×(n-1)0.4)]可確定出所需劃分的區間為6個。因此,則落入各小區間的樣本密度個數如表2所示,其直方圖如圖3所示。
2.3 試樣密度的期望平均估計
由式(2)可計算出密度的期望平均估計 =0.256 40 g/cm3。
2.4 試樣密度的迭代加權最小二乘估計
按照圖1中的迭代加權最小二乘估計運算流程可計算出密度的迭代加權最小二乘估計, =0.255 17 g/cm3。
2.5 本方法的結果分析
根據表1的數據,常用估計方法的密度估計結果如表3所示。
由表3可以看出,本方法的密度估計方差最小即均優于其他估計方法。此批桐木條(曾有資料顯示,桐木密度為0.2~0.4 g/cm3)制作的木結構用本方法估計出的木材結構總質量為6.14 g,經實際測量的結構總質量為6.08 g,實測結果如圖4所示。計算
出的結構總質量符合實際總質量,也是上述估計方法中最符合實際結構質量的。
3 結束語
本方法采用的期望平均估計方法和迭代加權最小二乘法在測量平差領域均有廣泛應用,但這兩種方法都是針對測量值存在等精度和非等精度測量誤差的情況下得出的較為準確的估計結果,未考慮因樣本存在較大離散度而導致測量誤差較小的情況。
迭代加權最小二乘法的權系數通常取方差倒數,使均方誤差和達到最小,或根據對象的特點取信噪比、可信度等作為權系數。此類權系數的取法均不適用于離散度較大,但測量誤差較小、離散度呈現準正態分布的木材密度樣本;迭代加權最小二乘法的初始均值通常取算術平均估計值或最小二乘法估計值。由于估計值在有限樣本下具有的性質,迭代過程常存在發散現象。
本方法以有限樣本下具有無偏估計性質的期望平均估計作為初始均值估計值,以迭代加權最小二乘法進行回歸估計微調,權系數取樣本密度頻數與誤差距離倒數的乘積(兼顧了樣本的出現概率和對樣本的估計效果,符合木材密度樣本離散度較大、密度較小的樣本的出現概率小、樣本容量有限的特點),可以任意收斂到設定的門限閾值內,不出現發散現象,能較準確地反映出總體樣本的密度。
綜上所述,在本文提出的迭代加權最小二乘估計方法中,初始均值取具有無偏估計性質的期望平均估計,且權系數取樣本密度的頻數與估計誤差距離的倒數之乘積,具有對期望平均估計微調至最優和迭代任意收斂的性質,上述為本文的技術創新所在。
參考文獻
[1]孫燕良,張厚江.木材密度檢測方法研究現狀與發展[J].森林工程,2011,27(01).
[2]程永生,湯兵勇.基于數據點重要性差異的最小二乘加權法[J].東華大學學報(自然科學版),2006,32(06).
[3]黃杰.正態分布三個特殊隨機模型及適用范圍——兼論算術平均值是有偏估計[J].桂林工學院學報,2000,20(04).
[4]楊波.加權最小二乘估計中加權系數的確定[J].現代電子技術,2002(12).
〔編輯:張思楠〕