宮 雷, 許世蒙, 李春洋, 杜建華, 馬潤波
(1. 裝甲兵工程學院基礎部, 北京 100072; 2. 裝甲兵工程學院技術保障工程系, 北京 100072; 3. 裝甲兵工程學院科研部, 北京 100072)
基于雙層Bayes分析的3維編織復合材料彈道侵徹異常點檢驗
宮 雷1, 許世蒙1, 李春洋2, 杜建華3, 馬潤波1
(1. 裝甲兵工程學院基礎部, 北京 100072; 2. 裝甲兵工程學院技術保障工程系, 北京 100072; 3. 裝甲兵工程學院科研部, 北京 100072)
在3維編織復合材料的彈道侵徹測試數據異常點檢驗中,將仿真數據作為試驗數據的先驗信息,采用Bayes方法檢驗模型形式和參數:應用2步估計方法推導出關鍵參數的后驗分布,應用小概率判別法檢驗出異常點。數據統計分析結果表明:綜合仿真數據與試驗數據提供的信息,采用雙層Bayes分析法檢驗異常點是行之有效的。
異常點;雙層Bayes分析;3維編織復合材料;先驗分布
3維編織復合材料彈道侵徹測試數據分析中的異常點是指與數據集的主體存在一定偏差的點[1],如果這些異常點被忽視或處置不當,將會影響分析結果的準確性和有效性,甚至得到與實際情況嚴重不符的結果。傳統彈道測試數據異常點的診斷主要采用基于統計、基于偏移、基于距離、基于密度等方法[2-3],但在小樣本、非重尾情況下,某些測量值與異常點表現非常類似,判斷其是小概率事件還是較大概率事件,是常態還是偶發態,是正常點還是異常點等,很多問題亟待解決。
通過現代仿真技術可較為真實地描述系統的運行、演變及其發展過程,生成的仿真數據可作為試驗數據的先驗信息。而Bayes方法可充分利用先驗信息,并綜合樣本信息進行Bayes統計推斷[4]。本文將Bayes分析引入異常點判別中,將仿真數據作為試驗數據的先驗信息,并與試驗數據有機結合,以此來檢驗試驗數據中是否存在異常點,為3維編織復合材料的彈道侵徹測試數據異常點分析提供了一種使用少量試驗數據便可高精度判別異常點的方法。
1.1 異常點產生的原因
應用Bayes方法檢驗異常點時,產生異常點主要有如下3個原因。
1) 模型使用不當導致的數據異常。此處的模型使用不當是指數據分析時模型形式的選擇不當。數學模型是用字母、數字及其他數學符號建立起來的等式或不等式,以及圖表、圖像、框圖等描述客觀事物的特征及其內在聯系的數學結構表達式[4],如線性模型、指數模型、非參數模型等。實踐中,由于人們對現實問題理解的偏差和對數學知識的誤用,應用模型時都會或多或少、直接或間接地導致數據表現異常。
2) 先驗分布應用錯誤導致的數據異常。原則上講,任何分布都可作為未知參數的先驗分布[5],但無論選用何種先驗分布,最后都要看Bayes統計推斷的效果。最常用的參數先驗分布是無信息先驗分布與共軛先驗分布,其中:無信息先驗分布基于同等無知原則;共軛先驗分布的優點是未知參數的先驗分布與后驗分布屬于同一分布族。在實際應用中,選取先驗分布時應對所考察的事件有較為透徹的了解,這樣才能使確定的先驗分布更符合實際需求。若無信息先驗分布選擇不正確,會導致先驗信息運用不當,進而浪費對目標已有的正確認識;應用共軛先驗分布常犯的錯誤是過于重視計算的方便性而忽略先驗的合理性[5-6]。
3) 模型中參數使用錯誤導致的數據異常。參數估計的核心是根據樣本估計總體分布的未知參數。在新材料研發中,由于試驗條件等因素的限制,有關新材料的數據嚴重缺失,需要應用仿真數據來估計模型參數,而這些參數是否適用于試驗數據模型還需要進一步驗證。
1.2 檢驗步驟
利用雙層Bayes方法檢驗3維編織復合材料試驗數據中異常點的步驟如下。
1) 模型形式檢驗。設試驗數據集為(Y,X)。仿真數據分析表明Y與X間的關系服從某一經驗模型,但該模型是否適用于試驗數據,還需進一步分析。采用Bayes方法檢驗模型的思路是:求出每個數據點適用于仿真數據模型的后驗概率,若后驗概率很小的數據點足夠多,則認為該模型不適用于試驗數據[5]。實踐中多采用比較分析法,即首先以試驗數據為樣本點導出其模型形式,并與經驗模型形式相比較,若二者形式一致,則不需要重新建模,進入步驟2);否則,重新分析機理,進一步了解研究對象的性質,修正經驗模型。
2) 先驗分布確定。由于模型參數多且相互關聯,參數先驗分布的確定較為困難,且即使能得出參數的先驗分布,某些參數的先驗分布對實際問題的作用也不大,因此確定參數先驗分布時,應首先從實際問題出發,選擇關鍵參數,然后再確定其先驗分布。Box等[6]提出了確定參數先驗分布的最佳方法:首先,主觀估計出參數先驗分布的幾個分位數;然后,選擇合適的先驗分布密度形式,并依據極大似然法計算超參數。
3) 模型參數確定。在Bayes決策問題中,表示未知參數點估計的決策函數稱為未知參數的Bayes估計,其與損失函數密切相關:若已知未知參數的先驗分布,則Bayes估計在平方損失下,為其后驗分布的均值;在絕對損失下,為其后驗分布的中位數;在0-1損失下,為其后驗極大似然估計[7]。
采用Bayes方法檢驗異常點的流程如圖1所示。

圖1 Bayes方法檢驗異常點的流程
2.1 試驗設計與測試結果
試驗[8]采用的纖維材料為荷蘭Tarpon 1000型、對位芳族聚酞胺纖維長絲束合股,基體為熱固性環氧樹脂,采用縱橫陣列編織機進行織造;發射采用7.62 mm步槍標準彈,56式彈道發射槍;用2組錫箔作計時觸發器,共測試13組子彈的入射速度與剩余速度,結果如表1所示。

表1 3維編織復合材料彈道侵徹試驗入射速度與剩余速度的測試結果 m/s
2.2 異常點分析
2.2.1 模型形式
練軍[8]在考察3維編織復合材料細觀結構的基礎上,建立了與3維編織復合材料具有相同纖維體積的單向板細觀模型,通過精細化標準細觀結構模型與細觀結構模型的彈道侵徹破壞過程的有限元分析,揭示了3維編織復合材料在彈道沖擊下的破壞模式,計算出彈體貫穿靶體后的剩余速度,這些仿真數據可信度高,對判斷試驗數據中的異常點極具借鑒意義。仿真數據分析表明:3維編織復合材料彈道侵徹試驗中,剩余速度與入射速度應呈線性關系。
圖2為3維編織復合材料彈道侵徹試驗數據中剩余速度對入射速度的散點圖。

圖2 3維編織復合材料彈道侵徹試驗中剩余速度對入射速度散點圖
由圖2可以看出:剩余速度與入射速度的線性關系顯著,且剩余速度隨著入射速度的增大而增大。此判斷與仿真數據分析結果一致,因此,在3維編織復合材料彈道侵徹試驗數據分析中可不改變模型形式,將采用一元線性回歸模型來刻畫剩余速度與入射速度的關系,即
Y=βX+ε,
(1)
式中:Y為剩余速度;X為入射速度;ε~N(μ0,σ02),為誤差。
2.2.2 參數先驗分布

1) Δβi近似服從正態分布,即Δβi~N(μ,σ2),其中:μ、σ2均未知,且相互獨立。
2)μ在1.134附近取值的概率大,μmin=0,但接近0的概率極小,μ的概率密度函數為鐘形曲線。
由此可認為:μ的先驗分布π(μ)為正態分布,即π(μ)~N(μ1,σ12)。根據3-σ法則,設1.134-3σ1=0,可得σ1=0.378,則π(μ)~N(1.134,0.3782)。
2.2.3 模型參數的Bayes估計
在試驗數據中,Δβ=X~N(μ,σ2),即

采用2步估計法估計模型參數。


(2)
2) 估計μ。未知參數μ的先驗分布為π(μ|σ2)~N(μ1,σ12),根據文獻[4],在方差已知的前提下,若正態總體均值的先驗分布為正態分布,則在平方損失、絕對損失、0-1損失下,未知參數Bayes估計μB均為后驗均值[13-15], 即

(3)
2.2.4 異常點檢驗
3維編織復合材料彈道侵徹試驗中剩余速度對入射速度的變化率如表2所示。

表2 3維編織復合材料彈道侵徹試驗中剩余速度對入射速度的變化率

|P{μ<3.40}-P{μ0≥3.40}|=0.94,
|P{μ<3.00}-P{μ0≥3.00}|=0.87,
|P{μ<0.03}-P{μ0≥0.03}|=0.71,
|P{μ<2.90}-P{μ0≥2.90}|=0.85,
由此可知:2、4、9號數據點可懷疑為異常點;8號數據點雖然不超過顯著性水平0.85,但由于顯著性水平較高,也是值得關注的數據點,實踐中可結合其他方法來復檢其異常性;其余數據點均為非異常點。
1) 雙層Bayes方法在檢驗模型形式和參數時均采用Bayes方法,將仿真數據處理為先驗信息,有效實現了仿真數據與試驗數據的信息融合,從而通過少量試驗數據便可挖掘出更多信息,且具有很好的精度。
2) 試驗設計時不應采用入射速度相差不大的數據點;否則,易導致Δβi偏大,從而將由樣本數據的隨機性產生的數據點誤判為異常點。
3) 采用數據點的變化率來檢驗異常點,會存在1個數據異常點帶動其前后2個非異常點顯示異常的情況,因此,應用雙層Bayes方法檢驗異常點時應考慮與其他方法相結合。
4) 為了更好地探索3維編織復合材料彈道侵徹數據的規律性,應結合試驗設計來研究異常點的分析方法。
[1]HawkinsD.IdentificationofOutliers[M].London:ChapmanandHall, 1980:1-58.
[2]BarnettV,LewisT.OutliersinStatisticalData[M].NewYork:JohnWiley, 1994:72-134.
[3]VelascoF,VelmaP.ImportanceofSleeknessandKurtosisStatisticalTestsforOutlierDetectionandEliminationinEvaluationofGeochemicalReferenceMaterials[J].MathematicalGeology, 1998, 30(1): 109-128.
[4]MeerschaertMM.數學建模方法與分析[M].劉來福,楊淳,黃海洋,譯. 北京:機械工業出版社, 2007:1-24.
[5] 茆詩松,王靜龍,濮曉龍.高等數理統計[M].北京:高等教育出版社, 2006:307-391.
[6]BoxGEP,TiaoGC.ABayesianApproachtoSomeOutlierProblems[J].Biometrika,1988, 55(3):119-129.
[7]BergerJO.統計決策論及貝葉斯分析[M].賈乃光,譯.北京:中國統計出版社, 2006:59-128.
[8] 練軍.三維編織復合材料彈道侵徹的數值模擬[D].上海:東華大學, 2006.
[9] 陳玲. 線性模型中參數型經驗Bayes估計若干問題研究[D].合肥:中國科學技術大學,2011.
[10] 宮雷,許世蒙,杜建華,等. 3維編織復合材料彈道測試數據的異常點分析[J]. 裝甲兵工程學院學報,2014,28(5):94-97.
[11] 韋來生,張偉平.貝葉斯分析[M].合肥:中國科學技術大學出版社, 2013:33-80.
[12] 丁曉,韋來生. 雙指數分布位置參數的經驗Bayes估計問題[J]. 數學雜志,2005,33(4):413-420.
[13] 楊亞寧.正態分布參數的經驗Bayes檢驗[J].中國科學技術大學學報,1992,22(1):12-21.
[14] 劉榮玄,朱少平. 正態模型刻度參數的經驗貝葉斯估計的漸近性[J]. 統計與決策,2009, 18(17):158-160.
[15] 仇麗莎,韋來生. 正態總體均值和誤差方差同時的經驗Bayes估計[J].中國科學院大學學報,2013,30(4):454-461.
(責任編輯: 王生鳳)
Outliers Test of 3D Braided Composite’s Ballistic Data Based on Double Bayesian Analysis
GONG Lei1, XU Shi-meng1, LI Chun-yang2, DU Jian-hua3, MA Run-bo1
(1. Department of Fundamental Courses, Academy of Armored Force Engineering, Beijing 100072, China; 2. Department of Technical Support Engineering, Academy of Armored Force Engineering, Beijing 100072, China; 3. Department of Science Research, Academy of Armored Force Engineering, Beijing 100072, China)
In the outliers test of 3D braided composite’s ballistic penetration test data, taking the simulation data as the prior of experimental data, Bayes method is adopted in the test of model and parameters, the method of two-step estimation is used to deduce posterior distribution of key parameter, and the outliers is examined by the little probability discriminant method. The data statistical analysis result shows that it is an effective method to test the outliers with the double Bayesian analysis method using the information provided by simulation data and experimental data.
outlier; double Bayesian analysis; 3D braided composite; prior distribution
1672-1497(2015)04-0107-04
2015-04-07
國家自然科學基金資助項目(51001117); 北京自然科學基金資助項目(3132024)
宮 雷(1980-),男,講師,碩士。
O21
A
10.3969/j.issn.1672-1497.2015.04.022