鄧世容 石躍勇
摘 要 本文以概率論與數理統計課程中的兩個典型問題(復雜難求概率的估計、非正態 總體的假設檢驗)為例,給出了基于蒙特卡洛方法的解答過程。并用統計模擬驗證了提出的方法的可行性及有效性。
關鍵詞 蒙特卡洛方法 概率 統計
中圖分類號:G424 文獻標識碼:A DOI:10.16400/j.cnki.kjdks.2018.01.050
Applications of Monte Carlo Method in Teaching of
Probability and Mathematical Statistics
DENG Shirong[1], SHI Yueyong[2]
([1] School of Mathematics and Statistics, Wuhan University, Wuhan, Hubei 430072;
[2]School of Economics and Management, China University of Geosciences, Wuhan, Hubei 430074)
Abstract In this paper, the Monte Carlo Method for the two classical problems (probability estimation and hypothesis testing for non-normal population) in Probability and Mathematical Statistics is described. Simulations are developed to verify the feasibility and effectiveness of the proposed method.
Keywords Monte Carlo Method; probability; statistics
概率論與數理統計是一門主要研究隨機現象的統計規律性的學科,廣泛應用于社會生活的各個學科中。[1]在其教學過程中,理論知識的講述是根本,同時也應該引導學生學習運用理論知識分析實際應用問題。在實際問題分析的過程中,利用統計軟件得到的數據、圖表的等可以幫助學生對問題有更全面直觀的理解,同時也可以培養學生的學習興趣與實踐經驗。因此,在課程引入統計軟件的簡單運用是必要的,并且會是對概率論與數理統計教學的一大改進。
R軟件是一種完全免費共享的統計軟件(http://www.r-project.org),它提供了豐富的統計軟件包,可以非常方便靈活地分析數據,深受統計學家們的喜愛。 [2]R在Windows、Mac、Linux系統下都可以安裝使用,并且掌握起來很容易,學生在概率統計課程中學習使用R軟件,有助于更好地理解理論問題,提高學習興趣。
蒙特卡洛方法,也稱為統計模擬方法,是二十世紀四十年代中期由于電子計算機的發明及科學技術的發展,而被提出的一種以概率統計理論為指導非常重要的數值計算方法。蒙特卡洛方法通過構造符合一定規則的隨機數來解決數學上的各種問題。當所求解問題是某種隨機事件出現的概率或者是某個隨機變量的期望值時,蒙特卡洛方法通過隨機模擬的方法用這個事件出現的頻率估計這一隨機事件的概率,或者得到這個隨機變量的某些數字特征,并將其作為問題的解。
在概率論與數理統計的傳統教學中,一般并未討論下面的兩類問題。一類是要計算的概率涉及到不能用初等函數表示出來的積分時,所求概率最終是求不出來的;另一類是非正態總體的假設檢驗問題,難點在于在非正態總體下檢驗統計量的分布不好確定。針對這兩類實際應用中會存在的這兩類問題,我們提出了用蒙特卡洛方法來解答,并通過模擬驗證了我們提出方法的可行性及合理性。為這兩類問題給出了簡單直觀的解答方式,為概率論與數理統計的教學提供了更為豐富的資料。
1 概率的估計
例1 考慮(0,1)區間上均勻分布且獨立的隨機變量和,求概率。
解:本題的求解的常規方法就是求二重積分,但是無法用初等函數表示出來,[3] 因此寫不出具體的結果。下面我們給出蒙特卡洛方法的具體過程:
1)隨機生成個隨機點,即和是(0,1)上均勻分布的隨機數;
2)計算個點中滿足條件的點的個數,記為;
3)當,所求概率近似等于頻率。
將上述步驟編寫成R模擬程序(程序名:Calpro.R)如下:
Calpro<-function(n){
k<-0;x<-runif(n);y<-runif(n)
for(i in 1:n){
if (y[i]<=exp(-x[i]^2))
k<-k+1
}
k/n
}
調用Calpro.R函數,取不同的,重復運行1000次,取平均值()作為最終結果,并且得到這1000次估計的樣本標準差(),結果見表1:
由表1可知,當不斷增大并且趨于無窮時,所求概率逐漸穩定在常數0.7468附近,且估計的標準差也越來越小,說明我們所要求的概率=0.7468。
2 非正態總體的假設檢驗
例2 假設樣本獨立同分布于非正態總體,其期望為 ,方差為 2。在實際應用中,有時需檢驗如下的假設:
。
解: 想要對上述假設做檢驗,首先要找到一個合適的統計量,對于非正態總體, 通常的分布形式很難寫出,因此無法得到基于這個統計量的檢驗拒絕域。
下面我們利用蒙特卡洛方法給出基于這個統計量的檢驗方法:
1)生成個服從的隨機數,計算統計量的值,記為;
2)將步驟1)重復次,得到;
3)將從小到大順序排列,得到;
4)對于給定的顯著性水平 ,定義的上 分布點為,其中表示不超過的最大整數;[4]
5)對于假設構造拒絕域,再根據樣本觀測值判定檢驗結果。
我們以為例[5],取,用上述方法得到了其上 分位點。由中心極限定理知,依分布收斂于,則的近似上 分位點,其中為標準正態分布的上 分位點。按照上述過程編寫程序,并運行1000次,得到的平均值及樣本標準差(), 另外還得到了的平均值。表2中給出了 =0.025和0.05的模擬結果,其他值的結果也可得到(由于篇幅限制,這里并未給出)。
從表2可知,上述蒙特卡洛方法得到的統計量的上 分位點與由中心極限定理得到的上 分位點是可比的,并且當樣本量增加,蒙特卡洛方法重復的次數增加時,這兩個分位點的差距變小,且標準差也變小,說明結果更穩定。充分說明提出的蒙特卡洛方法可以得到合理的分位點,進而得到準確的假設檢驗的結論。
本文以概率論與數理統計中常規方法求解不出來的概率的估計以及非正態總體的假設檢驗問題,提出利用蒙特卡洛方法來求解,用R軟件編程模擬驗證所述方法是可行的。這些例子可作為教學示例演示給學生,會使得課程內容更加豐富;同時也可以激發學生的學習熱情,自主學習用統計軟件分析理論知識,真正做到理論與實踐的完美結合。
*通訊作者:鄧世容
基金項目: 武漢大學教學改革研究項目(QYW201409);中央高校教改基金項目(G1320311745)
參考文獻
[1] 劉祿勤,王文祥,龔曉慶.概率論與數理統計(第二版).北京:高等教育出版社,2011.
[2] 薛毅,陳立萍.統計建模與R軟件.北京:清華大學出版社,2007.
[3] 華東師范大學數學系.數學分析(上冊),北京:高等教育出版社,2000.
[4] 楊自強.你也需要蒙特卡羅方法——一個得心應手的工具[J].數理統計與管理,2007.26(1):178-188.
[5] 張幗奮,丁寧.一種非對稱拉普拉斯分布[J].浙江大學學報(理學版),2014.41(6):650-653.