李寶娜 朱 平
(洛陽師范學院數學科學學院 河南·洛陽 471934)
概率論與數理統計是研究自然界中隨機現象數量規律性的一門學科,最早產生于17世紀中葉的賭博行為,并以此發展起來。概率論是研究隨機現象的統計規律性,而數理統計研究如何從樣本分布估計總體分布.大多數的概率統計教材中,概率論最后一個章節便是大數定律和中心極限定理,中心極限定理表達的是確定在什么條件下,大量隨機變量之和的分布逼近于正態分布??梢赃@樣說,正因為有了這類定理,自然界的許多符合正態分布的隨機現象有了堅實的理論基礎。
中心極限定理(Central Limit Theorems)是概率論中論證隨機變量和的極限分布為正態分布的定理的總稱。中心極限定理的教學安排在隨機變量、分布函數等內容之后,抽樣分布、假設檢驗等統計學內容之前,從這個意義上來看,中心極限定理是概率論和數理統計兩部分的銜接,起著承上啟下的作用;從內容上來說,中心極限定理的數學表達具有抽象性,理論性較強,短時間內理解起來比較困難。如果從純理論角度來講解會加大學習的難度;從學情分析,概率論與數理統計為專業基礎課,數學院的學生主要在大二上學期學習.對于步入大學的第二年,有一定的學習能力和專業基礎,對大學學習和生活已經基本適應,學習積極性比較高,但是學習方法掌握的不夠多,學習深度不夠強,尤其是對于理論性較強的缺乏實踐認知。
本文立足內容難度和學情分析,先從生活中的現象講起,實驗模擬,引出中心極限定理表達內容,最后通過具體事例闡明中心極限定理的應用.將抽象的內容更加形象化和具體化,開闊了學生的視野,緩解了學生的畏難情緒,從而達到良好的教學效果。
生活中,我們會有這樣一個經驗性認知:中間狀態是事物的常態,過高和過低都屬于少數.也就是我們數學中的正態分布所描述的現象,比如人群的身高、壽命、血壓、考試成績、測量誤差、員工回家所需要的時間、某城市的耗電量等等,都符合正態分布.我們不僅要問一句:為什么?
在回答問題之前,我們先利用python進行模擬實驗:
2.1.1 數據生成
假設我們現在在觀察一個人擲均勻的骰子,得出的結果1-6的概率都是相同的1/6,他擲了20000次?,F在我們來模擬下擲骰子的結果:
生成出來的平均值:3.49525
生成出來的標準差:1.6982866181831617
由于骰子點數服從均勻分布,平均值接近3.5符合理論值。
2.1.2 畫圖
生成的數據用直方圖畫出來如下:
2.1.3 抽樣
接下來隨便抽取一組數據,例如,從生成的數據中隨機抽取10個數字.這10個數的結果是:[6 1 2 1 4 3 1 3 1 6]
生成出來的平均值:2.8
生成出來的標準差:1.8867962264113207
可以看到,只抽取少量樣本的時候,樣本的平均值(2.8)會距離總體的平均值(3.5)偏差較大。
2.1.4 中心極限定理的體現
現在我們抽取20,200,2000,20000 組,每組50個.每組的平均值都計算出來,直方圖如圖1。
我們看到投擲20000個骰子點數的平均值符合概率理論結果,當觀察每組50的平均值時我們發現抽樣次數比較少時,平均值的分布沒有規律,但隨著抽樣的增加,取2000組甚至更多時,可以看到平均值的分布近似為正態分布,基本符合大多數為中間狀態(3.5附近),靠近1和6的可能性明顯很低。
由上述的實驗可以看到,隨著抽樣的增加,極限分布趨近于正態分布。這便是中心極限定理所表達內容。由于中心極限定理是一類描述和的極限分布為正態分布的定理,我們接下來主要介紹常見的三個中心極限定理。


圖1


定理三(棣莫弗-拉普拉斯(De Moivre-Laplace)定理)設隨機變量服從參數為n,p(0<p<1)的二項分布,那么對于任意的x即有

設有100個年齡為x歲且相互獨立的被保險人都投保了保險金額為10元的終身壽險,隨機變量剩余壽命T的概率密度。保險金于被保險人死亡時進行給付,保險金給付是從某基金中按照利息強度支付。計算這項基金在最初的數額至少是多少時,才能保證從這項基金中足以支付每個被保險人的死亡給付的概率達到95%?
由于對每個被保險人都有



所以,該基金在最初時至少為449.35元,比收取的躉繳純保費總額400元多出49.35元。
中心極限定理為一類定理的統稱。中心極限定理表明,在較為一般的條件下,當獨立隨機變量的個數不斷的增加時,和隨機變量的分布趨近于正態分布。一方面,中心極限定理可以解釋為什么正態分布在生活中很常見;另一方面,中心極限定理是大樣本統計推斷的理論基礎。不管是從名稱來源、教學地位還是教學內容,中心極限定理都占有重要的位置。本文突出從形象易懂擲骰子的例子出發引導學生理解中心極限定理所表達的含義,通過圖示直觀感受,并以實際保險為練習強化對中心極限定理的理解和應用,以期學生能夠對中心極限定理有更加全面、準確的認識。