河南質量工程職業學院基礎教學部 趙曉艷
在介紹泊松分布之前,我們先介紹二項分布。泊松分布符合二項分布前提條件,是在二項分布基礎上的一種特殊分布。
二項分布適合的類型:二項分布適用伯努利概型,即隨機事件A只有兩種結果,要么發生,要么不發生。如果我們假設事件A發生的概率為p,那么不發生的概率就是1-p。生活中比較典型的例子,比如投籃球、扔一枚硬幣、彩票中獎、射擊目標等,這些例子都是比較典型的伯努利概型。比如射擊,對于一個人來說,在某段時間內射擊水平穩定,每射擊一次,命中的概率為p,未命中的概率就是1-p。又比如一個人在某段時間內投籃球命中率也是固定的,假設命中率是百分之六十,那么未命中的概率就是百分之四十。下面我們給出伯努利概率的具體定義。
n重伯努利試驗:獨立重復進行n次伯努利試驗,這一獨立重復試驗序列為n重伯努利試驗。
伯努利定理:假設獨立重復進行n次試驗,在一次試驗中,事件A發生的概率為p,在n重伯努利試驗中,事件A發生K次概率為
下面介紹伯努利概型前提下的幾種分布。兩點分布:當隨機變量X取值只有兩個,假設為對應的概率為其中,如果則隨機變量X服從參數為p的兩點分布,記為用式子表示為則依此公式可列出隨機變量X的分布,也可以用表格,表格更加簡單明了,學生更容易理解運用。有一種特殊情況,如果這時,隨機變量X的分布稱為0-1分布,容易看出,0-1分布是二項分布的一種特殊情況,它符合二項分布的所有特征,包括前提條件等。現實生活中,比如投籃球、射擊等,就是非常典型的兩點分布,也是0-1分布。比如射擊,我們可以把命中記為未命中記為如果命中概率為百分之七十,那么未命中概率就是百分之三十,如果看作0-1分布的話,令即可。下面我們來介紹二項分布,此試驗獨立重復進行n次,假設事件A發生的概率為p,記隨機變量X為n次獨立重復試驗中事件A發生的次數,當隨機變量X所有可能取值為0、1….n,則隨機變量X的分布用式子可以表示為:若隨機變量X分布列為此形式,則稱隨機變量X服從參數為np的二項分布,記為當然,也可用表格形式表示。此分布稱為二項分布,因其表達式和中學里的二項式定理展開式非常類似,因此叫作二項分布。當二項分布中隨機變量X取值只有兩個時,二項分布即為兩點分布。由此我們可得:兩點分布是二項分布的特例,而0-1分布又是兩點分布的特例。
二項分布中當n非常大,但是同時事件A發生的概率p又非常小時,此時用二項分布中求概率公式已經很難求出其值,例如,因為n很大,p很小時,導致展開式非常難計算,有時候必須借助計算機才可以計算最終結果,這時候我們引入泊松分布,泊松分布在離散型分布中具有非常重要的意義,例如在一個醫院中,每個病人來看病都是隨機并獨立的概率,則該醫院一天(或者其他特定時間段,如一小時、一周等等)接納的病人總數可以看作是一個服從poisson分布的隨機變量。但是為什么可以這樣處理呢?最好的解釋方法是從poisson的兩種不同定義上著手。Poisson分布的第一個定義泊松分布:假設隨機變量X的分布為:,其中則稱隨機變量X服從參數為 的泊松分布,記為這個定義就是我們平時考試或者理論工作時用的poisson隨機變量的定義。
泊松定理:在n重伯努利試驗中,事件A在一次試驗中發生的概率為p,我們取則對任意確定非負整數k,有注意Poisson還有一個知名度比較小的第二個定義,或者說是Poisson Process定義:假定一個事件在一段時間內隨機發生,且符合以下條件:(1)將該時間段無限分隔成若干個小的時間段,在這個接近于零的小時間段里,該事件發生一次的概率與這個極小時間段的長度成正比。 (2)在每一個極小時間段內,該事件發生兩次及以上的概率恒等于零。(3)該事件在不同的小時間段里,發生與否相互獨立。 則該事件稱為poisson process。這個第二定義就更加利于大家理解了,回到醫院的例子之中,如果我們把一天分成24個小時,或者24×60分鐘,或者24×3600秒。時間分得越短,這個時間段里來病人的概率就越?。ū热玑t院在正午12點到正午12點又一毫秒之間來病人的概率是不是很接近于零?)。條件一符合,如果我們把時間分得很細很細,條件二也符合。條件三的要求比較苛刻,應用到實際例子中就是說病人們來醫院的概率必須是相互獨立的,如果不是,則不能看作是poisson分布。問題是為什么現實生活中的情況(如醫院例子)會服從poisson分布的第一定義?現在有了第二定義作為橋梁,應該就很容易理解了。現實生活中的例子中如果事件相互獨立,那么它就是符合poisson分布的第二定義的。而從poisson第二定義到poisson第一定義之間是有嚴格的數學證明的。因為泊松分布在實際生活應用中有廣泛的現實背景和意義,比較典型的例子有在某一個紅綠燈路口發生交通事故的件數、一個紗線廠紗線在某一段時間內出現的斷頭數、某縣年齡在100歲以上居民人口數、火山在某時間段內噴發次數等等,這些例子都有一個共同特征,那就是這些事件都是稀有事件,發生次數服從或者近似服從泊松分布。所謂稀有事件,即為每次試驗中事件發生的概率非常小,如洪水、火山噴發、地震、工廠出現次品乃至銀行印鈔機印出錯鈔都屬于此事件,這種情況一般都是n很大,p很小,這時候雖然試驗都符合伯努利概型,也可以用二項分布概率公式求出,但是出現一個很難解決的問題:大部分概率利用此公式計算起來都非常困難,這時候二項分布可以近似為泊松分布,利用泊松分布概率分布表,即可求出概率。
接下來我們看一個例子:設某保險公司的某人壽險種有2000人投保,每個人在一年內死亡的概率為0.002,且每個人在一年內是否死亡相互獨立,試求在未來一年這2000人中死亡人數不超過8人的概率。此問題屬于伯努利概型,符合二項分布,且從題中可以看出,n=2000,p=0.002,我們先用二項分布解決這個問題:如果利用二項分布公式計算,需要計算8個式子,況且每一個式子都需要計算機才能計算出結果,但同時我們發現此案例中,n很大,p很小,np=4,符合泊松分布,因此我們轉換思路,利用泊松分布計算。我們假設2000個投保人在一年內死亡人數為X,則2000個投保人在一年內死亡人數不超過8人的概率為:由此可得2000個投保人在一年內死亡人數不超過8人概率為0.9781,非常接近百分之百,由此結果我們可以看出,雖然投保人達到2000人,但是因為概率非常小,最后得到一年內死亡人數不超過8人幾乎是絕對的,由此保險公司可制定出適宜的政策,從而獲得最大收益。
本文主要講了泊松分布的幾點重要的說明。首先介紹0-1分布和兩點分布,給出了具體形式和適用前提條件,然后引出二項分布,通過分析我們得出0-1分布是兩點分布的特例,兩點分布是二項分布的特例,進而我們又通過二項分布引出泊松分布,給出了泊松分布的背景和研究意義,又得出二項分布可視為泊松分布的條件,并且給出在此條件下為何二項分布可視為泊松分布。同時我們又給出讀者典型案例,說明泊松分布在計算中的重要性,最后給出本文小結。
[1]盛驟 謝式千等.概率論與數理統計[M].北京:高等教育出版社,2008:P71.
[2]陳希孺.概率論與數理統計[M].北京:中國科學技術出版社,2017:P68.
[3]謝壽才.概率論與數理統計[M].北京:中國人民大學出版社,2014:P89.
[4]程依明等.概率論與數理統計教程[M].北京:高等教育出版社,2008:P56.
[5]張幗奮.概率論數理統計與隨機過程[M].浙江:浙江大學出版社,2005:P120.