【摘要】常用分布是概率論的重要內容,通過常用分布的具體模型可以引導學生理解隨機變量的統計規律性.而現行的概率論教材,只是簡單介紹常用分布的定義、性質、應用,少有對它們產生背景的講解.針對于此,本文介紹七種常用離散型分布產生的背景.
【關鍵詞】離散型分布;背景
伯努利試驗(Bernoulli Jakob,1654~1705)是指只有兩種可能結果(A或A)的隨機試驗.例如拋擲硬幣,出現正面或反面;抽檢產品,出現合格品或不合格品.伯努利試驗獨立、重復地進行n次,稱此試驗序列為n重伯努利試驗.伯努利試驗是幾種常用離散型分布產生的基礎.
1.伯努利分布(Bernoulli distribution)
在一次伯努利試驗中,令X表示事件A發生的次數,即X=1,A發生,0,A沒發生,稱X為伯努利計數變量.若記P(A)=p,P(A)=q(p+q=1),則X的分布為0 1q p,稱為伯努利分布(又稱0-1分布或二點分布),記為X~B(1,p).
2.二項分布(binomial distribution)
在n重伯努利試驗中,令X表示事件A發生的次數,則X的分布為P(X=k)=Cknpkqn-k(k=1,2,…,n).因Cknpkqn-k是二項式(q+p)n展開式中的第k+1項,故稱為二項分布,記為X~B(n,p).易見n=1時,二項分布即是伯努利分布.
3.幾何分布(geometric distribution)
在伯努利試驗序列中,令X表示事件A首次發生時完成的試驗次數,則X的分布為P(X=k)=pqk-1(k=1,2,…).因pqk-1是幾何級數∑∞k=1pqk-1的一般項,故稱為幾何分布,記為X~Ge(p).幾何分布是一種“等待分布”,可以描述系統中第一個質點(信息、命令、故障等)出現的時刻.如網絡上某個網站第一次發出某個信息的時刻、一個電子元件第一次出現故障的時刻等.
4.帕斯卡分布(Pascal distribution)
在伯努利試驗序列中,令X表示事件A發生r次時完成的試驗次數(r為事先給定的正整數),則X的分布為P(X=k)=Cr-1k-1prqk-r(k=r,r+1,…),稱為帕斯卡(Pascal Blaise,1623~1662)分布.此分布的系數Cr-1k-1(r=1,2,…;k=r,r+1,…)與“帕斯卡三角”(即“楊輝三角”或“賈憲三角”,是數字組成的三角形陣列,它呈現了二項式展開式各項系數的規律)相對應.為紀念這位著名的數學家,稱此分布為帕斯卡分布.帕斯卡分布也是一種“等待分布”,可以描述系統中第r個質點出現的時刻.易見r=1時,帕斯卡分布即是幾何分布Ge(p).
5.負二項分布(negative binomial distribution)
在伯努利試驗序列中,試驗進行到事件A發生r次時停止,這時事件A沒發生的試驗次數X的分布為P(X=i)=Cr-1i+r-1prqi(i=0,1,2,…)(*),稱為負二項分布,記為X~Nb(r,p).由負指數二項展開式(1-x)-r=∑∞i=0Ci-r(-x)i=∑∞i=0Cii+r-1xi=∑∞i=0Cr-1i+r-1xi,令x=1-p,可得p-r=∑∞i=0Cr-1i+r-1qi,則證得∑∞i=0P(X=i)=∑∞i=0Cr-1i+r-1prqi=1,即(*)式是隨機變量X的概率分布.因利用負指數二項展開式證得,故稱為負二項分布.容易看出,負二項分布與帕斯卡分布既有聯系又有區別,在很多概率教材中,把它們稱為一種分布,筆者認為有所不妥.負二項分布常用于描述生物群聚性,醫學上用來描述傳染性或非獨立性疾病的分布和致病生物的分布.
6.泊松分布(Poisson distribution)
若隨機變量X的概率分布為P(X=k)=λkk!e-λ,k=0,1,2,…,稱為泊松分布,記為X~P(λ).泊松分布是泊松(Poisson SiméonDenis,1781~1840)在《關于刑事案件和民事案件審判概率的研究》(Recherches sur la probabilité des jugements en matière criminelle et en matièrecivile,1837)著作中提出的.泊松研究了服從二項分布的隨機變量序列Xn~B(n,pn)(n=1,2,…)在附加約束條件limn→∞npn=λ>0(λ為常數)之下的極限狀態,發現n→∞時,Cknpkn(1-pn)n-k→λkk!e-λ,即泊松定理(二項分布的泊松近似).社會生活中的很多現象可以用泊松流來描述,如網站在一段時間內收到的點擊數、電話交換臺收到的呼喚數、交通樞紐的客流和車流、放射性分裂等,所以泊松分布的應用非常廣泛.
7.超幾何分布(hypergeometric distribution)
設有N個產品,其中有M個不合格品.從中不放回的隨機抽取n個,則其中含有的不合格品的個數X的概率分布為P(X=k)=CkMCn-kN-MCnN(k=0,1,…,r;r=min{M,n}).因∑∞k=0CkMCn-kN-MCnN是超幾何級數,故稱為超幾何分布,記為X~H(n,N,M).若試驗采用放回抽樣方式,則X的概率分布為P(X=k)=CknMNk1-MNn-k,即二項分布.所以在產品檢驗中,用超幾何分布描述不放回抽樣的情況,用二項分布描述放回抽樣的情況.容易理解,當N(產品總數)充分大時,不放回抽樣與放回抽樣是差不多的.即X~H(n,M,N),則N→∞時,Xa~Bn,MN.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文