王炳章
(煙臺大學 數學與信息科學學院,山東 煙臺264005)
超幾何分布是概率論中的一種典型的離散型分布,文獻中有較多的討論[1-3].本文將要研究的是教材中極少涉及的負超幾何分布.在無放回抽樣模型中,設n為產品總數而m為其中的次品數,則取到第r個次品時的抽取次數Xr的分布為
(1)
其中分布參數r;m,n都是正整數且滿足1≤r≤m 于是,在有放回抽樣中,取到第r個次品時的抽取次數即服從上述的帕斯卡分布(此時參數p=m/n). 文[6]中討論的分布是本文(1)式當r=m時的特殊情況. 與帕斯卡分布類似,負超幾何隨機變量顯然有一種通常的逐段分解方法.文[7]中利用負超幾何隨機變量的一種特殊的伯努利變量(0-1變量)分解法,算出了負超幾何分布的期望與方差.但文[7]中給出的負超幾何分布的形式比較復雜,不便導出其多維聯合分布.本文首先討論多個負超幾何分布變量的聯合分布及若干推論,最后利用聯合分布的這些推論結合負超幾何隨機變量的通常的分解方法計算了負超幾何分布的期望和方差. 設X1,X2,…,Xr分別為第1次、第2次、…、第r次取到次品時的抽取次數. 定理1設1≤i (2) 證利用文[8]中的不盡相異元素的排列模式,來確定m個次品的位置. 類似可以得到任意有限維的多維分布,從略. 推論1隨機向量(X1,X2,…,Xr)的聯合分布為 進一步,令 Y1=X1,Y2=X2-X1,Y3=X3-X2,…,Yr=Xr-Xr-1, (3) 從而得到負超幾何變量Xr的通常的逐段分解式: Xr=Y1+Y2+…+Yr. (4) 每一段的變量Yi(1≤i≤r)是等待一個新的次品出現所需要進行的抽取次數,即是從第i-1個次品出現后到第i個次品出現所需要進行的抽取次數. 推論2隨機向量(Y1,Y2,…,Yr)的聯合分布為 證因為P(Y1=l1,Y2=l2,…,Yr=lr)=P(X1=l1,X2=l1+l2,…,Xr=l1+l2+…+lr), 由此根據推論1可看出欲證之式的正確性. 可以看出隨機向量(Y1,Y2,…,Yr)的多維分布形式上是對稱的. 推論3隨機向量(Y1,Y2,…,Yr)的每個分量Yi(1≤i≤r)的分布為 (5) 即Y1,Y2,…,Yr服從相同的負超幾何分布NH(1;m,n). 證利用引理1,根據求邊緣分布的公式得 類似地,取r=2可得如下推論4. 推論4隨機向量(Y1,Y2,…,Yr)的任何兩個分量Yi,Yj(1≤i,j≤r)的聯合分布為 (6) 定理2設隨機變量Y服從負超幾何分布NH(1;m,n), 則 證由Y~NH(1;m,n)得 有 故 進而有 E[(n+1-Y)(n+2-Y)] 即 于是有 因此 上式化簡即可得到定理中D(Y)的表達式.定理2證畢. 結合推論3,對于i=1,2,…r, 有 (7) 定理3隨機向量(Y1,Y2,…,Yr)的任何兩個分量Yi,Yj(1≤i (8) 證利用推論4中Yi,Yj的聯合分布,有 將(7)中第一式E(Yj)=E(Y)=(n+1)/(m+1)代入得 于是有 進而可求得 定理4對于(1)式中服從負超幾何分布NH(r,m,n)的隨機變量Xr,其數學期望和方差分別為 (9) 證利用負超幾何變量Xr的分解式(4),有 例1某工廠的7件產品中有4件廢品.作不放回抽樣,設X為抽到第3件廢品時的抽取次數.求X的數學期望和方差. 解 法一由(1)式得X的概率分布如下 P(X=3)=8/70, P(X=4)=18/70, P(X=5)=24/70, P(X=6)=20/70, 故 EX=(3·8+4·18+5·24+6·20)/70=4.8, 法二由題意知X~NH(r,m,n), 取n=7,m=4,r=3,代入(9)式得EX=4.8,D(X)=0.96. 直接計算的結果與本文理論結果完全一致. 注1 在總數為n而廢品數為m的箱中作不放回抽樣.抽取次數為r時抽到的廢品數服從超幾何分布H(r,m,n); 而取得r個廢品時的抽取次數服從負超幾何分布NH(r,m,n). 負超幾何分布是不放回抽樣模型中的一種等待時間分布,對其性質和數字特征的研究理論上具有重要意義,同時在統計推斷中也具有一定的應用價值.本文首先給出了負超幾何變量的聯合分布,然后結合負超幾何變量的一種自然的分解法,計算得出了負超幾何分布的數學期望和方差.在教學過程中,適當的穿插類似這樣的素材,對提高學生的創新能力有著積極的作用. 致謝感謝相關文獻對本文的啟發以及審稿專家提出的寶貴意見.2 負超幾何變量的聯合分布及若干推論




3 負超幾何分布的期望與方差

DX=(32·8+42·18+52·24+62·20)/70-4.82=0.96.
4 結 論