馬少龍
超幾何分布與二項分布模型是人教版選修2—3概率問題的重要模型,教材通過實例,要讓學生認識模型所刻畫的隨機變量的共同特點,并能運用兩個模型解決一些實際問題。然而在教學過程中卻經常發現學生不能準確辨別是何種概率模型,根源在于學生不能準確地理解概念,超幾何分布和二項分布雖然有著密切的聯系,但也有明顯的區別,事實上,在超幾何分布模型上只要稍作改變,超幾何分布就可能變為二項分布。其中超幾何分布必須同時滿足兩個條件:一是抽取的產品不再放回;二是產品數目為有限個,當這兩個條件中任何一個發生改變,則不再是超幾何分布,下面結合例題對這類問題作闡述。
一、準確理解概念
超幾何分布的概念是:一般的,在含有M件次品的N件產品中,任取n件,其中恰有X件次品,則P(X=k)=,k=0,1,2,…,m,其中m=minM,n,且n≤N,M≤N,n,M,N∈N?鄢,如果隨機變量X的分布列具有上述形式,則稱隨機變量X服從超幾何分布。而二項分布的概念為:一般的,在n次獨立重復試驗中,設每次試驗中事件A發生的概率為p,用X表示事件A發生的次數,則P(X=k)=Cknpk(1-p)n-k,k=0,1,2,…,n,如果隨機變量X的分布列具有上述形式,則稱隨機變量X服從二項分布。
由以上概念可知,超幾何分布與二項分布模型的最主要區別是有放回抽樣還是無放回抽樣,一般來說,有放回抽樣與無放回抽樣計算的概率是不一樣的,學生在解題時要仔細閱讀題意,不要濫用公式。
二、注意超幾何分布和二項分布的區別
例1:(1)袋中有大小相同的8個白球、2個黑球,有放回的從中隨機地連續抽取3次,每次取1個球。求取到黑球的次數X的分布列;
(2)袋中有大小相同的8個白球、2個黑球,從中隨機地取3個球。求取到黑球的個數Y的分布列。
分析:(1)有放回抽樣時,每次抽取時的總體沒有改變,因而每次抽到某物的概率都是相同的,可以看成是獨立重復試驗,此種抽樣是二項分布模型,取到的黑球次數X可能的取值為0,1,2,3。又由于每次取到黑球的概率均為,3次取球可以看成3次獨立重復試驗,則X~B3。
例2:某農場計劃種植某種新作物,為此對這種作物的兩個品種(分別稱為品種甲和品種乙)進行田間試驗。現在在總共8小塊地中,隨機選4小塊地種植品種甲,另外4小塊種植品種乙。種植完成后隨機選出4塊地,其中種植品種甲的小地塊的數量記為X,求X的分布列與數學期望。
分析:本題容易錯誤的得到X服從二項分布,即X~B(4,)。錯誤的根源在于每塊地種植甲或種植乙不是相互獨立的,它們之間相互制約,無論怎樣種植都要保證8塊地中有4塊種植甲,4塊種植乙,事實上X是服從超幾何分布。若將例2改為:在8塊地中,每塊地要么種植甲,要么種植乙,那么在選出的4塊地中種植甲的數量為ξ,則ξ服從二項分布,即ξ~B(4,)。二項分布模型和超幾何分布模型最主要的區別在于是有放回抽樣還是不放回抽樣。所以,在解有關二項分布和超幾何分布問題時,要仔細閱讀、辨析題目條件。
三、注意超幾何分布和二項分布的聯系
事實上,超幾何分布和二項分布有著密切的聯系,樣本個數越大,超幾何分布和二項分布的對應概率相差越小,也就是說:樣本數量較大時,不放回抽樣與放回抽樣的差別不大,一般認為是獨立重復試驗。
例3:隨機觀測生產某種零件的某特大型工廠的25名工人日加工零件數(單位:件),獲得數據如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36。
(1)確定樣本頻率分布表中n1,n2,f1和f2的值;
(2)根據上述頻率分布表,畫出樣本頻率分布直方圖;
(3)根據樣本頻率分布直方圖,求在該廠任取4人,至少有1人的日加工零件數落在區間(30,35]的概率.
分析:(3)題意是:“某特大型工廠”,即工人很多,根據樣本頻率分布表,每人的日加工零件數落在區間(30,35]的概率為■,設所取的4人中,日加工零件數落在區間(30,35]的人數為隨機變量ξ,則ξ~B(4,),故4人中,至少有1人的日加工零件數落在區間(30,35]的概率為:P(ξ≥1)=1-P(ξ=0)=1-1-4=1-0.4096=0.5904。
所以4人中,至少有人的日加工零件數落在區間(30,35]的概率約為0.5904。
點評:當總體的容量非常大時,超幾何分布近似于二項分布。所以,在處理超幾何分布與二項分布相關問題時一定要仔細閱讀題目,辨析概念,準確區分。
(作者單位:廣東省汕頭市實驗學校)