[摘要]小概率事件原理是概率論中實用價值較高、應用泛圍較廣的基本理論,本文從實際生活的典型事例出發,運用該原理來分析解決此類問題,從而揭示獨立重復隨機試驗中,小概率事件發生的必然性。
[關鍵詞]概率統計 小概率事件 假設檢驗 應用
一、問題的提出
在概率統計中,為了研究隨機現象,必須計算種種隨機事件的概率,由于隨機現象的多樣性,我們不得不研究各種數學模型,并對每一種模型進行具體分析。
問題(萬峰湖魚數量):假設從萬峰湖里捕了1000條魚,系上紅線后,放回去,過了一段時間后,又捕了1000條魚,現在其中5條魚系著紅線,試估計湖中魚的總數。
此問題可用不退還抽樣的概率公式求其估計值。我們將重點探討如何利用小概率事件檢驗關于湖中魚的個數的假設。
二、小概率事件的認識
一小概率事件,不管其概率是多么小,其值總是一個確定的正數。該事件隨著試驗次數的不斷增加,遲早會發生的概率趨近于1。事實上,假如在某個隨機試驗中,事件A的概率為
P(A)=ε,ε是一個充分小的正數,則不論ε如何小,只要不斷獨立地重復這一試驗,事件A總是會發生的(即A發生的概率為1)。
設以A k表示事件A于第k次試驗中發生這一事件,則P(A k)=ε。
從而在前n次試驗中,A都不發生的概率為:
故在前n次試驗中,A至少發生一次的概率為:
當n→∞時,由于0<ε<1,有limn→∞pn=1
記事件Bn={前n次試驗中A至少發生一次},則必有
這就說明了雖然事件A在一次試驗中發生的概率很小,但在不斷地重復獨立試驗中,A總會發生。
在概率論的基礎理論研究中,大量隨機現象具有某種穩定的性質,例如頻率的穩定性,平均結果的穩定性等等,它反映了偶然性與必然性之間的辯證關系。為了揭示這種實際上的必然性或實際上的不可能性,我們對概率接近于1或0的事件的研究,具有重大的意義。概率論的基本問題之一,就是要建立概率接近于1或0的規律。特別是對大量獨立或弱相關因素的累積結果所發生的規律的研究,將導致“依概率收劍”和“依概率1收劍”等概念的產生,與此同時,相應的(弱)大數定律和強大數定律的研究也應運而生。
三、不退還抽樣的計算公式
現在就假定有形狀完全相同的N個球裝在壇子里,其中N1個是白的,N2個是黑的,我們從壇子里抽n個球,在抽的時候我們并不知道它的顏色。這里有兩種情況:一種是抽出的球看了它的顏色之后再放到壇子里去;一種是抽出的球不再放回去,前者稱為退還抽樣,后者稱為不退還抽樣。
不退還抽樣:這是在實際應用時常見的情形,即從N個事物組成的母體中抽出大小為n的一個子樣,這種情形對于統計抽樣技術是很重要的。
在這種情形,我們顯然必須要求n≤N,此外,顯然所求的概率當v>N1或n-v> N2時為零,因為樣本中白球的個數不可能大于N1,黑球的個數不可能大于N2,對于其它v的值,我們可借助古典概型,計算其概率,由N個事物中抽取n個共有N
n種方法,有利于我們事件發生的方法共有N1
v#8226;N2
n-v種方法,于是有v個白球,n-v個黑球的概率計算公式為:
具體問題:為了估計湖中的魚數N,自湖中捕出r條魚,做上記號放回湖中;然后再從湖中捕出s條魚,結果發現這s條魚中有ξ條標有記號。這里N是未知常數,r、s是已知常數,試問應如何估計N的值?
問題分析:
由不退還抽樣,則知事件{X=ξ}的概率由超幾何分布所確定,代入上公式(*)有:
其中RV-ξ為整數,是第二次捕出的有記號的魚數,且滿足
四、小概率事件在假設檢驗中的應用
設有一統計假設H,當H正確時,事件A是一個小概率事件,即它發生的可能性很小,在一次試驗中,我們實際上可以認為A不會發生。做一次試驗,如果A發生了,則我們有理由懷疑假設H的正確性,從而拒絕H,如果A沒有發生,我們就接受H。于是小概率事件,為我們提供了檢驗統計假設的方法。下面介紹利用小概率事件檢驗關于湖中魚的個數的假設。
萬峰湖魚數量問題解答:
我們假定兩次捕魚都是從全部魚中隨機地進行的,并且在第二次捕魚時,魚的數量未發生變化,如果變化不大,對研究問題的影響也可忽略不計。
令 N=湖中魚的總數(未知)
r =第一次捕魚的魚數=1000
s =第二次捕的魚數=1000
ξ=第二次捕的魚中系著紅線的魚數=5
Pξ(N) =第二次捕的魚中恰有ξ條系紅線的魚的概率
由不退還抽樣的計算公式(*)有:
上式中,s、r和ξ是可以觀察到的,而N是未知的,但我們知道,已有s + r -ξ條魚被捕到過,從而s + r -ξ≤N,在我們的例子里s + r -ξ =1000+1000-5=1995,故我們可以肯定湖中至少有1995條魚,但如果我們作一假定N=1995,則
利用stirling公式:
可知它是一個很小的數,其數量級為10--430,即在n=1995的假設下,第二次捕1000條魚有5條系紅線是一個概率很小很小的事件,而小概率事件在一次試驗中幾乎不會發生。因此,我們傾向于拒絕N=1995條的假設。
同理N很大,例如N=108這一假設,也必須拒絕,怎么辦?
我們想辦法找一個,使得Pξ(N)當N=時最大,這個叫做N的極大似然估計。由極大似然原理的直觀想法:一個隨機試驗如有若干個可能的結果A、B、C…..。若在一次試驗中,結果A出現,則一般認為試驗條件對A發生有利,也即A出現的概率最大。
為了找考慮比值:
故我們就把=200000看作是對湖中魚的總數所作的合理的估計。
上面給出的方法具有一般性,可用同樣方法估計一個城市的人口總數或汽車總數。這種檢驗法本身并不是從邏輯上嚴格論證假設H的正確與否,在數理統計中我們不能證明任何統計假設的真偽,而是對統計假設作出拒絕或接受的選擇。
在利用小概率事件檢驗假設H時,我們可能犯兩種錯誤。如果H真,我們拒絕了它,我們犯了第一類錯誤。因為只有當小概率事件A發生時,我們才拒絕H,故犯第一類錯誤的概率為P(A)。也有時H不真,我們接受了它,這時我們犯了第二類錯誤。
在數理統計中,制定檢驗法時,常常是先控制犯第一種錯誤的概率,然后使犯第二種錯誤的概率盡可能地小。
參考文獻:
[1]魏宗舒.概率論與數理統計教程[M].北京:高等教育出版社,2001.
[2]馬文.概率應用及思維方法[M].重慶:重慶大學出版社,1989.
(作者單位:貴州黔西南民族師范高等專科學校)