摘 要: 全概率公式是概率論中的一個基本的公式,它的應(yīng)用是初學(xué)概率論者的難點之一。本文通過應(yīng)用全概率公式來處理敏感性問題的調(diào)查結(jié)果,體會全概率公式的魅力。并試圖用全概率公式解決瑪麗蓮問題。
關(guān)鍵詞: 全概率公式 概率 瑪麗蓮
1.基本概念
全概率公式的定義:設(shè)B,B,…,B為樣本空間Ω的一個分割,即B,B,…,B互不相容,且B=Ω,如果P(B)>0, i=1, 2, …, n,則對任一事件A?奐Ω,有P(A)=P(B)P(A|B)。我們也稱B,B,…,B為一個完備事件組。
全概率公式是概率論中的一個重要公式,它提供了計算復(fù)雜事件概率的一條有效途徑,使一個復(fù)雜事件的概率計算問題化繁就簡。
特別地,n=2時,B,B互斥且對立,即B=B,B=,得到全概率公式的最簡單形式:若0
2.問題引入
學(xué)生閱讀黃色書刊或觀看黃色影像會影響其身心健康發(fā)展,對這類敏感性問題的調(diào)查,涉及到個人隱私,不便直接展開正面調(diào)查,也很難獲得真實信息。現(xiàn)設(shè)計一個調(diào)查方案,利用全概率公式,從調(diào)查數(shù)據(jù)中估計出學(xué)生閱讀黃色書刊和觀察黃色影像的比率p。
像這類敏感性問題的調(diào)查是社會調(diào)查的一類,如一群人中參加賭博的比率、吸毒人的比率、經(jīng)營者中偷稅漏稅戶的比率、學(xué)生中考試作弊的比率,等等。
對敏感性問題的調(diào)查方案,關(guān)鍵要使被調(diào)查者愿意作出真實回答又能為其保守秘密。一旦調(diào)查方案設(shè)計有誤,被調(diào)查者就會拒絕配合,產(chǎn)生逆反心理,所得的數(shù)據(jù)將失去真實性。經(jīng)過多年的研究和實踐,一些心理學(xué)家設(shè)計了一種調(diào)查方案,在這個方案中,被調(diào)查者只需回答兩個問題中的一個問題,而且只需回答“是”或“否”。
問題Q:你的生日是否在7月1日之前?
問題Q:你是否看過黃色書刊或影像?
這個調(diào)查方案看似簡單,但為了消除被調(diào)查者的顧慮,使被調(diào)查者確信他(她)參加這次調(diào)查不會泄漏個人秘密,在操作上有以下關(guān)鍵點:
(1)被調(diào)查者在沒有旁人的情況下,獨自一人回答。
(2)被調(diào)查者從一個罐子(罐子中只有紅色球和白色球)中隨機(jī)抽出一只球,看過顏色后即放回。若抽到白球,則回答問題Q;若抽到紅球,則回答問題Q。
被調(diào)查者無論回答問題Q或Q只需在下面答卷上認(rèn)可的方框內(nèi)劃鉤,然后把答卷放入一個密封的投票箱內(nèi)。
這種調(diào)查方法,主要在于旁人無法知道被調(diào)查者回答的問題是Q還是Q,由此可以極大地消除被調(diào)查者的顧慮。
3.問題分析
現(xiàn)在的問題是如何分析調(diào)查的結(jié)果。
當(dāng)然,我們對問題Q不感興趣。
首先,我們設(shè)有n張答卷(n較大,譬如1 000張以上),其中有k張回答“是”。而我們又無法知道這k張回答“是”的答卷中,有多少張是回答問題Q,多少張是回答問題Q。但有兩個信息我們是預(yù)先知道的:
(1)在參加人數(shù)較多的場合,任選一人,其生日在7月1日之前的概率是0.5。
(2)罐中紅球的比率b已知。現(xiàn)根據(jù)這4個數(shù)據(jù)去求p。
此時,“回答問題Q”=“從罐中摸得白球”=B,“回答問題Q”=“從罐中摸得紅球”=,記A=“答卷回答為是”。由全概率公式,得P(A)=P(B)P(A|B)+P()P(A|),所以,將P()=b, P(B)=1-b,P(A|)=p,P(A|B)=0.5代入上式右邊,而式子左邊用頻率代替,得=0.5(1-b)+pb,由此得p=,因為我們用頻率代替了概率P(A),所以從上式得到的是p的估計。
4.應(yīng)用舉例
例1. 甲箱中有1只黑球3只白球,乙箱有2只黑球2只白球,從兩箱中各取1只球放在一起,再從中任取1只球,問該球是黑球的概率是多少?
分析:這是一個需用全概率公式解決的題目。記C=“該球是黑球”,A=“從甲箱中取出的一球為白球”,B=“從乙箱中取出的一球為白球”,則=“從甲箱中取出的一球為黑球”,=“從乙箱中取出的一球為黑球”,于是,對事件C來講,事件組AB,A,B,構(gòu)成一個完備事件組,由全概率公式,可得P(C)=P(AB)P(C|AB)+P(A)P(C|A)+P(B)P(C|B)+P()P(C|)。
其中,P(AB)=×=,P(A)=××,P(B)=×=,P()=×=,而P(C|AB)=0,P(C|A)=,P(C|B)=,P(C|)=1。代入,得P(C)=.
例2.瑪麗蓮之門
在1990年第9期的ParadeMaganize雜志上,提出了這樣一個趣味題,也就是被稱之為“瑪麗蓮問題”的有獎競猜題目。題目如下:有三扇門,其中一扇門后面放有一輛汽車,另外兩扇門后面是空的。主持人讓你隨意選定一扇門,確認(rèn)后打開,門后面的東西就歸你。假定你選中1號門,先不打開1號門,現(xiàn)在主持人打開另外兩扇門,假定主持人打開3號門,發(fā)現(xiàn)是空的。現(xiàn)在主持人問你,為了有更大的機(jī)會選中汽車,你是否愿意換2號門?
分析:問題歸結(jié)為,換門之后的中獎概率多大?是不是比換門前中獎的概率要大?當(dāng)然,換門之前的中獎概率是,無可辯駁。但換門后的中獎概率卻爭議較大的,據(jù)說最早曾在美國公眾中引起巨大爭論。這里,用全概率公式給出一種解釋。我們來看換門后的中獎概率。顯然。換門后應(yīng)包含換門前的信息。記A=“換門后中獎”,B=“選擇第i號門”,按照題目所給條件,不妨設(shè)汽車在2號門。P(A|B)=(這里,是換門前的選擇),P(A|B)=1,P(A|B)=0,由全概率公式,得P(A)=P(B)P(A|B)=1×+×1+×0=。這表明,換門,即重新選擇后中獎的概率為,比不換的中獎概率要大。事實上,主持人打開一扇門后,參與者已獲得了更多的信息,再做重新選擇,當(dāng)然比先前有利。
參考文獻(xiàn):
[1]茆詩松.概率論與數(shù)理統(tǒng)計教程[M].高等教育出版社,2005.
[2]趙志蓮.基于SAS編程分析瑪麗蓮問題[J].統(tǒng)計與咨詢,2006.6.
注:“本文中所涉及到的圖表、公式、注解等請以PDF格式閱讀”