朱盛 陳春焦



【摘要】 根據條件概率與概率兩個概念的比較,指出條件概率也是概率,從而說明概率所具有的性質對條件概率也成立.文中總結了與條件概率相關的三大重要公式,并給出計算條件概率的方法,最后運用相關性質解決現實生活中的具體問題.
【關鍵詞】 樣本空間;概率;條件概率
【基金項目】河南省高等學校精品在線開放課程項目,河南省研究生教育改革與質量提升工程項目“研究生教育優質課程”(No:hnyjs2017kc09),河南理工大學研究生教育教學改革基金項目“融入課程思政的應用統計教學改革”(No:2020YJ02).
一、引言
“概率論與數理統計”是高等院校多個學科本科專業的必修課程之一,也是相關專業碩士研究生入學考試的一門必考科目,更是本科學生運用隨機思維模式解決本專業相關問題的實用課程[1].它在自然科學、社會科學、工程技術、工農業生產領域中得到了越來越廣泛的應用.作為一門應用數學學科,“概率論與數理統計”具有高度的抽象性、嚴密的邏輯性、廣泛的應用性,并且具有更獨特的思維方法[2].條件概率是“概率論與數理統計”課程中的一個重要概念.本文給出條件概率與概率兩個概念的定義,并對其作出比較,指出條件概率也是概率,從而進一步說明概率所具有的性質對條件概率也成立,最后運用該性質解決實際問題.
二、條件概率與概率的定義與比較
定義1設E是隨機實驗,S是它的樣本空間.對于E中每一個事件A賦予一個實數,記為P(A),稱為A的概率,如果集合函數P(·)滿足下列條件[3]:
(1)非負性:對于每個事件A,有P(A)≥0;
(2)規范性:對于必然事件S,有P(S)=1;
(3)可列可加性:設A1,A2,…是兩兩互不相容的事件,則
P(∪∞i=1Ai)=∑∞i=1P(Ai).
定義2設A,B是兩個事件,且P(A)>0,則稱P(B|A)=P(BA)[]P(A)為在事件A發生的條件下事件B發生的概率[3].
定理1條件概率也是概率[3].
證明設E是隨機實驗,S是它的樣本空間.條件概率P(·|A)是集合函數,對于E中每一個事件B,都有實數P(B|A)與之對應.
(1)非負性:對于每個事件B,顯然有P(B|A)≥0;
(2)規范性:對于必然事件S,有P(S|A)=P(SA)[]P(A)=1;
(3)可列可加性:設A1,A2,…是兩兩互不相容的事件,則
P(∪∞i=1Ai|A)=P{(∪∞i=1Ai)A}P(A)=P{∪∞i=1(Ai∩A)}P(A).
由于Ai∩A,i=1,2,…兩兩互不相容,故
P(∪∞i=1Ai|A)=∑∞i=1P(AiA)P(A)=∑∞i=1P(AiA)P(A)
=∑∞i=1P(Ai|A).
綜上可知,條件概率P(·|A)滿足概率定義的條件,因此條件概率也是概率.
三、條件概率的性質
由定理1可知,條件概率也是概率,因此概率具有的性質,條件概率也具有.這與“白馬是馬”一樣,白馬一定具有馬所具有的生活習性和生理特征.我們知道概率有很多性質,比如:有限可加性、加法公式、減法公式等.根據定理1可知,條件概率也應該具有概率的相應性質.在我們的教材中已經給出條件概率的有限可加性、加法公式和減法公式了.下面我們通過幾個定理來進一步說明如何將概率的性質類推到條件概率上.
定理2[4]設A1,A2,…,An是樣本空間S中的一組事件,則
P(∪ni=1Ai)≤∑1≤i1≤nP(Ai1)-∑2≤i1≤nP(A1Ai1).
定理3[4]設A1,A2,…,An是樣本空間S中的一組事件,則
∑1≤i1≤nP(Ai1)-∑1≤i1 ≤P(∪ni=1Ai). 定理2與定理3的證明見文獻[4]. 上面兩個定理可以認為是概率的兩個性質,由于條件概率也是概率,故條件概率也有類似的性質. 定理4設A1,A2,…,An是樣本空間S中的一組事件,則對于樣本空間S中的任一事件A,若P(A)>0,則 P(∪ni=1Ai|A)≤∑1≤i1≤nP(Ai1|A)-∑2≤i1≤nP(A1Ai1|A). 證明取Bi=AiA,根據定理2可得 P(∪ni=1AiA)≤∑1≤i1≤nP(Ai1A)-∑2≤i1≤nP(A1Ai1A), 于是, P(∪ni=1Ai|A)=P(∪ni=1AiA)P(A) ≤∑1≤i1≤nP(Ai1A)-∑2≤i1≤nP(A1Ai1A)P(A) ≤∑1≤i1≤nP(Ai1A)P(A)-∑2≤i1≤nP(A1Ai1A)P(A) ≤∑1≤i1≤nP(AiA)-∑2≤i1≤nP(A1Ai1|A). 定理5設A1,A2,…,An是樣本空間S中的一組事件,則對于樣本空間S中的任一事件A,若P(A)>0,則 ∑1≤i1≤nP(Ai1|A)-∑1≤i1 ∑2≤i1 定理5的證明與定理4類似. 四、條件概率相關的三大公式 在本節,我們主要探討與條件概率相關的三大重要公式,分別是:乘法公式,全概率公式,貝葉斯公式.該三大公式在相關的“概率論與數理統計”教材中均有闡述,本文主要討論乘法公式,全概率公式以及貝葉斯公式之間的關系,通過比較說明不同公式在實際應用中的運用場景.為便于相關分析的闡述,我們在下面先總結一下相關的結論[3]. 設A,B是兩個事件,且P(A)>0,則P(AB)=P(A)·P(B|A),該等式稱為概率的乘法公式.類似地,若P(B)>0,則P(AB)=P(B)P(A|B),該等式也稱為概率的乘法公式.乘法公式可推廣到有限多個事件的情形,比如,若A1,A2,…,An是樣本空間S中的一組事件,且P(A1A2…An)>0,則 P(A1A2…An)=P(A1)P(A2|A1)…P(AnA1A2…An). 設B1,B2,…,Bn是一組完備事件組,且P(Bi)>0,則對于任意事件A,有P(A)=∑ni=1P(Bi)P(ABi).另外,若P(A)>0,則 P(Bi|A)=P(ABi)P(Bi)∑nj=1P(Bj)P(ABj). 以上兩個公式分別稱為全概率公式和貝葉斯公式.關于乘法公式、全概率公式與貝葉斯公式的進一步分析以及相關性質,有興趣的讀者可進一步閱讀參考文獻[2][3]. 下面,我們重點闡述乘法公式、全概率公式以及貝葉斯公式之間的聯系.從數學史的角度來說,它們的產生順序是不同的.首先有乘法公式的定義,在乘法公式的基礎上獲得全概率公式,然后進一步推導出貝葉斯公式.這樣的關系也體現在各個公式的證明中,比如,在證明全概率公式時需要用到乘法公式,而在證明貝葉斯公式時需要用到全概率公式.乘法公式通常應用于求積事件的概率;全概率公式通常應用于已知某事件在完備事件組下的條件概率,求該事件的概率;而貝葉斯公式主要用于解決條件概率問題.在區分何時用全概率公式、何時用貝葉斯公式時,我們可采用以下判別方法:“由因求果”用全概率公式,而“執果求因”用貝葉斯公式.所謂“由因求果”指的是,經過一系列的原因,最后求結果的概率;“執果求因”意味著已知結果,求由某個原因造成該結果的概率.我們可以用一個具體的例子來分析一下. 某數據調查公司調研得出,投保的汽車司機按性格可分為三類,分別是性格謹慎、性格溫和以及性格急躁三類人群,我們分別將其稱為第一類投保人,第二類投保人以及第三類投保人.經統計發現,三類人群的比例分別為30%,40%,30%.已知第一類投保人在保險合同期內發生事故的概率為0.03,第二類投保人在保險合同期內發生事故的概率為0.04,第三類投保人相應的事故概率為0.02.現從所有投保人中任意選擇一位,(1)此人在保險合同期內發生事故的概率是多少?(2)如果某投保人在保險合同期內發生事故,則此人來自第三類投保人的概率是多少?解決這個問題,我們首先可以將相關事件用數學符號表示出來.設事件“此人在保險合同期內發生事故”為A,Bi(i=1,2,3)表示此人為第i類投保人.于是前面所提的問題可轉化成如下形式:問題(1)實質上指的是求事件A發生的概率P(A);問題(2)可轉化為求條件概率P(B3|A).我們首先考慮問題(1),投保人的性格類型不同使得他們在保險合同期內發生事故的概率各不相同,不同類型的投保人占總投保人群的比例也不同.基于這樣的原因,我們需要探討隨機選擇一名投保者,此人在保險合同期內發生事故的概率.“在保險合同期內發生事故”是一種結果,所以問題(1)實質上是“由因求果”的問題.“由因求果”用全概率公式,故問題(1)可用全概率公式解決,即 P(A)=∑3i=1P(Bi)P(ABi). 由已知條件,可知P(B1)=0.3,P(B2)=0.4,P(B3)=0.3,P(AB1)=0.03,P(AB2)=0.04,P(AB3)=0.02.將上述條件代入全概率公式可得事件A的概率,即 P(A)=0.3×0.03+0.4×0.04+0.3×0.02=0.031. 接下來,我們來探討問題(2),在這一問題中,我們已經知道了結果,即某投保人在保險合同期內發生事故,求在這種條件下,該投保人是第三類投保人,也就是急躁型投保人的概率.顯然,這是一個已知結果求原因的概率,即“執果求因”,所以我們可以運用貝葉斯公式來求解問題(2).由貝葉斯公式,可得 P(B3|A)=P(AB3)P(B3)∑3j=1P(Bj)P(ABj)=631. 我們通過上面的例子給大家介紹了如何運用全概率公式,以及如何運用貝葉斯公式.這兩個公式可用來解決很多現實生活中的實際問題. 五、計算條件概率的方法 在本節,我們主要介紹計算條件概率的方法.在學習“概率論與數理統計”的過程中,條件概率是一個重要的知識點.對于從事隨機現象方面問題研究的科研工作者來說,這一概念是最基本的知識.那么,如何計算條件概率呢?在這里,我們介紹以下三種方法. (一)利用條件概率定義 根據定義2,設A,B是兩個事件,且P(A)>0,則稱P(B|A)=P(BA)[]P(A)為在事件A發生的條件下事件B發生的概率.若求條件概率P(B|A),可先求出A,B積事件發生的概率,然后再算出事件A發生的概率,最后計算兩者的比值即可.這一方法通常適用于求解較為簡單的問題.下面給出一個簡單的例題. 某橋梁在設計過程中執行如下標準:使用壽命達到80年的概率為0.95,使用壽命達到100年的概率為0.82.假設該橋梁施工時嚴格按照設計標準執行,現已知該橋梁已經使用了80年,試求該橋梁在未來的20年內損毀的概率. 設A為事件“該橋梁使用壽命達到80年”,B表示事件“該橋梁使用壽命達到100年”.于是,P(A)=0.95,P(B)=0.82.根據題意可知,該題可轉化為求條件概率P(B-|A).由條件概率的性質,可知P(B-|A)=1-P(B|A).再根據條件概率的定義可得 P(B-|A)=1-P(AB)P(A)=1395. (二)利用乘法公式求解 我們知道,當P(A)>0,P(B)>0時,以下兩個乘法公式均滿足: P(AB)=P(A)P(B|A), P(AB)=P(B)P(A|B). 于是,若求解條件概率P(B|A),可利用上述兩個條件概率公式,即P(A)P(B|A)=P(B)P(A|B),則 P(B|A)=P(B)P(A|B)P(A). 利用這一等式,先求出P(A),P(B),P(A|B),然后即可計算獲得P(B|A). (三)利用貝葉斯公式求解 在前文中,我們已經總結分析了貝葉斯公式.設B1,B2,…,Bn是一組完備事件組,對于任意事件A,若P(A)>0,P(Bi)>0,則 P(Bi|A)=P(ABi)P(Bi)∑nj=1P(Bj)P(ABj). 上述公式可用于解決較為復雜的條件概率問題.利用這一公式時,可先根據題意計算P(A|Bi),P(Bi),i=1,2,…,n,然后代入貝葉斯公式即可計算獲得P(Bi|A). 六、生活中的條件概率 綜上,我們給出了條件概率的定義,比較分析了條件概率與概率的關系,并總結了與條件概率密切相關的三大公式.在本節中,我們將從現實生活中遇到的實際問題出發闡述條件概率的現實應用. (一)新冠病毒試劑實驗中的條件概率 2020年新冠疫情在全球暴發.由于快速有力的防控措施,我國疫情得到有效控制.在疫情防控過程中,我國的科學家們也在積極研發應對新冠病毒的疫苗.要判斷新型冠狀病毒檢測試劑是否有效,通常需要做如下兩類實驗: (1)對新冠肺炎病人的實驗.通過這個實驗對新冠肺炎病人進行檢測,得出呈陽性的概率. (2)對未患有新冠肺炎病人的實驗.通過這個實驗對非新冠肺炎病人進行檢測,得出呈陰性的概率. 基于這些實驗的結果,分析某人經過該新型冠狀病毒檢測試劑的檢測能否正確判斷其是否患有新冠肺炎.前述實驗實際上是對條件概率的統計實驗.比如,若我們設A=“某人患有新冠肺炎”,B=“某人做此實驗結果為陽性”,則對新冠肺炎病人的實驗,檢測后呈陽性的概率可寫成P(B|A).另外,對非新冠肺炎病人的實驗,檢測后呈陰性的概率可寫成P(B-|A-). (二)蒙提霍爾問題 蒙提霍爾問題源于美國一檔游戲節目,選手面對三扇關閉的門,在每扇門后有不同等級的獎品.獎品分別是汽車和山羊,其中一扇門后面是汽車,而另外兩扇門后面是山羊.主持人知道門后的獎品情況.當選手選擇一扇門后,先不打開.主持人打開另外兩扇門中后面藏有山羊的那扇門.然后,選手被詢問是否要變更之前的選擇.這意味著,此時選手有機會從剩下兩扇關閉的門中任選一扇作為最終選擇的結果.在這樣的游戲中,請問該選手是否應該變更自己的選擇,或者說換一扇門是否會提高其獲得汽車的概率呢[5]. 這個問題,實際上也是個條件概率的問題.我們將三扇門編上序號,分別將其稱為1號門,2號門,3號門.假設選手第一次選擇時選擇1號門,而主持人打開3號門.我們記“主持人打開3號門”的事件為事件A.事件Bi= “第i號門后是汽車,i=1,2,3”.要判斷換一扇門是否能提高其獲得汽車的概率.我們可把這兩扇門后有汽車的概率算出來.需要注意的是,這個概率是有條件的,因為主持人已經打開了3號門.顯然,在主持人打開了3號門的條件下,汽車在1號門后的概率為P(B1|A);在主持人打開3號門的條件下,汽車在2號門后的概率為P(B2|A).根據貝葉斯公式,能得到P(B1|A)=1[]3以及P(B2|A)=2[]3.在這里,我們忽略了具體的計算.通過比較,我們發現P(B2|A)>P(B1|A),故換一扇門可以提高其獲得汽車的概率. (三)工業流水線中的條件概率問題 某工廠有三條流水線,各自獨立生產相同的產品,比如節能燈.生產出來的節能燈都放在工廠的倉庫中,并向不同地區的銷售商發售.根據之前的統計,這三條流水線生產的節能燈合格率是不同的,分別是0.98,0.99,0.97.現某人購買了該工廠生產的節能燈,發現是次品,請問該次品來自哪一條流水線.在這個問題中,我們可以記A為“節能燈是次品”,Bi=“該節能燈是第i條流水線所生產的,i=1,2,3”.于是,在某人購買的節能燈是次品的條件下,該次品來自第1條流水線的概率可寫為P(B1|A).顯然這也是個條件概率問題.要計算這一條件概率需要用到貝葉斯公式.實際上,在求解有關條件概率的實際問題時,經常使用貝葉斯公式. 類似這樣的例子,生活中還有很多.火箭發射時,如發射失敗,就需要探討是由某部件導致的概率;在信號傳輸過程中,原信息為A,求經過傳輸后接收方收到的是信號B的概率等.因此,只要我們認真觀察,就會在生活中發現很多關于條件概率的例子. 七、總結 本文首先給出了概率和條件概率的定義.通過對兩者進行比較分析發現,條件概率也是概率.基于這一結論可知,概率所具有的性質,條件概率也都具有.文中總結了與條件概率密切相關的三大公式,通過例題進一步闡述條件概率的性質.最后,本文結合新冠病毒試劑實驗中的條件概率、蒙提霍爾問題,以及工業流水線中的條件概率問題,進一步說明了生活中的條件概率問題無處不在. 【參考文獻】 [1]徐雅靜,段清堂,汪遠征.概率論與數理統計[M].北京:科學出版社,2009. [2]河南理工大學概率論與數理統計教研組.概率論與數理統計[M].北京:高等教育出版社,2013. [3]盛驟,謝式千,潘承毅.概率論與數理統計(第四版)[M].北京:高等教育出版社,2008. [4]林正炎,白志東.概率不等式[M].北京:科學出版社,2006.