任傳榮



【摘要】貝葉斯公式是“概率論與數理統計”中的一個重要公式,也是教學中的一個重難點.教學中,結合實例給出應用背景和應用原理,引導學生理解貝葉斯公式內涵和應用,可以獲得理想的教學效果.
【關鍵詞】貝葉斯公式;概率;教學設計;教學效果
貝葉斯公式這一節教學內容在“概率論與數理統計”中占有重要的地位,是這門學科的教學重點與難點之一.這個公式無論是在我們日常生活中,還是科學技術領域都有著廣泛的作用.學生在學習這塊知識內容時,一方面搞不清這個知識怎么用,另一方面容易和前面所學習的全概率公式發生混淆,不能理解它的思想,掌握它的作用.筆者就貝葉斯公式這一節內容采取了一種新的教學設計,并應用于課堂教學,取得了不錯的效果.
一、教學內容的引入
(一)回顧舊知識
首先來復習一下前面學的條件概率、乘法公式、全概率公式.
這些公式能不能解決下面的歷史問題呢?
(二)應用背景導入——核潛艇沉沒搜救事件
1968年5月22日,美國“天蝎號”核潛艇在大西洋亞速海海域神秘沉沒,艇上99人全部遇難,美軍憑經驗在海底進行了長達五個月的搜索,結果一無所獲,最后聽從了數學家Craven的建議,經過幾次搜索,在爆炸點西南方3200米深的海底發現其殘骸[1].
這位數學家給出的建議是什么呢?可以用前面的公式理論來解決嗎?答案是不能,但是我們可以通過一個簡單例子來感受一下所用的原理.
(三)引例
例1 某個興趣班,把班上學生分成三組進行討論,其中第1小組有3個男生和4個女生,第2小組有4個男生和3個女生,第3小組有1個男生和6個女生,現在老師在三個小組中任選一組,從中任意選擇一名同學進行發言,如果這名同學是女生,求該同學來自第1小組的概率.
選取的這個例題比較簡單,通俗易懂.這是一個已知結果的產生,尋找導致這種結果的來源或者原因的概率的問題.生活中類似的例子很多,如病人發燒了,尋求導致發燒的因素,次品產生了,找出是哪條流水線生產的產品等,都可以歸結為這類由果尋因事件的概率.所以將(1)式一般化便可得到貝葉斯公式.
二、貝葉斯公式
(一)定理
(二)定理的注解
1.上式稱為貝葉斯公式,公式的推導類似于例1的推導,由條件概率公式及全概率公式即可得,初學者也很容易接受.貝葉斯公式由英國數學家托馬斯·貝葉斯(1702—1761)提出,他生前是受人尊重的牧師,自學成才的數學家,在數學方面主要研究概率論.他首先將歸納推理法用于概率論基礎理論,創立了貝葉斯統計理論,對統計決策函數、統計推斷、統計的估算等做出了貢獻[6].他的著作有《論機會學說問題的求解》(1763)和《機會的學說概論》(1758).歷史上有些數學家雖然名氣不大,著作很少,但影響深刻,貝葉斯就是這樣一個典型的代表人物[3].
三、貝葉斯公式的應用
(一)典型例題
例2 《三國演義》中有個著名的故事是“諸葛亮揮淚斬馬謖”,原因是“街亭失守”,現在我們來分析馬謖要不要承擔主要責任.我們主要考慮影響這次街亭之役的三個主要因素:(1)主帥缺少才能,不堪大任;(2)將帥不和,難服人心;(3)敵眾我寡,兵力懸殊.哪個可能大,各占多大比例?
通過計算的結果,我們得知“街亭失守”的主要責任在主帥馬謖.舉這個例子既可以增加課堂教學的趣味性,又可以初步理解貝葉斯公式的意義.
例3 某地居民肝癌發病率為0.003,采用甲胎蛋白法進行普查,患者對這種檢查結果呈陽性的概率為0.94,而未患肝癌的被檢查者呈陽性的概率是0.05,現有一批人甲胎蛋白檢查結果呈陽性,問此批人是肝癌患者的概率有多大?[3,4]
接下來我們進一步分析本題結果的意義.這一地區的普通人群肝癌發病率是0.003;患者對甲胎蛋白測試結果呈陽性的概率為0.94,不是100%,這說明這種檢查對患者存在漏診;未患病的檢查者對甲胎蛋白測試結果是陽性的概率為0.05,說明這種檢查存在誤診情況.那么這種甲胎蛋白檢查對于診斷被檢查者是否患有肝癌有無意義呢?如果不做這種檢查,抽查一人,他是患者的概率P(C)=0.003(先驗概率),這是檢查前根據臨床資料統計而得出的.檢查出現陽性反應后,此人是患者的概率為P(C|A)=0.0535(后驗概率),概率增加了約18倍.也就是說這個人從普通人群上升為“疑似”人群,這說明這種檢查很重要,很有意義.另一方面,檢查出甲胎蛋白結果是陽性來判斷病人是否患肝癌,它的準確率是很低的,因為P(C|A)=0.0535,也就是說100個人檢查是陽性,約5人是肝癌患者,即使某人檢出陽性,也不能過早下結論此人患有肝癌.這和我們的直覺不一樣!原因是P(A|C)=0.94,P(C|A)=0.0535這兩者均為條件概率,但區別很大.前者是正向概率,原因導致結果的概率;而后者是逆向概率,由結果推原因的概率.那么為什么這個結論和我們的直覺相差這么大呢?是因為先驗概率P(C)=0.003的值比較小,在貝葉斯公式計算中,分子作為分母的一部分所占的權重低,所以最終后驗概率數值不大.本題中抽查一個人是陽性,雖然不一定是患者,但此人從普通人群也上升到“疑似”人群了,接下來該怎么辦呢?復查!這時先驗概率已更新為P(C)=0.0535,則P(C-)=1-0.0535=0.9465,運用貝葉斯公式可得
這個概率值比較大了,可以說此人是“高度疑似”病患了.如果第三次復查結果仍為陽性,先驗概率再一次更新為P(C)=0.5152,再次運用貝葉斯公式可得
這個概率值已經很大了,可以說此人基本確診.而事實上先驗概率為0.3時,后驗概率值就接近0.9了,幾乎可以確定是患病了,需要趕快治療.通常醫生總是先采取一些其他簡單易行的輔助方法進行檢驗,當他懷疑病人有可能患有肝癌時,才建議用甲胎蛋白法檢驗,這時,如果病人出現陽性結果,那么他患病的可能性就很高了.