程恭品


【摘 要】貝葉斯統計是高校統計學專業的主干課程之一,該課程的理論體系和思想方法與經典統計學存在著諸多不同之處。不少學生在學習貝葉斯統計方法時往往感覺困難重重。本文從貝葉斯教學實踐出發,闡述了如何進行貝葉斯統計思想的課堂教學,以期達到良好的課堂效果。
【關鍵詞】貝葉斯統計;貝葉斯方法;教學
中圖分類號: O212.8-4 文獻標識碼: A 文章編號: 2095-2457(2018)01-0072-002
【Abstract】Beysian statistics is one of the main course of universities whose theory system and ideology has many difference from those of the traditional statistics.Therefore,some students always find it hard to learn the course.In this paper,we discussed how to teach the ideology of Beysian statistics in the process of teaching in order to get better classroom teaching effect.
【Key words】Beysian statistics;Beysian method;Teaching
0 前言
英國學者托馬斯·貝葉斯在《論有關機遇問題的求解》中提出一種歸納推理的理論,直至貝葉斯去世兩年以后的1763年12月23日,倫敦皇家學會會議上才公布了這篇遺世之作,從此貝葉斯定理誕生。隨后,一些統計學者逐漸將其發展為一種系統的統計推斷方法,稱之為貝葉斯方法。貝葉斯統計內容相當豐富,包括貝葉斯公式,貝葉斯推斷、先驗分布的確定、貝葉斯決策和貝葉斯計算等內容。從國內外的文獻資料來看,貝葉斯統計理論幾乎可以作為每一個學科的研究工具之一,并且在自然科學及國民經濟的許多領域中有著廣泛應用。它既可以用于質量控制與評估、可靠性評價和物品的存儲問題,又可以應用于事件頻率的估計、犯罪學不完全記數的估計以及保險精算。尤其是,近年來貝葉斯統計理論在宏觀經濟預測中取得了巨大的成功。從模型的穩定性和預測精度兩個方面來看,貝葉斯預測模型優于非貝葉斯模型,因此貝葉斯方法獲得越來越多專家學者的認同。
貝葉斯統計最核心的內容是貝葉斯公式以及由貝葉斯公式衍生的貝葉斯推斷以及預測等理論。在教學內容上,該課程側重理論知識以及相關結論的理解和應用,計算復雜,公式繁多,對學生的學習構成較大挑戰。從教學效果來看,一方面該課程學生不及格率偏高,部分學生反映較難;另一方面,由于部分學生打算出國繼續深造,又必須保持該課程一定的理論深度。因此,如何對這門課程的理論知識進行教學是教學過程中的重點和難點。筆者在實際教學中發現,最基本的貝葉斯公式該如何引入和理解成為首要解決的知識難點。因此筆者在教學過程中從以前的概率論基礎知識出發,循序漸進地引入貝葉斯公式,并具體闡明了公式的含義和應用,使得公式的理解變得更加自然。
此外,由于貝葉斯統計學和經典統計學在理念和思想方法上有著巨大的差異,筆者在課堂教學中,通過不斷復習經典統計中的理論方法,再和貝葉斯方法加以比較,使學生在熟悉了以往知識點的基礎上又加深了對新的貝葉斯理論的理解,了解了貝葉斯方法的特殊性和以及跟經典統計學相比巨大的優勢。從而使教學過程深入淺出,易于接受。
為了提高學生的學習興趣,體現貝葉斯統計方法的應用價值,我們不斷優化教學內容,在兼顧學生后續學習的需要、夯實學生理論基礎的同時,減少部分適用性較差,較為繁瑣的理論證明內容。與此同時在教材之外增加了一些貝葉斯統計學在經濟中應用的趣味性例子。
最后為了豐富教學手段,提高課堂教學效果,我們使用Python等統計軟件具體計算一些經典的案例,收到了良好的反饋。
1 循序漸進引入貝葉斯公式
貝葉斯統計學與經典統計學最基本的區別之一在于貝葉斯統計學對總體的未知參數做估計時采用了未知參數的先驗分布,這使得未知參數不再是一個固定的常數,而是一個隨機變量。因此可以使用貝葉斯公式求得關于未知參數在抽取樣本之后的分布——后驗分布,得到后驗分布之后就可以對參數進行一系列的統計推斷。貝葉斯方法的分析過程可以概括為下圖所示:
因此,首要的關鍵問題是如何使用貝葉斯公式得到后驗分布,以及如何理解貝葉斯公式。為了使得在引入公式時不顯得突兀,又能加深學生對公式含義的理解,在實際教學中,筆者先從經典的概率公式入手,循序漸進地導出貝葉斯公式。具體說明如下:
設θ是總體X~p(x|θ)中的未知參數,x=(x1,x2,…,xn)是從總體中抽取的一個樣本,π(θ)是關于θ的先驗分布,則貝葉斯公式為:
結合全概率公式和乘法公式可以推導出上述事件形式的貝葉斯公式(3)。由公式(3)的形式再給出離散形式參數θ的貝葉斯公式(2),最后給出連續形式的貝葉斯公式(1)。整個過程循序漸進,逐步引入貝葉斯公式,使得公式的理解變得容易,并且含義清晰,收到了良好的課堂效果。
2 在教學過程中始終貫穿比較教學法
由于貝葉斯方法和經典統計方法存在著本質性的差異,而貝葉斯方法又以經典統計學基礎知識為前提。因此在教學過程中,我們始終將二者放在一起加以對照比較,在比較過程中既復習了以前的經典統計學知識,又使得新的概念更加清晰易懂,突出了貝葉斯方法的優點。例如,在講述貝葉斯推斷方法中的區間估計時,先回顧了經典統計中關于區間估計部分的內容,使得學生對這部分已學習過的知識熟悉之后,再具體介紹貝葉斯統計學的處理方法。相較之下,經典統計學的區間估計必須要先構造含有未知參數θ的一個統計量,并且要求這個統計量的分布已知,從而由這個統計量的置信區間解出總體未知參數θ的置信區間。而使用貝葉斯方法,在采用了未知參數θ的先驗分布π(θ)之后,由貝葉斯公式可得到θ的后驗分布π(θ|x),直接使用后驗分布可求得θ的可信區間,其含義清晰,計算方法簡單,使得學生領略到了貝葉斯方法的巨大的實用價值。在介紹貝葉斯點估計和假設檢驗時也采用了這種比較的教學方法,使得概念易于理解,方法易于掌握。
3 教學過程中引入一些趣味性的例子
貝葉斯統計是一門很實用的課程,在實踐中有許多應用,在教學中可采用一些趣味性的例子以提高教學效果、引起學生的學習興趣。這里有兩個生動的例子:(1)Laplace在1786年研究了巴黎男嬰的出生的比例θ,收集到1745-1770年在巴黎出生的嬰兒數據,其中男嬰251527個,女嬰241945個,判斷男嬰的出生比例是否明顯高于女嬰?(茆詩松(2012))(2)伊索寓言“孩子與狼”講的是一個小孩每天到山上放羊,山里有狼出沒,第一天他在山上喊:“狼來了!狼來了!”山下的村民們聞聲便去打狼,可到了山上,發現狼沒有來;第二天仍是如此;第三天,狼真的來了,可無論小孩怎么喊叫,也沒有人來救他,因為前二次他說了謊話,人們不再相信他了。使用貝葉斯統計來分析寓言中村民的心理活動。類似于這樣的例子可以使學生感受到這門課的實踐價值和趣味性。
4 采用數學軟件輔助教學
參照王燕飛(2015)和李春娥(2015)中的辦法,在進行一些復雜的例題計算時,可以采用一些數學軟件來進行輔助計算。這里我們主要采用的教材為Allen B.Downey(2015)和John K.kruschke(2015),依據教材中的方法使用Python軟件計算一些有趣的案例,比如說曲奇餅問題、德軍坦克問題、波士頓棕熊隊問題、歐元問題等。這些案例既有趣味性又有強烈的現實背景,讓學生不僅熟悉了Python軟件的操作,又能體會到貝葉斯方法的重要性和實用價值,因而增加了學生學習的積極性。這種教學過程中輔以軟件操作的教學方法改變了單一的粉筆加黑板的教學方式,既節省了時間又減輕了教師的負擔,真正將貝葉斯統計在實踐中應用起來,提高了課堂效果。
5 小結
以上簡單介紹了一些貝葉斯統計教學上的方法。由于貝葉斯統計學是一門實用性很強的學科,其理論和方法在實踐中得到不斷發展和創新,所以在教學中還要不斷進行探索,與日益發展成熟的理論相結合,以培養出實際需要的應用型人才。
【參考文獻】
[1]茆詩松,湯銀才.貝葉斯統計[M].第二版.中國統計出版社,2012.
[2]王燕飛.貝葉斯統計中后驗分布的教學研究與探析[J].科技視界,2015(31):180-181
[3]李春娥,等.貝葉斯公式及其應用的教學研究[J].大學數學,2015(02).
[4]Allen B.Downey.貝葉斯思維:統計建模的后驗分布的Python學習法[M].人民郵電出版社,2015.
[5]John K.kruschke.貝葉斯統計方法——R和BUGS軟件數據分析示例[M].機械工業出版社,2015.