[摘 要]醫學統計學教學離不開概率的計算。而在傳統的醫學統計學教學中,概率是通過查相應的密度函數分布表(如t值、u值(或Z值)、F值及χ2值表等)獲得的,無法滿足醫學科學發展的需求。隨著人民生活水平的提高、計算機和有關應用軟件的普及,大學醫學統計學教學應與時俱進,可用計算機的密度函數取代現行的密度函數分布表。
[關鍵詞]計算機密度函數;界值表;醫學統計學
[中圖分類號] G642 [文獻標識碼] A [文章編號] 2095-3437(2016)04-0091-02在醫學研究中,人們要對醫學數據進行整理、分析、判斷,最后得出結論,而這一切都離不開醫學統計學,所以醫學統計學是一門應用性很強的學科。由于課程原理主要涉及高等數學的概率分布,且概念抽象、具有邏輯推理性,特別涉及密度函數的分布時,所計算出來的統計量,如t值、u值(或Z值)、F值及χ2值等,需通過查相應的密度函數分布表(多數醫學統計學書稱之為界值表),獲得相應的P值(即概率),然后進行判斷。由于密度函數分布表的有限性,它所得到的P值多數為一范圍值,如0.1>P>0.05或0.01
一、取消界值表的現實性與可行性
在60~70年代,學生上數學課或做課外數學作業時,經常會用到平方表、算術平方根表、三角函數表、反三角函數表、對數表、反對數表以及隨機數字表等。隨著科學技術的發展、計算機的普及,這些表陸續退出了歷史的舞臺。
同樣,隨著我國人民生活水平的提高,筆記本電腦在大學生中已經普及,在我校,平均一個大學生(包括貧困生)有一臺筆記本電腦。由此可以推斷:筆記本電腦如同手機一樣,已成為大學生的必備。同時,相應的計算機軟件,如Office、WPS等辦公軟件,已經得到普遍的應用。這為醫學統計學取消有關界值表創造了良好的條件,也為理論教學與實踐(練習)的結合打下了良好的基礎,消除了以往的教學與實踐相脫節的弊端。
二、界值表與計算機函數
(一)標準正態分布面積表與標準正態分布函數
標準正態曲線呈對稱分布,多數醫學統計學教材在設計面積分布表時,均給出1 / 2的概率分布,另一半則需要根據對稱性的原理進行推算。而且由于表的有限性,所給出的面積和u(或Z)的界值也十分有限。
眾所周知,標準正態曲線下面積是從-∞向+∞積分所得,面積為1。在EXCEL或WPS表格的統計函數(Statistical)中,提供了NORMSDIST,格式為NORMSDIST(z)。參數Z為從-∞積分到當前Z(或u)值的面積或概率。例如,公式“=NORMSDIST(-1.23)”的計算結果為0.109348552,即從-∞到-1.23的曲線下面積(或概率)為0.109348552。同時,NORMSDIST函數具有返回標準正態累積分布函數(反函數),格式為NORMSINV(probability),返回從-∞到任意曲線下累積面積的u(或Z)的界值。例如,公式“=NORMSINV(0.109348552)”返回-1.23。
(二)t值表與t分布函數
t分布曲線形態是與自由度(Degree of freedom)大小有關的對稱分布曲線,與標準正態分布曲線相比,曲線下面積仍為1,但是,自由度愈大,t分布曲線愈接近標準正態分布。多數醫學統計學的t值表(或t界值表)分別有限地給出了在一定的自由度下,t分布曲線下雙尾側或單尾側的概率,實際上是任意一側的積分面積,或者兩側的積分面積之和。
在EXCEL或WPS表格的統計函數中,有TDIST函數,返回t分布雙側或單側的概率,格式為TDIST(x,degrees_freedom,tails)。X為計算的t值;Degrees_freedom為自由度;Tails指明返回的分布函數是雙側或單側分布的概率。如果tails=2,函數TDIST返回雙側概率;如果tails=1,函數TDIST返回單側分布概率。使用此函數可以代替t分布的臨界值表。例如,t=2.343,degrees_freedom=10,公式“=TDIST(2.343,10,2)”返回0.041128661,即從-∞到-2.343與+∞到+2.343的兩側概率之和;如果Tails=1,自動返回左側或右側曲線下面積或概率(如為0.020564331,即0.041128661/2)。由此可見,t值必須為絕對值。同樣,TDIST函數具有TINV反函數,TINV函數可返回某一概率和自由度t分布曲線下的t值,格式為TINV(probability,degrees_freedom)。參數Probability為對應于雙側t分布的概率,Degrees_freedom為分布的自由度。例如,公式“=TINV(0.041128661,10)”返回2.343,即當前曲線下,兩側的t值分別為-2.343和+2.343。
(三)F值表與F分布函數
F值表來自F分布,由于與兩個數據集的自由度變化有關以及表的有限性,僅有右側的0.05和0.01兩個概率值,無法滿足醫學科研的實際需要。而在EXCEL或WPS表格的FDIST函數中,可提供兩個數據集任意自由度變化的右側任何概率積分,格式為FDIST(x,deg_freedom1,deg_freedom2)。X為所計算的F值;Deg_freedom1為分子自由度;Deg_freedom2為分母自由度。例如,經方差分析、計算,得F=5.343,分子自由度(組間)=3,分母自由度(組內)=28,公式“=FDIST(5.343,3,28)”返回0.004883957,即在F分布曲線下,從+∞到5.343右側的面積(概率)為0.004883957。同樣,FDIST有FINV反函數。FINV函數返回F分布右側概率的F界值,格式為FINV(probability,deg_freedom1,deg_freedom2)。Probability為F分布右側的概率,即P值;Deg_freedom1為分子自由度;Deg_freedom2為分母自由度。例如,已知F分布曲線下右側的概率(P)=0.005,分子自由度(組間)=3,分母自由度(組內)=28,那么其相應的F界值是多少?可用公式“=FINV(0.005,3,28)”,返回5.317,即當前的F分布曲線下,當P=0.005時,其F界值為5.317。
(四)χ2值表與χ2分布函數
卡方(χ2)值表同t值表類似,與自由度有關,所給出的概率和χ2值也是有限的。而EXCEL或WPS表格的CHIDIST函數可取代χ2值表,格式為CHIDIST(x,degrees_freedom),可返回χ2分布曲線下右側的概率。X為計算的χ2數值;Degrees_freedom為自由度。例如,經卡方分析、計算,得χ2=8.643,自由度=3,公式“=CHIDIST (8.643,3)”返回0.034434,即在當前的χ2分布曲線下,從+∞到8.643右側的面積(概率)為0.034434。同樣,CHIINV為CHIDIST的反函數,計算χ2分布曲線下右側概率的反函數值,即χ2界值,格式為CHIINV(probability,degrees_freedom)。例如,已知當前的χ2分布曲線下右側P=0.005,自由度=3,求其相應的χ2界值。可用公式“=CHIINV (0.005,3)”返回12.838,即在當前的χ2分布曲線下,當右側面積(概率)為0.005時,其相應的χ2界值為12.838。
至于在直線相關分析、秩和檢驗中所用到r界值表和T界值表,實際上來自t分布、χ2或u(Z)分布,可用其相應的計算機函數代替。而在方差分析中,所用到的Q界值表等,在我國比較普及的SPSS或SAS等統計軟件提供了相應的分布概率值。特別是SPSS軟件,因其為菜單式界面和對話框的特點,教師易于操作,只需點擊鼠標就可完成,比較適合于在課堂教學中運用,也可為學生今后的學術發展打下一定的基礎。該軟件是在醫學界非專業人員應用最多的統計分析軟件,也是國際醫學期刊引用最多的統計軟件。[4]
三、意義
(一)統計界值表的取消可促進教學效率的提高
在傳統的醫學統計學教學中,教師多側重于某一章節理論知識的講授,然后安排學生到計算機房進行相應的統計實習。由于實習課與理論課有一定的時間間隔,多數學生遺忘了理論知識,故容易出現理論與實際相脫節的現象。
在醫學統計學教學中,取消有關統計界值表的教學內容可促使教師將教學與計算機結合起來,將統計學理論與實踐結合起來,加深學生對統計學理論的理解,提高學生綜合運用理論和方法的能力。
例如,對于標準正態分布,為何其標準差為1,均數為0?以往的教學中,教師往往通過數學證明,或者讓學生死記,學生只知其然,不知其所以然。但是,如果教師課前將大樣本資料通過QQ群傳給學生,上課首先簡單地講解一下數學公式證明,然后讓學生用計算機求出樣本資料均數和標準差,再通過均數和標準差求出各觀察值u(Z),用計算機繪u(Z)直方分布圖,并求其均數和標準差。不難發現u(Z)呈正態分布,其均數和標準差為0。
(二)統計界值表的取消可提高學生的學習能力和教師的教學水平
將計算機直接引入課堂后,可以讓學生通過自身的電腦產生一個合理的隨機數,并與課堂作業練習相結合。這樣將復雜統計資料的處理、運算與具體的實踐相融合,可大大激發學生的學習興趣,提高學生綜合分析、解決問題的能力,避免作業互相抄襲的現象。
統計界值表的取消必然要求學生“帶電腦進課堂”。由于學生所帶電腦的“檔次”不同,會出現不同版本的操作系統和應用軟件。這迫使教師要在課前熟悉不同版本的操作系統和應用軟件。課中主導與從屬地位的相互轉換,促進了教師與學生的互動,既可獲得良好的教學效果,又可極大地提高教師的教學水平。
[ 參 考 文 獻 ]
[1] 陳啟光,陳炳為.醫學統計學(第三版)[M].南京:東南大學出版社,2013:222-236.
[2] 高祖新.醫藥數理統計學方法(第五版)[M].北京:人民衛生出版社,2013:268.
[3] 方積乾,徐勇勇.衛生統計學(第七版)[M].北京:人民衛生出版社,2012:458.
[4] 李英.淺談統計學基礎的教學改革[J].高校講壇,2011(2):265-266.
[責任編輯:鐘偉芳]