高麗
[摘 要]近年來隨著計算機技術和生物信息學的發展,統計軟件應用已成為本科教學的必修內容,其中Excel和SPSS統計軟件是大多數高校授課的首選分析軟件。作者針對生物統計學教學過程中存在的問題,參考多年來的教學和科研經驗,對傳統的教學內容進行了更新調整,介紹了Excel和SPSS軟件中常用的統計分析方法,分析和比較了兩種統計軟件的應用范圍和優缺點,探索利用Excel和SPSS軟件輔助理論教學的生物統計學教學新模式。
[關鍵詞]生物統計學 教學內容 Excel軟件 SPSS統計軟件
[中圖分類號] G642 [文獻標識碼] A [文章編號] 2095-3437(2014)15-0144-03
生物統計學是一門在實踐中應用十分廣泛的工具學科。近年來,隨著生物學的快速發展和計算機技術普及[1],統計分析軟件的應用越來越廣泛。統計軟件的使用使得計算變得簡單、快捷和準確,利用統計軟件分析處理數據是生物統計學發展的必然趨勢。[2]但很多院校生物統計學的教學內容僅限于統計原理等理論知識的講解,有關統計分析軟件的應用較少,學生不具備運用統計軟件分析試驗數據的能力。
Excel和SPSS軟件是大多數高校本科授課的首選統計分析軟件。[3]Excel作為常用辦公軟件,同時也可完成大多數統計分析任務;SPSS為專業統計軟件,統計分析功能強大,是大型統計分析中的常用工具。作者結合多年來從事生物統計教學和科研工作的實踐經驗,就適合水產養殖及相關專業的教學內容進行了調整更新,探索使用統計軟件SPSS和Excel來輔助理論教學的模式,以提高學生對理論知識的理解和軟件應用能力。
一、生物統計學教學內容的調整
生物統計學作為一門應用性很強的工具學科,在教學內容安排上應遵循據既重視基本理論又重視實踐的思路。目前,大多數院校生物統計學的教學課時為54學時,有的僅36學時,這就需要精選、調整教學內容,形成適合本專業特色和學生實際需要的課程體系。生物統計學是我校海洋學院水產養殖等本科專業的必修課,總課時為54學時,不單獨開設實驗。同時,我校水產養殖專業不開設概率論與數理統計課程,學生的概率論知識比較薄弱。基于以上因素,作者結合自己多年來從事生物科研的經驗,把教學內容確定為統計原理、統計方法、統計軟件和試驗設計四個部分,基本章節為:①試驗資料整理與特征數的計算;②概率與概率分布;③統計推斷;④方差分析;⑤回歸及相關分析;⑥試驗設計。
在教學實踐中,遵循以下原則:①加大對統計分析原理、統計方法的適用范圍與應用案例、統計結果的解釋等介紹,減少對公式的推導和統計分析計算過程。②結合課程內容,增加水產養殖研究方向的應用性案例講解,使教學內容適應專業特點。③重視統計軟件的使用,在每章節講解完理論知識后,緊接著演示Excel和SPSS軟件在本部分的應用,實現教學內容與統計軟件應用的有機融合。④布置課下作業,要求學生用傳統的計算器計算和統計軟件分別完成,并對所得統計結果做出解釋和分析。通過此環節,可使學生加深對統計原理等理論知識的理解,并掌握應用軟件進行數據統計分析的方法。
二、Excel軟件常用統計功能的介紹
Excel軟件除具有較強的數據計算和圖表制作功能外,[5,6]還提供了大量統計函數和數據分析工具,其統計功能涵蓋了統計學的基本內容,可基本滿足生物統計學的本科教學要求。
(一)統計函數的應用
在Excel的“插入”菜單項,選擇“函數”命令,除了常用的數學和邏輯函數外,還可應用統計函數進行統計學參數或概率值的計算。
(1)統計學參數或特征數的計算
平均數、標準差等常用參數可由統計函數計算,反映數據集中趨勢的函數有Average(均值)、Median(中位數)、Mode(眾數)等;反映離散趨勢的函數有:Stdev(樣本標準差)、Var(樣本方差)、Skew(偏態系數)等。
(2)數據分類
Frequency函數可實現對大量數據進行分類和統計。函數表達式:Frequency(Data array,Bins array),注意該函數應以數組公式的形式輸入。
(3)t 檢驗
t 檢驗可由Ttest函數完成,函數功能為返回t檢驗的概率。函數表達式:Ttest(Array1,Array2,Tails,Type),設置各項參數,運行得到t檢驗的概率值(P),以此來判斷顯著性水平。如P<α,則拒絕原假設,說明檢驗達顯著水平;反之則不顯著。
(二)數據分析工具的應用
Excel中的分析工具庫具有較強的統計分析功能,但此功能需加載后才可使用。每次使用時,先按正確格式輸入原始數據,單擊“數據分析”選項,即彈出對話框,統計分析方法包括描述性統計、t檢驗、方差分析、協方差分析、直方圖、回歸、相關、F檢驗等,主要介紹如下。
(1)數據分類
首先將各組的組上限值輸入工作表,在“數據分析”對話框中選擇“直方圖”,在對話框中“輸入區域”輸入分類數據所在的單元格地址,“接收區域”輸入分組組限所在的單元格地址,運行后即可顯示分類結果,包括每組的頻率數及百分比等。
(2)描述統計
在“數據分析”對話框中選擇“描述統計”,即可計算出最小值、最大值、平均數、標準差等多項統計參數。
(3)t檢驗
包括平均值的成對二樣本分析、雙樣本等方差假設、雙樣本異方差假設三種類型。以成對二樣本分析為例,在“數據分析”對話框中,選定“t檢驗:平均值的成對二樣本分析”,分別在變量1、變量2區域選擇數據所在單元格地址,之后在“輸出區域”選擇空白單元格,確認后即可輸出結果。t檢驗結果包括t值、df(自由度),單尾和雙尾概率(P)、單尾和雙尾的臨界t值等信息。
(4)方差分析
包括單因素、無重復雙因素、有重復雙因素三種方差分析類型。以單因素方差分析為例,在“數據分析”中選定“方差分析:單因素方差分析”,彈出對話框后,在輸入區域、分組方式、α、輸出區域等處輸入相應信息后,即可輸出方差分析表。
(5)相關與回歸
相關系數:在“數據分析”對話框,選定“相關系數”,彈出對話框后,設置輸入區域、分組方式、輸出區域等各項參數后,即可得到兩組數據間的相關系數。
線性回歸:在“數據分析”對話框,選定“回歸”,彈出對話框后,在X值輸入區域、Y值輸入區域、置信度、輸出區域等處輸入相應信息后,即可返回截距(intercept,a)、回歸系數(b)以及回歸系數的t檢驗結果。
三、SPSS軟件常用統計功能的介紹
SPSS軟件是國際流行的統計分析軟件,具有數據轉換、統計分析和圖形繪制等強大功能,目前最新版本為22.0版本,可在網上下載免費英文或漢化版本。
(一) 數據文件的建立
在進行統計分析之前,需建立正確的數據文件,注意各種統計方法要求數據的輸入格式有很大不同。進入SPSS軟件頁面,在數據窗口直接輸入各變量的原始數據,也可利用復制粘貼功能把Excel 文件中的數據拷貝過來;此外,可在SPSS中直接打開Excel 文件,選擇需分析數據的工作簿。
(二)主要統計功能
SPSS幾乎涵括了生物學中所有的統計方法[3,7],包括描述統計、比較均值、一般線性模型、相關、回歸、聚類分析、非參數檢驗等,現根據課堂所授理論內容,把常用功能介紹如下。
(1)描述性統計
單擊“Analyze”菜單中的“Descriptive Statistics”,選中“Descriptives”,彈出對話框,選擇要分析的變量移到右面的 Variables框,單擊“Option”按鈕彈出一個窗口,里面列出了各項統計參數,包括均值、標準差、標準誤等,根據需要勾選,確定即可。
(2)數據分類
操作步驟:①確定分組的組數、組距和組限;②單擊“Transform”菜單,選擇“Recode into different variables”,在彈出的對話框中,給輸出的新變量命名;③點擊“New and old values”按鈕,在新窗口左邊舊值處輸入每組的上下限,在右邊賦以相應的新值。④對新變量進行頻數分析,單擊“Analyze”菜單中的“Descriptive Statistics”,選中“Frequency”,即可繪制精確頻數表。
(3)t檢驗
包括單樣本t檢驗(One sample T Test),成對樣本t檢驗(Paired-samples T Test),獨立樣本t檢驗(Independent-samples T Test)三種類型。以獨立樣本t檢驗為例,步驟為:①單擊“Analyze”菜單中的“Gompare Means”,選擇“Independent Samples T Test”,在彈出的對話框中,Test Variables框輸入要分析的變量;②Grouping Variable框:輸入組別變量,單擊“Define groups”按鈕,分別在 Group 1和Group 2輸入兩組的代碼;③“Continue”返回到主對話框,點擊“OK”。輸出結果中,有假設方差相等和不相等兩行,應先判斷Levene檢驗結果,若Sig.(P)>0.05,說明方差齊性,故選擇假設方差齊性一行的t檢驗結果,反之則選擇方差不齊一行;之后根據t檢驗結果中的P值,判斷均值差異的顯著性水平。
(4)方差分析
常用的有單因素、雙因素及多因素方差分析等。單因素方差分析步驟:①在“Analyze”菜單中打開“Compare Means”,選擇“One-Way ANOVA”命令。在主窗口中,Dependent List框輸入指標變量,Factor框輸入因素變量;②單擊“Post Hoc~~”按鈕,在對話框中選擇多重比較方法,“Continue”返回主窗口;③單擊“Option”按鈕,在對話框中選中Descriptive,返回主窗口,點擊“OK”運行。輸出結果包括描述性統計、方差分析表、兩兩比較等。
(5)相關分析
包括雙變量、偏相關和距離相關分析。雙變量相關分析:單擊“Analyze”菜單中的“Correlate”,選中“Bivariate”,彈出對話框,在Variables框選入要分析的變量;在相關系數欄選擇Pearson相關系數,在顯著性檢驗欄中選中Two-tailed。運行可返回兩個變量間的相關系數,并用*和**注明其顯著性水平。多個變量間的相關分析,其步驟同兩個變量,只是在Variables框選擇多個變量,即可得出多個變量間的兩兩相關系數。
(6)線性回歸分析
單擊“Analyze”菜單中的“Regression”,選中“Linear”,彈出對話框。在Dependent框輸入因變量(Y),Independent框輸入自變量(X);點擊“Statistics”按鈕,在彈出的窗口勾選Descriptive,“Continue”后運行即可。統計結果包括線性方程的各項參數及回歸關系檢驗結果。
四、Excel和SPSS軟件的比較
利用Excel 軟件可較方便完成簡單的統計分析,而SPSS統計軟件具有強大的統計分析功能,現對兩種軟件的適用范圍和優缺點比較如下:
描述統計。Excel軟件中,利用一個統計函數只能計算一個參數值;利用“數據分析”工具中的“描述性統計”,可返回一系列特征參數值,但只能是一個變量。在SPSS中,可同時對一個或多個變量進行描述統計分析。
t檢驗。對兩個樣本進行均值比較的時候,應先判斷兩總體方差是否相同,然后進行t檢驗。Excel軟件提供了樣本等方差和異方差來兩種分析程序,統計時應先進行F檢驗(雙樣本等方差檢驗),之后再選擇相應的統計方法進行t檢驗。SPSS軟件可同時返回方差齊性檢驗結果、方差齊性和非齊性兩種情況下的t檢驗結果,可根據齊性檢驗結果,直接選擇對應的t檢驗結果,較為簡便。
方差分析。SPSS軟件中方差分析較為齊全,而Excel軟件只適用于最基本的方差分析。就統計結果來看,Excel軟件僅列出了方差分析表;而SPSS軟件不僅包括方差分析表,如果F檢驗顯著,還可給出多重比較結果,以判斷兩兩處理間均數差異的顯著性。
相關分析。Excel軟件中,利用Correl函數可得到一對變量間的相關系數;利用數據分析工具,可同時得到兩個或多個變量間的兩兩相關系數。SPSS軟件不僅可以同時對兩個或多個變量間進行相關分析,還標明了顯著性水平。
線性回歸。利用Excel軟件中分析工具中的“回歸”,或者SPSS軟件“Regression”中的“Linear”選項可進行線性回歸。根據輸出結果均可寫出線性回歸方程,并判斷方程的顯著性水平,兩個軟件沒有大的差異。
數據分類。Excel軟件中,確定分組組限后,利用Frequency函數進行頻數分析,或利用分析工具中的“直方圖”,較為簡便。而SPSS中,確定分組組限后,應先進行數據轉換,建立新變量,之后再利用“Descriptive Statistics”中的“Frequency”對新變量進行頻數分析。
五、結語
Excel 和SPSS軟件各有自己的應用特點,就統計分析功能而言,Excel的通用性更強,SPSS的專業性較強。在對數據進行簡單的統計分析時,Excel較為方便,適合生物統計學初學者使用。在學生具備全面的統計知識后,應逐漸加強對SPSS軟件的學習,以進一步提升分析復雜試驗數據的能力。在使用統計軟件時,應首先根據課堂上的統計理論知識,選擇正確的統計方法,建立相應的數據文件,并最終能夠從統計學和專業的角度正確解釋所得結果。生物統計學教學過程中,在學生充分理解了理論知識和統計原理后,靈活結合Excel和SPSS統計軟件輔助多媒體理論教學,這種教學模式不僅可以培養學生解決實際問題的能力,還能顯著提高教學效果。
[ 參 考 文 獻 ]
[1] 寧海龍,李文霞,金益.信息時代生物統計學教學的特點與對策[J].東北農業大學學報(社會科學版),2006(4):91-92.
[2] 李昆太,程新.生物統計學教學改革初探[J].大學教育,2013(7):93-94.
[3] 丁雪梅,徐向紅,邢沈陽等.SPSS數據分析及Excel作圖在畢業論文中的應用[J].實驗室研究與探索,2012(3):122-128.
[4] 李春喜,邵云,姜麗娜.生物統計學[M].北京:科學出版社,2009.
[5] 楊景峰.EXCEL的計算功能在生物統計學教學中的應用[J].內蒙古民族大學學報(自然科學版),2012(6):738-741.
[6] 張丹,呂海燕,張幸果等.應用Excel軟件有效提高《生物統計學》課程的教學效果[J].河北農業科學,2012(8):93-95,99.
[7] 梅花,白乙爾圖.SPSS統計軟件在《生物統計學》教學中的應用實例[J].中國畜牧獸醫文摘,2012(7):217.
[責任編輯:林志恒]