摘 要:在總體服從正態分布的前提下,方差齊性與否決定了單因素多水平的模型能否采用方差分析來檢驗均數間的差異。主要介紹在EXCEL中,Bartlett齊性檢驗的自動計算工具的設計與實現。工具完成后可以重復使用,大大減少以后齊性檢驗計算的工作量。
關鍵詞: 方差齊性;總體;檢驗;EXCEL
中圖分類號: G8032 文章編號:1009-783X(2007)01-0114-03 文獻標識碼: A
在體育教學和運動訓練等的科學實驗中,對影響體育教學成績及運動競賽的成績的原因的探究,一直是當代體育科研中研究的主線。例如,在運動訓練中,為更加有效地提高運動成績,通常需要考察不同的運動強度、不同的運動量和不同的運動持續時間等因素對不同的專項運動成績的影響,目的是為了找出適合不同專項的運動強度、運動量、運動持續時間的較佳組合。又如,我們從運動系體操專業的學生中隨機抽取條件相似的20名學生隨機分成4組,每組5人,由4位教師施以不同的教學方法,教20個具有相當難度的體操動作,并規定每個動作的計分標準,試教一學期后舉行測試,測得各組得分,見下表。現假定每組的得分服從正態分布,則這4種教學方法的效果間是否有顯著性差異的問題就是我們迫切需要了解的。
如果僅僅從上例每組的總分上看,顯然四種不同的教法帶來了四種不同的學生得分,分值上肯定有差異,但這種差異主要是由隨機誤差引起的,還是主要是由于教學方法的不同而引起的,即是否有顯著性差異的統計結論,還須經統計檢驗后才能得出。若用兩個樣本間均數差異的顯著性檢驗方法來處理本類問題的話,需要做6次檢驗。若這樣的試驗安排共有N組,則需要做N(N-1)/2次兩兩比較,這一方面,顯然太麻煩了,另一方面,當設定兩兩比較時,犯第一類錯誤的概率α=0.05,則N個獨立樣本兩兩比較時,每次比較不犯第一類錯誤的概率為0.95N(N-1)/2,相應犯第一類錯誤的概率為1-0.95N(N-1)/2,遠遠大于事先設定的0.05。因此,多個均數比較時不宜采用我們熟知的t檢驗作兩兩比較,應采用一種新的統計處理方法來實現。
解決這一類問題的方法是方差分析。它最早由英國統計學家費舍(R.A.Fisher)在1923年提出,最初用于生物學和農業試驗方面,后于1946年由斯內德克(G.W.Snedecor)進一步加以完善。為紀念費舍的杰出貢獻,又把它稱為F檢驗。現在它在體育領域中也得到了廣泛的應用。
方差分析是在總體服從正態分布且方差齊性的假設下展開的,在滿足總體正態性但方差不齊時,此法不可用,而只能改用方差不齊時兩均數差異的顯著性檢驗的方法來進行兩兩均數間的比較。因此,這里很有必要來考慮方差的齊性檢驗的問題。本文主要介紹在EXCEL中如何來實現多總體方差的Bartlett齊性檢驗的自動計算。
1 Bartlett方差齊性檢驗的方法
Bartlett法是一種可在各水平重復測定次數不等時用來檢驗方差齊性的方法,雖然,當各水平重復測定次數相等時,可用Cochran提供的檢驗方法,但Bartlett法同樣適用。
2 在EXCEL中進行Bartlett方差齊性檢驗的方法
2.1 工作表的安排
在用Bartlett法進行方差齊性檢驗時,為使計算相對自動化,而且能在必要時可以擴展到更多的水平數,需要在同一個工作簿中動用兩張工作表。
其中,工作表1用來存放實驗結果的原始數據。工作表2用來存放中間和最后的運算結果。
2.2 原始數據清單的格式要求
在第一張工作表中,第一行從A到Z的各列中用來建立單因素相應各水平的名稱,即字段名。字段名應由字母或漢字開頭加EXCEL中的其它合法字符組成。考慮到后續運作的需要,字段名的長度不要過長,最好在10個字符以內。
A列中用來存放因素的第一個水平的字段名和測試值,B列中用來存放因素的第二個水平的字段名和測試值,余類推。建立的數據清單,如圖1所示。需要注意的是在工作表1中除輸入上述必須的數據外,不能在空白單元格中輸入與實驗數據無關的任何內容。
2.3 在工作表2中用Excel的公式和函數進行計算
根據Bartlett方差齊性檢驗的計算公式,用Excel公式和函數計算和存放中間統計量和最后結果。從而使整個計算過程實現自動化。工作表2中的樣式見圖2。
需要注意的是,在工作表2第12行以上的整個區域中的許多單元格,是被用來定義存放不同的計算結果的,因此,與此無關的內容,不能在本區域中出現。
2.3.1 單因素水平數(即分組數)的確定
在計算過程中,多次用到水平數這個值,由于水平數會隨著實際問題的變化而變化,為達到自動計算的目的,必須用函數來對它進行實際的測定,具體可通過函數COUNTIF(Sheet1!A:Z,\">\"\"\")來計算該問題的實際水平數。其中A:Z表示,由A到Z共26列和EXCEL默認的最大行組成的區域,也即測定的最大水平數定義為26。本文開發的計算工具中,定義的最大水平數為26。如果實際的水平數比這還大,可通過修改Z值使之更大即可。
2.3.2 總觀測值數(各樣本含量的總數)的確定
同樣用函數COUNT(Sheet1!A:Z)可計算得到該問題中總觀測值數。同上,如果實際的水平數比這還大,可通過修改Z值使之更大即可統計出各樣本含量的總數。
在本計算工具的開發過程中,上述分組數和總觀測值數的計算函數將被嵌套在其它函數中用來實現具體的功能。
2.3.3 各水平樣本含量的確定
工作表1中,第一列即A列的樣本含量的確定, 可用COUNT(Sheet1!A:A) 計算得到該列的觀測值數。由于工作表1中的水平至少3個或3個以上,因此,須在工作表2中用多個處在同一行的連續的單元格來存放計算結果,這就帶來不確定性。當預設有公式的單元格數超過實際的因素的水平數時,如不作特殊處理將在后續的計算中會帶來不必要的麻煩。為了使工作表2的相應列中列出各水平的樣本含量數,而對超出對應水平數的列中不顯示任何信息,從而不影響后續的計算,因此,可使用IF()函數來實現上述想法,即當某列中的觀測值數為0時,在工作表2的相應單元格中,不顯示任何信息。考慮到其它各列的樣本含量的統計方法同其是一樣的,可通過使用填充句柄復制的方法實現公式的粘貼,為能得到圖2所示的結果,故在工作表2的B2單元格中輸入“=IF(COUNT(Sheet1!A:A)=0,\"\",COUNT(Sheet1!A:A))”,其它各列與第2行對應單元格中的計算公式可通過向右拖曳填充句柄的方式來實現公式的錄入。同前一致,在工作表2中,從B2單元格起已將計算各樣本含量數的公式設置到AA列的AA2元格。這樣最多可同時處理26個水平。如水平數更多時,用上法繼續向右復制粘貼公式即可。
2.3.4 各樣本自由度的確定
樣本的自由度等于樣本含量減1。工作表2中的第三行[l4]被設計用來存放計算得到的各樣本自由度的結果。主要是為了用它來計算 的結果。它可通過上一行的對應數據減1來求得。考慮到上述的其它原因,因此在單元格B3中輸入“=IF(B2=\"\",\"\",B2-1) ”,即可計算得到該列樣本對應的自由度。其它各列與第3行對應單元格中的計算公式可通過向右拖曳填充句柄的方式來實現公式的錄入,一直到AA3單元格。
2.3.5 各樣本方差的計算
在EXCEL中,樣本的方差可通過調用VAR()函數來計算。區域A:A表示整個A列,函數VAR(A:A)可用來求A列樣本的方差。因此,在B4單元格中輸入“=IF(COUNT(Sheet1!A:A)=0,\"\",VAR(Sheet1!A:A))”,其它各列與第4行對應單元格中的計算公式可通過向右拖曳填充句柄的方式一直到AA4單元格結束來實現公式的錄入。
2.3.6 離均差平方和的計算
離均差平方和這一行的設置是專門用來計算合并方差的。在EXCEL中,調用DEVSQ()函數可計算各樣本的離均差平方。同樣本方差的計算方法一樣,只需在B5單元格[16]中輸入“=IF(COUNT(Sheet1!A:A)=0,\"\",DEVSQ(Sheet1!A:A))”,其它各列與第5行對應單元格中的計算公式可通過向右拖曳填充句柄的方式一直到AA5單元格結束來實現公式的錄入。
2.3.7 方差的對數與自由度乘積的計算
方差的對數與自由度乘積的計算是為計算q值做準備的。在EXCEL中,以10為底的方差的對數的計算,可直接調用LOG10( )函數來完成。因此,只需在B6單元格中輸入“=IF(B2=\"\",\"\",LOG10(B4)*B3)”,即可得到第一個樣本的方差的對數與其自由度乘積的計算結果,其它各列與第6行對應單元格中的計算公式的錄入,可通過向右拖曳填充句柄的方式一直到AA6單元格結束來實現。
2.3.8 合并方差的計算
合并方差的計算是為計算最終的χ2值做準備的。根據組合樣本方差的計算公式,在B7單元格中輸入“=SUM(B5:I5)/(COUNT(Sheet1!A:Z)-COUNTIF(Sheet1!A:Z,\">\"\"\"))”,即可求得合并方差。
2.3.9 q值的計算
總觀測值數與水平數之差可通過“=COUNT(Sheet1!A:Z)-COUNTIF(Sheet1!A:Z,\">\"\"\")”來求得,方差的對數與自由度乘積的總和可用“=SUM(B6:AA6)”來求得,故在B8單元格中輸入“=(COUNT(Sheet1!A:Z)-COUNTIF(Sheet1!A:Z,\">\"\"\"))*LOG10(B7)-SUM(B6:AA6)”,即可求得q值。
2.3.12 P值的計算
調用卡方分布函數CHIDIST(),可計算得到給定的χ2值在給定的自由度下的概率值。在B11單元格中輸入“=CHIDIST(B10,COUNTIF(Sheet1!A:Z,\">\"\"\")-1)”,即可求得原假設成立的概率值。
2.3.13 得出分析結論
當p<0.05時,拒絕方差齊性的原假設,當p>=0.05時,沒有理由拒絕方差齊性的原假設。故在B12單元格中輸入“=IF(B11>0.05,“方差齊性”,“方差不齊”)”。
我們將上述公式在“方差齊性檢驗”工作簿的工作表2中對應地做了設置,并用8水平的一組數據進行測試,運行正常,用表1中的數據進行了校驗,證明工作表2中預設的公式是正確的。表明上述的思路是正確的。
3 實例分析
在田徑的鉛球教學中,為了研究三種不同的鉛球教學方法的效果,將某年級三個班中,同齡的各種運動能力基本相同的男生分成三個組,分別按以下三種不同的方法進行教學,方法一(A1)、方法二(A2)、方法三(A3)。在三個月后,經過多次課的教學,以同樣的標準測得各組成績,見圖3。試分析三種方案的教學效果的方差間是否齊性?
在EXCEL中的解題步驟:
1打開“方差齊性檢驗”的工作簿。
2在工作表1中按圖三所示輸入字段名和原始數據。
3單擊工作表2的標簽,在工作表2中出現如表4所示的結果,不拒絕方差齊性的原假設。
4自動計算工具制作的注意事項。
1) 原始數據的錄入應嚴格按文中“原始數據清單的格式要求”中的有關說明進行,方可在工作表2中得到正確的運算結果。
2)工作表2的許多單元格中的IF()函數不能缺少,它不僅是用來美化工作表2的,更是用來確保計算的正確性的。
3) 注意函數與公式輸入的正確性,這是自動檢驗工具完成的關鍵。尤其應該注意公式和函數中的標點符號必須是英文半角符號。
4 小結
1)本文通過對Bartlett齊性檢驗中計算公式的分解,合理利用EXCEL中的函數,實現了多總體方差的Bartlett齊性檢驗的自動計算。
2)方差齊性自動檢驗工具一旦制作完成,即可重復使用。使用簡單方便,幾乎一勞永逸。大大提高了運算速度。
3)可以根據教學對象,引導學生按此文敘述的步驟自己實現自動計算工具的制作,教師也可以將自己制作的檢驗工具拷貝給學生,供學生使用。
本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。