曹遠紅
(湖南師范大學體育學院,湖南 長沙 410012)
科學研究的目的是通過研究事物間的相互關系,闡明事物客觀存在的規律性。而客觀的規律是很復雜的,要考察交織在一起的各種因素之間的關系,就需要進行科學實驗;為了合理解釋實驗數據中所反映的客觀規律,就需要選擇恰當的統計分析方法[1]。體育科學中,統計分析方法的掌握程度直接影響著體育科學前進的步伐。體育科學統計分析方法的應用狀況如何?怎樣進一步提高統計分析方法的應用水平?這正是本調查研究要解決的問題。
本文旨在調查目前體育科學實驗研究中統計分析方法的應用狀況,將能夠代表體育科學實驗研究水平的期刊《體育科學》《北京體育大學學報》《體育與科學》3種核心期刊中611篇實驗性研究論文的調查論文為調查對象。為考察體育科學統計分析水平的進展狀況,調查時間定為2000-2008年。
1.2.1 文獻資料法 在中國知網上檢索到1990-2008年體育科研中有關“統計誤用”方面的文獻共27篇,又在中國知網上檢索到醫學、生物科學方面的有關“統計誤用”的文獻共186篇。通過對以上資料收集、鑒別、整理與分析,確定了初步
調查指標和指標量化標準。
1.2.2 調查法 (1)預調查。預調查和正式調查都是由本人獨立完成。預調查的研究對象是2000-2008年北京體育大學學報中各年第1期、第6期的實驗性研究論文,共約60篇。預調查的目的一是確定樣本含量,二是考察“最初調查指標和指標量化標準”的不足之處,然后對其進行必要的修正,建立“最終調查指標和指標量化標準”。
本調查研究中,采用抽樣調查時總體率的估計方法計算樣本量。公式如下:

其中,式中n為樣本含量;α為第Ⅰ類錯誤,本次調查取0.05;δ為容許誤差,根據以往調查經驗,取0.04;預調查60篇論文中,統計分析合理的有15篇,所以總體率π為0.25,因此:

本次調查中,選取的3種核心期刊內的實驗性研究論文共611篇,遠遠高于所需樣本量,滿足了調查需求。
指標的修正方法是“發現問題即刻修正”,沒有對存在的問題規范化的分類描述。通過指標的修改、剔除等過程,使調查指標更能能夠體現研究內容和研究目的(提高指標效度);通過指標定義的確切化、指標調查順序的調整,使調查過程更加易于實施(提高可行性);通過指標的細分、準確量化、準確定義,提高指標的穩定性和敏感性。建立的“最終調查指標和指標量化標準”。(表1)
(2)正式調查。根據“最終調查指標和指標量化標準”制作調查表,展開正式調查并收集數據。調查順序按“年”(3種期刊“卷”號不同,但都是每年1卷)進行,采用“隔年調查、順序倒置”的方法,即調查順序為2000年、2002年、2004年、2006年、2008年、2007年、2005年、2003年、2001年。每一年內的3種文獻一起調查,順序不確定。
1.2.3 數理統計法 本研究采用的統計方法有頻數分布表、交叉列聯表、x2檢驗等。
2.1.1 總體實際應用狀況 3種期刊611篇實驗性研究論文中各種統計方法(實際統計)實際應用狀況統計可知,統計方法應用較多的依次是t檢驗(45.5%)、單因素方差分析(26.8%)、多因素方差分析(3.9%)、重復測量方差分析(1.8%)、其他等。其中,統計方法不詳,統計描述中只描述P值的占17.9%。“差值t/方”指前后測量差值的t檢驗或方差分析,是專門處理前后測量設計的統計分析方法,占1.1%。
2.1.2 統計方法逐年應用狀況 由于“統計方法”中“差值t/方”、協方差分析、重復測量方差分析、多因素方差分析應用的頻數較少,并且相對于t檢驗和單因素方差分析都屬于較復雜問題的統計分析方法,所以可以把它們都稱為“復雜統計分析”。t檢驗只能進行2組之間的對比分析,可認為是“簡單統計方法”,單因素方差分析處理3組及以上之間的對比分析,可認為“較復雜統計方法”。最終進行逐年分析描述實際統計時只把“t檢驗”“單因素方差分析”“復雜統計分析”“統計不詳,只有P值”納入,結果見圖1。

表1 最終調查指標和指標量化簡表

圖1 逐年統計方法應用頻率

圖2 各理論統計對應統計分析合理性分布
經x2檢驗,統計方法與卷(年)存在交互作用(x2=59.455,P=0.000<0.01),也就是說,統計方法應用狀況在2000-2008年變化有非常顯著性差異。2000-2008年t檢驗(簡單統計方法)應用頻率呈降低趨勢;單因素方差分析(較復雜統計方法)應用頻率呈上升趨勢;復雜統計方法的應用頻率也有上升趨勢,但是上升幅度較小,至2008年,其應用基數仍然較小。統計方法越復雜,越容易正確地分析復雜的研究問題。體育科學實驗研究中,研究者應用復雜或較復雜的統計方法的頻率逐漸增多,體育科學實驗研究統計應用方面正在不斷的進步當中。
“不詳,只有P值”,只用P值與顯著性水平的大小來描述統計結論,而不明確表達統計方法的現象在逐漸減少,但由圖1可知,這種減少的趨勢并不太明顯,到2008年,仍然有8.7%的論文存在這樣的問題。
2.2.1 總體合理性分析 統計分析的合理性是指統計分析時應用的統計方法的合理性,統計分析合理率為24.5%,不合理率58.4%,不明確率占15.6%,說明2000-2008年的統計方法應用狀況并不樂觀。
2.2.2 各統計分析方法應用的合理性分析 各統計分析方法(理論統計)應用的合理性如圖2所示。
經x2檢驗,各實驗設計方法統計分析合理性不同(x2=27.483,P=0.001<0.05)。由圖1可知,t檢驗、單因素方差分析統計分析合理率>不合理率>不明確率;多因素方差分析、重復測量方差分析、前后測量統計的統計分析不合理率>不明確率>合理率。可以發現,基本統計分析方法統計合理率比高級統計分析平均高出41.8%;然而其統計分析不合理率卻比高級統計分析平均低33.9%。這一現象說明了高級統計方法應用合理率嚴重偏低,基本統計分析方法應用的合理率有待進一步提高。

表2 2000-2008年“無方法適用性檢驗”狀況一覽表

表3 逐年t檢驗誤用狀況一覽表

圖3 統計合理性逐年變化趨勢圖
2.2.3 逐年統計分析合理性分析 2000-2008年的統計分析合理率、不合理率、不明確率的變化趨勢見圖3。
x2檢驗表明,2000-2008年的統計分析合理性變化沒有統計顯著性(x2=23.919,P=0.091>0.05)。由于P值接近顯著性水平0.05,結合圖3,仍然可以做出以下判斷:不合理率曲線基本呈水平,基本沒有變化;合理率曲線有上升趨勢;不明確率曲線有下降趨勢。2000-2008年,不合理率始終比合理率、不明確率高很多。
2.3.1 無方法適用性檢驗 “無方法適用性檢驗”就是說論文中沒有對統計方法適用性進行統計檢驗。2000-2008年“無方法適用性檢驗”狀況見表2。
經x2檢驗,2000-2008年“無方法適用性檢驗”狀況無顯著性變化(Fisher精確檢驗值為 7.956,P=0.341>0.05)。在602篇有效統計論文中,有96.5%的論文沒有介紹相應統計方法的適用性檢驗。這種無視統計方法適用性的問題會很大地影響論文的質量甚至體育科研水平。2000-2008年,高達95.1%的論文沒有統計方法適用性的描述,足可以說明,體育科學實驗研究中,存在著嚴重的“忽視”統計方法適用性的問題。
2.3.2 t檢驗、單因素方差分析的誤用 t檢驗誤用的問題很多體育科研學者都曾經提出過[5-8],也是長時間以來,體育科學研究中統計方法應用方面存在的一個很大的問題。使用單因素方差分析代替多因素方差分析或重復測量方差分析跟前面所講的t檢驗誤用所犯的錯誤類似,都包括導致Ⅰ類錯誤升高、無視重測資料數據相關性等。本調查中,使用過t檢驗的有306篇論文,其中233篇(76.1%)有誤用現象;存在單因素方差分析代替多因素方差分析的有91篇,由于基數較少,不再進行逐年分析。2000-2008年t檢驗應用狀況如表3。
經x2檢驗,2000-2008年t檢驗應用狀況沒有顯著性變化(x2=8.983,P=0.344>0.05)。2008年t檢驗誤用率(64.9%)達到最低,但從此以后是否仍有繼續下降趨勢還需后續調查。
調查可知,2000-2008年t檢驗誤用頻率由高到低依次為t檢驗代替重復測量方差分析(34.8%)、t檢驗代替前后測量方差分析(27.0%)、t檢驗代替單因素方差分析(18.5%)、t檢驗代替多因素方差分析(13.7%)、數據無可比性用t檢驗(6.0%)。可見,在體育科學研究中,t檢驗誤用狀況一直很嚴重,重復測量設計(任何實驗設計經過指標的重測都可以轉化為重復測量設計)中,t檢驗誤用率最高。
2.3.3 實驗前分組合理性證明 實驗前各組非實驗因素的均衡一致是組間具有可比性的前提條件之一。大多數研究者采用隨機方法將研究對象分為若干組別,雖然是“隨機”分組,但是,分組效果如何?隨機誤差有沒有可能影響實驗結果?這些問題都需要實驗前對組間均衡性進行科學的論證,也就是實驗前分組合理性的證明。本調查中,478篇(非單組設計)實驗性研究論文中,有400篇(83.7%)沒有實驗前的分組合理性證明。由此可見,體育科學實驗研究性論文中,大多數研究者沒有對實驗前分組的合理性給予足夠的重視,毫無疑問,這會影響體育研究的科學性。
3.1.1 t檢驗、單因素方差分析應用率較高,復雜統計分析方法應用率偏低;復雜統計分析方法應用率逐漸增多,簡單統計分析方法應用率逐漸減少。
3.1.2 統計分析合理率稍有上升,但是,合理率仍然較低。
3.1.3 統計分析誤用狀況有所減少,但是仍然較為嚴重,具體體現在:缺乏統計方法適應性檢驗;t檢驗誤用率一直較高;缺乏實驗前分組合理性證明等。
3.2.1 加強體育統計學科建設 體育統計作為一門學科,隨著體育學科、體育技術的發展,體育統計作為一門應用性學科愈發顯得其重要地位。目前,我國體育統計教學還有許多問題值得商榷。例如,不同學校課時安排差異很大,到底安排多少課時為宜,還缺乏科學的論證;本科與研究生體育統計教學如何有效銜接、教材如何配套;隨著統計軟件的使用,是否應該增設、如何增設體育統計應用實踐課;作為統計教材如何進一步完善,對于常用的抽樣分布定理、F分布、t分布的定義教材中為什么沒有體現等等,這些問題還有待于進一步研究解決。
3.2.2 同等重視體育統計的“原理”和“應用” 隨著統計軟件在體育統計中的應用,出現了輕原理重應用的現象,統計誤用的根本原因是對統計的相關原理掌握不清,正確的應用需要建立在正確掌握原理基礎之上的。例如,簡單統計方法中的t檢驗,存在著套用公式和決策時套用判斷標準的問題,使用前對數據是否服從正態分布、是相關還是獨立樣本、總體方差是否相等等問題缺乏檢驗;再如,假設檢驗的實質是區分數據差異是抽樣誤差還是條件誤差引起的,所以在實驗前就必須把抽樣誤差降到最小,就必須對實驗分組的合理性進行確切的說明。諸如此類的問題,在實際運用中必需理清各種統計方法的原理和使用條件。
3.2.3 加強體育統計方法使用的融合與借鑒 體育統計這一學科本身就是體育與統計學的融合,在使用統計方法時就必須考慮其使用條件,需要更多的統計知識融合到體育實踐應用中來,才能進一步解決實踐中各種復雜問題。通過調查發現,體育科學實驗研究中,研究者應用復雜或較復雜的統計方法的頻率逐漸增多,這表明體育科學實驗研究統計應用方面正在不斷的進步當中。同時,還可以借鑒經濟學、醫學、生物學等學科的研究成果與統計方法的選擇和使用,防止“錯誤再錯誤”現象。
[ 1 ]張文彤.SPSS統計分析高級教程[M].北京:高等教育出版社,2006.
[ 2 ]戴龍基,張其蘇,蔡榮華.中文核心期刊要目總覽[M].北京:北京大學出版社,2000.
[ 3 ]戴龍基,蔡榮華.中文核心期刊要目總覽[M].北京:北京大學出版社,2004.
[ 4 ]朱強,戴龍基,蔡榮華.中文核心期刊要目總覽[M].北京:北京大學出版社,2008.
[ 5 ]郭璐.體育科學實驗設計誤區[ J ].北京體育大學學報,2006,29(12):1596-1599.
[ 6 ]馬國東.體育科研中統計方法應用的幾個問題[ J ].吉林體育學院學報,2006,22(4):150-151.
[ 7 ]周素華,陸云霞.t檢驗和x2檢驗常見誤用辨析[ J ].公共衛生與預防醫學,2007,18(2):110-112.
[ 8 ]孫芝娟.正確選用體育統計方法的若干思考[ J ].體育成人教育刊,2006,22(2):49-50.