叢乃霞 陳頌
醫學統計學在醫學科學研究中應用比較廣泛。在文獻研究設計、實驗觀察、數據收集、資料分析、結果表達與解釋、論文寫作和發表等環節無不涉及統計學問題。如果統計學內容出了差錯,就會造成實驗設計不合理、實驗方法錯誤、數據錯誤,導致結果和結論出現偏差等嚴重問題,因此,醫學論文正確運用統計學是保證科學研究可信度的關鍵,也是確保醫學論文質量的關鍵[1-2]。程亮星發現[3],《腫瘤基礎與臨床》編輯部修回稿件的直觀性統計學差錯分析中,796篇修回稿件,直觀性統計學差錯率為85.93%。郝麗潔等[4]發現,某醫學期刊413篇論文中,255篇存在統計學差錯問題,發生率為61.74%。汪媛等[5]發現,24種腫瘤學期刊中,18種期刊在論文報告P值時出現了P值的誤用情況,占75.00%。近幾年,作者和編輯越來越重視統計學問題,但從作者投稿和出刊情況來看,統計學差錯問題依然很多。本文通過整理常見問題加以分析,希望引起作者和編輯的重視,減少統計學常見差錯問題。
在《中國療養醫學》雜志稿件庫中,隨機抽取某一年100篇連續編號的文章,其中有3篇文章未涉及統計學內容,97篇文章納入統計學分析,通過直觀審核和SPSS 26.0軟件統計分析判斷正誤。
通過對97篇文章的審核,發現統計學問題比較突出,主要表現在5個方面,見表1。

表1 97篇文章統計學問題差錯率[n(%)]
3.1 統計學方法描述不全面 統計學方法描述過于簡單和籠統,不能很好地解釋和概況研究方法,編輯人員也無法審核研究方法的正誤,統計學方法應寫的具體和詳細。比如,對于計量資料,只寫采用t檢驗,沒有寫清楚具體采用了何種t檢驗,因為t檢驗包括單樣本t檢驗、獨立樣本t檢驗和配對樣本t檢驗。
簡單示例:統計學方法以SPSS 20.0處理,計量資料用t檢驗,計數資料用χ2檢驗,P<0.05為有差異性。
正確示例:統計學方法,數據以SPSS 20.0處理,計量資料以(±s)表示,采用t檢驗,組間比較采用獨立樣本t檢驗,組內比較采用配對樣本t檢驗。計數資料以率表示,采用χ2檢驗,P<0.05表示差異有統計學意義。
3.2 統計學方法描述不一致 文章在統計學方法中提到采用了某種統計分析方法,但在結果或圖表中并沒有對應的統計數據呈現,或者在結果或圖表中出現了統計量及P值,但在統計學方法中并未進行對應描述,出現前后不呼應的情況,導致條理不清,邏輯混亂,嚴重影響閱讀。
3.3 統計學方法誤用 研究應基于實驗設計類型和分析目的不同,選用合適的統計分析方法。通過對97篇論文統計學分析,發現統計學方法誤用問題比較嚴重,比如,一般χ2誤用Fisher精確卡方檢驗,一般χ2誤用配對卡方檢驗。本次統計,單向有序分類資料統計學方法誤用比例高達37%。對于分組變量無序、對比指標變量有序的單項有序統計資料,如果是比較觀察指標不同組間等級強度有無差別,可以根據分組數不同選擇不同的非參數統計分析方法。如果分組數是兩組,選用兩獨立樣本比較的Wilcoxon秩和檢驗進行分析,如果分組數大于等于3種, 則應選用多個獨立樣本比較的Kruskal-Wallis H檢驗和Mann-Whitney U檢驗[6],而不是選擇χ2檢驗。
舉例說明,兩組飛行員治療效果比較,表1比較療效采用了卡方檢驗屬于統計學方法誤用[7],表2采用秩和檢驗是正確的,見表1~2。

表1 兩組飛行員治療效果比較[n(%)]

表2 兩組飛行員治療效果比較[n(%)]
3.4 統計結果問題
3.4.1 統計結果未提供t值 作者在結果中只給出P值,未給出t值,或者只給出P值范圍,未給出P值具體數值,這些都屬于內容表述不完整問題。在寫作中需要給出具體的t值和P值,突出科學的嚴謹性,方便其他作者和編輯驗證方法的可行性和準確性。
3.4.2 統計值差錯問題 統計值出現差錯,有的是作者制表錄入時粘貼復制導致的差錯,有的是作者統計學方法選擇不當導致的差錯,有的是作者計算錯誤導致的差錯,也有因作者保留小數位數不當導致的差錯,統計值差錯會直接影響結論,所以,要求統計值計算和表述準確無誤。
3.4.3P值表述問題P<0.05時,表示對比組之間差異具有統計學意義,而不應說對比組之間差別有顯著性或者具有顯著性差別[8]。P值為0.00或0.000時,應書寫為P<0.01或P<0.001,而不是直接書寫0.00或0.000。
統計學在醫學科研整個過程中具有重要的作用,作者應加強對統計學的認識,不斷提高統計學應用水平與科研能力,培養嚴謹的科學態度,保證統計數據結果的準確性和真實性[9]。編輯應重視統計學知識的培訓和學習,可以參加培訓班,研讀統計學教材及相關論文提升自身統計學知識水平[10]。編輯要重視對統計學問題的審核,嚴把統計學問題關,難以把握的統計學問題要與作者反復的溝通,可以向作者要原始數據加以核對,也可以送統計學專家外審。