閔 瑩
(中國醫學科學院放射醫學研究所《國際放射醫學核醫學雜志》編輯部 天津300192)
醫學期刊文獻中常見的統計學問題分析
閔 瑩
(中國醫學科學院放射醫學研究所《國際放射醫學核醫學雜志》編輯部 天津300192)
按照“中華醫學會系列雜志審讀中對科研設計與統計學方面的要求”,收集、整理某醫學類期刊 2014年投稿文獻,分析其中常見的統計學問題,主要包括:統計研究設計、數據收集與表達、統計方法的選擇中存在的錯誤和漏洞。綜合研究后,提出應當從期刊編輯、評審專家和文章作者三方面出發,即加強統計學理論的培訓,強化作者的統計學意識,嚴格專家審稿制度,以保證醫學科研論文的嚴謹、合理。
醫學編輯 統計學 存在問題
醫學統計學是醫學科學研究的重要手段,醫學科研論文中研究結果需要經過正確的統計學分析,才能體現科研結果的邏輯性和科學性。[1]隨著現代醫學和統計學的發展,越來越多的醫學期刊編輯和論文作者也意識到了統計學的重要性。[2]然而,在現有的醫學期刊中統計學錯誤的痼疾仍然存在,如實驗設計不夠嚴謹,誤用、濫用統計方法等現象比較嚴重。本文就醫學期刊論文寫作中存在的常見統計學問題進行分析,旨在探討規范,提高醫學研究人員的統計學水平和科研水平,保證醫學科研論文的學術質量。
1.1 資料來源
收集、整理2014年1~12月醫學期刊自由來稿的初稿文獻,剔除其中綜述、臨床病例報告等不需統計學處理的文章,選取其中關于患者治療療效,臨床用藥及診斷方法比較,動物、細胞實驗等方面的稿件共322篇作為分析資料。
1.2 分析方法
按照“中華醫學會系列雜志審讀中對科研設計與統計學方面的要求”[3],研究分析作者來稿資料中統計分析方法的應用情況。主要包括:統計研究設計、數據收集與表達、統計方法選擇中存在的錯誤和漏洞。
2.1 統計研究設計
2.1.1 統計研究設計
統計研究設計包括實驗設計、調查設計、臨床試驗設計和干預實驗設計。而在大多數醫學期刊文獻中并未注明研究設計的類型,導致設計本身不夠嚴謹。
2.1.2 統計研究設計中應當遵循隨機、對照、重復和均衡的原則
322篇來稿中未設置對照組的有38篇,有62篇文獻設立了對照組但未提及各組基線資料間是否具有可比性。如某文獻中探討關于采用“腹腔鏡診斷治療內異癥術后疼痛復發”中,采用 T檢驗說明內異癥患者入院前后性交疼痛(前 3.39±3.146,后1.06±1.349)、盆腔疼痛(前 5.07±3.107,后 2.37± 2.773)等指標的變化,即得出結論“腹腔鏡診斷治療有利于預防內異癥術后疼痛復發”。該文章中未設置對照組,僅對單組樣本治療的前后情況進行觀察,因而降低了研究結論的可信度。
2.2 數據收集與表達
首先,部分文章中的抽樣方法不科學。大多數抽樣方法采用的是單純隨機抽樣,但未考慮樣本的數量是否適合隨機抽樣;采用系統抽樣時未對預定的抽樣規則進行詳述;[4]另有部分文章對整群抽樣和系統抽樣方法存在混淆,整群抽樣需在分組之后對群內全部調查,而系統抽樣則需從每一部分各抽取一個觀察單位組成樣本。
其次,經過對文稿的分析發現,作者在圖表中所犯的錯誤通常為用坐標軸等距離標線表示不相等的數量,且分組中可能存在重復值,改變了圖形應有的變化趨勢;[5]此外,數值軸尺度未從“0”點開始,改變了各對比組間的比例關系,另有部分文章的圖形中未標示縱軸(Y軸)所代表的意義,如圖 1所示。同時,統計學要求文章中的表格一律為三線表,但仍有部分來稿文章中未使用規范的表格格式上的刻度值。
此外,在來稿中有作者采用均數和標準差描述數據的分布情況,但數據標準差過大,大于均數的一半或大于均數,沒有仔細核實數據分布類型,更有甚者在文章中存在數據前后不一致的情況。[6]
2.3 統計方法的選擇
322篇來稿共涉及統計學方法12種,主要包括t檢驗、χ2檢驗、方差分析、兩變量間相關性分析、回歸分析(二分類的 Logistic回歸、有序多分類有序的Logistic回歸)以及ROC生存曲線等,其中t檢驗、卡方檢驗、方差分析、兩變量間相關性分析等常用統計方法的使用頻次較高,如表1所示。

圖1 患者血漿中GLU變化水平隨入院時間的變化趨勢Fig.1 The variation trend of GLU in the plasma of patients with admission time

表1 來稿中常用統計方法使用正誤情況(%)Tab.1 Use of statistical methods in the contributions(%)
2.3.1 定量資料的統計方法
對于定量資料而言,常見的研究設計類型有成組設計、配對設計、析因設計、重復測量設計等。在判斷資料設計類型的基礎上,還要檢驗資料是否滿足參數檢驗的條件,如不滿足則采用非參數檢驗方法。[7]眾所周知,t檢驗應用的前提條件為所處理的數據必須符合正態分布,在來稿中有9篇對數據未進行或未提及正態性檢驗,即采用兩組獨立樣本的t檢驗分析數據,因而不能得出正確的研究結果。
誤用成組t檢驗處理配對設計資料。某來稿文章為探討“肝切除患者術后營養指標及免疫球蛋白的變化”,在術后第3天對68例肝切除的患者給予低熱量胃腸內營養(HEN),作者采用成組 t 檢驗比較患者手術前后各指標及免疫球蛋白的變化情況。結果如表2所示。
根據該研究的實驗設計和實驗目的,應當使用配對設計的t 檢驗。成組t檢驗是將受試對象分配成兩個處理組,而針對同一受試對象手術前后相關指標結果的比較,不滿足成組 t檢驗對獨立樣本的要求,應屬于配對設計中“同一受試對象處理前后的結果進行比較”。
2.3.2 定性資料的統計方法
在處理定性資料的數據時,應根據變量類型、假設檢驗的適用條件來選用適合的統計方法。[8]通過對來稿文章中采用的定性資料統計方法進行分析,常見的錯誤主要有:忽視方法和使用的前提條件,盲目使用χ2檢驗,誤用χ2檢驗進行定性資料的相關分析等。
2.3.2.1 混淆統計資料類型盲目使用χ2檢驗
某研究將腦出血急性期患者622例,按預后情況分為對照組和觀察組,檢測兩組患者治療前血清總膽固醇(TC)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)等指標,評價兩組患者生化指標的差異情況,見表3。
表2 手術前后營養指標及免疫球蛋白變化(x±S)Tab.2 Changes of nutritional index and immunoglobulin before and after operation(±S)

表2 手術前后營養指標及免疫球蛋白變化(x±S)Tab.2 Changes of nutritional index and immunoglobulin before and after operation(±S)
時間 N 白蛋白( g / L ) 前清蛋白( m g / L ) 轉鐵蛋白( g / L )術前 6 8 2 9 . 6 8 ± 7 . 5 8 2 7 6 . 8 5 ± 2 3 . 0 6 2 . 7 1 ± 0 . 2 6術后 6 8 2 7 . 7 3 ± 5 . 0 2 2 3 8 . 6 9 ± 1 9 . 2 1 1 . 8 8 ± 0 . 1 4

表3 兩組患者血脂結果比較(x±S)Tab.3 Comparison of blood lipids in the two groups (x±S)
本例中,作者對 t 檢驗和 χ2檢驗的應用條件混淆不清,該研究中患者的生化指標采用x±S的形式給出,因而組間差異的比較應采用獨立樣本t檢驗的方法進行處理。
2.3.2.2 不滿足χ2檢驗前提
某文章就“甲狀腺結節問題對居民進行訪談,了解居民知曉途徑,每位居民舉出一種主要來源”,原文作者對不同職業的居民列出的主要媒體種類進行了 χ2檢驗,說明不同職業居民在知曉途徑上存在差異,見表4。

表4 不同職業居民獲得甲狀腺結節知識的主要媒體種類(N)Tab.4 Major media types to gain the knowledge of thyroid nodules in denizens with different occupations(N)
同小樣本四格表的檢驗方法相同,對于 RXC列聯表資料,采用χ2檢驗的前提要求是理論頻數小于5的格子個數不能超過總格子數的 1/5,否則應考慮增加樣本量,或采用 Fisher確切概率法進行分析。本例中的數據屬于定性資料,但由于樣本數較少,每個單元格中的例數不足 5個,因此一般的 χ2檢驗方法不適用列聯表數據分析,應采用 Fisher確切概率法進行分析。
3.1 加強醫學期刊編輯統計學理論的培訓
醫學期刊編輯的統計學知識與統計學錯誤的發生存在密切關系。[9]因此,作為醫學期刊編輯,應從思想上重視統計學應用的審查,在審讀稿件內容時要善于識別統計學使用中的各類錯誤,注重對論文的統計學問題進行審查,同時也要不斷進行統計學相關知識的學習,可定期聘請統計學專家對醫學編輯的統計學知識進行系統培訓、組織醫學編輯參加統計學知識的繼續教育等。同時建議在期刊中增加常見統計學方法介紹等欄目,刊登與本刊論文關系密切的統計學方法和常見的統計學錯誤,以提高作者自身的統計學應用水平和科研能力。[10]
3.2 嚴格專家審稿制度,把控統計質量關
醫學論文文獻中需要經常涉及數據收集、處理和分析等工作,由于統計學專業性較強,因而對醫學論文的審稿工作需要醫學統計專家負責所有論文的統計學審稿,以確保論文的科學性和真實性。建議在論文審稿過程中聘請醫學統計學專家進入期刊編委會,通過實驗設計、數據收集、統計方法選擇、統計結果解釋和圖表等方面對文章統計學應用情況進行全面的評審,并提出具體的修改意見和建議。[11]
3.3 強化作者的統計學意識,提升科研人員的統計學水平
目前,科研人員統計分析水平不高與學生階段的統計學教育、教學質量有直接的關系。由于醫學高校中關于醫學統計學的課程、課時設置較少,無法達到規范醫學科研的目的。因此,建議在學校教育中適當增加統計學的學時,從源頭上提高醫護人員的科研意識與科研水平;其次,應提高統計學教材的質量,教材內容應服務于科研,緊密聯系實際,尋找灌輸統計學理論和體現實用價值的突破口。[9]另外,可開辦科研論文撰寫培訓班,邀請專家重點講授科研課題中統計學的設計和方法的正確應用,進而強化作者的統計學意識,增加優質稿源,提高期刊學術質量。
[1] 王曉瑜,王雅琢,封艷輝,等. 醫學期刊投稿常見統計學問題分析[J]. 科技與出版,2011(11):42-44.
[2] 劉璐,安勝利. 中外醫學期刊論文中的統計學方法應用情況分析[C]. 中國衛生統計學年會論文集,2011:174-179.
[3] 楊燕,李娟生,劉小寧,等. 近 5年國內不同醫學類核心期刊中統計方法應用的分析[J]. 現代預防醫學2010,37(1):10-12.
[4] 黃晨,袁平戈,張大志. 醫學期刊來稿中有關統計學錯誤分析[J]. 現代醫藥衛生,2010,29(15):2268-2269.
[5] 宿瑞俊,張保平,杜瑞軍. 醫學期刊論文中常見統計學錯誤分析與方法正確選擇[J]. 中國病案,2013, 14(3):43-45.
[6] 李淑杰. 某醫學期刊來稿中統計學方法應用情況分析[D]. 天津:天津醫科大學,2009.
[7] 曾智,陳雯,凌莉. 常見醫學論文統計學問題及釋疑(一):定量資料分析中存在的問題[J]. 器官移植,2013,4(5):304-306.
[8] 石景容,陳雯,凌莉. 常見醫學論文統計學問題及釋疑(二):定性資料分析中存在的問題[J]. 器官移植,2013,4(5):367-369.
[9] 張亞玲. 醫學期刊中常見統計學問題分析及解決對策[J]. 出版科學,2013,21(5):67-69.
[10] 胡良平. 醫學期刊中常見的統計學錯誤及對策[J]. 中國卒中,2006,1(12):865-878.
[11] 張巧蓮. 三種醫學期刊統計學應用問題現狀及對策[D]. 烏魯木齊:新疆醫科大學,2013.
Analysis of Statistical Problems in Medical Journals
MIN Ying
(Institute of Radiation Medicine,Chinese Academy of Medical Sciences,Tianjin 300192,China)
To standardize and improve the statistical competence of medical researchers and statistical analysis level of studies to ensure the academic quality of medical papers,a series of Chinese Medical Association journals were evaluated according to scientific research design and statistical requirements and data collection methods.A number of medical journal articles published in 2014 were collated and analyzed for common statistical problems.A comprehensive analysis was given and it points out that the status of medical statistics in medical literature has become increasingly important.Besides,training on statistical theory,as well as the statistical proficiency of authors and researchers should be strengthened.
medical paper editing;statistics;existing problems
G232
A
1006-8945(2016)01-0068-04
2015-12-09