摘 要:本研究基于臨床常用的研究方法和統計學方法,總結醫學學術論文中常見研究方法的統計策略及常見統計學錯誤類型,探析醫學學術期刊編輯提升統計學素養的重要性,并提出醫學期刊編輯提升統計學素養的途徑,旨在為提高醫學學術期刊質量提供借鑒。
關鍵詞:統計學素養;醫學學術期刊;編輯;統計方法
中圖分類號: Z68 文獻標識碼: A 文章編號: 1672-8122 (2024) 12-0087-04
統計分析是高質量醫學論文的重要組成部分[1]。醫學論文常采用的流行病學研究方法有實驗性研究和觀察性研究兩類,實驗性研究包括臨床試驗、現場試驗和社區試驗,觀察性研究包括病例對照研究和隊列研究。不同研究類型的統計分析策略不同,不同數據類型的統計方法也不同。這就要求作者準確運用統計學方法進行寫作,醫學期刊編輯在論文審閱過程中也要把好統計關。
從事醫學期刊編輯工作人員接受系統醫學統計學教育的較少。李娜等抽樣調查了288名醫學期刊編輯,發現醫學期刊編輯的主要是臨床醫學和非醫學專業,占比為53%,其次為預防醫學/公共衛生和其他醫學專業,占比為29. 2%[2]。部分醫學期刊編輯由于未接受統計學繼續教育,導致已編校、發表的醫學論文存在統計學差錯。對此,我們應全面提高醫學期刊編輯的統計學素養,提高論文質量。本研究從臨床常用研究方法的常見錯誤類型和常見統計學錯誤兩方面進行列舉說明,并探討提升編輯統計學素養的重要性和途徑。
一、臨床常用研究方法和常見錯誤
(一)隨機對照試驗(randomized controlled trial, RCT)
RCT采用隨機分組,設立具有均衡可比的對照組,確保有效控制混雜因素,常用于分析不同干預措施的效果,是臨床研究的重要方法[3]。基本統計分析策略包括4個步驟(假設將研究對象分為試驗組與對照組兩組,觀察指標為定量資料): 1.兩組研究對象觀察指標基線水平的可比性; 2.干預后兩組研究對象觀察指標差異是否存在統計學意義; 3.干預前后組內觀察指標差異是否存在統計學意義; 4.試驗組與對照組干預后觀察指標的差值是否有統計學意義。隨機化是RCT的重要原則,隨機分組能夠有效避免樣本選擇偏倚。“隨機分組”應包括2個重要步驟: 1.產生不可預測的隨機分配序列; 2.隨機分配方案的隱匿[3]。RCT研究的最常見錯誤就是“隨機分組”。
案例一:“以多中心、隨機、雙盲、陽性藥對照臨床研究方法開展。共選取口腔科冠周炎、牙周炎和根尖周炎口腔厭氧菌感染患者132位,實驗組和對照組各66例”。該案例沒有體現上述2個步驟。由于沒有描述“隨機分組”過程,審稿人員無法根據作者的描述判斷是否做到真正的隨機分組。
(二)病例對照研究
病例對照研究不需要過多的研究對象,比較容易組織實施,是臨床科研最常用的研究方法之一。基本統計分析策略包括3個步驟: 1.統計描述,兩組研究對象觀察指標基線水平的可比性; 2.暴露因素與結局變量的簡單關聯分析,如卡方檢驗、相關分析以及單因素logistic回歸分析等; 3.暴露因素與結局變量的多因素分析,如多因素logistic回歸分析等。病例對照研究的常見錯誤有:對照組入選條件不明確或在配對時存在配對過頭等。
案例二:“本研究采用1∶2病例對照研究,以2012年3月1日至2014年12月31日在本院兒科就診的兒童為研究對象。”該例采用配對設計,但未闡述配對的具體條件。
案例三:“采用巢式病例對照研究設計,病例組與對照組按1∶20的配比進行匹配”。其中,“1∶R匹配”能夠保證對照與病例在某些基線資料方面的可比性,能以較小樣本量獲得較高的檢驗效率,但R值不宜超過4,否則得不償失[4]。
二、常見統計學錯誤
(一)統計表述不規范
1.統計學方法的表述與結果部分使用的統計學方法不一致
在一些來稿中,有的稿件結果部分是生存率比較,但在統計學方法部分沒有敘述;有的稿件結果部分是正態分布資料的方差分析的兩兩比較,但在統計學方法部分未詳細說明兩兩比較采用的統計學方法;有的稿件結果部分是多組正態分布資料的方差分析,文中卻描述為t檢驗。
2.錯誤理解P值意義
部分投稿作者認為,數據差異有統計學意義即代表某種藥物或者某項治療方法療效更顯著。“顯著”是統計學術語,與藥物或者治療方法療效的“顯著”并不是同一概念。統計學的“顯著”僅指兩(或多)組間某指標有差異(不同)。
3. P值寫為0. 000
在部分來稿中,我們經常看到“P=0. 000”,見圖1。這是由于統計軟件顯示的限制,給出的統計結果僅顯示三位小數。因此,當P值很小時,僅顯示“0. 000”。但圖1中的“0. 000”并不是0,而是數值很小,近于0。因此,應改為“P<0. 001”。

4.統計結果中缺少統計值
同時展示統計值和P值,有助于審稿人和讀者了解作者采用何種統計方法,快速判斷統計方法是否合適,也可粗略判斷統計值和P值之間是否合理。但部分來稿中只列舉了P值,見圖2。

(二)統計方法錯誤
1.參數檢驗與非參數檢驗統計方法錯用
正態性檢驗是定量數據進行統計分析須第一步完成的步驟,一般采用正態性檢驗P值、直方圖和專業知識綜合判定數據是否符合正態,這決定著作者對后續統計方法的選擇。正態分布數據和近似正態分布數據可以采用參數檢驗,偏態分布數據需采用非參數檢驗。
案例四:在圖3中,中西藥組指標PCT的標準差大于均數,而指標PCT指標不會存在負值。因此, PCT這項指標顯然是偏態分布資料,不能使用t檢驗。

2.成組多樣本t檢驗與重復測量資料方差分析混用
重復測量是指對同一研究對象的某一觀察指標在不同場合(如時間點)進行多次測量,前后數據間具有相關性。重復測量資料方差分析將總變異分為處理因素、時間效應、兩者交互作用及隨機誤差。推論干預措施是否有效是以假定觀察指標不會隨著時間的變化而變化為前提的[5]。如果用獨立樣本t檢驗,會增加犯Ι類錯誤(拒絕了實際上成立的、正確的假設)的概率,不能準確判斷干預措施的效果。
案例六:在圖5中,數據是重復測量資料,應該采用重復測量資料方差分析。

在筆者審閱的來稿中,對重復測量數據資料,少數作者會正確采用重復測量資料方差分析這一統計學方法,闡述重復測量數據是否滿足球形假設的作者更是屈指可數。若球形檢驗(Mauchly’s Test of Sphericity)成立,即球形檢驗P大于設定的檢驗水準,則采用未校正的結果;若數據不符合球形對稱條件,需采用校正后的結果。SPSS軟件可直接給出3種校正結果,即Greenhouse - Geisser、Huynh - Feldt、Lower -bound。其中, Lower - bound校正相對保守, Greenhouse-Geisser次之[6]。
3.對卡方檢驗、校正卡方檢驗和Fisher確切概率法應用條件不清楚,存在混用情況
當R×C列聯表數據為等級資料時,不宜采用x2檢驗,而應采用等級資料比較的秩和檢驗。對于R×C列聯表資料, SPSS統計輸出結果中的格子理論頻數不應小于1,且1≤理論頻數<5的格子數不能超過總格子數的1/5。對于四格表資料,當樣本量≥40且所有格子的理論頻數≥5時,用卡方檢驗;當樣本量≥40但出現1≤理論頻數<5的格子時,用校正卡方檢驗或Fisher確切概率法;當樣本量<40或有格子的理論頻數<1時,用Fisher確切概率法。因此,當樣本量<40或表格中出現較小數字時,要警覺是否符合卡方檢驗條件。
案例七:圖6中的一些格子人數較少。經筆者核查,發現是否放療指標中有2個格子理論頻數小于5(見圖7);婚姻狀況指標中,有一個格子理論頻數小于1 (見圖8)。因此,是否放療指標應采用校正卡方值或Fisher確切概率值,婚姻狀況指標應采用Fisher確切概率值。


4.回歸分析
(1)樣本量不夠。對于logistic回歸分析所需樣本量大小與自變量個數,一般認為樣本容量應為自變量個數的5~10倍[7]。
案例八:“選取2017年10月至2019年6月在蘇州市立醫院本部神經內科住院治療的161例LAA型腦梗死患者。”圖9為該文章的logistic回歸分析結果,共納入6個變量,研究對象例數為161例,樣本量明顯不足。在已發表的文章中,這樣的情況不少見。樣本量太小會影響統計結果的真實性,因此,編輯在審閱稿件的過程中,要對文章的樣本量把好關。

(2)共線性存在。如果發現多個變量之間存在共線性,應考慮采用其他統計方法。在線性回歸分析中,反映自變量之間多重共線性的指標有方差膨脹因子(variance inflation factor, VIF)、條件數(condition number)等。VIF值越大,自變量之間的線性相關性越強,若所有自變量中最大的VIF值>10,多重共線性會影響結果;當條件數>1000時,則認為自變量之間有較嚴重的多重共線性[8]。當編輯懷疑變量之間存在共線性時,需要要求作者提供上述指標值。
(3)結果出現明顯矛盾。圖10中陰影所示, ALP指標OR值在95%CI范圍外,存在明顯矛盾。

三、醫學期刊編輯提高統計學知識水平的重要性
醫學期刊來稿作者多為臨床醫生,統計學知識相對欠缺。這就要求編輯在收稿時,把握文章的統計學方法是否存在錯誤。在初審時若能及時發現稿件中的常見統計學問題,將錯誤及時反饋給作者,能夠有效加快稿件的處理速度,高效遴選出優秀稿件,從而提高工作效率,降低稿件審核成本,進而提高醫學期刊學術質量[9]。
四、醫學期刊編輯提高統計學素養探析
(一)內容
首先,醫學期刊編輯不僅要加強統計學知識學習,也要深入了解醫學臨床常用的研究方法,知曉不同研究方法有不同的統計分析策略。當收到稿件后,編輯要先判斷是什么類型的研究,根據研究類型判斷該文章的統計分析策略是否合理,再對作者所用的具體統計方法是否合理進行仔細判斷。
其次,醫學期刊編輯要掌握基本統計知識和簡單SPSS軟件統計分析操作。常見數據類型采用的統計分析方法是否合理,編輯可以從作者給出的統計值作出快速判斷。卡方檢驗不需要作者提供原始數據,編輯在懷疑稿件中卡方檢驗數值存在錯誤時,可通過SPSS軟件進行快速復核。t檢驗與秩和檢驗都容易通過SPSS軟件實現,編輯在對文中統計數值存疑時,也可要求作者提供原始數據庫,進行簡單分析達到復核目的。在審稿過程中,對于一些簡單的統計學邏輯錯誤,編輯應及時看出并聯系作者修改,如回歸分析中回歸系數為負值時OR值應小于1, OR值是否在95%CI范圍內以及OR值與P值是否存在矛盾現象等。這些錯誤可能是作者在謄寫SPSS統計軟件結果時出現的錯誤,也可能是作者統計學知識缺乏導致的。
(二)提升途徑
第一,醫學期刊編輯部要營造良好的學習氛圍,聘請醫學院校統計學專家對編輯人員開展統計學知識培訓。一般情況下,對于醫學論文中使用的較常見的統計學方法,醫學期刊編輯部要聘請醫學院校統計學專家擔任稿件統計學方面的審稿專家,并對編輯人員就醫學論文中的常用統計學方法展開系統知識培訓,確保他們系統掌握醫學統計相關知識。此外,還要對編輯人員進行常用統計學方法的SPSS軟件操作流程培訓,以便他們在日常審閱稿件過程中對存疑的數據能夠進行簡單復核。第二,編校人員要自主參加繼續教育學習,提高自身編輯知識水平和統計學知識水平。首先,繼續教育培訓班中的統計學專家不僅會介紹常用統計學方法,還會就已發表的醫學論文中常見的統計學錯誤展開講解,這為編輯人員在日常審稿中提供了參考。其次,要善于利用相關醫學網站、論壇、微信公眾號等獲取統計學知識資源,如中國知網、丁香園論壇等。最后,在日常工作中,應注重積累統計學知識,多留心、多總結,拓寬思路,提升自身統計學素養。
五、結 語
隨著醫學的進一步發展,醫學論文數量不斷增加,這對醫學期刊編輯的統計學專業知識素養提出了更高要求。要提高醫學期刊質量,培養編校人員的統計學素養至關重要。在審閱稿件時,編校人員不僅要能發現作者采用的統計學方法和統計描述是否存在問題,也要關注作者所采用的研究方法能否科學嚴謹地證實變量之間的因果關系。一篇高質量、具有科學價值的醫學論文,需從研究方法、統計學方法、統計描述三方面做到可信、可靠、有說服力。編校人員統計學素養也應從這三方面進行提升,確保醫學期刊論文的準確性、科學性,避免因統計學錯誤導致期刊質量下滑。
參考文獻:
[1] 郭瑞,宋國營,張媛.醫學期刊編輯應重點審核的統計學問題分析與建議[J].編輯學報,2019,31(6):623-625.
[2] 李娜,李潔,孫飛,等.我國醫學期刊編輯對醫學研究報告規范的認知度[J].中國科技期刊研究, 2019,30(4):358-363.
[3] 李靜,孫歡,李永弘.隨機對照研究中常見誤區辨識與應對[J].協和醫學雜志,2019,10(2):166-171.
[4] 李立明.流行病學(第六版)[M].北京:人民衛生出版社,2011:83.
[5] 向艷平.醫學期刊中重復測量方差分析的誤用[J].湖北科技學院學報,2020,40(6):149-154.
[6] 喻榮彬,邱洪斌,汪寧,等.醫學研究的數據管理與分析[M].北京:人民衛生出版社,2009:165.
[7] 金丕煥,陳峰.醫學統計學[M].上海:復旦大學出版社,2009:365.
[8] 金丕煥,陳峰.醫學統計學[M].上海:復旦大學出版社,2009:345.
[9] 李曉煒,王春燕,王希營,等.醫學期刊青年編輯統計學素養的影響因素和提升策略[J].編輯學報, 2020,32(2):225-227.
[責任編輯:李慕荷]