醫學期刊中常見統計學問題分析及解決對策

2013-12-29 00:00:00張亞玲

出版科學 2013年5期

[摘要] 結合實例，探討分析我國醫學期刊中常見的統計學問題，并提出解決方案，為醫學編輯工作能力的提高以及醫學期刊整體水平的上升提供幫助。

[關鍵詞] 醫學期刊統計學問題編輯

[中圖分類號] G230 [文獻標識碼] A [文章編號] 1009-5853 （2013） 05-0067-03

醫學統計學是一門以統計學原理和方法為基礎，探索醫學科研工作中遇到的有關數據的收集、整理和分析方法的應用科學，又可被看成一個收集信息、處理信息、分析信息，進而從中提煉和總結分析出新的信息的過程[1]。隨著醫學科研水平和醫療技術水平的不斷提高，醫學科研和臨床實際工作中，人們對待科學的態度逐漸從原來的“經驗主義”轉變為“論據先行原則”，無論是在一些醫學相關學科的基礎實驗中，還是在一些臨床疾病的診治等工作中，人們遇到問題時不再“想當然”，而是首先考慮為什么，有何依據，而這些依據大多需要通過統計學中的信息收集、整理、分析來提供。因此，醫學統計學在醫學工作中的地位越來越重要，統計學應用的正確與否直接影響著醫學科研結論的科學性、嚴謹性和可靠性，具體到醫學期刊方面，就會出現因統計學應用不恰當而導致醫學期刊不嚴謹、不科學、不可靠和不具有影響力[2]。鑒于醫學統計學在醫學期刊中的重要地位，作者結合《腫瘤基礎與臨床》雜志2011年的240篇文章中出現的統計學問題，對目前我國醫學期刊中常見的統計學問題進行分析，同時提出一定的解決方案，為醫學編輯工作能力的提高以及醫學期刊整體水平的上升提供一定幫助。

1 醫學期刊中常見統計學問題

統計學的誤用、錯用和不用問題廣泛存在于許多醫學期刊中，統計學錯誤率處于較高水平，有文獻報道期刊論文統計學錯誤率為38%—80%，而且統計學問題的種類幾乎涉及統計學的每個方面，包括實驗設計不合理、未進行統計學處理、統計分析軟件未介紹或介紹不清、統計學數據的描述方法不當、統計學方法的描述不清或錯用、統計值或P值不全或描述不清、統計學結果分析或描述錯誤等[3-4]。王倩等[5]對5種“中華”系列雜志刊登的文章的統計學應用進行回顧性分析，發現1985年統計學方法應用的錯誤率占24%，1995年占36%。沈進等[6]選取8種醫學期刊，分析發表于1998年至2005年的544篇論著文章的統計學方法應用情況，結果顯示，136篇的統計學出現明顯錯誤，錯誤率達到25%，其中以資料處理方法不當所占比例最高，達到61.76%，其次為圖表錯誤、未作統計學處理等。我刊2011年刊登的240篇論文中，排除個案報道、教學論文、棕色行論文36篇，剩余的204篇論文中有126篇論文采用了統計學處理，占61.76%（126/204），現結合本刊統計學應用現狀針對醫學期刊中常見的統計學問題進行分類分析如下。

1.1 統計研究設計不合理問題

大多數非統計學專業的學者在進行統計研究設計（包括實驗設計、調查設計、臨床試驗設計）時僅僅從本專業的角度考慮，根據主觀想要得到的結果進行分組設計，而完全沒有考慮該實驗設計的可行性、組間數據是否具有可比性等問題，主要表現在實驗設計時不遵循隨機化原則、未設置對照或對照不合理、均衡性原則貫徹不徹底等[7]。常見的統計研究設計不合理問題包括缺少對照或對照不合理、單因素設計取代多因素設計、樣本量選擇不具有代表性或樣本量不足等[8]。例如，本刊《SMO蛋白及mRNA在食管癌鱗狀細胞癌組織中的表達及意義》一文，在實驗分組設計時未對各組間數據是否具有可比性進行統計學分析。

1.2 未進行統計學處理問題

許多醫學期刊論文雖然也進行了分組設計、設立對照等，但是文中未說明采用何種統計方法，也未對這些數據進行統計學處理，僅僅通過對實驗所得的實際數據的直觀判斷就得出結論[9]。例如，本刊《肺尖癌26例療效分析》一文中，作者在分析不同治療方法對肺尖癌的療效時并未采用任何統計方法，而是直接得出了“綜合治療較單純治療更能延長肺尖癌患者生存期”的結論，這不符合現代醫學科研的結論需有據而立的原則。

1.3 統計方法的描述不具體或錯用問題

1.3.1 統計方法的描述不具體

一些醫學期刊論文中列出的統計方法過于簡單，甚至未列出，主要有以下幾種情況[10-12]：在“材料與方法”部分中的“統計學處理”中未列出所用的統計學軟件或僅列出所用軟件而未說明所用軟件的版本；對于何種數據采用何種統計方法僅籠統描述，未具體列出文中的那些數據應該用何統計方法；對于定量數據僅列出采取t檢驗或方差分析，而未列出是否進行正態性檢驗和方差齊性檢驗；對于兩組定量數據無論是應該采用成組設計t檢驗還是配對設計t檢驗，均僅描述為“兩組定量數據比較采用t檢驗”；對于兩組或多組定性數據的比較，無論是僅需用 2檢驗，還是需要采用矯正 2檢驗或 2分割檢驗，均描述為“兩組或多組定性數據的比較采用 2檢驗”；統計學符號書寫不規范，例如，根據GB/T3358-82，F檢驗、P值、 2檢驗、t檢驗等中的字母應為斜體，不符合上述規定的書寫均為錯誤情況，這在論文中非常普遍；未列出檢驗水準，檢驗水準是事先設定的判斷小概率實踐的標準，實際意義是允許犯假陽性錯誤概率的最大值，需要根據不同的研究目的進行設定。例如，本刊《 -連環蛋白和層粘連蛋白的表達與垂體腺瘤侵襲性的關系》一文在“統計學處理”僅說明數據的比較采用t檢驗，而未說明t檢驗的類型。

1.3.2 統計方法的錯用

一些醫學期刊論文中的統計方法的應用存在明顯的錯誤。對于所有定量數據，常見的錯誤有[13-14]：無論是否符合正態分布、是否方差齊，一律盲目應用t檢驗或單因素方差分析等參數檢驗方法進行比較分析；無論數據分為幾組，一律采用t檢驗進行比較分析，把其當做定量數據比較的萬能工具；無論各組數據是何關系，一律采用成組設計t檢驗或單因素方差分析。例如，本刊《癌癥相關性乏力與TGF- 1的關系分析》一文中，定量數據進行比較分析之前未說明是否進行了方差齊性檢驗和正態性檢驗。對于所有定性數據，常見的錯誤有：把 2檢驗當做所有定性數據的萬能統計工具，忽略了其應用的前提條件是， 2檢驗適用于正態分布的定性數據，且樣本量最好>40，列聯表數據進行 2檢驗時不能有1/5以上的格子其理論頻數<5或任一個格子的理論頻數<1；多組數據進行比較時，總體進行 2檢驗比較分析后，若還需要進行各組的兩兩比較時未進行 2分割，依然采用 2檢驗進行再次比較。例如，本刊《P16蛋白在宮頸組織中的表達及意義》一文中，數據總體進行 2檢驗比較分析后，再次兩兩比較時未進行 2分割，檢驗水準也未重新設定。

1.4 統計結果的描述及分析錯誤問題

許多醫學期刊論文中均可見到統計結果的描述或分析錯誤，常見的有以下幾種[15-17]：1）對于定量數據應當根據是否符合正態分布而采用不同的描述方法，符合者一般采用“均數±標準差”或“均數±標準誤”表示，而不符合者則采用中位數和四分位間距來進行表示，不按上述規定進行描述者均屬于錯誤描述；2）對于定性數據，常見的錯誤是構成比和百分率不分，計算率或構成比等相對數的樣本量過小；3）解釋有統計學意義時僅根據P值的大小得出相應結論，例如對于A、B組2組的療效（假定A組療效優于B組），其“P<0.05”認為A組顯著優于B組，“P<0.01”認為A組非常顯著優于B組，“P<0.001”認為A組極其顯著優于B組，這在實際應用中非常常見，而犯這種錯誤的原因是對統計學中的P值理解錯誤，其實P值是拒絕特定無效假設而可能犯的假陽性錯誤的概率，并不代表組間差異的大小，其值越小僅越能說明組間比較不同，而不反映組間差異的大小。例如，本刊《癌癥相關性乏力與TGF- 1的關系分析》一文中，“18例肺癌患者血清TGF- 1的含量平均為（33.1±36.9）ng/L”中的標準差大于均數，這說明該數據不符合正態分布，不能用“均數±標準差”表示，而只能用中位數和四分位間距表示，用前者表示不但不能代表數據變化的趨勢，還容易誘導作者采用t檢驗或單因素方差分析等參數檢驗對其進行分析。

1.5 統計值和（或）P值描述不清以及統計值缺失問題

許多醫學期刊對統計結果進行描述時，通常不能完整清晰地描述出統計值和P值，常見的有以下幾種情況[18-19]：統計結果僅用“P<0.05”或“P>0.05”得出結論，缺少相應的統計值；統計結果包括統計值，但是P值僅寫出“<0.05”或“>0.05”，未列出具體的P值；僅列出具體的P值，而統計值缺失，上述幾種情況均不利于文獻閱讀者進行數據驗證和meta分析。例如，本刊《同步放化療治療局部晚期食管癌臨床觀察》一文中，所有統計結果均僅列出了“P<0.05”或“P>0.05”，未列出具體的統計值和P值。

2 針對醫學期刊中常見統計學錯誤的解決對策

目前，醫學期刊論文的統計學問題已經成為衡量論文質量高低的重要標準，統計學的錯誤可能會導致論文學術水平和學術質量的降低，甚至有可能導致嚴重的后果。近年來，隨著廣大醫學科研工作者和醫學期刊編輯及審稿專家對醫學統計學應用的重視，醫學期刊論文中的統計學問題已經明顯減少，但仍然處于較高的水平，這可能與以下幾點有關[20-22]：論文作者、編輯及審稿專家思想上不夠重視論文統計學應用；期刊編輯的統計學應用知識匱乏；選擇審稿專家只注重其專業領域內的影響力，而未關注其統計學應用水平。因此，要想提高醫學期刊的統計學應用水平，從而更進一步提高期刊總體質量，需要做到以下幾點：作為醫學期刊編輯，必須不斷進行統計學相關知識的學習，例如參加相關培訓班、旁聽醫學院校的統計學課程及請教統計方面的專家等，以提高自身的統計學應用水平，并從思想上重視統計學應用的審查，在給新投稿件的作者的初步意見中就強調統計學應用的重要性，規定一旦統計學有問題，論文可隨時退稿；聘請醫學統計學專家進入期刊編委會，負責所有論文的統計學審稿；應通過各種途徑，向廣大科研工作者宣講統計學在醫學科研工作中的重要性，使其養成良好的正確應用統計學的習慣；在科研課題設計過程中要求有統計學相關專家的參與；科技期刊中增加統計學應用論文發表欄目，刊登與本刊論文關系密切的統計學方法，或者刊登一些常見的統計學錯誤，與作者或讀者交流，提高其統計學應用能力。

注釋

[1]孫振球.醫學統計學（第3版）[M].北京：人民衛生出版社，2010：1-8

[2]胡良平，郭秀花，劉惠剛.醫學統計學是評價醫學科技論文質量優劣的重要依據[J].中華口腔醫學雜志，2011，36（3）：229-232

[3][8]胡良平，李子建.醫學統計學基礎與典型錯誤辨析[M].北京：軍事醫學科學出版社，2003：4

[4] Garc€韆-Berthou E，Alcaraz C.Incongruence between test statistics and P values in medical papers[J].BMC Med Res Methodol，2004，4：13

[5]王倩，張博恒.五種中華醫學會系列雜志論著中統計方法的應用現狀[J].中華醫學雜志，1998，78（3）：230-233

[6]沈進，茍莉，湯潔，等.生物醫學期刊中統計學方法應用情況分析[J].中國修復重建外科雜志，2007，21（5）：541-543

[7] [15]王曉瑜，王雅琢.《山東醫藥》論文中統計學錯誤分析[J].中國科技信息，2010（16）：193-194

[8][9][10][20]邱春暉，郭明興，邱源.醫學論文中統計學方法的誤用及其防范措施[J].山東教育學院學報，2009（5）：116-118

[11] 冉明會，羅萍，鄧丹.醫學期刊編輯應注意的幾個統計學處理問題[J].編輯學報，2009，21（6）：503-505

[12][16][18]李霞，張印朋，閆蘇平.醫學期刊作者來稿統計學應用與表述常見問題分析[J].中國科技期刊研究，2011，22（1）：88-89

[13] 王曉瑜，王雅琢，封艷輝，等.醫學期刊投稿常見統計學問題分析[J].科技與出版，2011（11）：42-44

[14] 金永勤，王維.醫學期刊編輯應重視統計學中的幾個問題[J].編輯學報，2009，21（1）：33-34

[17]張功員，田慶豐.醫學科研論文中統計結果表達和解釋錯誤分析[J].鄭州大學學報（醫學版），2002，37（3）：338-340

[19]葉亮，李偉東，范欣生.醫學論文中常見的統計學應用問題辨析[J].南京中醫藥大學學報（社會科學版），2011，12（4）：247-248

[21]吳紅艷，尹平.醫學期刊編輯應在數據的統計把關中有所作為[J].編輯學報，2008，20（5）：400-401

[22]彭敏寧，昌蘭.統計學審稿：醫學期刊質量控制的重中之重[J].長沙鐵道學院學報（社會科學版），2007，8（1）：284-285

（收稿日期：2013-05-08）

出版科學2013年5期

出版科學的其它文章: “第四屆數字時代出版產業發展與人才培養國際研討會”公告會議籌備組; 《民國時期出版史料匯編》即將出版; 武漢大學徐麗芳教授出席2013菲耶索萊館藏開發研修會; 第五屆中國數字出版博覽會7月在北京召開; 中國期刊的質量、改革和科學發展; 關于“出版轉型中的編輯角色和核心價值”的討論