程亮星
摘 要 以2015—2017年《腫瘤基礎與臨床》編輯部接收的所有2 314篇初投稿件作為數據篩選范圍,其中涉及統計學方法的稿件1 823篇,經過篩選發現其中涉及四格表數據的初投稿件927篇,將其納入本研究,分析存在的統計學問題,并提出避免這種統計學錯誤的方法和建議。結果發現,927篇涉及四格表數據統計分析的初投稿件中,統計學方法描述不清、錯誤或籠統者占63.54%(589/927),統計數據有問題者占88.78%(823/927),包括其中兩者均有問題者42.93%(398/927)。823篇四格表數據統計結果有問題的稿件共涉及4 345組四格表數據,其中統計結果有問題者3 647組(83.94%),包括χ2值未寫或錯寫1 123組(30.79%),P值未寫、錯寫或無具體數值1 638組(44.91%),χ2值和P值均未寫、錯寫、無具體數值886組(24.29%)。結論:《腫瘤基礎與臨床》編輯部2015—2017年接收的涉及四格表數據統計的稿件,其統計學方法及結果均存在較多問題,通過文章措施能夠使錄用稿件刊登前的統計學問題明顯減少。
關鍵詞 醫學期刊;四格表數據;腫瘤基礎與臨床;差錯分析
中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2018)212-0172-03
醫學研究中,統計學方法的正確運用是評估研究的科學性、實用性、規范性和創新性的重要方法。在醫學期刊刊登的論文中大多數需要應用統計學對所得數據進行分析,以便得出簡介有說服力的結論,因而正確運用統計學方法與否是評估論文在質量高低的重要指標,也是論文是否能夠對后續科研給予積極的幫助的關鍵[ 1 ]。
目前,文獻報道關于期刊統計學問題的報道,大多是以已經公開發表的期刊論文為研究對象,較少有研究關注編輯部初投稿件的統計學問題,而初投稿件又是統計學錯誤發生的重災區,因此,這一范圍內的統計學問題值得進行研究和探討。
鑒于此,本文以《腫瘤基礎與臨床》編輯部2015—2017接收稿件作為數據篩選范圍,以其中的四格表數據為例,對其中存在的統計問題進行分析和總結。
1 資料與方法
1.1 研究對象
以《腫瘤基礎與臨床》編輯部2015—2017接收的新投稿件作為數據篩選范圍,將其中涉及四格表數據(僅納入隨機樣本數據,排除配對四格表數據)的稿件納入本研究。
1.2 研究方法
將2015—2017年3年期間《腫瘤基礎與臨床》編輯部接收的涉及四格表數據的稿件納入本研究后,對所有稿件的統計學方法描述及統計學結果進行審查,其中統計學方法描述參考《醫學統計學》[2]一書,并結合本刊的統計學描述格式。統計學結果按照四格表數據的類型和四格表數據統計學方法應用條件,采用SPSS?23.0統計軟件對其進行重新統計分析。所有數據均有編輯部的副高級職稱以上的統計學審稿專家對統計學方法描述的恰當與否和統計結果的正確與否進行審查和核驗。
四格表數據的統計學方法選擇原則為:
1)當樣本量n≥40且理論頻數T≥5,用Pearson?χ2檢驗進行統計分析;
2)當樣本量n≥40,且理論頻數T<5但T≥1,用連續校正的χ2檢驗進行統計分析;
3)當樣本量n<40或理論頻數T<1,用Fisher確切概率法進行統計分析[2]。
2 結果
2.1 納入研究稿件的基本情況
《腫瘤基礎與臨床》編輯部2015—2017年接收的2?314篇初投稿件中涉及統計學方法的稿件1?823篇,占78.78%,其中含有四格表數據的稿件927篇。通過對這927篇稿件中所有四格表數據的統計學方法、結果分析發現,927篇稿件涉及四格表數據統計分析。其中統計學方法描述不清、錯誤或籠統者占63.54%(589/927),統計數據有問題者占88.78%(823/927),包括其中兩者均有問題者42.93%(398/927)。
2.2 823篇四格表數據的統計數據有問題稿件的統計學問題分析結果
823篇四格表數據的統計結果有問題的稿件共涉及4?345組四格表數據,其中統計數據完整無問題者698組,占16.06%;統計數據有問題者3?647組,占83.94%,包括χ2值未寫或錯寫1?123組(30.79%),P值未寫、錯寫或無具體數值1?638組(44.91%),χ2值和P值均未寫、錯寫、無具體數值886組(24.29%)。
3 討論
目前,我國醫學研究,特別是基礎研究水平相對落后,科研方法也較老舊,特別是對統計學方法在醫學科研整個環節中的重要性的認識不夠,這造成了醫學研究課題設計的不嚴謹、不合理,研究方法的不恰當,研究結果的不嚴謹,甚至不正確。而這體現在醫學期刊方面,就造成了論文的統計學描述不清楚甚至錯誤,統計學方法的選擇錯誤,以及統計結果的錯誤等[3-4]。
統計學涉及醫學研究的方案設計、數據收集和處理以及結果解釋與分析等多個環節,合理的實驗設計和正確的統計分析結果是保證期刊論文科學性和可靠性的前提[5]。因此,醫學期刊統計學問題的存在則會直接造成醫學期刊質量的下降和其學術影響力的減弱,這對期刊學術性、權威性、創新性等均會造成嚴重影響。
因此,為了進一步提高期刊質量,《腫瘤基礎與臨床》編輯部聘請鄭州大學公共衛生學院統計學專家對所接收稿件進行統計學審查,以盡可能避免有統計學問題的論文見刊。
本文從期刊論文常見的四格表數據的統計學問題方面展開審查,以《腫瘤基礎與臨床》編輯部2015—2017年接收稿件作為數據篩選范圍,將其中涉及四格表數據的稿件納入本研究,對這些稿件涉及四格表數據的統計學方法描述和統計結果進行重新審查和核驗。
結果顯示,《腫瘤基礎與臨床》編輯部2015—2017年接收的2?314篇稿件中的927篇涉及四格表數據的統計分析,其中統計學方法描述不清、錯誤或籠統者占63.54%(589/927),統計數據有問題者占88.78%(823/927),包括其中兩者均有問題者42.93%(398/927)。823篇四格表數據的統計結果有問題的稿件共涉及4?345組四格表數據。其中統計數據完整無問題者698組(16.06%);統計結果有問題者3?647組(83.94%),包括χ2值未寫或錯寫1123組(30.79%),P值未寫、錯寫或無具體數值1638組(44.91%),χ2值和P值均未寫、錯寫、無具體數值886組(24.29%)。這說明接收稿件中大多四格表數據的統計學存在問題,主要有以下幾類[5-8]:
1)統計學方法選擇錯誤,未按照文獻規定的四格表數據的統計學方法選擇原則進行選擇。比如當樣本量n≥40,且理論頻數T<5但T≥1,直接用Pearson?χ2檢驗;當樣本量n<40或理論頻數T<1,直接用了Pearson?χ2檢驗。
2)χ2值未寫或錯寫。χ2值未寫得可能原因是未用統計學方法分析,僅根據研究結果對數據進行的直觀上的評估,這導致根本無χ2值可寫,也可能是將應該用χ2檢驗的數據錯用為Fisher確切概率法導致無χ2值可寫。χ2值錯寫其原因可能是應該選錯了統計方法,將需要應用連續校正的χ2檢驗的數據直接用Pearson?χ2檢驗進行分析,導致χ2值的錯寫。
3)P值未寫、錯寫或無具體數值。P值未寫可能是未進行統計分析導致無P值可寫。P值錯寫可能是選錯了統計學方法而導致對統計學結果分析時錯寫了P值。而無具體P值(僅寫明>0.05或<0.05等)這可能是因為對統計學的重視不足,僅以檢驗水準為界限對有無統計學差異進行了分析,進而籠統寫了P >0.05或P <0.05。當然上述這幾種統計學問題均有可能是論文書寫過程中的粗心大意所致。
對于四格表數據容易出現的統計學問題,我們認為通過以下方法能夠明顯減少甚至避免其發生在錄用稿件的修回稿或刊登于期刊上的論文[9-13]:
1)編輯部對所接收稿件增加統計學審查環節,通過統計學專家關于統計學的審查,發現并指出作者所寫稿件統計學問題,并要求其改正。
2)編輯部實行統計學審查結果一票否決制,即對于存在統計學問題的稿件一律返修,直至所有統計學問題得到解決方可進入刊登流程進行刊登。
3)編輯部的編輯進行統計學知識培訓,提高統計學問題審查能力,配合統計學審稿專家把好稿件統計學質量關。
4)編輯部組織作者群,并進行醫學研究統計學方法講座,提高作者的統計學素養。
總之,《腫瘤基礎與臨床》編輯部2015—2017年接收的涉及四格表數據統計的稿件,其統計學方法及結果均存在較多問題,通過作者和編輯工作者統計學知識培訓、審稿環節增加統計學審稿、通過統計軟件演算核實能夠在稿件修回或刊登時明顯降低這種統計學錯誤的發生概率。
參考文獻
[1]張亞玲.醫學期刊中常見統計學問題分析及解決對策醫學期刊中常見統計學問題分析及解決對策[J].出版科學,2013,21(5):67-69.
[2]孫振球.醫學統計學[M].3版.北京:人民衛生出版社,2010:111-118.
[3]姜敏,儲怡星.醫學研究生應該重視論文寫作中的統計學問題[J].醫學與哲學(人文社會醫學版),2011,32(4):75-76.
[4]潘明志,梁明佩,唐毓金,等.廣西14種醫學類科技期刊統計學應用調查研究[J].右江醫學,2012,42(4):477-480.
[5]馬莉,高貴現.《山東醫藥》雜志常見統計學錯誤及分析[J].編輯學報,2016,28(1):32-34.
[6]韓磊.醫學期刊編輯提升統計學素養的難點及策略[J].科技與出版,2016(1):50-53.
[7]胡寶文.動物學定量與定性資料分析中的常見錯誤[J].動物學雜志,2009,44(6):41-47.
[8]徐謙,沈耿,莫傳偉,等.中醫論文撰寫中常見的統計學錯誤分析[J].廣州中醫藥大學學報,2012,29(4):474-477.
[9]姜瑞濤.醫學科研論文中常見的統計學問題與改進措施[J].衛生職業教育,2018,36(8):13-14.
[10]田云鵬,陳麗.醫學論文中常見統計學錯誤例析[J].中華全科醫學,2017,15(10):1791-1794.
[11]駱煥園,劉慧芳,吳艷喬,等.根據重復觀察數據分析臨床病人轉歸的統計學問題和實踐[J].中國衛生統計,2017,34(5):749-752.
[12]閆洪濤,楊新軍.藥學研究論文中常見統計學問題分析[J].藥物流行病學雜志,2009,18(3):210-211.
[13]閔瑩.醫學期刊文獻中常見的統計學問題分析[J].天津科技,2016,43(1):68-71.