劉煥英 唐 顏 陳珊茗
醫學期刊編輯應注意文章的數據統計
劉煥英唐 顏陳珊茗
數據的統計方法對文章的結果和結論有重要的影響,針對醫學論文中統計方法應用的重要性,從研究設計、統計軟件的選擇、統計方法、統計描述及統計圖表幾個方面分析了統計分析中常見的錯誤。編輯對稿件進行加工時應注意文章的統計分析,從研究設計到結果描述進行嚴格審核,指導作者選擇正確的方法,提高稿件的科學性。
醫學期刊;編輯;數據統計
數據統計是論文的基礎,是醫學論文寫作上不可或缺的環節,正確使用統計方法能使研究的結果和結論更科學、嚴謹和可靠。醫學期刊論文的統計學問題已經成為衡量論文質量的重要標準,統計學的錯誤會導致論文學術水平及學術質量的降低。
研究設計是工作的源頭,良好的研究設計是順利進行科學研究和數據統計分析及統計推斷的先決條件,也是獲得預期結果的重要保證。研究設計主要包括專業設計和統計設計兩部分,專業設計是基礎,統計設計是對資料搜集、整理和分析全過程總的設想和安排。醫學科學研究中常用的方法有實驗研究、調查研究、實地研究和文獻研究,特別是實驗研究和調查研究用得最多。編輯在對論文處理時發現,實驗設計和調查設計存在不少問題。
大多數實驗設計存在以下錯誤:(1)未按照實驗設計的基本原則要求設立對照組,臨床試驗應設立對照組,病例報告類文章則無須設置對照組。對照是比較的基礎,設立對照組是控制混雜因素和偏倚的重要手段,只有設立對照組,處理因素的效應才會充分顯露出來;不設立對照組往往會導致錯誤的結論,誤將處理因素造成的偏倚當成處理效應。(2)設立的對照組沒有滿足組間的均衡性,把非處理因素造成的偏倚當成處理效應。在整個實驗過程中,對照組和實驗組應始終處于同時同地,即應設同期對照組。盡量不要用歷史對照或其他研究的資料作為對照。對照組設立后應對各組的基線資料進行統計分析比較,檢驗對照組及處理組開始時的狀態是否均衡。(3)實驗設計的受試對象沒有按隨機化原則分組。使用隨機的方式、對大量不可控制的非處理因素的重要手段,使每個受試對象有同等的機會被分到實驗組和對照組中。它可使不可控制的混雜因素在實驗組及對照組中影響相當,可視為實驗誤差。在實際實驗中,隨機化可通過隨機數字表和計算機的偽隨機數來實現。(4)實驗研究沒有進行重復,使實驗誤差過大。因實驗誤差是客觀存在的,只有在相同的實驗條件下對同一觀察指標進行多次重復測定,才能準確算出誤差的大小。
調查問卷在醫學論文中應用也比較多,它是通過有針對性地設計一系列的問題,直接對調查對象進行調查的一種方法,醫學研究中主要用于病因探討。調查設計包括調查研究資料的收集、整理和分析全過程的計劃和安排。調查設計類稿件主要存在的問題:(1)調查問卷的定義不夠準確,調查問卷的問題較含糊,使調查對象無所適從,搜集到的數據不準確[1]。(2)調查表的問題使用了不確切的詞,如“很久”“經常”“一些”等副詞或形容詞。調查表制定的問題帶有引導式的提問或有斷定性問題,引導性的問題會使被調查者偏向同意問題中的暗示的結論。引導式的提問是調查的大忌,常會導致出現嚴重偏倚的結論。(3)沒有對調查表的內容進行效度、信度及可接受性進行考評。其中信度與效度的考評方法適用于各條目均有和分的調查表,信度與效度的相關系數越接近1越好,越接近0越差。(4)調查的抽樣方法使用錯誤,使調查結果的抽樣誤差過大。(5)調查表沒有對樣本含量進行估計,樣本含量過大過小都有其弊端。樣本含量過小,研究所得指標不穩定,檢驗的功效低,推斷總人體模型的精密度和準確度差,難以獲得正確的研究結果。樣本量過大,浪費人力物力和時間,還會引入過多的混雜因素,從而影響數據的質量。
目前,醫學期刊中采用頻率較高的統計學軟件為SPSS、SAS、STATA、PEMS等,其中以SPSS軟件使用最為常見[2]。所有論文均需對數據處理所用軟件、版本、具體方法及檢驗水準進行詳細表述。SPSS和SAS進行統計分析時沒有給出假設檢驗的顯著性水平,或者沒有根據數據的類型給出正確檢驗方法。統計方法描述不準確如卡方檢驗里面,當n<40及T<1時采用χ2檢驗確切概率法進行檢驗,但大部分的稿件只籠統地描述為“χ2檢驗”。
醫學期刊中最常用的統計推斷方法為t檢驗、χ2檢驗、F檢驗、方差分析、相關分析、回歸分析。處理稿件時比較常見的錯誤:(1)t檢驗使用不當,t檢驗一般用于兩組資料的對比,對數據要求正態、隨機。多組資料的分析用方差分析,方差分析的前提條件是樣本獨立隨機,正態分布,方差齊。稿件中作者往往沒有對數據進行方差齊性檢驗,對方差不齊的數據也用此檢驗,導致檢驗結果不可靠。多組資料比較差異有統計學意義時,再選擇合適的方法進一步兩兩比較,而非簡單選用兩樣本的t檢驗,增加犯一類錯誤的概率。(2)卡方檢驗方法或結果選擇錯誤,部分文章隨意使用卡方檢驗。卡方檢驗的適用范圍為:當n>40且T>5時,使用一般的卡方檢驗;但當1<T<5,或n≥40時,應采用校正后的χ2檢驗;當n<40及T<1時采用χ2檢驗確切概率法進行檢測。對卡方檢驗結果選擇錯誤,一般的卡方檢驗所讀結果為peason chi-square,校正的卡方檢驗所讀的結果為continuty correct,確切概率法檢驗結果為fisher’s exact test。(3)相關分析和回歸分析混淆,相關系數和決定系數使用錯誤,相關分析主要是用于分析兩變量的相關關系,回歸是從預測的角度反映兩變量的變化規律。(4)相關分析時,只求出相關系數,并沒有對相關系數進行統計檢驗[3]。
一般來說,選擇了合適的統計軟件,運用正確的統計方法對數據處理后,數據的標注問題不大。統計結果描述的常見錯誤有以下幾種:(1)對于符合正態分布的定量數據的描述,一般用“均數±標準差”或“均數±標準誤”表示,而非正態分布資料則用中位數、四分數間距或眾數來表示。(2)對于定性數據,要正確區分構成比和率。率和構成比是兩個不同的概念,不能混淆更不能以率代替構成比,構成比是說明各組成部分的比重或分布,而率是說明某現象發生的頻率或強度。用率和構成比對資料進行比較時,要注意資料間的可比性,合并計算分組資料的率時,不能簡單相加。(3)算術均數、向何均數及中位數的誤用。算術均數適合正態分布的數據,幾何均數適合等比數據,而中位數適用于大樣本偏態分布的數據。(4)對統計學上的P值理解錯誤,僅根據P值的大小得出相應的結論。在實際工作中比較常見的錯誤表述是“P<0.05”認為差異顯著,“P<0.01”認為差異非常顯著,“P<0.001”認為差異極其顯著。其實P值并不代表各組數值差異的大小,P值越小只能說明組間的比較有差異,而不能反映研究對象差異的大小。(5)統計值或P值描述不清以及統計值缺失問題。許多稿件對統計結果進行描述時,沒有完整地描述統計值和P值,統計結果未列出具體的P值,僅用“P<0.05”或“P>0.05”得出結論,或僅列出具體的P值,缺少相應的統計值。(6)直接在論文中寫P=0。SPSS對數據進行統計分析時,當P值過小的情況下,系統會輸出P=0.0000,但實際上P值并不等于零,應描述為P<0.001或P<0.0001[4]。
論文中的數據一般以統計圖或統計表來表示,統計圖與統計表的錯誤非常常見,稿件中常見的圖表問題:(1)統計表違背了編排規范,主謂安排不當,標目重復。編排規范上的錯誤主要是由于作者對規范掌握不足,而統計表格的錯誤主要是由于作者的主觀偏好或列表習慣所致。(2)橫縱標目不明確,主辭和賓辭倒置。個別作者為了統計表格的美觀,縱橫標目倒置,以至于表格不能表達本來的意義。(3)統計表中缺少顯著性結果的標注,有些表格有多個因素需要用不同的符號或字母進行標注,表格中沒有作含義說明,標注不明確。(4)統計圖中有統計學差異結果的標注。有些圖沒有標準差或標準誤,有些多種標識沒有圖注。審核標注結果時,圖表需簡單明了,做好相應的圖注和表注。(5)統計圖中的坐標單位選擇不當、圖例形式選擇不當和坐標軸缺失等。(6)統計圖中坐標軸上各標值線間隔表示的數量不相等,當坐標標值不等距且有一定規律時,可改為對數坐標或半對數線圖或改為直條圖[5]。
編輯不僅要注意統計圖表中的數據標注問題,還要審核圖表的文字描述,文字描述要與圖表的表述相一致。當統計分析結果顯示差異沒有統計學意義時,作者表述時不宜用略有增加減少,或者描述為呈增加或減少的趨勢等。
統計分析方法的正確與否關系到科研結果的可信度及有效性高低,對數據處理方法的合理性及科學性的把握,影響到論文學術質量[6]。編輯加工時應注意文章的數據統計,從研究設計到統計軟件選擇再到數據統計指標、文字描述及統計圖表都要認真審核,提醒作者運用正確的方法。要做好統計學的審核工作,需培養編輯人員的統計能力。首先,要提高編輯人員的統計學水平,采用多元化渠道對統計學知識進行學習;其次,聘請統計學專業的專家給予指導[7]。
編輯對數據統計方法的認真審核,有助于作者自覺地按照規范的方法進行醫學研究設計、數據分析及數據推斷,而且有助于編輯對研究設計的結果核實,更有助于滿足meta分析等文獻再分析的需要。統計軟件和統計方法的選擇正確能提高結果的可信度,從而提高論文的科學性。
[1]邵曉軍.科技期刊編輯應注意統計描述中的錯誤[J].赤峰學院學報(自然科學版),2011(8):208-210.
[2]張巧蓮,楊晨晨.3種醫學期刊統計學軟件及統計學推斷方法應用現狀分析[J].新疆醫科大學學學報,2016(1):126-129.
[3]魏中青.編輯加工時應注意文章的數據統計——以《生態學雜志》為例[J].農業圖書情報學刊,2015(3):162-164.
[4]吳艷妮,周春蘭,江霞,等.國內護理學統計源期刊論文中報告精確P值常見錯誤:P=0.000[J].編輯學報,2016(2):133-134.
[5]汪勤儉,耿鵬,劉洪娥,等.科技論文中統計線圖坐標標值不等距的處理方法[J].編輯學報,2008(2):118-119.
[6]姜春霞.論醫學期刊編輯的統計學審核[J],中國科技期刊研究,2014(6):782-784.
[7]吳學軍,廖粵新.科技期刊編輯應注重統計數據的審核[J].編輯學報,2010(5):416-417.
劉煥英、唐顏、陳珊茗(通訊作者),廣州市第一人民醫院。