王惠群 張小為 楊玉英 宋 瑋 李賀瓊 傅賢波
(北京大學第三醫院《中國微創外科雜志》編輯部,北京 100191)
隨著微創外科的迅猛發展,設備、器械更新升級,技術不斷提高,微創外科領域新技術新方法層出不窮,操作技巧的技術改進更是各有所長,從傳統開腹手術到腹腔鏡手術,從三孔到兩孔、單孔到經臍或經自然腔道手術和機器人輔助手術,一些以往的禁忌證在一定條件下逐漸變為適應證。新技術的報道可以為國內或國際首例[1~3](需要省級以上單位的查新報告),也可以積累一定病例數和隨訪作為描述性研究進行報道,但只能說明這個技術的可行性,如果要說明其相對于傳統方法的優越性,如手術時間短、出血少、療效好等,則需要進行比較性研究[4~8]。
比較性研究的證據等級高于描述性研究,但很容易出錯,而且是原則性錯誤,其結局是沒有回旋余地的退稿。比較性研究包括前瞻性隨機對照研究(randomised controlled trial,RCT)、隊列研究(cohort study)、病例對照研究(case-control study)(前瞻或回顧性)等,均各有自己的要求。現將我刊對比較性研究的基本要求總結如下,以供讀者設計、撰寫、修改比較性研究時參考。
前瞻性研究都會有嚴格的病例選擇與排除標準,通常容易控制兩組可比性,而回顧性研究的可比性問題比較普遍。不是隨便兩組病例都能比較,例如比較兩種方法的安全性,要選擇病情輕重、操作難度、術者經驗都一致的病例進行比較;如果比較兩種技術的有效性,除了術前、術中情況一致外,還要求術后處理、隨訪時間和內容相同。如果兩組不可比,就不能確定觀察指標的差異是由于不同處理方法造成的,還是由于不同病情造成的。對所有可能影響觀察指標的因素在“一般資料”中列表一一比較,包括性別,年齡,體重指數,病程,病變大小、位置、分期或分型,合并癥,等等。
臨床工作中,通常是新技術逐漸開展,應用一段時間后體會某些方面有優勢,然后回顧性統計半年或1年此新技術治療病例的數據與傳統方法進行比較。這種回顧性病例對照研究很容易犯下“組間無可比性”的錯誤。因為開展新技術時,一般先選擇腫瘤小、分期早、粘連輕、體型偏瘦的病例,即手術難度相對較低的病例,而手術難度高的病例仍然使用自己已經熟練操作的傳統技術。經過一定數量手術經驗積累,手術難度較高的病例也逐漸應用新技術,而有一些特別困難的手術還是需要采用傳統方法。因此,如果比較,應選擇手術難度一致的病例。而難度高只能進行傳統手術的病例應該排除。
如果兩組為同一術者,開展新技術都要經過一定病例數的學習曲線開始階段,這個例數根據不同手術種類、不同術者的經驗基礎和悟性而不同,而傳統術式是術者已經熟練掌握的技術,進行回顧性病例對照研究時,不能用新開展的技術和傳統技術比較,要去掉學習曲線達平臺期之前的病例,而選擇學習曲線平臺期技術熟練后的新技術與傳統技術進行比較。
如果兩組為不同手術者,可比性則難以控制,“兩組均為經驗豐富的術者手術”缺乏客觀標準,“兩組術者均為主任醫師”也不能說明技術水平一致。應盡量避免不同手術者之間進行比較。
如果比較手術時間、出血、并發癥等指標,兩組手術應該具有相同的范圍,例如,腫瘤手術不能比較聯合和不聯合淋巴結清掃的兩組,不能比較全子宮切除和次全子宮切除術,不能比較射頻消融和腫瘤切除術。但如果觀察腫瘤復發、生存,在基線情況一致時,例如乳腺癌可以比較保乳手術和乳腺癌根治術的長期隨訪結果。
前瞻性隨機對照研究開始之前,應獲得醫院倫理委員會審批,以及患者充分知情同意,并上報國家RCT中心備案。微創外科的論文通常涉及兩種處理方式,隨機分組容易導致患者不能知情同意,尤其應該注意,不要刻意追求“隨機”、“雙盲”。對于新技術,在哪些方面可能有何獲益,風險如何,應該向患者交代清楚,由患者選擇。不符合倫理的情況可以發生在觀察組,也可以發生在對照組。對照組不符合倫理通常是因為觀察組方法的優勢已經是公認的,在兩個技術都熟練的情況下,為了比較而給對照組施行傳統術式就不符合倫理。為了比較而給某一組增加創傷或麻煩的做法也要避免,如在正常部位取材鏡檢,注射安慰劑或空白對照,都要設身處地考慮患者利益,維護倫理與人道。
前瞻性隨機對照研究應在論文前言或一般資料中要明確說明本研究經哪級倫理委員會審批,注明批文號,批文復印件或照片應附于文末。審批的時間應在研究開始之前,不能后補。
前瞻性論文通常會寫明診斷標準(包括權威的文獻出處)、病例選擇和排除標準,回顧性論文也應明確。針對一個術式,尤其新術式,不是有手術指征即可實施,對病情嚴重程度的上限都會有所限制,例如子宮肌瘤剔除術,不僅要求有手術指征,還要對肌瘤的個數、大小、位置、患者年齡和生育要求進行限制,這些會影響手術的安全性和有效性。
病例選擇標準不等于一般資料,不能用一個代替一個,都要寫清楚。例如選擇某處腫瘤1 cm以上,但不能大于10 cm,這是“病例選擇標準”;本組腫瘤最小2 cm,最大8 cm,平均4 cm,這是“一般資料”。
作為比較性研究,分組方法(即兩種方法如何選擇)必須如實寫清。回顧性研究不能寫“根據術式不同分為兩組”,而要寫如何決定患者采用哪個術式,是患者決定,還是術者根據什么情況選擇;前瞻性研究不能隨便寫“隨機分為兩組”,“隨機”是統計學概念,不等于“隨意”、“隨便”,要寫用什么方法進行隨機分組,如隨機數字表法、密閉信封法等,具體如何操作,如果兩組例數不同要解釋原因,要按“隨機”的操作方法調整。當然,在回顧性研究中寫“隨機分組”、“按住院號單雙號分組”等明顯錯誤一定要避免,應實事求是寫明如何選擇兩種方法。
通常對新技術都會詳細描述,但對照組由于是傳統術式,有時會受到忽略。傳統術式也是各人有各人的習慣,至少要寫明關鍵器械、步驟、順序,具體的手術方法可以引文獻。手術方法要避免寫成手術志,讀者是相同專業的醫生,應選擇手術的重點部分,使讀者可以重復。如果是技術改良,則先寫傳統方法,再寫改良之處,以突出改良的部分。
觀察指標應圍繞研究目的選擇,不能所有數據都羅列進來比較,導致重點被湮滅在繁雜的數據和表格中。觀察指標如何界定、如何獲得應如實明確寫清。例如機器人的手術時間是否包括機器人安裝調試時間;術中出血量如何測量;各并發癥如何診斷,以及標準和文獻出處;住院時間是總時間還是術后住院時間,術前住院幾天,達到什么標準方可手術,達到什么標準出院;如何隨訪;復發和轉移的診斷如何做出;如何判斷“治愈”、“有效”,以及標準和文獻出處。
療效標準要客觀,應該用公認的或權威雜志發表的治愈標準或優良中差的判斷標準,而且要有文獻依據,具體評分方法或標準要有中文出處,除非是非常普遍應用的方法。不能用“明顯減輕”、“明顯縮小”這類非量化的不確定詞,即使要用,也要對“明顯”、“減輕”、“縮小”等有明確、可重復、客觀的界定標準,如縮小的百分比,并應該有文獻出處。比較的數據要列表,并將統計值也列入表中。正文不要寫某指標兩組有顯著性差異,而要寫哪組什么指標高于或低于哪組,且不要重復表中的數據。
包括統計學軟件的版本,什么資料如何表示,采用具體哪個檢驗方法進行比較,如何定義有統計學差異。統計軟件的不同版本能做的統計方法不一樣,比如用SPSS13.0不可能做重復測量資料的方差分析。不能籠統地說用t檢驗,要寫明是獨立樣本t檢驗還是配對t檢驗;不能說用非參數檢驗或秩和檢驗,而應寫明具體是哪個檢驗方法。所有統計值都要放在表中,如t、F、χ2、Z、P值等,不能只寫P<0.05。
科學論文不是工作總結匯報,不是對外宣傳資料,而是用科學的方法論證一個問題。作為證據等級較高的比較性研究,要在臨床工作的基礎上,針對一個創新點,提出科學問題,從病例選擇、分組方法、可比性分析、觀察指標選擇、統計學處理等方面進行嚴謹、科學的設計,得出令人信服、經得起推敲的比較結果,指導臨床選擇處理方法。本文僅總結比較性研究的基本要求,對于前瞻性隨機對照研究尚有更高的要求[9,10],如樣本量計算、招募、隱藏、盲法、注冊等,需要有更多的統計學知識,最好尋求專業的統計學人士的幫助,從實驗設計、數據采集和處理各階段進行正確處理,得出科學的結論。