鄭 敏 張宇錚,2 呂海永 賈志芳 姜 晶,2△
【提 要】 目的 結合早期胃癌患者淋巴結轉移臨床預測模型的實例,探討通過Stata軟件建立、評價和驗證二分類結局的臨床預測模型的實現方法。方法 選取2010年至2018年收集的早期胃癌患者淋巴結轉移數據為實例數據集,并以2017年7月1日作為患者入組分界點,將數據分為建模集和驗證集,通過實例介紹利用Stata/SE 15.0建立、評價和驗證二分類結局臨床預測模型的方法。結果 實例中建模集746例胃癌患者中144例(19.3%)發生淋巴結轉移。預測模型最終納入T分期、腫瘤最大徑、分化程度和脈管浸潤4個變量。模型的區分度評價指標C指數為0.864,模型校準度Hosmer-Lemeshow檢驗P=0.983,臨床決策曲線顯示臨床適用度較好。在驗證集中,模型的C指數為0.911,校準度Hosmer-Lemeshow檢驗的P值為0.631。結論 利用Stata軟件可以簡單、快捷地實現臨床預測模型的建立、評價和驗證過程,尤其在列線圖的繪制方面存在優勢。
在臨床應用中,研究者關注的結局往往不是連續變化的,而是某個特定事件是否發生,如是否罹患疾病、有無并發癥等二分類結局事件。二分類結局事件的發生率分布于0~1之間,不服從正態分布,無法采用線性回歸模型描述觀察指標對結局的作用大小及方向。此時,logistic回歸模型可用于該結局事件發生概率的預測。
臨床預測模型可以通過數學公式估計特定個體當前患有某病或將來發生某種結局的概率。對于二分類結局事件,常通過建立logistic回歸模型,預測特定個體發生結局的概率。但是,目前對于此類模型在Stata軟件中如何實現的介紹較少。本文擬利用2010年至2018年收集的早期胃癌(early gastric cancer,EGC)患者淋巴結轉移數據作為實例[1],介紹此類模型的建立、評價和驗證的指標體系及在Stata/SE 15.0軟件中的實現方法,以期為相關研究者提供借鑒。
(1)模型的變量篩選方法
建立臨床預測模型,首先從研究目的出發,參考既往文獻提出的該結局事件的影響因素,結合專業知識,初步選定欲探究的預測變量。再利用統計模型篩選、綜合評估備選預測變量與結局事件發生與否的關系,最終確定納入預測模型的變量。
(2)logistic回歸模型的基本形式
logistic回歸模型是一種預測、判斷結局發生概率的概率型非線性回歸模型[2]。其預測變量可以是任意類型的數據,包括連續型、等級型、無序多分類型或二分類型等,結局變量可以是二分類、有序變量或無序多分類變量。在實際應用中,以二分類結局變量多見。
logistic回歸模型的基本形式為:


臨床預測模型評價常包括區分度(discrimination)、校準度(calibration)、臨床實用性(clinical usefulness)三個維度。
(1)區分度評價
預測模型的區分度是指該模型區分發生事件的高風險人群和較低風險人群的能力。區分度越高,模型的辨別能力越強[3]。常用指標包括C指數(C-index)、凈重新分類指數(net reclassification index,NRI)和綜合判別改善指數(integrated discrimination index,IDI)。
C指數是評價模型區分度的最常用指標。在logistic回歸模型中,C指數等于根據構建的模型繪制出受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)。logistic回歸模型的C指數和AUC取值范圍在0~1之間,取值越大,代表模型的區分度越高。
(2)校準度評價
校準度反映模型預測的絕對風險與實際觀察風險的一致程度,也稱一致性。校準度的評價方法包括擬合優度檢驗(Hosmer-Lemeshow goodness of fit test)和校準圖。校準曲線是常用的一種校準圖,是一條由個體發生結局事件的預測風險和實際風險的散點擬合而成的曲線,該曲線與斜率為1的參考線越接近、曲線擬合度越高,模型的校準度就越高。
(3)臨床實用性評價——決策曲線分析
決策曲線分析法(decision curve analysis,DCA)用于解決臨床效用問題。以實例數據為例,假設胃癌患者已發生淋巴結轉移的概率為Pt,此時界定為淋巴結轉移和(或)應當采取干預措施;無論Pt取何值,都會有個體因接受了干預而受益,也有個體因干預遭受傷害或未干預產生健康損失,由此計算淋巴結轉移概率Pt下所有患者的凈受益。決策曲線分析的意義在于探索如何令所有觀察對象的凈受益最大化。
建立預測模型后,還應當對模型進行驗證,評價模型的可重復性和外推性。驗證有內部驗證和外部驗證兩種策略[4]。內部驗證常在建立模型的數據集中進行,可采用留N法或K-折交叉驗證、隨機驗證或bootstrap重抽樣法。外部驗證是指于不同的時間和(或)不同的研究現場收集獨立的數據集,進而加以驗證,此獨立的數據集稱為外部驗證數據集。
臨床預測模型常用的展示方式包括公式法、評分系統、列線圖(nomogram)、網頁計算器等。其中,列線圖能夠直觀易懂地實現模型展示,適用于預測變量數不多的模型。
列線圖按照納入模型的預測變量的偏回歸系數進行評分。實際應用中,根據某個體的預測變量的實際取值,計算所有變量的得分之和,查閱列線圖中該總分對應的風險概率。
臨床預測模型的構建與驗證過程在常用的統計軟件中皆可實現,如Stata、R、SAS等。本文案例以早期胃癌淋巴結轉移(lymph node metastasis,LNM)預測模型的建立為例,展示使用Stata 15.0軟件進行模型的構建、評價和驗證的方法。案例中,研究者共招募872例早期胃癌患者,早于2017年7月入組的患者組成建模集(dataset1),共746例,之后的126例患者構成驗證集(dataset2)。
本案例數據集共有1個結局變量和9個備選預測變量,相應的變量名及含義見表1。

表1 變量命名、賦值及統計學描述
首先在建模集中進行結局變量LNM與上述9個備選預測變量關系的單因素分析,初步探究預測變量與結局變量是否相關,形成下一步變量篩選的變量池。單因素分析結果顯示,共有7個備選預測變量(P<0.1)。
將單因素分析P<0.1的變量納入多因素logistic回歸分析,采用向前篩選的方法,篩選可能與結局變量LNM獨立相關的因素??紤]T分期是早期胃癌治療方法選擇的重要依據,將其強制納入模型(β=1.49,P=0.065)。除此之外,進入模型的變量還包括脈管浸潤(有vs無,β=3.38,P<0.001)、分化程度(低分化vs中高分化,β=0.68;P=0.015)和腫瘤直徑(>3.0 cm vs ≤3cm,β=0.59;P=0.045)。模型建立使用的Stata程序命令見表2。

表2 早期胃癌LNM預測模型構建的命令及說明
區分度評價結果顯示,LNM預測模型的AUC為0.864(95%CI:0.827~0.901,圖1a),區分度較好。采用Bootstrap法進行500次自助抽樣進行內部驗證,AUC為0.861(95%CI:0.851~0.864);在126名研究對象構成的外部驗證集中,AUC為0.911(95%CI:0.848~0.974,圖1b)。上述結果表明模型的區分度良好。
校準度Hosmer-Lemeshow檢驗顯示,建模集中的P值為0.983(χ2=2.40),驗證集中的P值為0.631(χ2=3.49)。校準曲線顯示,建模集(圖1c)和驗證集(圖1d)的實際觀察值散點相對集中于斜率為1的參考線附近,表示模型預測值與實際觀察值擬合度良好。
臨床實用性評價結果顯示,當LNM的概率閾值(Pt)的取值在10%~70%時,在該預測模型下觀察對象的凈受益較高。綜上,該模型適合用于評價接受內窺鏡治療的EGC患者是否需要清掃淋巴結。
最終模型顯示,LNM預測模型的預測變量包括脈管浸潤、組織分化程度、腫瘤最大徑和浸潤深度(T分期),基于上述變量構建列線圖(圖2)。以上過程使用的Stata程序見表3。

表3 早期胃癌LNM預測模型驗證的命令及說明

圖1 早期胃癌LNM預測模型的區分度和校準度分析
臨床預測模型,作為直觀的風險與獲益評估的工具,可為醫生、患者和衛生政策制定者提供簡便易懂的資料[5]。模型的建立是個系統工程,不僅需要保證預測變量和參數計算方面準確易得,在模型的評價、驗證和可視化方面也應當易于實現。Stata軟件作為公認的統計分析軟件之一,在臨床預測模型的建立過程中有獨特優勢。其語句簡單易懂,輸出圖形可直接用于發表,同時軟件提供了詳細的幫助和命令書寫說明,大大降低了相關研究的學習門檻。研究者可以快捷地實現相應臨床預測模型建立的整個過程。
本研究實例建立的淋巴結轉移風險預測模型的列線圖顯示,早期胃癌患者如果有脈管浸潤,此變量對應的風險評分記為10分,對應的胃癌淋巴結轉移風險升高50%,脈管浸潤是發生淋巴結轉移的重要預測因素。該發現與第5版日本《胃癌治療指南》中引用的eCura評分系統(OR=3.99,95%CI:2.43~6.55)[6-7],以及Jeung等構建的RSS評分系統(OR=25.448;95%CI:9.58~67.61)[8]等結論一致。值得一提的是,Stata軟件僅需借助“nomolog”這一命令,即可輸出列線圖,而且圖片質量較高。

圖2 早期胃癌淋巴結轉移風險預測模型的列線圖
總之,Stata軟件在臨床預測模型,尤其是基于logistic回歸的預測模型的建立上,結果可靠,操作簡便,是值得推薦的工具。