呂志國,常天瀛,徐 鵬,王百通,張冬梅,李巧瑩,張藝繽,王 健
(長春中醫藥大學附屬醫院,長春 130021)
重癥肌無力(myasthenia gravis,MG)是一種由乙酰膽堿受體(acetylcholine receptor,AChR)抗體介導、細胞免疫依賴、補體參與,累及神經肌肉接頭突觸后膜,引起神經肌肉接頭傳遞障礙,出現骨骼肌收縮無力的獲得性自身免疫性疾病。其主要臨床表現為骨骼肌無力、易疲勞,活動后加重,休息和應用膽堿酯酶抑制劑后癥狀明顯緩解,感染、過度疲勞、精神刺激、妊娠、某些藥物等可促使病情加劇,甚至誘發危象[1]。重癥肌無力全球患病率為(150~250)/百萬,預估年發病率為(4~10)/百萬[2-3]。我國重癥肌無力發病率約為 0.68/10 萬,女性發病率略高;住院死亡率為14.69‰,主要死亡原因包括呼吸衰竭、肺部感染等[4],重癥肌無力臨床表現復雜多樣,有多重臨床亞型,治療始終面臨巨大的挑戰。基于此,積極規范的治療及管理是避免不良結局的主要手段及方式。現將國內外相關研究進行匯總分析,為研究者做類似研究設計提供循證依據或統計方法作為借鑒。
臨床試驗結局指標的異質性和選擇性報告問題造成了大量衛生資源浪費[5-6]。因此,本研究以團隊構建的重癥肌無力臨床研究終點結局指標的核心指標集為依托,開展了MG 臨床結局預測研究及相關設計分析。
1.1 檢索策略 基于研究結論核心結局指標集指標域及結局指標制定重癥肌無力結局預測研究的檢索策略。1)中文數據庫:中國期刊全文數據庫(CNKI)、中國生物醫學文獻服務系統(Sinomed)、萬方數據庫、維普中文科技期刊全文數據庫(ⅤIP)。2)英文數據庫:Pubmed、Cochrane,收集重癥肌無力的臨床結局預測研究,時間從2012 年1 月1 日-2022 年4 月30 日。參考Cochrane Handbook for Systematic Reviews of Interventions(Ⅴersion5.1.0),將檢索詞分為三大部分,即重癥肌無力、預測或模型和研究設計類型,以及包括9 個結局指標;根據各個數據庫的檢索特點調整檢索式的排列組合。
1.2 檢索結果及分析
1.2.1 重癥肌無力臨床結局預測研究設計概況 見表1。

表1 重癥肌無力臨床結局預測研究設計概況
1.2.1.1 微小狀態(MMS)[1]微小狀態是依據美國重癥肌無力基金會MGFA 對重癥肌無力干預后狀態中分級狀態中的級別,其指沒有任何因肌無力引起的功能受限,經專業的神經肌病醫生檢查可發現某些肌肉無力,是目前國內外公認的治療目標狀態,評價重癥肌無力臨床結局的公認終點結局指標。但由于MMS如何去定量的測評仍缺乏統一的尺度,因此,對于給出MMS 一個定量的評分作為評分范圍(如QMGS 或MG-ADL)將更具有可操作性和標準化。Li Y[7]研究發現,孤立的眼部受累和低基線QMG(≤16 分)是預后較好的預測因素,Yoshimoto Y[14]研究發現,而基線時的吞咽困難和低白蛋白血癥是預后較差的預測危險因素。
1.2.1.2 重癥肌無力總死亡率及危象病死率 在最新的研究中,中國重癥肌無力住院總體病死率[4](1.5%)與既往研究[20-21]相似,肌無力危象發生率與美國相比較低(4.81%),重癥肌無力危象病死率也較低(6.4%)。呼吸衰竭是導致肌無力危象的最常見的死亡原因。因此,如何早期脫機縮短插管時間也直接決定著重癥肌無力的預后,Shi J 等[13]發現肺炎并發全身性炎癥反應綜合征(1 周內)可以作為確定重癥肌無力危象(MC)脫機困難/延長脫機的獨立預測因子。另外,Du A等[17]研究認為性別、肺活量、Osserman 分型、麻醉方法、手術時間可預測胸腺切除術后拔管時間。同時,Tiamkao S[12]等研究認為肺炎、使用機械呼吸機和敗血癥是預測死亡的主要預測因素。筆者[9]通過回顧性研究論證并建立了基于3 個臨床特征(MGFA 分型,感染性休克和心臟驟停)的臨床評分系統,用于預測重癥肌無力危象患者的院內病死率。
1.2.1.3 眼肌型重癥肌無力(OMG)向全身型重癥肌無力(GMG)轉化 一項基于中國西北地區重癥肌無力患者的研究表明,約17%的OMG 患者在一年內會出現GMG 轉化,成人發病的OMG 患者轉為GMG 的概率顯著高于青少年發病的OMG 患者[22]。既往國外研究也表明,超過90%的OMG 患者在2~3 年內發生全身性轉變[23],這與國內數據有較大的差異。在一項最新的基于中國7家三級醫院的回顧性研究顯示(572例OMG),25.2%出現GMG 轉化[11],并發現成人發病的OMG、低頻重復電刺激異常、AChR-Ab 血清陽性、胸腺瘤病史可作為OMG 向GMG 轉化的預測因子。Wang L[19]經研究發現上瞼下垂或復視,以及胸腺增生可以作為預測前6 個月的轉化預測因子,伴隨的自身免疫性疾病可作為重癥肌無力復發的潛在預測因子。
1.2.1.4 類固醇誘導的初始惡化 重癥肌無力早期應用激素是大部分臨床醫師的主要選擇,然而,早期由于應用激素可能誘發重癥肌無力病情的惡化,目前報道,最初惡化的發生率在25%~70%之間[24-25]。一個研究提示年齡較大、嚴重的延髓癥狀與重癥肌無力惡化相關[26]。Tetsuya Kanai[10]研究提示,加重的胸腺瘤相關或早發型重癥肌無力,初始潑尼松龍用量每日超過40 mg,上肢肌肉無力的存在可以作為預測類固醇誘導的初始惡化的有用指標。
1.2.1.5 重癥監護室(ICU)入院率 目前數據約10%~20%的重癥肌無力患者將經歷至少一次MC 發作,需要ICU 入院,這也是重癥肌無力[21,27]發病和死亡的主要原因。一項對重癥肌無力患者ICU 入院的10年回顧性研究顯示,超過50%的患者在MC 期間出現全身感染,50%的MC 患者需要呼吸機支持。死亡原因的主要原因是呼吸衰竭和膿毒癥[28],因此,提前預測預警,及時調整用藥方案,對于減少ICU 入院率尤為關鍵。Chang CC 等[15]研究發現:基礎入院時的臨床MGFA 分類、胸腺瘤史、硫唑嘌呤治療史、病程、性別和發病年齡是制定ICU 入院預測決策規則的重要危險因素。即MGFA 分類級別越高、合并胸腺瘤史和硫唑嘌呤治療史,病程<41 個月和發病年齡<50 歲的重癥肌無力患者更容易有較高的ICU 入院率。
1.2.1.6 術后肌無力危象(POMC)的發生率 Gracey等[29]報道,術前球部癥狀的分級是POMCs 的唯一預測因素。渡邊等[30]研究顯示POMCs 與術前球部癥狀、抗AChR-Ab 水平高于100 nmol/L、術中失血量高于1 000 mL 有很強的相關性。Chu 等[31]檢測到Osserman 分型高于2 B,胸腺瘤和術后主要并發癥的存在可獨立預測POMCs。此外,Panda 等[32]報道,患有Osserman 分型III-IⅤ或合并胸腺瘤的重癥肌無力患者發生這種疾病的風險更高。但由于時間久遠,同時醫療水平的不斷進步,對于目前研究者只能作為借鑒。Leuzzi G 等[16]研究較貼近目前的臨床,他們發現POMC 與Osserman 分型之間存在很強的相關性,等于或高于IIB,BMI ≥28,既往肌無力危象史、重癥肌無力和肺切除術病程之間有較強的相關性。
1.2.2 統計方法及研究局限性分析 目前大部分研究均采用單因素、多因素Logistic回歸分析,建立模型應用Logistic回歸模型,Cox 風險比例模型;同時繪制了Kaplan-Meier 曲線,ROC 曲線。雖然均為目前較為經典和公認的統計方法,但缺少評估預測模型的性能及模型驗證的步驟。另外,目前研究設計均有一定的局限性,其共同局限性主要表現在研究設計為回顧性設計,數據無法進行質量控制;單一中心數據,具有潛在選擇性偏倚;治療方案無法規范;樣本量過少等。以上均為預測研究或模型構建的共性問題。因此,可能會由于部分變量未能納入分析,因變量的缺失,從而導致模型的缺陷,無法保證準確的預測或具有公認的外推性。但針對罕見病的臨床風險評估模型的構建,本身就具有其特殊性。因此,對于臨床結果的解讀,應該結合臨床實際情況進行分析,同時可以在本中心開展前瞻性隊列驗證,對于臨床醫師具有較大的借鑒意義。重癥肌無力臨床結局預測研究設計的局限性,見表2。

表2 重癥肌無力臨床結局預測研究設計的局限性
2.1 重癥肌無力臨床研究終點結局指標的核心指標集構建 本研究團隊前期按照核心指標集的制作流程遵循有效性試驗核心結局指標(Core Outcome Measures in Effectiveness Trials,COMET)手冊1.0 版本所推薦的COS 制定的制作流程制定,對近10 年的重癥肌無力相關結局指標預測研究進行了總結,同時做了外部一致性驗證。研究設計及方法主要包括:1)系統檢索近10 年中英文數據庫和臨床研究注冊平臺,收集符合要求的研究的結局指標;2)隨機對長春中醫藥大學附屬醫院門診重癥肌無力患者和家屬進行訪談和調查,收集患者群體認為重要的結局指標;3)整理、合并通過前兩步收集到的結局指標,形成建立結局指標遴選清單;4)邀請專家進行德爾菲法咨詢,通過對結局指標的重要程度進行評價,從而對結局指標進行篩選;5)通過共識會議,對經過德爾菲法專家咨詢初步確定納入和排除的結局指標進行最后的評價,形成核心結局指標集。
最終形成的核心結局指標集中包含了5 個指標域:終點指標、重癥肌無力癥狀評價、用藥情況評價、生活質量評價、安全性指標;9 個結局指標:復發率,激素并發癥發生率,危象發生率,QMGS 量表(重癥肌無力定量評分),重癥肌無力患者日常活動量表(MG-ADL),免疫抑制劑用量的分析,糖皮質激素用量的分析,膽堿酯酶抑制劑用量的分析,不良事件發生率。
本研究臨床結局預測研究分析指標,均來自于團隊構建的重癥肌無力臨床研究終點結局指標的核心指標集。
2.2 構建重癥肌無力臨床預測模型建議
2.2.1 根據臨床背景構建臨床問題,確定終點指標預測效能好的模型均源于一個有價值的臨床問題的提出,而臨床問題的評價,同樣要有公認的主要結局指標。因此,模型的構建,首先要根據臨床背景,提出臨床問題,確定終點指標。
2.2.2 進行數據收集和處理 預測模型的數據可以前瞻性收集,也可以來自回顧性隊列研究、登記注冊或管理的數據集。當然,數據集中樣本量越大、患者信息越全,構建的預測模型即越準確。數據的處理尤為關鍵,要檢查每個變量是否有缺失值異常值,要制定缺失值的處理辦法,比如可以使用插補法等。
2.2.3 模型構建與變量篩選 完成前兩步后,下一步是選擇要納入預測模型的變量,變量篩選的目的是選擇重要的協變量。目前,大部分的變量篩選方法是使用回歸分析來篩選變量,主要是在每個步驟中逐步從模型中添加協變量或從模型中移除潛在協變量,直至選擇出最佳模型為止。可以根據所有潛在的協變量都納入到初始多變量模型中,基于P值將<0.05,確定與結局關聯性最大的協變量。當然,基于P值篩選變量可以使用Akaike 信息準則和貝葉斯信息準則。但多變量Logistic回歸或Cox 比例風險模型的指南中建議,模型中的觀察病例數與協變量的比值應大于10 :1。協變量確定后,要觀察模型的統計假設是否得到滿足,如線性回歸模型連續變量與結局的對數要存在線性關系。不具有線性關系的連續變量需要使用更高級的建模方法。Cox 生存模型是比例風險模型假設,協變量對結局事件風險的影響隨時間成比例,因此可以繪制KM 生存曲線檢驗。
2.2.4 評估預測模型的性能 在二分類結局變量的模型中,可以使用一致性統計量來檢驗區分度一致性統計量等于ROC 曲線下面積。另外,還有進行模型校準度的檢驗,即實際風險與預測風險的一致性。雖然區分度和校準度在預測模型中均很重要,但模型中兩者不可能同時具有。
2.2.5 模型驗證 為確保模型的穩定性,需要進行內部有效性和外部有效性進行驗證,內部有效性驗證可以采用交叉驗證法和bootstrapping 法,參與的重癥肌無力危象預測模型采用了bootstrapping 法。外部驗證是在全新的數據集中進行評估,比如來自不同人種,不同的衛生系統或國家的患者。
2.2.6 模型的展示形式 目前模型的展示模型的方式有評分系統、應用程序、數學方程式等,但其宗旨應該以一種對臨床方便有益的方式進行展示。
本文整理了近10 年重癥肌無力相關風險預測模型研究,為從事重癥肌無力臨床研究的專科醫生提供了部分臨床決策建議,同時也分析了這些風險預測模型研究的設計、統計及局限性。因此,如何構建臨床預測模型是臨床醫師亟待解決的科學問題。風險預測模型是根據模型中預測變量的值來評估預測個體出現某一疾病或結局的概率。那么對于重癥肌無力來說,目前在國際、國內均具有公認的診斷及治療指南,但在疾病風險預測方面,缺少相關規范研究范例。因此,針對構建臨床預測模型,筆者提供部分建議供研究者參考。
綜上所述,對于風險預測模型研究主要包括確定臨床問題和預測模型類型、數據收集和處理、模型構建和變量篩選、模型性能評估、模型驗證、模型展示等基本步驟,但由于不同疾病終點指標的分類情況不同,模型構建仍有很大的區別,同時模型性能評估、內部有效性和外部有效性驗證在實際研究中存在著不同的選擇,這對研究者同樣提出更高的要求。