李海峰 黃雨 陳向軍
疾病的共同數據元(CDE)是描述疾病各種特征的標準化數據元素。其編制需要豐富的臨床經驗、臨床研究實踐及文獻積累,以定量、分類和定性數據反映疾病多維度特征,以數字化思維刻畫完整的疾病表型。重癥肌無力(MG)是經典的自身免疫性疾病,其表型具有多樣性和異質性。本文介紹共同數據元在重癥肌無力表型刻畫以及以表型為基礎進行臨床研究的意義。
表型是疾病可查知的特征及特征組合,包括患者和醫療人員可查知的臨床表型(如癥狀、體征和病情演變)、醫療人員借助輔助工具(如量表)或輔助檢查特定標準(如基于MRI的分類標準)才能評估的內表型、醫療人員通過儀器直接測量(如血壓和血糖)得到的中間表型[1]。表型可從多個維度反映疾病的特征,在疾病診治決策和預后評估中具有重要意義。一些表型是潛在的決定因素,而另一些表型是結局的反映。
表型的多樣性指疾病在臨床受累范圍、嚴重程度、病理學、生理學、生物化學、免疫學、影像學、療效和預后等不同角度具有的特征,要歸類分析。表型的異質性指上述不同特征在人群中分布及定量的差異。正是有了可歸類的特征,才使臨床研究從人群差異中找到規律,以指導個體化精準治療。
數據元是以特征歸類為基礎形成的數據項,并不包含數據本身,而是數據的標簽。每項特征均可形成數據元,不同特征間特定的組合(如重癥肌無力亞組)亦可形成數據元。通常包括下列內容[2]:(1)名稱,及其縮略語和代碼。(2)定義,用以解釋數據元的性質、范圍或意義。(3)指導語,詳細描述如何取得數據,如說明癥狀問卷的具體意義或明確實驗室的測試方案。(4)來源,用以描述數據元的歷史或起源及其科學性的證據,包括期刊、詞匯表或數據標準、審查過程、驗證過程和創建者。(5)值集(value set),可能存在的各種情況或數值的集合,如對于調查問卷值集應包括各種可能的回答,對于實驗室測試值集應包括允許的范圍及其單位。
對于選擇哪些數據、如何反映疾病特征刻畫表型,不同研究者的總體思路相近,但仍存有一定差異。共同數據元是跨不同研究的多個數據集中具有共性的數據項,可以在實踐中總結形成共識,亦可前瞻性設計。其核心是數據的結構化和標準化,以減少對重要數據的遺漏及縮小數據獲取過程中不同收集者之間的差異。編制共同數據元的目的是改進數據質量和促進數據共享[2]。共同數據元包括以下類型:(1)通用數據元(universal CDE),不局限于具體疾病或感興趣的方面,適用于各種疾病的數據集,如人口學特征、伴發疾病等。(2)特定領域數據元(domain?specific CDE),適用于按照特定疾病、癥狀、狀態、軀體系統或學科分類的研究,如帕金森?。≒D)、眩暈、全身炎癥反應綜合征或眼部疾病的數據元。(3)特需數據元(required CDE),滿足特定機構(如研究資助者或執行者)要求的數據元,需納入符合要求的所有受試者,如國家慢性疾病管理的數據集。(4)核心數據元(core CDE),滿足特定類型研究要求的數據元,如隨機對照試驗所需的數據元。以上數據元類型針對不同的應用,涉及不同的數據,存在交叉,但均為疾病研究數據標準化的基礎。
應特別注意兩個問題:(1)數據標準,采用商定的一套規則以標準化方式共享和處理信息,包括數據的表達方法(如文字、圖像模式或數字)和格式(如連續性數據或分類/二分法數據、大數據存儲格式)等。(2)詞匯表,是收集各種概念的數據庫,包含相應的定義和代碼,并闡明概念之間的關系。
編制重癥肌無力共同數據元的最初目的是研究,最終還需優化后用于臨床實踐,因此不僅要考慮其在隨機對照試驗和真實研究中的科學價值,更要考慮其潛在的臨床實用價值,具體內容應結合疾病自身的發生、發展和演變。本文介紹重癥肌無力共同數據元編制中應特別考慮的問題,特別關注如何準確獲得一些數據元的信息。
1.社會人口學 年齡是需特別關注的特征,包括發病年齡、采樣年齡和眼肌型重癥肌無力(OMG)轉化為全身型重癥肌無力(GMG)的轉型年齡等。采樣年齡較易獲得,而發病年齡和轉型年齡的確定則取決于對重癥肌無力癥狀的判斷。發病時間短的患者對癥狀回憶較好,隨訪好的患者客觀記錄較完整,均較易判斷,但精確判斷仍受一些因素的影響。重癥肌無力的早期癥狀波動可自行緩解,患者常無法識別或忘記首發輕微癥狀,一些癥狀甚至令神經科醫師也難以判斷。我們課題組采用標準化重癥肌無力癥狀問卷(表1)詢問病史后,立即行標準化疲勞試驗和新斯的明試驗,與患者自身提供的病史相比,近半數患者對受累肌群的判斷發生改變,標準化疲勞試驗可發現患者未主訴的受累肌群,而新斯的明試驗則可發現一些肌群受累并非重癥肌無力所致[3]。標準化重癥肌無力癥狀問卷可以盡可能幫助患者回憶最早出現的癥狀,尤其是波動性癥狀,有助于判斷發病和轉型的起始點。鑒別診斷有助于判斷癥狀是否為重癥肌無力所致:眼瞼下垂需與Meige綜合征和動眼神經麻痹相鑒別,眼外肌麻痹需與動眼神經麻痹、Graves眼病和Miller Fisher綜合征(MFS)相鑒別,咽喉肌無力需與輕微腦干梗死和后組腦神經麻痹相鑒別,頸部和四肢肌無力需與頸腰椎病變、代謝性肌病和電解質紊亂相鑒別,呼吸困難需與呼吸道感染、支氣管痙攣、心功能障礙、心包積液和肺栓塞等相鑒別,疲勞現象需與焦慮、抑郁和藥物因素相鑒別。盡管通過問卷和病史仍可能遺漏部分受累肌群,但卻是唯一獲得發病年齡和轉型年齡的方法。我們的做法是,選擇患者和有經驗的臨床醫師共同認定的癥狀起始時間作為上述兩個年齡點,也有一些患者在隨訪中提供了較最初病史更早的癥狀起始時間,應予以及時修正。病程是與年齡相關的重要數據元,發病至研究截止點的時間差即為病程。Osserman分型特別關注6個月內進展至呼吸肌受累[4],眼肌型重癥肌無力定義為發病2年后仍局限于眼外肌受累[5],因此計算病程時,對發病2年內的患者應盡可能精確到季度或月。

表1 標準化重癥肌無力癥狀問卷Table 1. Standardized MG symptom questionnaire
2.合并癥 重癥肌無力可并發多種合并癥,其中有些合并癥與治療中出現的不良反應有關,如高血壓、糖尿病、冠心?。ㄓ绕涫切慕g痛)、骨質疏松和感染[肝炎、獲得性免疫缺陷綜合征(AIDS)、梅毒、結核病、真菌病等];有些則與重癥肌無力表型有關。約15%的患者可伴發多種自身免疫性疾病,不伴胸腺瘤的早發型患者常伴發單一自身免疫性疾病,尤以自身免疫性甲狀腺疾病、系統性紅斑狼瘡(SLE)、類風濕關節炎(RA)和干燥綜合征常見[6],伴胸腺瘤的患者則可伴發多種自身免疫性疾病,包括Good綜合征[白細胞或淋巴細胞減少和(或)免疫球蛋白缺乏]、單純紅細胞再生障礙性貧血、心肌炎、天胞瘡、斑禿和膜性腎病等非神經科疾病,以及味覺改變、多發性肌炎、視神經脊髓炎譜系疾病(NMOSDs)、神經性肌強直和邊緣性腦炎(LE)等神經科疾?。??12]。值得注意的是,Graves眼病亦可導致眼外肌麻痹,應與重癥肌無力導致的眼外肌麻痹相鑒別[8?9],視神經脊髓炎譜系疾病是神經系統免疫性疾病,胸腺切除術可能是其危險因素[10]。應詳細記錄已發病并確診的自身免疫性疾病以及尚未發病但已檢出自身抗體的情況,制定最低限度的自身免疫性疾病和自身抗體譜篩查清單。我們的建議是:至少應將上述自身免疫性疾病列入共同數據元中,以及檢測甲狀腺抗體[包括抗甲狀腺過氧化物酶(TPO)、甲狀腺球蛋白(TG)和促甲狀腺激素受體(TSHR)抗體]、抗可提取性核抗原(ENA)抗體譜,存在胸腺瘤的患者還應篩查抗水通道蛋白4(AQP4)抗體、自身免疫性腦炎抗體、肌炎抗體、血清免疫球蛋白和淋巴細胞亞群,考慮到免疫抑制劑可能導致肝功能損害,還應加入自身免疫性肝病相關抗體以資鑒別。重癥肌無力亦可合并胸腺外惡性腫瘤,多見于合并胸腺瘤患者[13?14],且胸腺瘤無論是否合并重癥肌無力,胸腺外惡性腫瘤的發生率均升高[14]。免疫治療可能增加惡性腫瘤的發生率,尤其是淋巴瘤[6],因此,應按照腫瘤分類設置數據元。上述數據元須記錄發現合并癥證據的時間。
3.重癥肌無力特征 首發受累肌群和長期隨訪過程中病情最嚴重時的肌群受累范圍是重要表型。不同的首發受累肌群與不同的致病性抗體有關;最嚴重肌群受累范圍雖受治療的影響,但往往與遺傳因素(多基因)有關,尤其是未治療患者的最嚴重受累范圍更有意義[6,15]。肌群受累范圍的判定是Osserman分型[4]和美國重癥肌無力基金會(MGFA)分型[16]的重要基礎。為了容易分類將首發受累肌群分為眼外肌、球部肌和四肢肌[6]。乙酰膽堿酯酶抑制劑(AChEI)反應在不同類型重癥肌無力患者中存在差異,抗肌肉特異性受體酪氨酸激酶(MuSK)抗體陽性患者對AChEI的反應較差且易出現不良反應[17]。滕喜龍試驗由于藥物在體內維持時間較短并不適用于受累肌群范圍較廣患者的評估;新斯的明試驗的診斷靈敏度和特異度均達95%以上,且多次檢查可見不同肌群癥狀改善的時間不同,適用于對癥狀改善程度的反復評估[18]。溴吡斯的明替代新斯的明試驗在全身型尤其是球部肌受累的患者中有一定價值,但眼外肌受累對AChEI的反應較差,假陰性率較高。肌肉注射新斯的明的標準劑量為0.02~0.03 mg/kg,若劑量不足可導致假陰性結果。注射10分鐘后開始觀察直至60分鐘,每間隔15~20分鐘檢查1次,記錄受累肌群改善程度,切忌注射前患者一出現疲勞即終止檢查又在注射后反復鼓勵患者配合,以減少假陽性結果的發生。為避免饑餓或過度勞累出現的假陰性結果,應在注射 前 囑 患 者 進 食 并 適 當 休 息[16]。Osserman 分型[4]和MGFA分型[16]是基于受累肌群范圍和嚴重程度的臨床分型,主要用于臨床研究中對基線期患者特征的描述,前者還涉及病程和是否伴發胸腺瘤。我們課題組的研究顯示,Osserman分型和MGFA分型觀察者間的重復性良好,Osserman分型略優于MGFA分型,與Osserman分型分類項目較少和定義清晰有關[3]。雖然這兩種分型方法均涉及疾病嚴重程度,但評價嚴重程度并非主要目的,MGFA臨床研究指南指出,即使是兩個重癥肌無力領域專家也可能對疾病嚴重程度有不同的判斷,故不推薦將臨床分型作為嚴重程度的評價方法[16]。嚴重程度是重癥肌無力的重要表型,尤其是長期隨訪但未接受治療的患者,疾病嚴重程度更有意義。Oosterhuis評分是最早應用于臨床的疾病嚴重程度評分[19],根據患者主訴的日常生活活動能力進行評估,設計思路與Osserman分型相近,是一項粗略的評分。盡管有些研究將Osserman分型或MGFA分型的型別直接轉化為評分用于表示疾病嚴重程度,但是與抗體或電生理學指標嚴重程度相關性研究的差異表明,這些簡單分型無法作為嚴重程度的評價標準[20?22],建議使用專門的疾病嚴重程度評價量表。
4.合并胸腺瘤 伴與不伴胸腺瘤的重癥肌無力的發病機制不同,因此無論是僅有眼外肌受累還是全身受累,伴胸腺瘤的患者是一種獨立類型[6]。未行胸腺切除術的患者在不同研究中的比例不同可造成選擇偏倚,因此需要敏感性和特異性均較高的無創性檢查方法。CT篩查胸腺瘤的敏感性和特異性均較高,但僅根據CT檢查結果易將胸腺增生誤診為胸腺正常,也可能漏診CT無法發現的小胸腺瘤;MRI平掃并不增加胸腺瘤的敏感性[23?24]。最初 CT檢查未發現胸腺瘤的患者數年后復查仍可檢出胸腺瘤[25]。化學位移 MRI(chemical?shift MRI)和 DWI序列可以更好地鑒別胸腺瘤與胸腺增生,并評價胸腺瘤的治療效果[26?27]。示蹤劑99mTc?MIBI用于前縱隔SPECT顯影有助于鑒別胸腺瘤與胸腺增生,且攝取率與胸腺瘤WHO分類和Masaoka分期相關[28],該方法鑒別胸腺瘤與胸腺增生的敏感性或特異性已在國內研究中得到證實[29]。99mTc?MIBI SPECT 顯影可作為篩查胸腺瘤的另一手段,尤其是影像學難以發現的異位胸腺瘤和胸腺瘤轉移。抗連接素(titin)和Ryanodine受體(RyR)抗體在篩查胸腺瘤方面有相似的敏感性,60歲以下患者這兩種抗體檢測陽性即高度提示胸腺瘤,任意年齡的患者,這兩種抗體檢測陰性即可排除胸腺瘤[30]。抗連接素和RyR抗體陽性的年輕患者如果最初未發現胸腺瘤,建議每6個月復查1次胸腺影像學。
5.自身抗體 伴不同抗體的重癥肌無力臨床特征有所不同,有助于進行重癥肌無力亞組分類和個體化分層治療[6]??挂阴D憠A受體(AChR)抗體是致病性抗體,針對其主要免疫源區的抗體與疾病嚴重程度相關性較高,該抗體在兒童患者中雖陽性率較低,但其陽性有助于與先天性肌無力綜合征相鑒別;抗MuSK抗體也是致病性抗體,抗MuSK抗體陽性重癥肌無力表型相對獨特;抗低密度脂蛋白受體相關蛋白4(LRP4)抗體的致病性已有初步研究,但抗LRP4抗體陽性重癥肌無力表型與抗AChR抗體陽性不易區分[6]??惯B接素和RyR抗體屬于抗胸腺瘤抗體,在早發患者中有提示胸腺瘤的意義,但在晚發患者中這兩個抗體陽性的提示意義較低[30]??惯B接素和RyR抗體陽性重癥肌無力患者病情相對嚴重,且易伴發肌炎[31]。歐洲神經科學協會聯盟(EFNS)指南建議,盡早添加免疫抑制劑治療可使患者獲得更好緩解[32]。抗體陽性受諸多因素的影響,例如,酶聯免疫吸附試驗(ELISA)或放射免疫法(RIA)的抗原提取過程略有三維結構的改變,而細胞免疫熒光法(CBA)應用保持天然三維構象的抗原,故二者檢出的抗體不盡相同,關鍵是抗體針對的主要免疫源區是否保持完好和易結合[33]。其中,CBA法的敏感性較高,尤其是對眼肌型重癥肌無力患者[34];而ELISA法和RIA法定量檢測陽性與否取決于界值(cutoff value)的設定,而定性檢測陽性受檢測體系能夠檢出的閾值影響[33]。改進檢測體系可以提高檢測的敏感性[35]。我們課題組對ELISA法和RIA法的界值研究發現與標準曲線或經驗公式計算得到的轉化值形成的界值相比,檢測原始值的敏感性和特異性并不低于轉化值,且健康對照組原始值的變異系數更小,提示以原始值檢測可以避免轉化過程中因計算帶來的變異放大;以界值確定的抗體陽性與患者特征的相關性弱于采用定量數據與患者特征的相關性(待發表)。因此,臨床實踐中應登記檢測方法(定量或定性,包括參考文獻)以及定量檢測的參考值和檢測值。定量檢測結果接近界值時,將CBA法中的熒光強度與陽性和陰性進行質控參比,如果熒光強度明確則判定為陽性;定量檢測結果明顯高于界值但CBA法陰性,可能是抗體結合表位不同或純化過程改變抗原構象,亦可考慮為陽性。值得注意的是,對于CBA法結果不明確、定量檢測結果接近界值的患者應該追蹤復查。免疫系統疾病患者尤其是病程較短和癥狀較輕微的患者,最初檢測抗體呈陰性,經治療數月后復查可呈陽性[36?37]。這是由于一旦自身抗體產生,雖然在強力免疫抑制劑或胸腺切除術后抗體水平下降,但通常持續保持陽性[38?41]。我們課題組的研究亦證實,病程和是否接受治療對重癥肌無力相關抗體陽性檢出率幾乎無影響[42],僅少數患者抗體水平波動于檢測界值相鄰區域的患者陽性率稍有改變。
6.電生理學 重復神經電刺激(RNS)和單纖維肌電圖(SFEMG)是反映神經肌肉傳導的指標,如顫抖(jitter)異常可作為診斷證據且被視為潛在的療效評價指標。美國電生理診斷醫學協會(AAEM)對完整的診斷流程、受檢神經和肌肉、是否易化后再檢查均有明確的指導,特別強調將至少1根神經重復引出遞減現象(>10%)作為重復神經電刺激的陽性標準[43]。主要有兩種判斷方法:(1)對遞減 >10%的神經間隔30秒以上再行重復神經電刺激,若獲得相同結果,即使僅1個頻率引出遞減現象,亦判定為陽性。(2)1根神經上有2個以上刺激頻率引出遞減現象(>10%)。上述兩種判斷方法均為了證實陽性結果并非技術性因素(如誤差或刺激后肌肉運動電極移位)所致。參考臨床受累肌群,選取與受累肌群最為接近的神經,可使獲得陽性結果的可能性增加。此外,檢測支配近端肌肉的神經、增加受檢神經的數目亦可提高診斷敏感性。近年研究顯示,重復神經電刺激的界值從遞減10%降至7%~8%,可提高敏感性但不降低特異性[44],且遞減趨勢有助于與 Lambert?Eaton 肌無力綜合征(LEMS)相鑒別[45]。重癥肌無力患者完整的電生理學檢查還包括高頻重復刺激以排除突觸前膜病變,以及嵌壓部位的神經傳導檢測和肌肉針電極肌電圖篩查以排除嵌壓性神經病和肌肉病的影響[46]。電生理學異常程度與臨床嚴重程度的相關性和差異具有潛在應用價值,前者有助于客觀判斷嚴重程度,后者則提示特殊表型。重復神經電刺激波幅遞減程度與重癥肌無力定量評分(QMGS)呈微弱相關,而顫抖與QMGS評分的相關性較好[21,47]??筂uSK抗體陽性患者面肌重復神經電刺激異常比例高于抗AChR抗體陽性患者,但四肢肌重復神經電刺激異常比例顯著低于抗 AChR 抗體陽性患者,波幅遞減程度也較小[48?49];抗LRP4抗體陽性患者電生理學檢查罕見異常,波幅遞減和顫抖異常程度也輕微[50]。還應注意的是,重復神經電刺激對急性發病的重癥肌無力不敏感,有研究顯示,雖然急性發病患者血清抗AChR抗體水平與慢性發病患者相近且MGFA分型更為嚴重,但其重復神經電刺激異常比例遠低于慢性發病的患者[51]。
7.胸腺切除術 術前評估和麻醉評估應該系統化[52?53]。盡管 2000 年的 MGFA 臨床研究指南包括一些胸腺信息[18],但系統化的胸腺資料包括影像學檢查(尤其用于臨床分期的資料)、手術操作、胸腺瘤分類和分期、樣本取材、病理學檢查、預后指標、藥物治療和放射治療等規范尚不完備。近年來,胸腺在重癥肌無力發病機制中的作用和二次胸腺切除術治療重癥肌無力的價值越來越受到關注[54],國際胸腺惡性腫瘤興趣組(ITMIG)已制定出詳細的規范[55?60]。不同醫療中心選擇重癥肌無力患者行胸腺切除術的適應證有所不同,尤其是術前狀態,病情較重者術后發生危象的風險較高,因此應詳細記錄術前病程、受累肌群、嚴重程度、肺功能、溴吡斯的明劑量、激素和免疫抑制劑應用情況、靜脈注射免疫球蛋白或血漿置換應用情況、合并感染等;術中麻醉方式、手術方式、手術時間、出血、是否切斷膈神經、清理范圍和是否胸腔熱灌注等;以及術后拔管時間、拔管后肺功能、開始放化療時間和方案、不良反應等。
8.療效和預后 由于神經肌肉接頭(NMJ)代償和自我修復能力較好,重癥肌無力癥狀可在有效的免疫治療后改善,其療效由基線期臨床特征、藥效強度、患者依從性和并發癥所決定。2012年,重癥肌無力臨床試驗指南明確提出,重癥肌無力治療研究應以激素治療為基礎進行試驗設計,激素減量是重要的預后指標,可采用劑量?時間曲線下面積(AUDTC)評價[61]。2016年,國際專家共識指南提出日常工作的治療目標,即達最小臨床表現(MM)或更好[62]?;诖?,治療研究要在一定框架內進行,在激素治療基礎上聯合免疫抑制劑或其他方法,以最小臨床表現為治療目標,達穩定改善后開始激素減量[63],且在治療期間保持不變[64]。療效評價應考慮藥物或治療方法的藥效學預期起效時間,過短的觀察期無法評價療效[65],因此應記錄治療后不同時點的療效參數。對于長期療效,MGFA臨床研究指南提出了“干預后狀態(PIS)”概念,定義了完全穩定緩解、藥物緩解和輕微表現等反映良好預后狀態,以及改善、無改變和加重等狀態[18]。但對干預后狀態的判斷經驗仍局限于少數重癥肌無力診療中心,缺乏嚴重程度評分和生活質量評分等臨床熟悉的測評[66]。目前僅一項研究給出符合“最小臨床表現”定義的生活質量評分范圍[67]。我們課題組對最小臨床表現定義的研究初步確定了相應嚴重程度和生活質量評分范圍(待發表),與該項研究相近。短期療效可采用治療前后嚴重程度評分改變的平均值進行評價[63]。相對評分方法[(治療前評分-治療后評分)/治療前評分]可個體化反映每例患者嚴重程度的改變[68]。這種思路也體現在其他自身免疫性疾病的治療研究中[69]。我們課題組的初步研究顯示,對于基線期嚴重程度在一定范圍的患者,相對評分改變的組間比較與評分絕對值改變的成組比較可較為一致地反映療效;而對于嚴重程度較輕和過重的患者,相對評分改變與評分絕對值改變對療效的判斷不同(待發表)。此外,激素減量也是重要的療效評價指標,可采用激素平均值[65]或AUDTC評價[70]。參考多中心隨機對照試驗所采用的療效評價方法,由基本共同數據元經過邏輯運算得到衍生數據元,可以對依從性較差和隨訪信息不完整的病例判斷是否適合進行療效分析。
9.疾病嚴重程度量表 疾病嚴重程度是重要的內表型,是評價療效和預后的基礎。2012年重癥肌無力臨床試驗指南明確提出,療效評價應采用包含更多功能評價條目的量表[61]。這些量表絕大多數是單向有序復合量表,分為他評量表、自評量表和混合量表。最經典的他評量表是QMGS量表[71],已通過臨床驗證并確定了具有臨床意義的組間差異最小值[21,72],目前作為大多數隨機對照試驗的預后評價指標。其他他評量表包括肌無力肌肉量表(MMS)[73]、徒手肌力測定(MMT)[74]、重癥肌無力加權評分[75]和我國學者制定的重癥肌無力絕對和相對評分[68],上述量表用于評價重癥肌無力6個肌群的嚴重程度,通過不同條目計分和加權計分獲得總評分,與QMGS評分具有較好的相關性,也適用于隨機對照臨床試驗。他評量表以醫護人員測評為主,觀察患者肌無力體征和疲勞試驗,受其勞累程度和AChEI的影響,故觀察的是特定時點的嚴重程度,測評前囑患者保持平時活動強度并在末次服用溴吡斯的明6小時后較為可靠[76]。自評量表最經典的是重癥肌無力日常生活活動能力量表(MG?ADL)[77]和重癥肌無力生活質量量表(MG?QoL)[78],此外還包括重癥肌無力殘疾量表(Disability Scale for Myasthenia Gravis)[79]、重癥肌無力自評問卷(Self?Administered Questionnaire)[80]、重癥肌無力功能障礙指數(MGII)[81]和單一問題自評方法[82]。大多數自評量表與他評量表QMGS具有較好的相關性。重癥肌無力復合量表(MGC)集取QMGS、MG?MMT和MG?ADL量表中在臨床測評中表現最佳的條目形成,兼有自評量表和他評量表的優勢,經驗證與QMGS、MG?ADL和MG?QoL量表有較好的相關性,是目前推薦的隨機對照臨床試驗首選量表[83]。但上述量表均非線性量表(5分并非1分的5倍),目前有研究者正在編制基于Rasch模型的線性量表[84]。
10.亞組分類 亞組分類的目的是分層治療,目前針對免疫系統疾病的治療尚無法達到與腫瘤靶向治療一樣的精準,分層治療則是根據基線期和治療中的評估預先選擇不同強度的免疫治療方案。目前的亞組分類均來自研究者的臨床經驗和觀察性研究。我們課題組發現,發病年齡、抗體、胸腺瘤和受累肌群這些特征之間存在高度相關性[85],提示依據單一臨床特征分類并不可行。迄今國際上共有3個根據重癥肌無力主要臨床表現和免疫學特征進行的特定組合亞組分類方案,但不同方案的具體定義存在差異,無法實現不同方案之間的比較或Meta分析;即使采用同一亞組分類方案,也有部分患者同時符合2個不同亞組的定義[86?88]。鑒于此,我們課題組基于相互獨立完全窮盡(MECE)原則,提出了新的亞組分類建議(圖1)[89],并采用類似分類方案在以中等劑量激素為基礎治療的隊列研究中初步發現亞組分類與疾病嚴重程度和預后存在相關性[42],該亞組分類還有待前瞻性研究驗證。有學者采用聚類分析法進行亞組分類,分為眼肌型、伴胸腺增生型、抗AChR抗體陰性型、伴胸腺瘤型和不伴胸腺異常的抗AChR抗體陽性型,但并未完全證實前述亞組分類中的其他特定組合,且亞組之間仍存在重疊[90]。我們課題組也采用聚類分析法獲得類似結果(未發表)。

圖1 重癥肌無力亞組分類建議和流程[89]Figure 1 MG subgroup classification recommendations and procedures[89].
11.危象 重癥肌無力相關危象最初分為3種類型,即肌無力危象、膽堿能危象和反拗危象,后續分類逐漸摒棄“反拗危象”概念,但的確存在原來AChEI有效者突然失效的現象,多見于嚴重感染和酸中毒[91]。危象的誘因中感染應該細化,尤其不能忽略病毒感染[C?反應蛋白(CRP)和白細胞介素?6(IL?6)最敏感],以及膽道和泌尿系統感染。情緒、手術、外傷、妊娠和藥物等均可成為誘因,但判斷因果關系需慎重[92],可以分為確定關聯、很可能關聯、可能關聯和明確無關聯。需統一“危象”的定義[91],目前定義為因呼吸肌無力發生呼吸衰竭需通氣支持,但隨著無創通氣的應用,需進一步規范“需通氣支持”的定義。國際專家共識指南還提出“危象前期”的概念[62],為迅速加重經治療醫師判斷數天或數周內將發生危象的患者。在危象前期能夠識別潛在危象是非常重要的,制作共同數據元時設立相關項目有助于指導臨床醫師標準化評估患者和總結危象診治中的規律,并探索更好的干預措施。早期癥狀應關注二氧化碳輕微潴留引起的興奮狀態和嚴重潴留引起的抑制狀態,應記錄床旁肺活量;合并低氧血癥者應評估肺彌散功能、炎癥和大呼吸道堵塞;有條件者應記錄最大吸氣壓(MIP)和最大呼氣壓(MEP)[93],如采用無創通氣應記錄呼吸機參數;詳細記錄危象前期的重癥肌無力癥狀十分重要,包括球部肌和呼吸肌癥狀、吞咽功能、疾病嚴重程度、溴吡斯的明劑量、免疫治療等。“術后危象”的定義也應統一,包括氣管插管者延遲拔管持續時間和重新插管時間[94?95]。還應測定伴胸腺瘤患者的淋巴細胞亞群和血清免疫球蛋白水平,此類患者有5%~6%可發生Good綜合征[96],使感染難以控制。危象前期和危象發生后行氣管插管者應記錄重癥肌無力癥狀和伴隨癥狀,尤其是膽堿能受體刺激癥狀,如瞳孔、心率、唾液腺分泌和肌束震顫等。還應記錄對重癥肌無力癥狀和合并癥的治療、開始嘗試脫機時間、脫機時最初溴吡斯的明劑量及使用時間與脫機開始和結束的間隔、脫機嘗試結束時患者的狀態等。危象改善后應對呼吸和吞咽功能、肺部感染、肺功能進行系列評估。
12.妊娠 女性重癥肌無力患者處于妊娠不同階段出現的病情加重情況不同,現有指南對妊娠和分娩相關問題作出推薦[62,97]。應詳細記錄妊娠并發癥、妊娠期藥物劑量和治療時間、胎兒發育、分娩過程、胎兒關節彎曲癥、新生兒肌無力及嬰幼兒期異常等[97?98]。
13.難治性重癥肌無力 難治性重癥肌無力的診斷應考慮遵囑性,在患者依從性良好的情況下經規范激素和免疫抑制劑治療后未能在預期起效時間內達到足夠療效、需反復靜脈注射免疫球蛋白或血漿置換、反復發生危象、出現嚴重不良反應需停藥、治療有效但減量后多次復發者,均可判定為難治性重癥肌無力[62,99?100]。目前,不同醫療中心對難治性重癥肌無力的判斷標準尚有差異,應標準化判斷流程[99?100]。
14.藥物不良反應和安全性清單 長期免疫治療可以導致多種不良反應,治療前可采用不良反應風險清單評估不良反應風險[101],治療后發生不良反應時按照通行的不良反應報告規范及時登記。應特別注意伴胸腺瘤的患者可出現免疫缺陷,并非均由免疫治療所致[97]。
1.兼容既往數據 不同年代的研究進展不同,一些年代產生的數據來自病歷記錄,無法查找到當年的醫師核證,因此應回顧重癥肌無力、自身免疫性疾病和胸腺疾病的臨床研究及各種診斷和分類標準的歷史納入共同數據元中,例如,我們課題組檢索到了各年代胸腺瘤14種分期的系統文獻[60]。

圖2 重癥肌無力干預后狀態的判斷流程圖[102]Figure 2 Flow chart for determination of post?intervention status in MG[102].
2.衍生數據元 一些重癥肌無力表型特征是在基本數據元基礎上通過有定義的數據篩選和邏輯運算形成的衍生數據,如短期療效應基于QMGS或MGC評分絕對值或相對改變,干預后狀態則要對重癥肌無力癥狀對生活的影響、體征、藥物應用情況和持續時間等因素進行流程化評估(圖2)[102],可以通過數據庫軟件進行檢索和邏輯運算獲得。
3.數據元修訂 數據元修訂基于認識的進步,數據元的定義、數據格式等可能的改變,但要在既往數據元的基礎上進行修訂。因此,編制共同數據元時應考慮如何盡可能保留原始信息,能夠定量的數據則不采用分類或定性數據設置數據元格式,方能在數據元修訂時根據原始記錄進行重新分類。
4.數據元及時獲取和質控 專病管理軟件與醫院電子病歷系統的連接和數據提取可形成即時數據,最為可靠,盡管臨床醫師接診時也可能出現錄入錯誤,但避免了整理錄入中的進一步錯誤。如果無法做到多醫療中心均可從電子病歷系統中提取數據,則應雙人錄入并核查。數據質控不能僅核查最小數據集是否完整,更要核查具體集值的錄入是否準確。人工智能有助于通過邏輯運算核查集值可能出現的錯誤,提請核查人員特別注意。基于共同數據元的數據庫運行一段時間后應組織系統的核查和糾錯,以保證前期資料的可靠性并發現問題,改進共同數據元的編制和數據庫的管理[103?104]。
5.重復測量 多次隨訪必然產生重復測量數據,為保證數據的可靠性,應對測評者進行培訓,采用Kappa檢驗對不同測評者對同一患者特定時點測量的一致性進行質控,但應注意重癥肌無力的疲勞性使患者難以接受多次檢查,錄制視頻后分發給不同測評者獨立判讀是一種解決方法[79]。
6.可視化 可視化手段可將不同重癥肌無力表型特征直觀聯系起來,選擇多個共同數據元形成折線圖疊加清晰顯示各共同數據元在時間軸上的趨勢和相互關系,餅圖則有助于直觀顯示不同類別所占比例。生物信息學技術中的可視化方法應引入基于共同數據元的數據庫。
20世紀80年代,我國的一些重癥肌無力診治中心即已建立了相應的數據庫系統,建立時間與西方國家的差距并不大。基于重癥肌無力領域醫師和研究者的經驗和興趣,通常以印刷的表格形式填寫(圖3),一些最初未考慮的內容需手寫添加,由于印刷成本,難以及時修訂數據元。20世紀90年代后期,國內開始采用Excel等軟件登記,通常由紙版記錄表手工輸入,可滿足數據元的增加,使基于原始資料形成衍生數據以確立新的數據元成為可能。進入21世紀后,西方國家較早開始創建人機對話的結構化專病數據庫,在神經系統疾病中主要涉及腦卒中、癲和多發性硬化等常見病,最初為單機版本,2005年后陸續改為在線版本,為能夠多中心合作,專病共同數據元的需求應運而生。至2010年,國內采用Excel軟件登記已成為基本配置,也開始進行專病計算機軟件的研發,但截至目前大多數重癥肌無力診療中心仍應用Excel數據庫,思路相似但數據元的具體定義、數據規范、詞匯表和工作手冊各不相同,僅少數中心研發了人機對話數據庫和手機APP。在進行多中心研究前,不同重癥肌無力診療中心應核對數據元及其具體定義,討論確定共同標準甚至重新整理原始資料。值得注意的是,有些研究者使用數據庫時并未經過專業培訓,數據庫管理者也應不斷加強交流和培訓才能更好地管理其中的數據。

圖3 青島大學附屬醫院叢志強教授使用過的重癥肌無力登記單Figure 3 MG registration forms used by Professor Cong Zhi?qiang,Affilliated Hospital of Qingdao University.
2012年,筆者在翻譯美國國立衛生研究院(NIH)編制的腦卒中共同數據元[105]時查閱其官網,發現在已有肌肉病共同數據元中,重癥肌無力已納入其中[106]。該共同數據元包含許多肌肉病共用的電生理學和合并癥等數據元,以及重癥肌無力不常用但肌肉病常用的遺傳學和病理學等數據元,然而缺乏重癥肌無力相關胸腺影像學和病理學數據元。國際最大的兩個注冊登記研究隊列——MGFA重癥肌無力注冊[107]和歐洲重癥肌無力注冊[108]均有其數據元系統,但尚未達成一致。迄今國內尚無取得共識的重癥肌無力共同數據元。
單個數據元和基于單個數據元形成的衍生數據元均為疾病表型,如受累部位和干預后狀態是臨床表型,抗AChR抗體水平是中間表型,疾病嚴重程度是內表型。一些數據元可能是基線因素,如首發受累部位;另一些數據元則是結局因素,如疾病嚴重程度和干預后狀態。個體化精準治療應在病程中根據基線數據和隨訪數據特征進行分類和預測,以指導臨床決策。瑞典多發性硬化登記系統可以通過篩查相似特征患者中某一治療策略或藥物應用的實時大數據,給臨床醫師和患者在治療選擇中提供借鑒[103]。但其治療方法受不同時代臨床醫師診治理念和社會經濟因素(如醫保)的影響,更為精準的決策還應基于疾病表型進行臨床研究。
1.基于隊列的流行病學研究隊列研究分為回顧性和前瞻性研究,回顧性研究用于比較不同時代和診治條件下的自然史,發現各種潛在影響因素,尤其是治療手段缺乏時的自然史更是寶貴的資料;前瞻性研究則從一個時代的普遍診治框架開始,通過長期隨訪獲得發病機制、療效和預后影響因素、診治改進方法等。因此,共同數據元向前兼容各時代的數據元并建立與當前數據元的聯系非常重要。
2.以隊列為基礎的干預研究 隨機對照試驗和采用傾向匹配法進行真實世界隊列研究是級別最高、能盡可能體現因果關系的循證醫學證據,隨機對照試驗亞組分析可以提供獲得良好或不良結局的患者信息,形成進一步研究的假說,因素校正法和傾向匹配法可使用真實世界的數據對這些假說進行驗證。隨機對照試驗的不足是時間偏短且基線資料預測能力有限,尤其是自身免疫性疾病這種病程波動有自我緩解趨勢的疾病。傾向匹配法可以模擬隨機對照試驗并納入更多真實世界因素變量,需從研究起始點前數據、研究起始基線數據、研究過程中數據這三方面考慮,忽視研究起始點前數據和研究過程中數據可能導致無法達到預期,我們課題組針對國外1項重癥肌無力患者胸腺切除術后重癥肌無力預后研究提出了這一問題[109?110]。貝葉森法有助于解決具有復發緩解特點疾病的病程預測問題[111]。共同數據元的編制和更新要考慮研究方法學的進步,有臨床診治經驗的醫師應與臨床流行病學和統計學專家合作,明確數據元及其相互關系,并確定至少應該包括哪些數據元才能應對前瞻性研究的挑戰。
3.數據元的改進研究 精確獲取一些數據元的數據不僅要有明確的數據規范和工作手冊以及測評者的培訓,而且要對現有方法在不同文化背景下進行評價并優化。我們課題組對重癥肌無力標準化分型的研究結果顯示,系統完成病史、標準化疲勞試驗和新斯的明試驗是臨床分型的基礎,即使不是重癥肌無力領域的專家,只要按照標準化流程也能獲得可靠的分型結果[3]。我們隨后對國內外常用的4個疾病嚴重程度量表進行多中心評價,發現均具有良好的信度和效度,適于多中心臨床研究[112];進一步收集國內15個省市32位重癥肌無力領域專家意見,采用Delphi法篩選條目形成初始量表[113],在此基礎上編制了適合我國臨床研究的完整量表和簡化版自評量表[114],新的完整量表與常用量表相比具有良好的校標信度,簡化版自評量表與完整量表具有較高的相關性,且無需特殊檢查設備,耗時少,以保證多中心研究測評的準確性和一致性。在完成對抗AChR抗體定量檢測一致性的研究[115]后,我們課題組在數據庫中按照自然史隊列中檢測抗AChR抗體時的人群特征選擇患者形成一個具有臨床表型代表性的隊列,對ELISA法和RIA法定量檢測的界值進行優化(待發表),這是國際上首次采用有完整信息的樣本對商品化AChR試劑盒的驗證研究,有望進一步改進抗體檢測數據元的工作手冊。這些研究的基礎是數據元的設置充分且盡可能定量收集數據,研究目標是數據元和集值的進一步優化和標準化,以期為表型研究提供更好的工具。
疾病表型由一個個特征構成,具有時間、空間和嚴重程度的多樣性,每個特征及特征間組合均可形成數據元。共同數據元是約定的也是不斷隨著認識的更新而改進的數據元,標準化獲取和共享將對疾病表型的認識,以及因果關系的確認發揮重要作用。在共享平臺上,尤其是隨著大數據時代人工智能技術的發展,每位研究者均有機會成為解決一個科學問題或一個實用問題的主研,共同數據元的價值以及編制者的貢獻已經越來越受到認可[119]。本文對重癥肌無力共同數據元的編制提出相關概念和問題,希望推動重癥肌無力共享平臺的建設,通過表型研究更好地改進重癥肌無力的診斷、標準化評估和個體化治療。
利益沖突無