黃 平,馮慧芬,王 芳,黨德建,王 斌,趙 敬,易佳音
1) 鄭州大學第五附屬醫院消化科 鄭州 450052 2) 鄭州大學附屬兒童醫院感染科 鄭州 450051 3) 鄭州大學第五附屬醫院感染控制科 鄭州 450052
手足口病(hand-foot-mouth disease,HFMD)是由腸道病毒引起的一種常見的兒童傳染病[1],由于該病的自限性,大多數患兒僅表現出輕微的癥狀,如發熱及伴隨的軀體相應部位的出疹。但少數重癥患兒病情容易進展,出現各種嚴重的并發癥[2],如肺水腫、病毒性腦炎等[3],導致不良預后。2012年我國流行病學調查數據[4]顯示,12~23個月的幼兒HFMD發病率和病死率最高,心肺或神經系統的并發癥發生率為1.1%,病死率為3%,其中超過90%的死亡病例與腸道病毒71型(EV71)感染有關[5]。因此早期識別患兒的重癥化趨勢,及時進行臨床干預對于減少重癥HFMD患兒不良預后的發生顯得尤為重要。
通過創建一個直觀的統計預測模型圖表,可以準確地評估各種癌癥預后參數如轉移概率、總生存期及復發概率與各預測指標之間的關系,從而精確地預測各種結局風險[6]。列線圖是一種基于回歸模型創建的圖形計算工具,已成為一種流行的統計預測模型[7-8]。列線圖可以與Cox回歸或logistic回歸聯合應用。目前,尚無可供參考的HFMD臨床評分工具。既往大量學者的研究[9-10]僅限于在重癥危險因素的挖掘中,停留在定性評價階段,而無法做到向臨床輔助工具的轉化和開發。本研究旨在借助列線圖模型實現對重癥HFMD的發病風險預測,從而為后續研究以及臨床輔助量表的開發提供方法學參考依據。
1.1研究對象收集鄭州市某兒童醫院2017年7月至2018年2月住院診治的HFMD患兒病例資料。所有病例的診斷均由主治及以上職稱的醫師,依據《手足口病診療指南(2010年版)》[11],將患兒分為輕癥組562例和重癥組218例。納入標準:①初次診斷的HFMD患兒。②患兒除HFMD疾病之外,無其他基礎疾病,一般情況尚好。③患兒病例及檢驗等資料完整,無缺失。排除標準:①恢復期的HFMD患兒。②HFMD發病之前,已經合并心肺等其他并發癥的患兒。③存在免疫力缺陷等先天性疾病的患兒。
1.2資料收集按照預先制定的表格,由專人負責對納入的病例資料進行記錄及整理,包括患兒的基本信息及化驗結果等。錄入數據的質量控制由兩位研究者相互監督,保證資料的完整及真實性。
1.3列線圖的計算原理回歸模型對每個變量生成一個回歸系數β,將變量中絕對值最大的β轉化為100分,其余所有變量的β除以這個最大β,再乘以100,轉化為相應得分。將所有變量的得分進行累計求和,最終用總分來推算其結局事件發生概率。
1.4統計學處理使用R 3.5.1處理數據。主要用的R包有:mlr,stats,ROCR,Hmisc,grid,lattice,Formula,ggplot2,rms等。通過查閱文獻以及結合臨床,將連續性變量進行二分類離散化處理。2組基線特征和基礎資料構成的比較使用χ2檢驗。使用簡單隨機抽樣方法將全數據集分成訓練子集(70%)和測試子集(30%),其中訓練子集用于建立列線圖模型,測試子集用于模型的預測性能分析。使用預測正確率、ROC曲線和分類器校準進行間接評價。將所有變量一次性代入logistic回歸模型中,使用逐步回歸法進行分析,篩選有統計學意義的指標用于列線圖的構建。檢驗水準α=0.05。
2.1一般資料輕癥組562例,男、女分別為310、252例,發病時間1~7(2.2±1.9) d;重癥組218例,男、女分別為135、83例,發病時間1~5(2.1±1.8) d;兩組性別和發病時間均衡,年齡均為2個月~7歲。兩組患兒的基線特征見表1,訓練和測試子集的基礎資料構成比較見表2。

表1 輕癥和重癥組的基線特征
表2訓練和測試子集的基礎資料構成例(%)

特征訓練子集(n=546)測試子集(n=234)χ2 P分組 輕癥 重癥389(71.2)157(28.8)173(73.9)61(26.1)0.587 0.444 性別 男 女317(58.1)229(41.9)128(54.7)106(45.3)0.754 0.385 年齡/歲 <2 ≥2378(69.2)168(30.8)147(62.8)87(37.2)3.059 0.080 發熱/d <3 ≥3122(22.3)424(77.7)48(20.5)186(79.5)0.322 0.570 體溫/℃ <38.5 ≥38.5218(39.9)328(60.1)89(38.0)145(62.0)0.246 0.620
2.2重癥HFMD列線圖模型的構建使用訓練子集的數據進行模型訓練,采用逐步回歸法將所有變量代入logistic回歸方程,結果見表3。將上述logistic回歸篩選出的預測變量代入列線圖模型,結局指標選取重癥HFMD的發病風險,繪制列線圖,結果見圖1。根據每個變量的取值,向得分軸進行垂直投射,可以對應一個得分,如此,將所有變量對應得分進行總計,通過對應的總分軸向重癥風險軸進行投射,可以判斷某患兒發生重癥的風險。

表3 Logistic回歸分析

圖1 重癥HFMD的發病風險預測列線圖
2.3列線圖模型預測性分析模型擬合度偏差性檢驗結果:χ2=6.425,P>0.05,即模型預測的偏差性較小,擬合度較好。輸出模型預測正確率為83.9%。繪制列線圖模型和logistic模型預測重癥HFMD的ROC曲線為圖2,其曲線下面積分別為0.850(95%CI=0.835~0.864)和0.832(95%CI=0.821~0.848),兩者診斷價值差異無統計學意義。

圖2 兩種模型的ROC曲線
列線圖模型的分類器校準圖見圖3,可以看到,該模型實際校準線距離參考線較為接近,表明模型性能較好。

圖3 列線圖模型的分類器校準圖
本研究通過回顧性分析,將常見的幾種可能為HFMD患兒病情進展為重癥的危險因素進行初步篩選,并借助于列線圖模型,創建了一個臨床評分工具。目前,在評分工具開發方面,臨床預測規則(clinical prediction rules,CPRs)是較為常見的方法。CPRs是一種用來輔助臨床決策制定的工具,通常從病史、體格檢查以及相關化驗、檢查結果等方面來量化影響因素。CPRs通常又被稱為預測模型或風險評分等,它提供了一種估計發病風險、疾病預后,甚至是診斷或治療方案獲益的評判策略[12]。現臨床上廣泛使用的如新生兒阿普加評分、格拉斯昏迷評分量表等,都是基于CPRs的設計理念,經歷了從推導到驗證的過程,最后評價其臨床應用價值。
從推導過程來看,CPRs和列線圖都是基于logistic回歸模型,進行一系列回歸系數的轉化處理,但是相比于CPRs,列線圖具有以下優勢:①憑借著R語言的編程優勢,僅需一行代碼,就可以輕松繪制,無需像CPRs一系列復雜的手動的計算過程。②放寬了對預測變量類型的要求,無論是分類型,還是連續性變量,均可以用于構建列線圖,而CPRs僅限于分類變量,這就要求在構建之前對連續性變量進行人工離散處理。相比于軟件對連續性變量的自動優化處理,人工離散往往借助于臨床經驗,具有一定的盲目性,不能實現最優分割。③借助于R語言強大的編程,列線圖繪制中可以實現交互式建模,通過對預測變量的機器篩選結合人工增減實現擬合最佳模型,從而為后期創建具有指南指導價值的列線圖提供強大的技術平臺。
在篩選出的預測變量方面,Ooi等[13]通過前瞻性的隊列研究,得出發熱>38.5 ℃、發熱時間>3 d為HFMD患兒合并神經系統并發癥的獨立危險因素。林克武等[14]認為血糖增高具有提示HFMD合并腦炎的價值。目前的研究[15]認為,促炎因子參與了HFMD重癥化的過程,當患兒合并有腦干等損傷時,引起機體的一系列機能紊亂,進而導致外周血中白細胞及血糖的增高[16],但其具體機制仍待后續深入。
Liu等[17]認為,HFMD患兒發病的高峰年齡為2歲,Luo等[18]的流行病學調查研究發現,對于重癥HFMD患兒,從診斷到進展為重癥的中位數時間為2 d。因此對于少部分病情進展迅速的患兒,需要更多有效的臨床預測指標來識別,幫助臨床醫生從不典型癥狀的患兒群體中盡可能篩選出高危的患兒,給予必要的干預與治療措施,提高患兒的預后,避免不良事件的發生。
本研究尚存一些不足,雖然納入了較多樣本,一定程度上減少了擬合偏差,但是一個好的模型構建往往需要巨大的樣本量的支持,因此后續可繼續擴大樣本量,并在模型驗證方面積極跟蹤隨訪。目前國外有些學者依據已經發表的文獻,將腫瘤方面的列線圖工具制作成在線評分調查問卷,借以來收集外部驗證數據。因此后續研究如果能收集不同地域人群的調查結果,將更有助于完善模型和評測性能。
綜上所述,本研究表明列線圖可以用于重癥HFMD風險評估的預測,相比于傳統logistic回歸模型,列線圖具有簡單、直觀、實用性強等優勢,在臨床應用方面具有一定的輔助價值。借助于更多挖掘危險因素方面的深入研究以及結合流行病學大樣本量數據的應用,有望創建一個價值更高、應用范圍更廣的列線圖,為臨床指南和醫學決策的制定提供更充實的參考依據。