□ 朱千里 ZHU Qian-li
我國人口基數較大且結構不平衡,造成了社會醫療負擔較重。如何運用有限的醫療資源滿足龐大的患者群需求是現今醫改的重點和難點。腦卒中是一種常見并具有較高致殘率的疾病[1],主要病因分為腦血管源性和心源性[2],其中心源性多見于心房顫動患者[3]。針對不同病因腦卒中患者的治療原則不同,腦血管源性腦卒中的病理生理機制為動脈粥樣硬化,治療以抗血小板為主[4];房顫致腦卒中的病理生理機制為左房血栓脫落致腦動脈栓塞,故治療以抗凝為主[5]。如不加以區分地對患者進行隨機治療:對僅存在動脈粥樣硬化的腦卒中患者進行聯合抗凝治療會增加出血等高危并發癥;對房顫導致腦卒中的患者進行單純抗血小板治療則為無效治療。因此,尋找一種有效、簡易的方法來篩查、甄別伴發房顫的腦卒中患者至關重要。既往的研究對于腦卒中患者伴發房顫的篩查方法主要從提高敏感性出發,通過延長心電監測的時程來實現[6-8],但這些研究涉及的連續長達3 周至3 個月的心電監護在我國這種醫療資源稀缺的特殊環境下,臨床實際應用價值較低,無法普及推廣。本研究希望通過使用人工智能的手段,以心電監測結果為依據,觀察人工神經網絡在預測腦卒中患者合并房顫方面的效能。
1.一般資料。納入標準:2013 年1 月至2018 年1 月期間于我院診斷為急性腦卒中并住院治療患者,共669 例。排除標準:(1)腦卒中出現出血轉化;(2)精神或意識障礙,無法配合;(3)因檢查需要或其他原因導致心電監護暫停或取消;(4)死亡或自動出院病例;(5)已知既往房顫病史。最終收錄651 例患者。
2.變量采集及臨床事件定義
2.1 變量采集。通過檢索文獻歸納并收集11 個已證實與房顫發作相關的影響因素作為構建預測模型的變量[9-13],包括:他汀用藥史、血管緊張素轉換酶抑制劑(angiotensin converting enzyme inhibitors,ACEI)或血管緊張素受體抑制劑(angiotensin converting enzyme inhibitorstors,ARB)用藥史、身體質量指數(Body mess index,BMI)、糖尿病病史(Diabetic melitous,DM)、高血壓病史(Hypertension,HT)、年齡、性別、心臟射血分數(Ejection fraction,EF)、心臟左房內徑(Left atrial diameter,LAD)、尿酸、腦鈉肽(B-type Natriuretic Peptide,BNP)水平。
2.2 臨床事件定義。急性缺血性梗死性腦卒中:突發的>24小時的局部神經功能缺失癥狀,與相應的大腦動脈堵塞相匹配和/或對應影像學上的腦梗死病灶。房顫事件:心電監護記錄發作時間持續≥30 秒房顫心律。
3.構建Logistic 回歸(Logistic Regression,LR)和人工神經網絡(Artificial Neural Network,ANN)模型。
將入選患者根據公式RV.BERNOULLI (0.7) 隨機分為訓練集(70%)和驗證集 (30%)。比較兩個模型在驗證集患者中并發房顫的預測作用。
3.1 構建Logistic回歸模型。使用SPSS22 (SPSS Inc, Chicago,IL,USA) 構建Logistic 回歸預測模型,設定腦卒中患者是否存在房顫心律為結局(無房顫事件編碼為0;存在房顫事件編碼為1),將收集的所有預測變量納入模型,以“逐步前向法”進行推演運算。
3.2 構建人工神經網絡模型。使用MATLAB(R2012b,64bit)軟件進行人工神經網絡模型建設,將所有的預測變量納入模型輸入層。對于為定量資料的預測變量,在輸入層時進行標準化校正,轉化為0 ~1,以增加模型的穩定性。模型采用反向誤差回歸算法,隱藏層神經節點設置由模型進行優化擬定(隱層節點范圍1 ~50),輸出層根據腦卒中患者是否存在房顫心律分為2 個結局(無房顫事件編碼為0;存在房顫事件編碼為1)。
3.3 兩組模型對于預測效能的比較。分別繪制兩組模型ROC曲線并比較AUC 面積,根據最優化原則判斷約登指數,計算模型敏感性、特異性、似然比和一致率。人工神經網絡模型生成預測變量對應的權重列表。
4.數據的處理與分析。數據統計運用SPSS22.0 軟件處理,連續變量用均值±標準差表示,組間比較進行t 檢驗或Mann Whitney 非參數檢驗。分類變量使用頻數和百分率描述,組間比較進行χ2檢驗。兩組模型AUC 比較使用Z 檢驗。p<0.05 認為差異具有統計學意義。
1.預測變量賦值。變量X1 ~X6 為連續變量,納入模型時進行標準化校正,X7 ~X11 為分類變量,以“0”編碼無變量事件,“1”編碼存在變量事件(見表1)。

表1 訓練集與驗證集組間比較
2.訓練集與驗證集比較。本研究入選患者共651 名,隨機分入訓練集(n=455,69.9%)和驗證集(n=196,30.1%),交叉熵錯誤0.031,兩組患者變量間差異無統計學意義p>0.05。(見表2)。

表2 人工神經網絡與Logistic 回歸模型
3.人工神經網絡構建。本研究人工神經網絡預測模型分3層,包括1 個輸入層、1 個隱藏層、1 個輸出層。其中輸入層包含11 個變量,隱藏層5 個神經節點,輸出層2 個結局。敏感性為79%,特異性為93% (見表2),變量權重列表前四位為射血分數、尿酸、腦鈉肽、左房內徑(見圖2)。

圖1 兩種預測模型ROC 曲線下面積

圖2 ANN 模型輸入層變量權重
4. Logistic 回歸構建。Logistic 回歸預測模型敏感性為65%,特異性為55%(見表2),Hosmer-Lemeshow 檢驗值為0.681。
5.模型間預測效能的比較。兩種模型對腦卒中患者是否存在房顫心律的預測效能的比較(見表2),與LR 模型的AUC[0.612(95% CI0.594-0.706)]相比(見圖1),人工神經網絡模型AUC 較大[0.844(95%CI 0.768-0.921)],且差異有統計學意義(Z=3.863,p<0.05)。
人工神經網絡是人工智能的一種常見算法,通過模擬人腦神經元的運行方式,使用多層前饋網絡系統,以達到準確預測臨床事件的目的[14]。由于人工神經網絡可以將運算結果與設定的結局進行比對,將存在的差異反向導入運算層進行再次演算調整權重,故優勢在于能夠對臨床上受大量復雜因素影響的事件進行精確預測,提高臨床工作的效能[15]。
通過檢索房顫相關的研究文獻顯示,有大量因素能夠直接或間接引起或加重房顫的發生,包括:年齡、血壓、心臟結構和功能、尿酸水平等[9-11]。這些因素在不同的患者個體上會有不同的組合方式[12-13],隨著預測因素和患者群體數量的增加,這些組合方式將呈指數級上升,所以很難通過臨床經驗、簡單公式或評分系統對結局進行有效的分類預測。這也是本研究選擇人工神經網絡來構建這類復雜多變的預測模型的原因。其中考慮到腦卒中急性期甲狀腺功能會產生相應變化無法反映其與房顫的真實聯系[16];腦卒中頭顱CT 梗死灶的位點與房顫相關性仍存在較大爭議且急性期頭顱CT 往往采集于24 小時內無法充分反映病程等的客觀現狀[17-18],本研究未將甲功和CT 檢查等納入做預測變量。
本研究對腦卒中患者是否合并房顫的預測模型效能通過構建兩種不同模型進行比較。Logistic 回歸模型的Hosmer-Lemeshow 檢驗值為0.681,提示LR 模型已充分應用了本研究所涵蓋的變量資料進行演算。研究結果顯示,LR 模型的預測一致率為59.4%,敏感性、特異性分別為65%和55%,提示模型對于房顫事件的預測效果不佳。如使用LR 模型對腦卒中患者進行房顫的預測將會造成部分患者的漏診,從而引起嚴重的臨床后果。相對而言,人工神經網絡的預測模型的敏感性較高(79%),而特異性更是達到了93%。高特異性可以讓醫務人員在對腦卒中患者進行抗凝治療時最大限度地做到有的放矢。86.7%的一致率也提示人工神經網絡可以對近9 成的腦卒中合并房顫患者進行預測。因此,在針對急性梗死性腦卒中患者的診治環節中,通過應用本研究模型可以對不同病因進行鑒別診斷。急性梗死性腦卒中患者的抗血小板治療無法預防合并房顫患者的腦卒中再發。通過本研究模型預測的合并房顫的腦卒中患者進行相應的抗凝治療可以改善預后。
在模型構建過程中,預測變量將會被賦予不同的權重,本研究構建的人工網絡模型顯示,在對腦卒中患者合并房顫事件的預測上,權重較大的前4 項變量為射血分數、尿酸、腦鈉肽水平和左房內徑。故醫務人員在腦卒中患者的臨床診治過程中,需要更加關注這些類別的指標參數,在不同的患者個體上,當無法進行全面評估時,可以優先以這幾類參數為依據進行臨床決策和資源配置。
本研究采用臨床中常見的指標和參數,作為預測變量進行模型構建,具有良好的可操作性和推廣價值。研究結果顯示,人工神經網絡可以有效地預測腦卒中患者合并房顫事件的發生。通過對合并房顫的預測,可以指導臨床相應治療的進行,改善患者的預后。