賴海芳,顧琳,縱亞,牛傳欣,謝青
1.上海交通大學醫學院附屬瑞金醫院,上海市 200025;2.上海市瑞金康復醫院,上海市 200023
我國是世界上腦卒中負擔最重的國家,腦卒中的患病率高、發病率高、死亡率高,其中缺血性腦卒中發生率和患病率分別為69.6%和77.8%[1]。對于缺血性腦卒中,多種血清學和臨床數據對評估病情嚴重程度、指導臨床治療和判斷預后有重要參考價值[2-4];而如何分析豐富的臨床信息,以精準預測患者預后,制定個體化治療方案,是康復工作的重點之一。
Logistic 回歸是常用的分析方法,主要用于尋找疾病的危險因素、預測疾病的發生風險等[5]。Logistic回歸采用的是線性模型,當各自變量與因變量為非線性關系時,預測效果不夠理想[6]。
人工神經網絡是一種仿大腦神經網絡結構和功能而建立的信息處理算法,具有很強的非線性函數逼近能力和自組織自學習能力。由于缺血性腦卒中患者的結局涉及復雜的臨床指標,存在較強的非線性聯系,適合采用人工神經網絡模型進行分析[7]。其中,多層感知器(multiple layer perceptron,MLP)神經網絡應用范圍較廣,擴展性也強,使用通用的函數近似方法擬合復雜的函數,可以解決非線性分類問題[8]。本研究分別采用Logistic 回歸和MLP 神經網絡兩種方法構建亞急性期缺血性腦卒中的預后判斷模型,比較兩種模型的預測效能。
回顧性收集2019 年1 月至2021 年9 月在上海市瑞金康復醫院康復科住院的亞急性期缺血性腦卒中患者60 例,均符合《中國急性缺血性腦卒中診治指南2018》確定的缺血性腦卒中診斷標準,并經頭顱CT或MRI確診。
納入標準:①首次發作;②病程<30 d[9];③自愿簽署知情同意書。
排除標準:①既往腦出血、腦梗死、腦外傷、中樞系統感染、腦腫瘤等;②并發嚴重肝腎功能不全;③并發嚴重心血管疾病、自身免疫性疾病、惡性腫瘤等,嚴重影響身體功能;③近2 周有手術史、全身炎癥性疾病;④精神障礙、嚴重認知障礙等,不能配合檢查。
本研究經上海市瑞金康復醫院倫理委員會審查通過(No.RKIRB2021-18)。
1.2.1 特征變量
由康復專科醫師從電子化病歷系統和檢驗檢查管理系統中收集所有入組患者的臨床資料,包括性別、年齡、既往史(高血壓、糖尿病病史)、個人史(吸煙史、飲酒史)、實驗室檢查〔C-反應蛋白(C-reactive protein,CRP)、白蛋白、空腹血糖、脂蛋白a、D-D 聚體、B型鈉尿肽〕。所有患者根據入院時美國國立衛生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS)分為低分組(<11 分)和高分組(>11 分)。隨訪以再次入院的形式進行,采用改良Rankin 量表(modified Rankin Scale,mRS)評估患者首次入院3 個月后的功能結局,0~3 分為預后良好,4~5 分為預后不良。
患者各特征變量見表1。

表1 入組患者特征變量
1.2.2 統計學分析
采用SPSS 20.0 統計軟件進行數據分析。采用單因素分析(分類變量采用χ2檢驗,數值變量采用方差分析,顯著性水平α=0.05)篩選出與預后相關的變量,以此作為多因素Logistic 回歸分析的自變量和MLP 神經網絡的輸入節點。計算兩種模型的預測準確率,采用接受者操作特征(receiver operating characteristic,ROC)曲線評估預測效應。
60例患者中,預后良好與預后不良各30例,χ2檢驗結果見表2,方差分析結果見表3。共篩選出5 個與短期預后相關聯的變量,分別是年齡、CRP、白蛋白、脂蛋白a和入院NHISS評分。

表2 短期預后相關特征變量的χ2檢驗結果 單位:n

表3 短期預后相關特征變量的方差分析結果
將單因素分析篩選出的5個特征變量作為自變量,以短期預后(預后良好=0,預后不良=1)為因變量,進行多因素Logistic 回歸分析,加入和剔除的顯著性水平α 分別為0.05 和0.1,年齡、脂蛋白a 和入院NHISS評分為預后的獨立影響因素。見表4。

表4 多因素Logistic回歸分析結果
60 例患者任選42 例的數據用于模型訓練,另18例的數據用于模型評價。采用多層前饋神經網絡結構,共軛梯度優化算法,以單因素分析篩選出的5 個變量作為輸入層節點,隱藏層層數1,隱藏層節點數1~50,預后結果為輸出層唯一節點,建立MLP 模型。標準化處理后,5個變量的重要性見圖1。

圖1 各因素標準化后對MLP模型的重要性
兩種模型預測結果見表5。MLP 預測模型準確率高于Logistic回歸模型。

表5 兩種模型預測結果比較
Logistic回歸模型ROC 曲線下面積為0.851,MLP模型曲線下面積為0.930。見圖2。

圖2 兩種模型預測效應的ROC曲線
人工神經網絡模擬人腦思考結構,在處理非線性復雜關系時有特別的優勢[10]。隨著人工智能技術發展,越來越多的人工神經網絡算法被應用于圖像檢查、生物信號檢測、疾病專家系統等醫學領域[10-13]。相比其他神經網絡模型,MLP神經網絡在處理連續變量關系時有一定優勢,本研究采集的指標經單因素分析篩選后均為連續變量,故采用MLP 神經網絡。研究顯示,MLP 模型不僅預測準確率高于Logistic 回歸模型,還能將各影響因素進行重要性排序。多因素Logistic回歸篩選出3個短期預后的獨立影響因子,分別為年齡(OR=1.090)、入院NHISS 評分(OR=1.228)和脂蛋白a (OR=1.029)。MLP 模型的重要性排序依次為年齡、入院NHISS 評分、脂蛋白a、白蛋白、CRP,兩者結論基本一致。
本研究顯示,年齡是影響亞急性期缺血性腦卒中患者短期預后最重要的危險因素。多項研究表明[14-15],年齡是腦卒中預后不良和死亡的主要影響因素之一。
NIHSS 有較高的效度和信度,在缺血性腦卒中評估中被廣泛使用。入院NHISS評分的高低直接反映患者神經功能缺損程度[16]。本研究顯示,NHISS 評分是亞急性期缺血性腦卒中患者短期預后的良好預測因子,與Ahmed等[17]的結果一致。
脂蛋白a 具有多種功能,包括促動脈粥樣硬化、促凝血酶原和促炎癥[18]。血清脂蛋白a 水平升高與心血管疾病風險增加相關,尤其是心肌梗死、腦卒中和主動脈瓣鈣化狹窄[19-21]。Zhang等[22]發現,與健康人相比,急性缺血性腦卒中患者血清脂蛋白a 水平顯著升高;功能預后不良的患者血清脂蛋白a 水平更高。與本研究結果一致。
本研究存在一些不足。臨床資料只選取13 個變量,而諸如腦卒中部位、認知水平、意識狀態、情緒障礙、溶栓治療以及其他血液標志物等,也可能對腦卒中患者預后發生影響;本研究只隨訪了首次腦卒中后3個月時的功能狀態,未觀察長期預后。
現有研究多關注腦卒中急性期的預后相關危險因素[23-25],對亞急性期預后相關危險因素的研究不多。患者進入亞急性期后康復階段時,如能應用MLP 模型充分了解患者預后及其危險因素和重要程度,有望提升康復治療方案的精準性和個體化水平。
利益沖突聲明:所有作者聲明不存在利益沖突。