999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的新發急性缺血性卒中患者1年功能預后預測研究

2022-04-06 12:36:42陳思玎俞蔚然黃馨瑩劉歡姜勇王擁軍
中國卒中雜志 2022年3期
關鍵詞:模型研究

陳思玎,俞蔚然,黃馨瑩,劉歡,姜勇,2,王擁軍,3,4

卒中是全球第二大死亡原因,也是我國死亡和殘疾的主要原因[1-2]。急性缺血性卒中(acute ischemic stroke,AIS)占全部卒中的80%,具有高致殘率、高致死率及高復發率等特點[3]。利用預測模型準確預測AIS患者預后,提升患者的精準風險分層與診療策略管理、優化醫療資源配置,從而改善患者預后是卒中二級預防中不可忽視的環節。隨著大數據時代的到來,計算機算力的提高和算法的更新,機器學習在疾病預測方面取得了較大的進展。其中,多種集成模型(如各種樹模型)在疾病預測方面逐漸呈現出一定優勢。本研究利用中國國家卒中登記(China national stroke registry,CNSR)數據庫研究新發AIS患者1年功能預后的相關因素,比較機器學習模型和logistic模型的預測性能,為相關研究和臨床工作提供參考。

1 對象與方法

1.1 研究對象 本研究的研究對象來源于CNSR數據庫。CNSR為全國范圍內的前瞻性、觀察性急性卒中登記研究,其數據庫資料連續記錄了2007年9月-2008年8月全國27個省和4個直轄市(包括香港),共132家醫院收治的急性卒中患者信息。入組標準:①發病年齡≥18歲;②臨床確診為缺血性卒中或TIA;③發病7 d內就診并住院治療的患者。排除標準:①既往有卒中病史;②1年功能預后結局缺失。CNSR共納入了13 616例AIS和TIA患者,其中AIS患者為12 415例。本研究納入CNSR數據庫中新發AIS患者的資料。

1.2 預測變量及結局

1.2.1 預測變量 結合臨床經驗及AIS早期管理指南、文獻報道的相關預后預測模型和CNSR數據特點確定備選預測因子[4-5],使用病例報告表收集患者的人口學特征、卒中前mRS、飲酒史、既往史、用藥史、入院查體、發病-到院時間、入院實驗室檢查、TOAST分型、入院NIHSS、出院NIHSS、出院帶藥、90 d用藥依從情況、1年用藥依從情況等共37個變量。其中人口學特征包括年齡、性別、教育水平;既往史包括冠心病、心房顫動、糖尿病、高血壓、周圍血管病;用藥史包括抗血小板藥、抗凝藥、調節血脂藥、降糖藥、降壓藥;入院情況包括入院時BMI、心率、收縮壓、舒張壓、意識障礙、肢體運動功能障礙、視野缺損;入院實驗室檢查包括血糖、白細胞、肌酐、血小板;出院帶藥包括抗血小板藥、抗凝藥、調節血脂藥;用藥依從性包括抗血小板藥物和抗凝藥物的依從性。

1.2.2 結局變量 本研究結局變量是新發AIS患者發病1年預后不良。研究采用中心化電話隨訪的方法,使用mRS評估發病1年時的功能預后,隨訪由經過統一培訓的中心化隨訪員進行。根據mRS將患者分為預后良好(mRS 0~2分)和預后不良(mRS≥3分)兩組。

1.3 數據預處理 刪除不合邏輯的異常值,連續變量缺失值利用線性插值法填補,分類變量缺失值利用眾數填補。

1.4 模型構建方法

1.4.1 特征選擇 特征選擇是在建立模型之前減少輸入預測因子數量的過程。可以簡化輸入預測因子的數量同時提高運算效率,提高模型的可解釋性。本研究的特征選擇步驟在訓練集中利用logistic算法進行,利用OR和95%CI等指標增加模型的可解釋性。將單因素logistic回歸中P<0.1的預測因子納入多因素分析,使用逐步回歸最后確定進入模型的預測因子。

1.4.2 機器學習模型 本研究涉及的機器學習模型有CatBoost模型、XGBoost模型、梯度提升決策樹(gradient boosted decision trees,GBDT)模型、隨機森林模型4種樹模型。

(1)CatBoost模型:CatBoost模型是一種創新的有序梯度提升算法,它使用基于有序目標的統計量進行分類特征處理和排列策略來避免預測偏移,提高了算法的可泛化能力。CatBoost是一種新的集成學習算法,具有獨特的對稱數結構,通過計算葉子節點的值來構造決策樹,非常適合分類和異構數據的學習任務,同時降低了對超參數調優的要求[6]。

(2)XGBoost模型:XGBoost模型是一種可擴展的、高效率的機器學習分類器,在2016年由陳天奇等學者開發,是集成學習Boosting系列中支持自定義代價函數的模型,早期是由GBDT模型發展而來,它不僅以提升的方式組合多個決策樹,還可以進行二次泰勒展開[7]。XGBoost模型支持并行運算且在目標函數基礎上加入了正則項,以得到最優解,同時避免過擬合。

(3)GBDT模型:GBDT中使用的決策樹是一個回歸樹。每次訓練的目標是減小最后一次訓練的誤差,最終使誤差最小,模型采用梯度下降法減小誤差[8-9]。

(4)隨機森林模型:隨機森林是將決策樹作為元分類器的一種集成學習方法,對變量共線性不作要求。是一種集成的監督學習方法,它由多個決策樹對應不同的子數據集組成。計算每棵樹的結果,并得到預測結果的平均值。這種方法可以減少決策樹中的方差[10]。

比較不同模型對預后不良的預測性能時,主要從區分度和校準度兩個方面進行評價。本研究采用C統計量即ROC中的AUC值來評估區分度;采用Brier得分(0~1分)評估校準度,Brier得分越趨近0,模型的校準度越好;本研究其他評估的指標有準確率、陽性預測值、陰性預測值和F1分數。

應用Python 3.6.8軟件進行預測模型建模和可視化,應用SAS 9.4統計軟件進行logistic回歸分析。本研究利用Python 3.6.8軟件中train_test_split函數以進行5次隨機分組,將納入的研究對象按7∶3比例隨機分為訓練集和測試集。利用GridSearch CV在訓練集中進行10折交叉驗證調參,使模型在訓練集中AUC表現最優,結合特征選擇后的預測因子進行反復訓練和參數優化。測試集僅參與訓練好的模型評價。進入每個模型訓練和測試的預測因子都是經過特征選擇的最優預測因子集合。logistic模型采用逐步回歸法,其預測因子的效應通過回歸系數或OR值及其95%CI體現。以P<0.05為差異有統計學意義。

2 結果

2.1 基線信息和隨訪情況 本研究共納入12 415例AIS患者,排除有卒中病史的患者4172例,1年mRS資料缺失13例,共納入8230例新發AIS患者進入研究,其中1年預后良好組5870例,預后不良組2360例。入組患者的平均年齡64.4±12.8歲,女性3113例(38.7%),高中及以上教育水平2329例(29.0%)。單因素分析結果顯示,1年預后良好和預后不良組間的人口學特征、飲酒史、冠心病史、心房顫動史、糖尿病史、周圍血管病史、卒中前mRS、降糖藥物用藥史、入院查體情況和實驗室檢查、發病-到院時間、TOAST分型、入院和出院NIHSS、出院帶抗血小板和調節血脂藥物比例、90 d和1年抗血小板藥服用依從比例等指標的差異均有統計學意義(表1)。

表1 新發AIS患者1年預后良好和預后不良患者基線和隨訪資料比較

2.2 特征選擇結果及調參 多因素分析結果顯示增齡、女性、卒中前mRS≥3分、入院NIHSS、出院NIHSS、肢體運動功能障礙、周圍血管病史、入院血糖、調節血脂藥物(出院帶藥)、抗血小板藥(1年服藥依從)可作為預測模型的預測因子(表2)。

表2 訓練集多因素logistic回歸分析結果

2.3 機器學習模型和傳統logistic回歸模型預測性能比較 在測試集中,Catboost模型預測1年預后不良的AUC最高,其次為XGBoost模型、GBDT模型、隨機森林模型和logistic回歸模型(圖1、表3)。Catboost模型(P=0.0130)、XGBoost模型(P=0.0133)、GBDT模型(P=0.0229)、隨機森林模型(P=0.0429)對1年預后不良的預測性能均優于logistic回歸模型。每個模型的校準度均良好(表3)。

表3 機器學習模型和傳統logistic模型預測性能比較(測試集)

圖1 機器學習模型和傳統logistic模型ROC曲線(測試集)

3 討論

本研究基于機器學習的方法建立了新發AIS患者1年功能預后的預測模型,為了增加預測因子的可解釋性,采用了多因素logistic來進行特征選擇。然后利用機器學習的算法進行建模,并與傳統的logistic回歸模型進行比較。研究結果顯示,在區分度方面本研究所訓練的Catboost模型、XGBoost模型、GBDT模型和隨機森林模型均優于傳統logistic回歸模型,同時本研究建立的每個模型的校準度均良好。

既往常用的AIS功能預后預測模型主要為評分量表,多是基于logistic回歸算法建立的,常見的有洛桑急性卒中登記分析(acute stroke registry and analysis of Lausanne,ASTRAL)評分[11-12]、缺血性卒中風險預測評分(ischemic stroke predictive risk score,IScore)[13-14]以及血管事件總體健康風險(totaled health risks in vascularevents,THRIVE)評分[15-17]等。其中ASTRAL評分是利用多因素logistic回歸篩選出年齡、入院NIHSS、發病至入院時間、視野、血糖和意識水平6個預測變量,并對各變量進行分級賦值,應用最廣泛[11-12]。2016年,Cooray等[18]利用ASTRAL量表對36 131例AIS患者進行了90 d預后不良的預測,其外部驗證的AUC為0.790。

隨著大數據時代的到來和算法的更新,海量數據和機器學習算法的發展為腦血管病預測提供了新的技術。不過,在已發表的文獻研究中,無論是評分量表還是機器學習模型,更多的是對AIS患者出院和短期預后的預測,1年以及長期預后研究較少。相較于短期預后預測,AIS患者的長期預后更可能受到各種因素的影響,如長期的服藥依從性、生活習慣、經濟情況、文化程度等。所以本研究在納入變量時,除了基于疾病診療指南、相關預測模型以及公共衛生知識納入的基線信息,還納入了出院帶藥情況、90 d及1年服藥依從情況等。

本研究采用了logistic回歸的方法在訓練集進行特征選擇,最終確定的預測因素包括增齡、女性、卒中前mRS≥3分、入院NIHSS、出院NIHSS、肢體運動功能障礙、周圍血管病史、血糖、調節血脂藥物(出院帶藥)和抗血小板藥(1年服藥依從)。機器學習算法利用logistic回歸方法選擇的預測因子進行建模,在測試集上預測性能表現仍優于傳統logistic回歸模型,說明機器學習算法優于傳統logistic回歸模型。這可能由于機器學習算法不僅有處理海量數據的優勢,更有諸多參數可以進行配置優化,所以相較于傳統logistic模型更有靈活性。

在本研究中,測試集中Catboost模型預測性能最好,其次為XGBoost模型、GBDT模型、隨機森林模型以及logistic回歸模型,整體機器學習模型預測性能優于傳統logistic回歸模型,,同時本研究建立的每個模型的校準度均良好,且機器學習模型校準度Brier分數均低于logistic回歸模型。Catboost模型作為一種新的集成學習算法,具有獨特的對稱數結構,通過計算葉子節點的值來構造決策樹,它嵌入了自動將類別特征處理為數值特征的創新算法。Catboost模型還可以利用特征之間的聯系,采用排序提升的方法對抗訓練集中的噪聲點,從而可以有效避免估計偏差,解決預測偏倚問題。此外,Catboost模型魯棒性更強,減少了對很多超參數的調優要求,并降低了過擬合的機會。

本研究納入樣本量大,涵蓋我國大多數地區,對我國新發AIS人群的代表性較好。本研究除了基線臨床信息外,還納入了實驗室檢測指標、出院帶藥情況、90 d及1年用藥依從性情況,在對新發AIS患者1年功能預后預測時納入的變量維度更廣泛。本研究的局限性:一方面是缺乏影像學指標,可能限制了預測模型的預測效能。另一方面盡管CNSR是全國性的多中心前瞻性隊列,在中國卒中人群中有較好的代表性,但仍需要進一步在獨立的外部人群隊列中進行外部驗證,來檢驗預測模型的魯棒性和可外推性。未來將會進一步探究不同模型對于缺血性卒中的適應條件,在特征選擇、模型建立以及模型驗證方面進行全面研究,以期為后續建立更加完善的AIS患者功能預后預測提供更全面的借鑒。

【點睛】機器學習算法模型因其可以處理海量數據,優化參數的配置,已經成為卒中風險和預后預測研究的新興技術,本研究構建了CatBoost、XGBoost、GBDT和隨機森林模型4種預測AIS患者1年預后的機器模型,并證實其預測效能優于傳統的logistic回歸構建的模型。

猜你喜歡
模型研究
一半模型
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 久久精品国产999大香线焦| 真人高潮娇喘嗯啊在线观看 | 97综合久久| 国产亚洲精品无码专| yy6080理论大片一级久久| 亚洲AV成人一区二区三区AV| 亚洲国产在一区二区三区| 欧美中出一区二区| 在线另类稀缺国产呦| 不卡无码h在线观看| 夜夜拍夜夜爽| 华人在线亚洲欧美精品| 亚洲无码高清一区二区| 天堂在线www网亚洲| 一区二区理伦视频| 国产菊爆视频在线观看| 毛片免费高清免费| 色综合a怡红院怡红院首页| 免费网站成人亚洲| 国产精品成人啪精品视频| 亚洲精品爱草草视频在线| 亚洲性视频网站| 日韩免费毛片| www.日韩三级| 99re视频在线| 在线日韩一区二区| 亚洲欧美激情小说另类| 色婷婷成人| 在线观看视频99| 日本成人精品视频| 中文字幕在线看视频一区二区三区| 99re在线视频观看| 热伊人99re久久精品最新地| 国产日韩欧美在线视频免费观看| 久久不卡国产精品无码| 国产中文一区二区苍井空| 日本不卡视频在线| 日本三级精品| 欧美三级视频在线播放| 免费在线a视频| 国产尤物jk自慰制服喷水| 亚洲 成人国产| 成年人午夜免费视频| 高清久久精品亚洲日韩Av| 成人在线观看一区| 亚洲综合18p| 亚洲天堂2014| 欧美日韩一区二区在线播放| 国产资源站| 婷婷综合在线观看丁香| 国产门事件在线| 少妇精品网站| 综合亚洲网| 91在线国内在线播放老师| 色偷偷综合网| 精品丝袜美腿国产一区| 精品伊人久久久久7777人| 美女亚洲一区| 国产精品香蕉| 日韩AV无码免费一二三区| 亚洲色图欧美一区| 在线五月婷婷| 久久精品这里只有精99品| 成人自拍视频在线观看| 日本午夜精品一本在线观看| 性喷潮久久久久久久久| 亚洲精品无码日韩国产不卡| 美女被躁出白浆视频播放| 国产成人啪视频一区二区三区| 欧美成人aⅴ| 欧美一道本| 激情无码字幕综合| 久久久久国产精品免费免费不卡| 又爽又大又光又色的午夜视频| 欧美国产菊爆免费观看 | 国产午夜精品一区二区三| 精品夜恋影院亚洲欧洲| 久久99国产综合精品女同| a毛片免费观看| 亚洲精品国产乱码不卡| 啊嗯不日本网站| 国产在线观看人成激情视频|