999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于自然語言處理的多模態(tài)糖尿病預測模型

2023-08-03 09:18:16高豪俊蔣思清
當代醫(yī)藥論叢 2023年14期
關(guān)鍵詞:文本糖尿病模型

高豪俊,蔣思清,吳 健*

(1.浙江大學醫(yī)學院,浙江 杭州 310058 ;2.浙江大學睿醫(yī)人工智能研究中心,浙江 杭州 310000)

糖尿病已成為當今時代最嚴重和最常見的慢性病之一。2021 年全球糖尿病患者數(shù)量超過5 億人,估計患病率超過10%,預計到2045 年患者數(shù)將超過7億[1]。隨著病情的發(fā)展,糖尿病將引起諸多并發(fā)癥,影響患者的生存質(zhì)量,縮短其預期壽命,給其家庭和社會帶來巨大的經(jīng)濟負擔[2-3]。由于此病早期通常沒有癥狀,患者往往不能及時發(fā)現(xiàn)自身的疾病[4]。而通過相關(guān)早期篩查、及時干預可有效預防或延緩其并發(fā)癥的出現(xiàn)[5-6]。因此,需要開發(fā)一種簡單有效的篩查方法。目前已經(jīng)有許多研究采用機器學習算法來預測糖尿病,如隨機森林、支持向量機、決策樹等,并且展現(xiàn)出了優(yōu)秀的區(qū)分能力[7-10]。但這些研究對于飲酒、運動量、家族史等危險因素均是以分類變量的形式作為模型進行輸入。而此類信息在現(xiàn)實電子病歷系統(tǒng)中通常是以自由文本的形式保存,且由于內(nèi)容復雜,難以直接轉(zhuǎn)換為分類變量。通過模型直接利用這些文本信息更符合現(xiàn)實場景的需求。深度學習作為機器學習的一個分支,近年來飛速發(fā)展,在文本、圖像、語音等非結(jié)構(gòu)化數(shù)據(jù)的處理上有著出色的表現(xiàn)[11-12]。Transformer 是目前自然語言處理領(lǐng)域的主流架構(gòu)[13]。本文利用體檢數(shù)據(jù)中的結(jié)構(gòu)化和非結(jié)構(gòu)化文本數(shù)據(jù)在Transformer 架構(gòu)的基礎(chǔ)上構(gòu)建多模態(tài)糖尿病預測模型,并與其他僅能使用結(jié)構(gòu)化數(shù)據(jù)的模型進行對比。現(xiàn)報道如下。

1 數(shù)據(jù)來源

數(shù)據(jù)來源為杭州市每天健康體檢與健康管理服務(wù)平臺的多家醫(yī)院健康體檢數(shù)據(jù)。這項研究獲得了浙江大學公共衛(wèi)生學院醫(yī)學倫理委員會的倫理審批(倫理審查編號ZGL202107-4)。所有患者信息均已完成去標識化處理。我們納入2011 年至2020 年有進行過葡萄糖耐量試驗的體檢記錄,排除了病史中帶糖尿病描述的記錄,最終納入6 家醫(yī)院的共17 976 份體檢記錄。我們選擇其中一家醫(yī)院構(gòu)成數(shù)據(jù)集Ⅱ,作為外部驗證集,剩余5 家醫(yī)院共同構(gòu)成數(shù)據(jù)集Ⅰ,用作模型的訓練和內(nèi)部驗證。

我們依據(jù)糖尿病診斷標準將數(shù)據(jù)分為兩類(0 為未患病,1 為患病),診斷依據(jù)包括:空腹血糖≥7.0 mmol/L、葡萄糖耐量試驗中餐后2 小時血糖≥11.1 mmol/L 或糖化血紅蛋白≥6.5%。

我們采用空腹血糖和既往糖尿病預測模型常用的危險因素來搭建模型,包括性別、年齡、體重指數(shù)、甘油三酯、收縮壓、舒張壓、腰圍、體重、家族史、病史、煙酒史。其中家族史、病史和煙酒史為文本數(shù)據(jù)。

2 方法

我們參照FT-Transformer 的方法對數(shù)值型和分類型變量進行嵌入處理[14],轉(zhuǎn)換為d 維向量表示。對于文本變量,我們采用中文預訓練的BERT 模型進行語義提取[15],再通過一層全連接層轉(zhuǎn)變?yōu)閐 維向量,同嵌入處理后的其他變量拼接后輸入Transformer 模型進行分類預測。Transformer 模型采用2 層編碼器結(jié)構(gòu)。得益于Transformer 在多個領(lǐng)域的通用性,該模型可擴展其他類型的數(shù)據(jù),我們將其命名為可拓展的糖尿病預測模型(extensible diabetes prediction model, EDPM)。

本文采用既往研究中表現(xiàn)較好的MLP、邏輯回歸、隨機森林、支持向量機和XGBoost 進行對比[16-17]。所有模型均在數(shù)據(jù)集Ⅰ上進行10 折交叉驗證,并在數(shù)據(jù)集Ⅱ上進行外部驗證。由于類別存在明顯的不平衡,我們采用準確率、F1 分數(shù)、受試者工作特征曲線下面積(AUC)來評估模型性能。

3 結(jié)果

各模型在內(nèi)外部驗證集上的表現(xiàn)如表1 所示。只采用結(jié)構(gòu)化數(shù)據(jù)的情況下,傳統(tǒng)機器學習模型的表現(xiàn)最優(yōu),多數(shù)AUC 均達到0.94。引入本文數(shù)據(jù)后,EDPM 的表現(xiàn)相較無文本有了明顯提升,在外部驗證集上的AUC(0.93)超過了其他所有模型,但在內(nèi)部驗證集上的表現(xiàn)僅與最佳的機器學習模型相當(AUC=0.94)。

表1 各模型在驗證集上的表現(xiàn)

4 討論

實驗結(jié)果表明,在只采用結(jié)構(gòu)化數(shù)據(jù)的情況下,傳統(tǒng)機器學習算法依舊是當下最優(yōu)的選擇。深度學習算法在結(jié)構(gòu)化數(shù)據(jù)上的表現(xiàn)要略差于傳統(tǒng)機器學習模型。可能是由于表格數(shù)據(jù)的內(nèi)容已經(jīng)是經(jīng)過人為篩選得出的,等同于已經(jīng)經(jīng)過了一次特征工程,所以不像圖像和文本數(shù)據(jù)那樣擁有豐富的特征供模型學習,而且實驗特征數(shù)量較少,使得深度學習無法發(fā)揮其在高維復雜數(shù)據(jù)上的強大學習能力。

加入文本后,EDPM 的AUC 有了明顯的提升。可見EDPM 是能夠從文本數(shù)據(jù)中學習到與糖尿病相關(guān)的信息的。飲酒、體力活動少、紅肉攝入量高等作為糖尿病的重要風險因素[18],由于種類復雜,難以形成較為簡單統(tǒng)一的記錄方式。自由文本可攜帶的信息更豐富,對于醫(yī)護人員臨床工作的開展也更友好,是當下對此類信息最好的記錄方式。EDPM 可以在不改變臨床醫(yī)護人員工作習慣的條件下,提高對糖尿病患者預測的準確性。EDPM 還具有傳統(tǒng)機器學習所不具備的拓展能力,只要在模型輸入端加上特征提取模塊,就可以實現(xiàn)不同類型數(shù)據(jù)的多模態(tài)融合。此外,臨床上還有許多文本類型的數(shù)據(jù),如主訴、檢查報告等。這些都有望成為輔助決策的參考因素,進一步提高預測的準確性。

當然,我們的研究也有一定的局限性。由于進行葡萄糖耐量試驗的人群大部分是糖尿病高風險人群,導致我們的數(shù)據(jù)中糖尿病患者比例要遠高于正常人群,分布情況和實際篩查情況相差較大,可能對模型的表現(xiàn)造成一定的影響。盡管深度學習模型可以產(chǎn)生準確的預測,但其可解釋性差,常被視為黑盒模型。臨床醫(yī)生通常會因為推理過程不明確而不愿意接受機器建議[19]。這是未來深度學習需要改善的一個痛點。

猜你喜歡
文本糖尿病模型
一半模型
糖尿病知識問答
中老年保健(2022年5期)2022-08-24 02:35:42
糖尿病知識問答
中老年保健(2022年1期)2022-08-17 06:14:56
糖尿病知識問答
中老年保健(2021年5期)2021-08-24 07:07:20
糖尿病知識問答
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
3D打印中的模型分割與打包
主站蜘蛛池模板: 永久免费av网站可以直接看的| 麻豆精品在线| 亚洲高清中文字幕在线看不卡| 男人天堂亚洲天堂| 国产18在线| 日韩精品高清自在线| 国产黄色视频综合| 国产在线观看成人91| 日韩欧美中文| 国产97区一区二区三区无码| 22sihu国产精品视频影视资讯| 欧美国产综合视频| 国产精品 欧美激情 在线播放| 伊人久热这里只有精品视频99| 四虎精品免费久久| 亚洲va精品中文字幕| 色国产视频| 成人一区专区在线观看| 国产91精品久久| 动漫精品啪啪一区二区三区| 五月天婷婷网亚洲综合在线| 伊人狠狠丁香婷婷综合色| 国产精品综合久久久| 91www在线观看| 六月婷婷激情综合| 在线观看免费人成视频色快速| 欧美精品啪啪| 无码人中文字幕| 国产精品女人呻吟在线观看| 国产精品网拍在线| 国产精品女熟高潮视频| 国产专区综合另类日韩一区 | 亚洲国产91人成在线| 精品国产毛片| 成人免费黄色小视频| 亚洲综合经典在线一区二区| 正在播放久久| 538精品在线观看| 亚洲成年网站在线观看| 99热这里只有精品免费国产| 韩日午夜在线资源一区二区| 亚洲中文字幕97久久精品少妇| 国产chinese男男gay视频网| 亚洲狼网站狼狼鲁亚洲下载| 无码福利日韩神码福利片| 美女高潮全身流白浆福利区| 无码啪啪精品天堂浪潮av| 国产黄色爱视频| 一级做a爰片久久免费| 亚洲视频欧美不卡| 色综合天天综合中文网| 一级毛片无毒不卡直接观看| 日韩av无码精品专区| 免费无码AV片在线观看国产 | 日韩精品欧美国产在线| 亚洲欧美日韩另类| 久久久久久久97| 9久久伊人精品综合| 人妻丰满熟妇αv无码| 国产91麻豆视频| 少妇精品网站| 欧美日韩一区二区三区在线视频| 在线观看无码a∨| 污视频日本| 国产免费久久精品99re丫丫一| 亚洲AV电影不卡在线观看| 亚洲一区无码在线| 欧美精品v欧洲精品| 性色在线视频精品| 亚洲娇小与黑人巨大交| 制服丝袜在线视频香蕉| 久久久久人妻一区精品色奶水| 亚洲毛片网站| 中文字幕在线欧美| 精品人妻无码中字系列| 免费观看国产小粉嫩喷水| 中文字幕波多野不卡一区| 国产午夜福利亚洲第一| 亚洲一区二区成人| 国产精品综合色区在线观看| 精品久久久无码专区中文字幕| 久久久久88色偷偷|