999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的中風中醫辨證模型的構建與應用

2023-05-30 01:54:15孫資金吉靜馬重陽張風君趙宏躍王雪茜王慶國程發峰
湖南中醫藥大學學報 2023年4期
關鍵詞:機器學習大數據人工智能

孫資金 吉靜 馬重陽 張風君 趙宏躍 王雪茜 王慶國 程發峰

〔摘要〕 目的 建立基于人工智能的中風中醫辨證模型,為中風中醫智能辨證模型的構建與應用提供方法和依據。方法 檢索中國期刊全文數據庫,收集關于中風的中醫病案五種證型各60例,建立中風病案中醫信息數據庫,采用經過超參數調優的支持向量機(support vector machine, SVM)、K-近鄰(K-nearest neighbor, KNN)、隨機森林(random forest, RF)、極端隨機樹(extremely randomized trees, ExtraTrees)、XGBoost及LightGBM對數據進行機器學習建模。全部數據的70%作為訓練集,30%作為測試集,采用五折交叉驗證對模型進行評價,以Accuracy作為模型優劣的評價指標,比較模型的準確性。結果 中風中醫四診信息為輸入變量共55項,中風中醫證型為輸出變量共5項。6種模型的擬合效果較好,Accuracy值均在0.85以上;其中SVM模型的準確率最高,可達0.95。結論 基于SVM算法模型建立的中風中醫辨證模型具有較好的診斷、預測能力,機器學習技術應用于中風中醫辨證模型的構建具有方法學上的可行性。

〔關鍵詞〕 人工智能;機器學習;中風;中醫辨證模型;中醫藥現代化;證候;大數據

〔中圖分類號〕R241;TP18 ? ? ? 〔文獻標志碼〕A ? ? ? ?〔文章編號〕doi:10.3969/j.issn.1674-070X.2023.04.019

Construction and application of stroke TCM pattern differentiation model

based on machine learning

SUN Zijin1, JI Jing1, MA Chongyang2, ZHANG Fengjun3, ZHAO Hongyue4, WANG Xuexi1, WANG Qingguo1, CHENG Fafeng1

1. School of Chinese Medicine, Beijing University of Chinese Medicine, Beijing 100029, China; 2. School of Chinese Medicine, Capital Medical University, Beijing 100069, China; 3. School of Acupuncture-Moxibustion and Tuina, Shandong University of Chinese Medicine, Jinan, Shandong 250355, China; 4. The First Hospital of Harbin Medical University, Harbin, Heilongjiang 150007, China

〔Abstract〕 Objective To establish a TCM pattern differentiation model of stroke based on artificial intelligence, and to provide methods and basis for the construction and application of TCM intelligent pattern differentiation model of stroke. Methods Chinese Journal Full-text Database (CJFD) was searched for the five pattern types of TCM medical records regarding stroke, with 60 cases in each type. Then a TCM information database of stroke medical records was established. Support vector machine (SVM), K-nearest neighbor (KNN), random forest (RF), extreme random trees (Extra Trees), XGBoost, and LightGBM after hyper-parameter optimization were used to construct machine learning models, and 70% of the total data was used as the training set and 30% as the test set. Meanwhile, five-fold cross-validation was used to evaluate each model, and Accuracy was the evaluation index to compare the models accuracy. Results There were 55 input variables (information of stroke obtained by four diagnostic methods of TCM), and 5 output variables (TCM patterns of stroke). The fitting effect of the six models was good, and the accuracy values were all above 0.85; among which, the accuracy of SVM model was the highest, up to 0.95. Conclusion The TCM pattern differentiation model of stroke based on the SVM algorithm can diagnose and predict well, therefore, it is methodologically feasible to apply machine learning technology for constructing TCM pattern differentiation model of stroke.

〔Keywords〕 artificial intelligence; machine learning; stroke; TCM pattern differentiation model; TCM modernization; pattern; big data

中風是我國常見疾病之一,其出現多伴隨高血壓、糖尿病等多種基礎疾病,并存在著高發病率、高致殘率、高死亡率、高復發率、高經濟負擔等特點[1]。中醫藥在治療中風方面具有悠久的歷史,其病機于《黃帝內經》中即有相關記載,而方藥則在東漢張仲景《傷寒雜病論》中即有論述。辨證論治是中醫的特色和優勢所在,其精髓之“辨”是后續臨床中醫選方用藥的基礎所在。但中醫辨證多受個人主觀因素影響,不確定性、不穩定性較強,常出現千人千方、辨證各不相同的情況。人工智能(artificial intelligence, AI)的興起,為中醫學的發展提供了新的思路。AI技術不但可以在海量的數據中找到癥狀、體征與證候的相關性,并能通過知識的學習與樣本數據量的擴大,發現其辨證施方的內部規律,從而深度挖掘其內部關系,促進中醫現代化發展。此外,機器學習算法的應用,使得智能化、客觀化辨證成為可能[2]。基于機器學習的AI將中醫四診信息定量化、客觀化,可提高辨證的準確性和客觀性[3]。本研究基于文獻資料,采用支持向量機(support vector machine, SVM)、K-近鄰(K-nearest neighbor, KNN)、隨機森林(random forest, RF)、極端隨機樹(extremely randomizedtrees, ExtraTrees)、XGBoost、LightGBM分別構建中風的中醫AI辨證模型,為中風的中醫證候客觀化研究提供一定依據。

1 資料與方法

1.1 ?資料來源

檢索2000年1月至2022年4月在中國知網(China national knowledge infrastructure, CNKI)中公開發表的有關中風的中醫病案。檢索詞為“中風+經驗”“中風+驗案”“中風+醫案”“卒中+經驗”“卒中+驗案”“卒中+醫案”,將檢索詞以主題方式進行檢索。

1.2 ?診斷標準

參照《中醫內科學》(中國中醫藥出版社,第十版,十三五規劃教材)關于中風的診斷與辨證標準的相關內容,確定中風5個常見證型,即風痰阻絡證、氣虛血瘀證、陰虛風動證、痰熱腑實證、風陽上擾證,以及各證型的診斷標準。

1.3 ?納入標準

(1)符合中風診斷標準的文獻;(2)文獻中病案資料完整,包含臨床表現、辨證診斷、治療原則、治療手段等;(3)文獻發表年限為2000年1月至2022年4月;(4)對于重復發表的文獻,納入較先發表的文獻;(5)治療手段為中醫治療或中西醫結合治療;(6)文獻類型為學術期刊。

1.4 ?排除標準

(1)文獻中未標明治療效果或治療效果不佳;(2)報道信息太少而無法使用的文獻;(3)動物實驗或綜述類型的文獻;(4)會議論文/報刊報道/學位論文等;(5)呃逆、不寧腿綜合征、卒中后抑郁等不是以中風作為主證的病例;(6)治療手段與中醫無關;(7)文獻記載為純理論論述。

1.5 ?分析指標

將癥狀、體征等中醫四診信息條目作為AI學習特征,證型作為分類標簽。四診信息條目共55項,包括神志昏蒙、精神萎靡、肢體不遂、肢體麻木、肢體困重、肢體強直、口干口渴、耳鳴耳聾、視物干澀模糊、腰膝酸軟、心悸、氣短乏力、納差食少、口苦、舌紅、舌瘀點、舌淡嫩、舌裂紋、舌齒痕、舌暗、舌黯淡、舌下絡脈瘀滯、苔少苔剝、苔白、苔黃、苔膩、苔厚、脈沉、脈細、脈弱、脈緩、脈弦、脈澀、脈滑、脈大、脈數、汗出、大便溏、大便不行、大便干、小便黃、肢體抽搐、面赤、氣粗氣喘、喉中痰鳴、身熱、口舌歪斜、急躁易怒、頭沉、頭痛、痰多、嗜睡、眩暈、不寐少寐、煩躁不安。證型共5項,包括風痰阻絡證、氣虛血瘀證、陰虛風動證、痰熱腑實證、風陽上擾證。

1.6 ?數據處理及數據庫建立

由兩名研究人員完成文獻篩選,并將病例整理錄入Microsoft Excel 2019,建立中風病案中醫信息數據庫。對證候名稱進行規范化處理,剔除出現次數較少的癥狀及體征(如脈結代、舌糙等),各證候要素進行語言規范化處理,根據信息的有或無將病案中出現的癥狀或體征分別賦值1或0。賦值后的數據庫作為數據源導入Python 3.10.5,利用Pandas、Numpy等函數集合中的相關數據處理函數進行數據處理,包括檢查與去除空值、進行定義值賦值、隨機打亂病案順序,對證型診斷進行獨立編碼等。為保證模型運算不出現偏倚,對每種證型病案保留60例進行模型構建與評估。

1.7 ?指標篩選

為增加模型實用性,提高計算效率,去除不相關噪聲。使用Spearman相關分析與Lasso回歸篩選,篩選去除類似或在判斷證型過程中相對不重要的指標,相關系數閾值設定為0.9,經分析與篩選后保留得出的特征被應用于模型訓練與評定。

1.8 ?模型超參數設定

基于python3.10.5,使用scikit-learn庫進行機器學習模型構建,確保模型具有保證客觀性及可重復性。本研究對所有模型調參后,對其超參數固定。針對機器學習模型(SVM、KNN、RF、ExtraTrees、XGBoost、LightGBM),其訓練集與驗證集比例設置為7∶3,選擇Accuracy為主要評價指標,設定隨機種子,采用五折交叉進行交叉驗證,其交叉驗證測試集比例劃分為30%。

1.9 ?模型評價

本研究采用五折交叉驗證,對模型進行進一步訓練,選取Accuracy作為主要評價指標。

2 結果

2.1 ?文獻整理結果

根據“1.1”“1.2”“1.3”“1.4”項下的資料獲取規則,從“中風+經驗”檢索獲得877篇文獻,“中風+驗案”檢索獲得230篇文獻,“中風+醫案”檢索獲得388篇文獻,“卒中+經驗”檢索獲得284篇文獻,“卒中+驗案”檢索獲得49篇文獻,“卒中+醫案”檢索獲得62篇文獻。通過剔除重復文獻,閱讀文獻題目、摘要,并進一步通讀全文后篩選符合納入標準的文獻,共333篇。最終每類證型病案保留60例用于計算。

2.2 ?指標篩選結果

經過Spearman相關分析與Lasso回歸篩選后,得到以下指標:神志昏蒙,精神萎靡,肢體麻木,肢體困重,肢體強直,耳鳴耳聾,心悸,氣短乏力,納差食少,舌紅,舌瘀點,舌裂紋,舌齒痕,舌黯淡,舌下絡脈瘀滯,苔白,苔黃,脈沉,脈細,脈弱,脈緩,脈弦,脈滑,脈大,大便溏,大便不行,小便黃,肢體抽搐,面赤,氣粗氣喘,急躁易怒,痰多,嗜睡,眩暈,不寐少寐,煩躁不安。這些指標將用于接下來的模型訓練,具體相關分析與Lasso回歸結果見圖1—3。

2.3 ?模型超參數設定結果

SVM選取其中的支持向量機分類模型(support vector classification, SVC),其中probability=True;KNN中algorithm='kd_tree';RF中,n_estimators=10;ExtraTrees中,n_estimators=10;XGBoost中base_score=None,booster=None,colsample_bylevel=None,colsample_bynode=None,colsample_bytree=None,enable_categorical=False,eval_metric='error',gamma=None,importance_type=None,interaction_constraints=None,learning_rate=None,max_delta_step=None,max_depth=None,min_child_weight=None,missing=nan,monotone_constraints=None,n_estimators=10,n_jobs=None,num_parallel_tree=None,predictor=None,random_state=None,reg_alpha=None,reg_lambda=None,scale_pos_

weight=None,subsample=None,tree_method=None,use_label_encoder=False,validate_parameters=None,verbosity=None;LightGBM中,n_estimators=10,objective='binary'。

2.4 ?模型評價結果

在驗證集中得到模型驗證結果如圖4所示,其中,SVM準確率為0.95,KNN準確率為0.9,RF準確率為0.91,ExtraTrees準確率為0.93,XGBoost準確率為0.91,LightGBMin準確率為0.85。SVM模型相較其他模型而言,其準確率明顯更高。

3 討論

目前,AI已廣泛應用于醫療領域的多個方面,促進了醫學大數據時代的進一步變革[4]。在醫學領域中,AI已為影像診斷、患者預后預測與指導臨床用藥提供了強有力的幫助[5-6]。

將傳統的中醫辨證與AI相結合構建智能辨證模型,盡可能減少人為的主觀干預,可輔助臨床診斷,是實現中醫辨證診斷客觀化、規范化與現代化發展的要求[7]。如應用視覺注意機制的計算機視覺技術可為中醫舌診提供標準化和可重復化;基于中西醫結合的機器學習技術可為卒中后抑郁的發病提供預測等[8-10]。中醫辨證智能化的發展需要合理的算法模型,RF、SVM、KNN、ExtraTrees、XGBoost、LightGBM模型是目前主流應用的算法模型。

其中,支持向量機是建立在統計學習理論基礎上,借助最優化方法來解決機器學習問題的新工具。它將機器學習問題轉化為求解最優化問題,并應用最優化理論來構造算法。其通過尋求最小結構化風險來提高機器學習的能力,多適用于小樣本模型的訓練適用[11]。而SVC則是支持向量機中用于分類模型的優化算法,包含C-SVC與V-SVC兩種不同的參數模型設置[12]。KNN算法與支持向量機算法在一定程度上存在相似性,其亦是利用訓練數據對于特征向量之間表達出的不同關系來進行劃分,并將劃分結果作為分類模型。但因其空間復雜度高、特征維度大,故可解釋性較差,且存在對于樣本數量過少的類別預測準確率低等缺點[13]。RF是建立于決策樹算法基礎之上發展而來的算法,可用于機器學習的分類計算,常適用于監督學習,其利用多棵決策樹對模型進行綜合訓練[14]。其具有對離群值不敏感,不易對數據產生過度擬合的優點,但卻具有其算法傾向于觀測值較多的類別的缺點[15]。ExtraTrees算法與RF算法十分相似,都是由許多“樹”構成,但該算法與RF的主要區別如下:(1)ExtraTrees是使用所有的訓練樣本得到每棵決策樹的,也就是說,每棵決策樹應用的是相同的全部訓練樣本;(2)RF是在一個隨機子集內得到的最佳分叉屬性,而ET是完全隨機地得到分叉值,從而實現對決策樹的分叉。XGBoost與LightGBM均屬于boosting算法系列。其中,XGBoost顯式地將樹模型的復雜度作為正則項加在優化目標,并允許使用列抽樣來防止過擬合,借鑒了Random Forest的思想,同時對樹的葉子數和葉子分數做懲罰,以確保了樹的簡單性,實現了算力的節省[16]。與XGBoost相同,作為梯度提升決策樹(gradient boosting decision tree, GBDT)的一員,LightGBM同樣具有可解釋性高、準確、可進行多類分類運算等優點,但其相較于XGBoost而言,其所具有的基于梯度的單邊采樣與互斥特征捆綁,使其具有更高的運算速度與更小的內存消耗,從而能夠在相同的時間內對更大的樣本量與特征進行運算[17]。

本文中所使用的模型準確率較高,但因文獻資料與臨床實際可能仍存在一定程度的偏差,且可能存在過擬合的情況,故后續仍需結合臨床實際病例,對該模型進行調優。

綜上所述,基于AI建立中風辨證模型具有一定的可行性。但基于AI的中風中醫辨證模型尚需跨學科合作,以期在算法與臨床方面得到多方位的兼顧,并在未來樣本量提升與臨床病例的驗證后,可對其進行進一步的完善與優化,有利于提高中醫辨證診斷的科學性,促進中醫研究的現代化發展。

參考文獻

[1] 肖 ?爽,朱以誠.腦卒中的性別差異:流行病學、危險因素、治療及預后[J].中國神經免疫學和神經病學雜志,2020,27(1):57-60.

[2] 李本岳,李偉榮,潘華峰,等.人工智能對中醫診斷的影響[J].世界科學技術-中醫藥現代化,2020,22(5):1624-1628.

[3] 舒琛潔,梁 ?浩,劉淑明,等.機器學習算法對證候要素“氣虛”輔助診斷的性能評估[J].北京中醫藥大學學報,2021,44(10):928-934.

[4] 陳 ?梅,呂曉娟,張 ?麟,等.人工智能助力醫療的機遇與挑戰[J].中國數字醫學,2018,13(1):16-18.

[5] FARWELL M D, MANKOFF D A. Analysis of routine computed tomographic scans with radiomics and machine learning: One step closer to clinical practice[J]. JAMA Oncology, 2022, 8(3): 393-394.

[6] 王敬瀚.ROC曲線在臨床醫學診斷實驗中的應用[J].中華高血壓雜志,2008,16(2):175-177.

[7] 黃欣榮,鐘平玉,馬 ?綱.人工智能與中醫智能化[J].中醫雜志,2017,58(24):2076-2079,2106.

[8] 許家佗,周昌樂,方肇勤,等.舌像顏色特征的計算機分析與識別研究[J].上海中醫藥大學學報,2004,18(3):43-47.

[9] 劉 ?哲,陳家旭,趙宇明,等.基于視覺注意和支持向量機的舌體自動分割方法的探討[J].北京中醫藥大學學報,2013,36(1):18-20.

[10] 羅曉舟,溫小鵬,何家揚,等.基于機器學習的卒中后抑郁影響因素分析[J].中醫雜志,2017,58(17):1478-1481.

[11] CRISTIANINTNELLO. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods[M]. Cambridge: Cambridge University Press, 2000: 93-124.

[12] 湯華麗. SVM中兩類常用分類方法的關系研究[D].重慶:重慶大學,2005.

[13] ZHANG S C, LI X L, ZONG M, et al. Efficient kNN classification with different numbers of nearest neighbors[J]. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(5): 1774-1785.

[14] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.

[15] 李欣海.隨機森林模型在分類與回歸分析中的應用[J].應用昆蟲學報,2013,50(4):1190-1197.

[16] 連克強.基于Boosting的集成樹算法研究與分析[D].北京:中國地質大學,2018.

[17] KE G L, MENG Q, FINLEY T, et al. LightGBM: A highly efficient gradient boosting decision tree[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. New York: ACM, 2017: 3149-3157.

〔收稿日期〕2022-09-13

〔基金項目〕國家自然科學基金項目(U21A20400);燕京劉氏傷寒流派傳承工作室項目(1190062620029)。

〔第一作者〕孫資金,男,碩士研究生,研究方向:人工智能與大數據、生物信息學挖掘、經典方劑的應用基礎研究、經方治療常見病疑難病。

〔通信作者〕*程發峰,男,博士,研究員,博士研究生導師,E-mail:fafengcheng@gmail.com。

猜你喜歡
機器學習大數據人工智能
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
主站蜘蛛池模板: 欧美成人精品高清在线下载| 中文字幕乱码中文乱码51精品| 操美女免费网站| 在线观看热码亚洲av每日更新| 久久福利网| 亚洲av无码成人专区| 国产成人亚洲无吗淙合青草| 国产第一色| 国产日韩精品一区在线不卡| 欧美日本不卡| 成人福利一区二区视频在线| 国产婬乱a一级毛片多女| 激情综合网址| 国产婬乱a一级毛片多女| 免费女人18毛片a级毛片视频| 91国内外精品自在线播放| 精品亚洲麻豆1区2区3区| 国产美女无遮挡免费视频| 日韩成人高清无码| 国产成人AV综合久久| 在线高清亚洲精品二区| 四虎精品国产永久在线观看| 免费在线视频a| 欧美一级在线| 国产另类视频| 亚洲Aⅴ无码专区在线观看q| 狼友av永久网站免费观看| 色呦呦手机在线精品| 成人午夜免费观看| 亚洲一区二区三区香蕉| 亚洲男人在线天堂| 中文国产成人精品久久一| 国产精品露脸视频| 在线观看国产网址你懂的| 99re热精品视频国产免费| 无码丝袜人妻| 日韩欧美国产精品| 中文字幕在线日本| 精品成人一区二区| 国产精品美女网站| 亚洲第一色网站| 午夜精品影院| 亚洲AV无码久久天堂| 亚洲综合18p| 日本高清有码人妻| 国产精品30p| 国产精品yjizz视频网一二区| 日本欧美一二三区色视频| 一区二区三区精品视频在线观看| 亚洲欧美天堂网| 国产欧美日韩91| 久久综合亚洲鲁鲁九月天| 婷婷丁香色| 国产免费黄| 综合网久久| 欧美视频在线第一页| v天堂中文在线| 亚洲色偷偷偷鲁综合| 亚洲精品无码成人片在线观看| 五月婷婷丁香综合| 国产亚洲欧美日韩在线一区二区三区| 青草国产在线视频| 丁香亚洲综合五月天婷婷| 日本www在线视频| 综合色88| 2020精品极品国产色在线观看 | 在线a网站| 免费激情网站| 国产成人精品高清不卡在线| 99视频国产精品| 国产免费羞羞视频| 亚洲国产系列| 乱码国产乱码精品精在线播放| 亚洲清纯自偷自拍另类专区| 久久国产高清视频| 国产午夜福利片在线观看| 亚洲AV无码久久精品色欲| 日本成人不卡视频| 中文字幕在线看| 女人18毛片久久| 69综合网| 欧美一级片在线|