999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XGBoost和SHAP的中藥寒熱藥性識別及寒熱特征標記可視化研究*

2022-03-28 02:31:46張喜科趙文華付先軍馬志慶魏國輝
關鍵詞:可視化中藥特征

張喜科 ,趙文華 ,付先軍 ,馬志慶 **,魏國輝 ,**

(1.山東中醫(yī)藥大學智能與信息工程學院 濟南 250355;2.山東中醫(yī)藥大學中醫(yī)藥經(jīng)典理論教育部重點實驗室 濟南 250355)

中藥藥性理論是傳統(tǒng)中醫(yī)藥的重要組成部分,中藥寒、熱、溫、涼四性理論又是中藥藥性理論的核心內(nèi)容之一。四性反映了中藥對人體寒熱變化的作用傾向,其中寒與涼、溫與熱只是程度上的差異并沒有本質(zhì)上的區(qū)別。從本質(zhì)屬性講,四性可以歸結為寒熱兩性[1-2]。臨床治療中,寒熱辨證是中醫(yī)辨別疾病病因病性最基本的綱領[3]。因此,正確識別中藥寒熱藥性對中醫(yī)辨證施治、組方遣藥具有重要意義。

相關研究表明:決定中藥寒熱藥性的主要依據(jù)是藥效,而藥效的基礎是其所含物質(zhì)成分[4-12]。因此,中藥的物質(zhì)成分是產(chǎn)生寒熱藥性的基礎。從中藥的物質(zhì)成分角度研究中藥寒熱藥性識別主要包含兩方面的內(nèi)容:一是如何表征中藥的物質(zhì)成分;二是如何判別中藥的寒熱藥性。近年來,中藥寒熱藥性成為研究熱點[13]。研究者采用中藥物象[14]、中藥無機物質(zhì)含量[15]、代謝組學[16]、三維熒光光譜[17]、中藥化學指紋圖譜[18-19]和中藥化合物分子描述符[20-22]等方式表征中藥的物質(zhì)成分,之后通過構建人工智能模型識別中藥的寒熱藥性。薛付忠團隊選用中藥物象屬性表征中藥成分,使用人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)、主成分-線性判別分析和偏最小二乘模型識別中藥寒熱藥性[23-25]。王振國團隊通過構建支持向量機(Support Vector Machine,SVM)模型研究發(fā)現(xiàn)中藥寒熱藥性與無機物質(zhì)的種類和含量具有相關性[15]。聶斌等[16]采用中藥代謝組學數(shù)據(jù)表征中藥特征,構建隨機森林模型識別寒熱中藥。Long等[20]、Fu等[21]和 Wei等[22]應用分子描述符表征中藥的化合物成分并構建SVM、K近鄰(k-Nearest Neighbor,KNN)和極限學習機模型識別中藥的寒熱藥性。

筆者所在課題組研究發(fā)現(xiàn)中藥化學指紋圖譜可以用于識別中藥寒熱藥性,使用中藥紫外光譜數(shù)據(jù)結合距離度量算法對中藥寒熱藥性識別進行了嘗試[18-19],但識別效果一般。在此基礎上,本研究采用4種溶劑(無水乙醇、蒸餾水、氯仿、石油醚)提取中藥成分的紫外光譜數(shù)據(jù)。單溶劑不能提取中藥的全部物質(zhì)成分,通過多溶劑提取中藥的物質(zhì)成分更有利于對中藥寒熱藥性進行全面分析。但中藥紫外光譜數(shù)據(jù)大多具有樣本量偏小、特征偏多等特點,若繼續(xù)使用已有研究采用的經(jīng)典分類器,則識別效果不好。經(jīng)過大量實驗發(fā)現(xiàn),集成學習算法可以很好地適應中藥紫外光譜數(shù)據(jù)的特點,已有研究將集成學習算法應用于基于氣味指紋圖譜的中藥鑒定,取得了不錯的效果[26]。本研究將新的集成學習算法引入基于中藥紫外光譜數(shù)據(jù)的寒熱藥性識別,通過設計大量驗證實驗,從多個方面證實了集成學習算法應用于中藥寒熱藥性識別的可行性。同時,本研究將一種全新的可視化方式引入中藥寒熱藥性研究,通過中藥寒熱特征標記可視化的方式探索了中藥寒熱特征標記與寒熱藥性識別結果的關系。

1 資料與方法

1.1 極端梯度提升(eXtreme Gradient Boosting,XGBoost)算法

與經(jīng)典分類算法的目標函數(shù)只使用損失函數(shù)不同,XGBoost[27]算法的目標函數(shù)由損失函數(shù)和模型復雜度兩部分組成。中藥紫外光譜數(shù)據(jù)大多具有樣本量偏小等特點,大部分經(jīng)典分類模型應用于中藥紫外光譜數(shù)據(jù)時會處于過擬合狀態(tài)。模型復雜程度越高,對于訓練集的識別效果越好(偏差小),但對于測試集的識別效果較差(方差大),模型的泛化能力較弱。XGBoost模型的目標函數(shù)如下所示,其中,第一部分用于衡量偏差的大小,偏差越大模型的識別效果越差;第二部分用于衡量方差的大小,模型的復雜程度越高,對于訓練集的擬合越好但在測試集上的表現(xiàn)差異大。因此,為了達到模型的整體最優(yōu),需要綜合考慮偏差和方差的影響。XGBoost算法在目標函數(shù)上的改變使其生成的模型不易發(fā)生過擬合,具有更強的泛化能力,可以更好地適應中藥紫外光譜數(shù)據(jù)的特點。

1.2 SHAP(SHapley Additive exPlanations)算法

SHAP[28-31]是一種模型事后解釋的算法,可以對復雜的機器學習模型的識別結果進行解釋。本研究以61味中藥的紫外光譜數(shù)據(jù)集作為模型的輸入,模型的輸出為中藥的寒熱藥性。基于XGBoost算法構建的中藥寒熱藥性識別模型在識別準確率方面表現(xiàn)良好,但準確率的提升帶來了可解釋性的下降。由于基于XGBoost算法構建的中藥寒熱藥性識別模型幾乎是一個黑箱模型,導致我們對模型的具體構建過程并不了解,使用傳統(tǒng)的feature importance僅能反映各寒熱特征標記的重要程度,但無法了解各寒熱特征標記與寒熱藥性識別結果的具體聯(lián)系。SHAP值的優(yōu)勢在于,其不僅可以反映各寒熱特征標記對寒熱藥性識別結果的影響程度,而且可以準確指明影響程度的正負性。SHAP值通過量化每個特征標記對模型識別結果所做的貢獻來對模型的識別結果進行解釋。若xi表示第i個樣本,xij表示第i個樣本的第j個特征,yi表示模型對該樣本的識別值,ybase表示模型的基線(通常為所有樣本目標變量的均值),則SHAP值服從以下等式:

其中,f(xij)為xij的SHAP值,f(xik)為第i個樣本的第k個特征標記對最終識別結果yi的貢獻值,f(xik)>0時,表明該特征標記提升了識別值,對識別結果起正向作用;反之,則降低了識別值,對識別結果起反向作用。

1.3 數(shù)據(jù)來源

本研究選用藥性明確且具有代表性的61味中藥(30味寒性藥,31味熱性藥,如表1所示)。研究分別測量了在不同溶劑(無水乙醇、蒸餾水、氯仿、石油醚)中61味中藥對紫外波長400-190 nm的吸收度。圖1、2分別為寒性中藥薄荷和熱性中藥干姜的紫外吸收度曲線,兩曲線對比結果顯示,寒熱中藥的紫外吸收度曲線在吸收峰的形狀、所在位置及強度上存在一定差異。

表1 研究選用的61味中藥

圖1 薄荷(石油醚溶劑)不同紫外波長吸收度曲線

圖2 干姜(石油醚溶劑)不同紫外波長吸收度曲線

表2 不同溶劑下模型識別的ACC和AUC

1.4 模型設計

本研究的XGBoost模型基于Python語言構建,寒熱特征標記可視化基于SHAP實現(xiàn)。

1.5 模型評價

采用準確率(Accuracy,ACC)和受試者工作特征曲線下方的面積大小(Area Under Curve,AUC)兩種評價指標衡量單溶劑下模型的性能;采用ACC評價指標衡量多溶劑下模型的性能。ACC和AUC值越大,模型性能越好。

圖3 不同溶劑下模型識別的ROC曲線

為了證明本文模型在寒熱藥性識別任務上的優(yōu)勢,設計對比實驗比較本文模型與已有研究采用的ANN[23]、SVM[15,20]和KNN[21]模型在上述兩種評價指標上的差異。

1.5.1 穩(wěn)定性評價

本研究采用留一法對模型的穩(wěn)定性進行評估。留一法使用的訓練集與原始數(shù)據(jù)集相比只減少了一個樣本,這使得留一法中被實際評估的模型與使用原始數(shù)據(jù)集訓練出的模型基本相似,評估結果比較準確。就本研究使用的61味中藥紫外光譜數(shù)據(jù)而言,不同溶劑(無水乙醇、蒸餾水、氯仿、石油醚、多溶劑)下實驗分別重復進行61次,每次留出1味中藥樣本作為測試集,剩余60味中藥樣本作為訓練集。

1.5.2 外推評價

在模型的外推性能評估中,本研究隨機將原始數(shù)據(jù)集中各約20味寒熱中藥樣本作為訓練集,剩余中藥樣本作為測試集。為了消除分組的偶然性對實驗結果可能造成的偏差,實驗重復進行10次計算平均值和方差。

2 結果

2.1 穩(wěn)定性比較

不同溶劑(無水乙醇、蒸餾水、氯仿、石油醚)下模型識別的ACC和AUC如表2所示,ROC曲線如圖3所示。實驗結果表明,石油醚溶劑下的紫外光譜數(shù)據(jù)最適合用于寒熱藥性識別,氯仿、蒸餾水溶劑下的紫外光譜數(shù)據(jù)在寒熱藥性識別上的表現(xiàn)次之,無水乙醇溶劑下的紫外光譜數(shù)據(jù)在寒熱藥性識別上的表現(xiàn)較差,在后續(xù)多溶劑實驗中,可以考慮只融合石油醚、氯仿和蒸餾水3種溶劑下的紫外光譜數(shù)據(jù)。

表3 單溶劑多模型穩(wěn)定性比較結果

表4 多溶劑多模型穩(wěn)定性比較結果

表5 單溶劑多模型外推比較結果

表6 多溶劑多模型外推比較結果

表7 寒熱藥性總體識別的精確率、召回率和F1值

表8 寒熱藥性總體識別的混淆矩陣

鑒于石油醚溶劑下的紫外光譜數(shù)據(jù)在寒熱藥性識別上的表現(xiàn)最好,無水乙醇溶劑下的紫外光譜數(shù)據(jù)在寒熱藥性識別上的表現(xiàn)較差。因此,在設計對比實驗比較4種模型的性能時,單溶劑選取石油醚溶劑下的紫外光譜數(shù)據(jù)作為原始數(shù)據(jù),多溶劑融合石油醚、氯仿和蒸餾水3種溶劑下的紫外光譜數(shù)據(jù)作為原始數(shù)據(jù)。本文模型在單溶劑和多溶劑下與ANN、SVM和KNN模型的穩(wěn)定性表現(xiàn)分別如表3、4所示,實驗結果顯示,本文模型的穩(wěn)定性優(yōu)于參與比較的3種模型。

2.2 外推比較

單溶劑和多溶劑下本文模型與ANN、SVM和KNN模型的外推性能表現(xiàn)分別如表5、6所示,實驗結果顯示,本文模型在外推表現(xiàn)上優(yōu)于參與比較的3種模型。

綜合表3-6的實驗結果可以得出結論:與已有研究采用的經(jīng)典機器學習模型相比,本文模型在單溶劑和多溶劑下均具有更好的穩(wěn)定性和外推性能,更加適應中藥寒熱藥性識別任務的需要。

2.3 寒熱藥性總體識別

本研究使用留一法評估模型的總體識別性能,寒熱藥性總體識別ACC為85.2%(52/61),寒熱藥性總體識別的精確率、召回率和F1值(F1值可以看作是精確率和召回率的調(diào)和平均數(shù),是一種同時兼顧精確率和召回率的度量方式)如表7所示。表8為寒熱藥性總體識別的混淆矩陣,9味中藥藥性被誤判,側柏、柴胡、金銀花、毛知母、梔子5味寒性中藥被識別為熱性中藥,白芥子、半夏、附子、天南星4味熱性中藥被識別為寒性中藥。通過繪制上述9味藥性被誤判的中藥的紫外吸收度曲線(見圖4),并與兩種典型的寒熱中藥薄荷、干姜的紫外吸收度曲線進行對比,結果顯示,藥性被誤判的9味中藥的紫外吸收度曲線與其相異藥性的中藥的紫外吸收度曲線在吸收峰的形狀、所在位置或強度上存在相似性,這是導致其藥性被誤判的主要原因。

2.4 寒熱特征標記可視化

圖5為61味中藥寒熱特征標記重要性排行。實驗結果顯示,61味中藥在石油醚溶劑下對紫外波長400、301、299、256、267、373、265、226、368和251 nm的吸收度對于其寒熱藥性識別發(fā)揮重要作用。從整體角度來看,紫外波長400 nm的吸收度對于61味中藥寒熱藥性識別最重要。

圖4 藥性被誤判的中藥(石油醚溶劑)不同紫外波長吸收度曲線

本研究以寒性中藥薄荷、車前子,熱性中藥白胡椒、蓽茇4種中藥寒熱特征標記可視化的方式進一步分析中藥寒熱特征標記與寒熱藥性識別結果的關系。寒熱特征標記貢獻度為負,則該特征標記對于該味中藥為寒性特征標記;貢獻度為正,則該特征標記為熱性特征標記。貢獻度的絕對值大小表示該特征標記對于寒熱藥性識別結果的影響程度大小,本研究將貢獻度的絕對值大于0.5的特征標記視為重要特征標記。圖6-7分別為寒性中藥薄荷和車前子的寒熱特征標記貢獻度可視化效果圖。圖8-9分別為熱性中藥白胡椒和蓽茇的寒熱特征標記貢獻度可視化效果圖。實驗結果顯示,寒性中藥在紫外波長400和267 nm的吸收度具有相似性,而熱性中藥在紫外波長400、299和301 nm的吸收度具有相似性。

本研究通過單味中藥寒熱特征標記可視化的方式,分析了寒熱中藥在不同紫外波長吸收度上的差異。可視化的結果表明,有相似的紫外光譜的中藥具有相似的藥性。基于筆者所在課題組已有研究得出的結論:中藥的化學指紋圖譜可以有效表征中藥的物質(zhì)成分。本研究從中藥寒熱特征標記可視化的角度初步證明了:物質(zhì)成分相似的中藥具有相似的藥性。

3 討論

圖5 寒熱特征標記重要性排行

圖6 薄荷寒熱特征標記貢獻度

圖7 車前子寒熱特征標記貢獻度

圖8 白胡椒寒熱特征標記貢獻度

理論上講,決定中藥寒熱藥性的主要依據(jù)是藥效,而藥效的基礎是其所含物質(zhì)成分,寒性中藥能夠調(diào)理熱證,熱性中藥能夠調(diào)理寒證,應具有相應的物質(zhì)基礎[5]。在前期研究中,筆者所在課題組發(fā)現(xiàn)中藥的化學指紋圖譜可以用來識別中藥的寒熱藥性。課題組使用距離度量算法對中藥寒熱藥性識別進行了嘗試。由于中藥紫外光譜數(shù)據(jù)大多具有樣本量偏小、特征偏多等特點,導致經(jīng)典分類器的識別效果一般。因此,本研究引入新的集成學習算法對中藥紫外光譜數(shù)據(jù)進行寒熱藥性識別。穩(wěn)定性評價中,提出的模型在單溶劑下的ACC和AUC分別為0.852、0.865;多溶劑下的ACC為0.770。外推評價中,提出的模型在單溶劑下的ACC和AUC分別為0.810、0.828;多溶劑下的ACC為0.786。經(jīng)過實驗驗證,提出的模型在單溶劑和多溶劑下均具有更好的穩(wěn)定性和外推性能。實驗結果表明,新的集成學習算法能夠更好地適應中藥紫外光譜數(shù)據(jù)的特點,與經(jīng)典分類器相比,寒熱藥性識別效果更好。從寒熱藥性識別的角度,本研究初步證明了中藥的紫外光譜與中藥的寒熱藥性存在相關性,即有相似的紫外光譜的中藥具有相似的藥性。初步證明了物質(zhì)成分相似的中藥其藥性是相似的。

圖9 蓽茇寒熱特征標記貢獻度

中藥的寒熱藥性,寒性和熱性是一個相對的概念。每一味中藥都可以看作是一劑復方,無論是寒性中藥還是熱性中藥,其內(nèi)都同時含有寒性和熱性物質(zhì),只是寒熱物質(zhì)的種類和數(shù)量的不同配伍才使中藥表現(xiàn)為寒性和熱性。當寒性物質(zhì)在種類和數(shù)量上占主導地位時,該味中藥表現(xiàn)為寒性;而當熱性物質(zhì)占主導地位時,該味中藥表現(xiàn)為熱性。本研究將一種全新的可視化方式引入中藥寒熱藥性研究,首先對中藥寒熱特征標記的feature importance進行可視化,從而在整體層面上對決定中藥寒熱藥性的重要特征標記進行初步的認識。然后以寒性中藥薄荷、車前子,熱性中藥白胡椒、蓽茇4種中藥為例,對單味中藥寒熱特征標記進行可視化表達,直觀地展示了各寒熱特征標記對最終寒熱藥性識別結果的貢獻度。可視化結果表明,寒性中藥在紫外波長400和267 nm的吸收度具有相似性,而熱性中藥在紫外波長400、299和301 nm的吸收度具有相似性。從中藥寒熱特征標記可視化的角度,本研究進一步證明了相同藥性的中藥的紫外光譜具有相似性。進一步證明了如果中藥的物質(zhì)成分是相似的,那么藥性是相似的。

4 結論

在本研究中,我們建立了一個基于集成學習的中藥寒熱藥性識別方案。該方案通過多溶劑下的中藥紫外光譜數(shù)據(jù)表征中藥的物質(zhì)成分,采用集成學習模型對中藥紫外光譜數(shù)據(jù)進行寒熱藥性識別。穩(wěn)定性和外推實驗結果表明,本文模型能夠更好地適應中藥紫外光譜數(shù)據(jù)的特點,穩(wěn)定性和外推性能均顯著優(yōu)于經(jīng)典模型,在寒熱藥性識別上具有更高的識別準確率。本研究還通過中藥寒熱特征標記可視化的方式進一步分析中藥寒熱特征標記與寒熱藥性識別結果的關系。可視化的結果表明,相同藥性的中藥的紫外光譜具有相似性。中藥寒熱藥性識別和寒熱特征標記可視化的結果初步證明,物質(zhì)成分相似的中藥具有相似的藥性。

猜你喜歡
可視化中藥特征
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
中藥久煎不能代替二次煎煮
中老年保健(2021年4期)2021-12-01 11:19:40
您知道嗎,沉香也是一味中藥
中老年保健(2021年4期)2021-08-22 07:08:32
中醫(yī),不僅僅有中藥
金橋(2020年7期)2020-08-13 03:07:00
基于CGAL和OpenGL的海底地形三維可視化
如何表達“特征”
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
中藥貼敷治療足跟痛
主站蜘蛛池模板: 久久亚洲AⅤ无码精品午夜麻豆| 国产99视频精品免费视频7| 欧美在线天堂| 欧美成人区| 国产一级做美女做受视频| 亚洲三级电影在线播放| 国产啪在线| 亚洲精品色AV无码看| 波多野结衣国产精品| 91久久国产综合精品女同我| 69av在线| 91在线高清视频| 免费啪啪网址| 欧美日韩中文国产va另类| 2022精品国偷自产免费观看| 日韩无码黄色| 日本国产精品| 欧美h在线观看| 白浆视频在线观看| 蜜臀AV在线播放| 国产乱人乱偷精品视频a人人澡| 日韩欧美国产区| 国产日韩AV高潮在线| 51国产偷自视频区视频手机观看| 欧美不卡二区| 久久无码免费束人妻| 久久6免费视频| 欧美日韩亚洲综合在线观看| A级毛片无码久久精品免费| 国产午夜一级毛片| 亚洲第一区精品日韩在线播放| 欧洲亚洲一区| 日日拍夜夜嗷嗷叫国产| 四虎成人精品| 72种姿势欧美久久久久大黄蕉| 一区二区在线视频免费观看| 亚洲熟女中文字幕男人总站| 亚洲精品另类| 国产美女主播一级成人毛片| 色吊丝av中文字幕| 成人国产小视频| 亚洲欧洲日韩国产综合在线二区| 日本五区在线不卡精品| 一区二区影院| 久久综合一个色综合网| 国产精品美女网站| 亚洲欧美自拍视频| 国产91透明丝袜美腿在线| 国产欧美在线观看精品一区污| 直接黄91麻豆网站| 国产一在线观看| 午夜精品久久久久久久无码软件 | av无码一区二区三区在线| 亚洲国产成人自拍| 成人无码区免费视频网站蜜臀| 久草网视频在线| 青青草原国产| 一级成人欧美一区在线观看 | 97国产精品视频自在拍| 久久网欧美| 亚洲中文无码h在线观看| 一本大道香蕉中文日本不卡高清二区| 福利一区在线| 色AV色 综合网站| 久久超级碰| 波多野结衣一区二区三区四区| 九色91在线视频| 无码专区国产精品一区| 亚洲第一区欧美国产综合| AV不卡在线永久免费观看| 国产一区二区三区免费| 无码中文字幕乱码免费2| 亚洲最大福利网站| 精品久久久久久中文字幕女| 久久国产热| 91成人精品视频| 凹凸国产分类在线观看| 亚洲国产一区在线观看| 中文字幕在线免费看| 亚洲欧美激情小说另类| 久久精品嫩草研究院| 色婷婷狠狠干|