999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

AdaBoost算法識別阿爾茨海默病藥物活性成分

2023-12-29 00:00:00董西尚宋傳東王瑩楊斌
濟南大學學報(自然科學版) 2023年5期

摘要:針對利用網絡藥理學研究中藥藥方治療或預防阿爾茨海默病的機制存在人工篩選藥方中活性成分具有武斷性和不準確性的問題,提出一種基于機器學習的阿爾茨海默病藥物活性成分識別算法。該算法結合疾病相關活性成分和非活性成分,利用AdaBoost算法進行訓練,進而預測新藥方中與疾病相關的活性成分。實驗結果表明,與線性回歸、K鄰近回歸和貝葉斯嶺回歸算法相比,AdaBoost算法可以更加準確地識別阿爾茨海默病相關活性成分。

關鍵詞:阿爾茨海默??;AdaBoost算法;藥物活性成分;機器學習

中圖分類號:TP391

文獻標志碼:A

開放科學識別碼(OSID碼):

Active Ingredients Identification for

Alzheimer’s Disease Drugs Based on AdaBoost Algorithm

DONG Xishang, SONG Chuandong, WANG Ying, YANG Bin

(School of Information Science and Engineering, Zaozhuang University, Zaozhuang 277100, Shandong, China)

Abstract: Aiming at the problems of arbitrariness and inaccuracy of manual screening of active ingredients in traditional Chinese medicine prescriptions for the treatment or prevention of Alzheimer’s disease by using network pharmacology, a machine learn-based algorithm for the recognition of active ingredients related to Alzheimer’s disease was proposed. The algorithm combined disease-associated active and inactive ingredients was trained using AdaBoost algorithm to predict di-sease-associated active ingredients in a new medicine prescription. The experimental results show that AdaBoost algorithm can identify Alzheimer’s disease related active ingredients more accurately compared with linear regression, K nearest neighbor regression and Bayesian ridge regression algorithm.

Keywords: Alzheimer’s disease; AdaBoost algorithm; active ingredient of drug; machine learning

阿爾茨海默?。ˋlzheimer’s disease)是老年人中最常見的神經系統變性疾病,涉及大腦中控制思維、記憶和語言的部分,可導致大腦萎縮和腦細胞死亡[1-3。該疾病通常從60歲以后開始,隨著時間的推移,癥狀可能會變得更加嚴重[4,患者可能不認識家庭成員,在說話、閱讀或寫作方面出現困難,病情嚴重的患者需要全面照顧,給家庭成員帶來巨大的壓力5。由于在阿爾茨海默病診斷和治療過程中存在發病機制不明、早診難、尚無可預防可治愈的藥物等問題,因此阿爾茨海默病診療一直是近幾十年來醫學工作者研究的難點。

阿爾茨海默病是一種多因素的復雜疾病。近年來多種中藥藥方通過多靶點、多途徑等方式,以補益氣血陰陽為主,活血化瘀、化痰開竅為輔,來改善阿

收稿日期:2022-08-25 網絡首發時間:2023-07-24T09∶00∶44

基金項目:國家自然科學基金項目(61702445);山東省自然科學基金項目(ZR2015PF007)

第一作者簡介:董西尚(1980—),男,山東棗莊人。副教授,碩士,研究方向為生物信息分析。E-mail: dxs@uzz.edu.cn。

通信作者簡介:宋傳東(1972—),男,山東棗莊人。教授,碩士,研究方向為大數據分析。E-mail: scd@sohu.com。

王瑩(1982—),女,山東棗莊人。副教授,碩士,研究方向為生物信息。E-mail:zzxywy@uzz.edu.cn。

網絡首發地址:https://kns.cnki.net/kcms2/detail/37.1378.N.20230721.1845.002.html

爾茨海默病癥狀,取得了較好的效果[6-9。梁喜才等10通過分析人參成分與阿爾茨海默病作用靶點發現人參二醇與非受體酪氨酸激酶具有較強的結合性,對阿爾茨海默病細胞具有保護作用。張運輝等[11分析了淫羊藿治療阿爾茨海默病的作用機制,發現淫羊藿治療阿爾茨海默病具有多成分、多靶點、多通路的特點。孫莉敏等12研究發現了黃連解毒湯治療阿爾茨海默病所涉及的藥效成分、作用靶點、通路和相關的靶點蛋白。Xiao等[13利用網絡藥理學和分子對接方法研究了“七福飲”治療阿爾茨海默病的作用機制,發現了阿爾茨海默病相關的511種成分、577個潛在的靶點和通路。

前期大部分研究都是基于網絡藥理學方法展開的,但是在分析過程中需要篩選與阿爾茨海默病相關的活性成分,尤其是當中藥藥劑包含大量中藥材和成分時,人為篩選具有武斷性和不準確性?;谝陨蠁栴},本文中提出一種基于機器學習的阿爾茨海默病相關活性成分識別算法。該算法結合疾病相關活性成分,利用AdaBoost進行訓練,進而預測新藥方中與疾病相關的活性成分,提高了化合物篩選的效率和準確率。

1 AdaBoost算法

1.1 AdaBoost算法

AdaBoost算法是一種動態集成分類算法,它將多個弱分類器(單層決策樹)合理組合成為一個強分類器[14。該算法可以選擇不同的弱分類器進行級聯,比如K近鄰(KNN)、決策樹和樸素貝葉斯分類器等。相比于普通的Bagging算法和隨機森林算法,該算法可以考慮每個弱分類器的權重,最終取得較高的分類精度?;谏鲜鰞烖c,AdaBoost算法已經廣泛應用于人臉檢測[15、生物信息學[16和文字定位17等領域。

AdaBoost算法的框架如圖1所示。具體算法流程如下。

1)初始化每個樣本的權重。假設數據集包含n個樣本點{(x1, y1), (x2, y2),…,(xn, yn)},其中,xi為特征數據,yi為標簽集,i=1,2,…,n,則在開始時為每個訓練樣本點i賦予相同的權重w1i,得到訓練數據的權重分布為

2)訓練弱分類器。根據樣本對弱分類器進行訓練。如果樣本已準確分類,則在構建下一個訓練集時,其權重將減小。相反,如果采樣點未準確分類,則權重增大。同時,根據弱分類器的分類誤差計算權重,然后,使用具有更新權重的樣本集訓練下一個分類器,整個訓練過程迭代進行。經過多次迭代后得到多個弱分類器。具體迭代過程如下。

執行迭代t=1,2,…,T,T為迭代最大次數。

(1)根據權重分布訓練數據集,得到分類器

(2)計算該分類器在訓練集上的誤分率為

式中:wti為第t次迭代對應第i個特征數據的權重:I(·)為分類器Ct(x)在樣本集上錯分的個數。

(3)計算該分類器的權重at,

(4)更新訓練集的權重系數

3)將訓練好的弱分類器組合成強分類器。每個弱分類器通過分類函數連接各自的權重形成強分類器。每個弱分類器經過訓練過程后,分類錯誤率越小的弱分類器權重越大,對最終的分類函數起到的決定作用越大;而分類錯誤率越大的弱分類器權重越小,在最終的分類功能中具有較小的決定性作用。組合G(x)表達式為

對于二分類問題,可以通過符號函數得到分類結果H,

1.2 活性成分識別

將AdaBoost算法用于阿爾茨海默病相關活性成分識別, 識別過程如圖2所示。具體過程分述如下。

1)以阿爾茨海默病作為關鍵字,在文獻數據庫中搜索治療或預防該疾病的藥方和藥物。通過對這些最新文獻的分析,收集地黃飲子、黃連解毒湯、六味地黃湯、知母、人參茯苓藥等重要藥物或藥方,檢索到94個與阿爾茨海默病密切相關的化合物,如黃連堿、小檗堿、黃芩苷、淫羊藿苷、巴馬汀、巴戟甲素、槲皮素、山柰酚等。這些化合物已經通過生物學實驗或分子對接得到驗證。本文中將其作為正樣品。將上述94個與阿爾茨海默病密切相關的化合物輸入到DUD·E網站(https://dude.docking.org),生成非活性化合物。隨機選擇188個非活性化合物作為負樣本。構造的數據集樣本個數為282,正、負樣本比例為1∶2。

2)活性和非活性化合物均具有分子結構。為了更好把樣本化合物輸入到分類器進行學習,本文中利用開源化學信息學與機器學習工具包RDKit提取每個化合物的分子描述符作為化合物的特征,構成阿爾茨海默病相關數據集。每個化合物包含208個特征。將收集的數據集輸入到AdaBoost算法進行學習,預測新的藥方中與阿爾茨海默病相關的活性化合物。

2 實驗

通過實驗驗證AdaBoost算法在阿爾茨海默病相關活性成分識別的性能。采用受試者特征(ROC)曲線、ROC曲線下與坐標軸圍成的面積(AUC)值和精準率與召回率的調和平均數F1值3個指標評價算法性能。ROC曲線是以假陽率為橫軸、真陽率為縱軸單調遞增曲線,越接近左上角,活性成分識別的效果越好。AUC值取值范圍為[0,1],該值越大,識別越準確。F1值平衡精準率和召回率影響,可以較為全面地評價分類效果,取值范圍為[0,1]。為了評價AdaBoost算法的性能,將線性回歸、KNN回歸和貝葉斯嶺回歸算法同樣用于識別阿爾茨海默病藥物活性成分。為了比較不同測試算法的穩定性,分別使用了5種交叉驗證方法(留一法交叉驗證、3折交叉驗證、5折交叉驗證、8折交叉驗證和10折交叉驗證)。

圖3為不同分類算法在阿爾茨海默病的藥物活性成分的識別性能。從4個分類器的ROC曲線可以看出,AdaBoost算法比線性回歸、KNN回歸和貝葉斯嶺回歸算法的識別性能更好,并且AdaBoost算法的AUC值比其他3個分類算法的大,說明該算法在阿爾茨海默病的藥物活性成分識別方面具有較好的穩定性和準確性。

4個分類算法的F1值如圖4所示。從圖中可以看出: 對于不同的交叉驗證方法,AdaBoost算法的F1值相比線性回歸、KNN回歸和貝葉斯嶺回歸算法都有不同程度的提高, 其中提升幅度最大值出現在5折交叉驗證中, AdaBoost算法的F1值較線性回歸算法的提高了51.8%,提升幅度最小值出現在10折交叉驗證中, AdaBoost算法的F1值較KNN回歸算法的提高了6.9%,表明AdaBoost算法可以更加準確地識別阿爾茨海默病藥物的活性成分。

相比于線性回歸、KNN回歸和貝葉斯嶺回歸算法,AdaBoost算法可以更加準確地識別阿爾茨海默病藥物的活性成分的原因在于:1)該算法是一種集成算法,可以根據弱分類器的反饋,自適應地調整假定的錯誤率,具有很高的分類精度;2)該算法不容易發生過擬合;3)數據集正、負樣本比例合適,不會影響算法的分類精度。

3 結語

為了更加準確地識別阿爾茨海默病藥物中相關活性成分,本文中提出一種基于AdaBoost算法的藥物相關活性成分識別算法。通過查閱最新的阿爾茨海默病相關文獻,收集與疾病相關活性成分和非活性成分,提取成分的分子描述符得到訓練集,然后輸入到AdaBoost算法進行訓練,進而預測新藥方中與疾病相關的活性成分。ROC曲線、AUC和F1值都驗證了AdaBoost算法比線性回歸、KNN回歸和貝葉斯嶺回歸算法能更加準確地識別阿爾茨海默病藥物的相關活性成分。

參考文獻:

[1] 趙鵬, 孫亞平, 陳紅. 阿爾茨海默病發病機制探究[J]. 中風與神經疾病雜志, 2016, 33(1): 86.

[2] HARDY J, SELKOE D J. The amyloid hypothesis of Alzheimer’s disease: progress and problems on the road to therapeutics[J]. Science, 2002, 297(5580): 353.

[3] HERSANT H, GROSSBERGR G. The ketogenic diet and Alzheimer’s disease[J]. The Journal of Nutrition, Health and Aging, 2022, 26(6): 606.

[4] 王偉, 蒼玉華, 孟新玲. 不同時期阿爾茨海默病患者臨床癥狀分析與護理對策[J]. 新疆醫學, 2008, 38(1): 12.

[5] 黃小娟. 阿爾茨海默病患者精神行為癥狀和睡眠結構[J]. 世界最新醫學信息文摘, 2020(86): 110.

[6] 宋克立, 張瓊瓊, 王曉晗,等. 基于數據挖掘研究現代中醫治療阿爾茨海默病用藥規律[J]. 世界科學技術:中醫藥現代化, 2019, 21(7): 1424.

[7] 聶志玲, 董夢久, 張騰. 阿爾茨海默病的病機及治療[J]. 長春中醫藥大學學報, 2011, 27(1): 57.

[8] 郭靜, 李斌, 謝沛俊,等. 基于泛素-蛋白酶體途徑探討遠志散“益氣化痰開竅”治療阿爾茨海默病的科學內涵[J]. 世界科學技術:中醫藥現代化, 2021, 23(7): 2334.

[9] LIN H Q, HO M T, LAU" L S, et al. Anti-acetylcholinesterase activities of traditional Chinese medicine for treating Alzheimer’s disease[J]. Chemico-Biological Interactions, 2008, 175(1/2/3): 352.

[10] 梁喜才, 姚瓔珈, 王玉瑩, 等. 基于網絡藥理學的人參二醇對阿爾茨海默病細胞保護作用的研究[J]. 中國藥理學通報, 2018, 34(9):1275.

[11] 張運輝, 周小青, 伍大華, 等. 基于網絡藥理學的淫羊藿治療阿爾茨海默病作用機制研究[J]. 中國現代應用藥學, 2021, 38(16):1945.

[12] 孫莉敏, 劉麗芳, 朱華旭, 等. 基于網絡藥理學的黃連解毒湯治療阿爾茲海默癥的作用機制研究[J]. 藥學學報, 2017, 52(8):1268.

[13] XIAO Q Y, YE T Y, WANG X L, et al. A network pharmacology-based study on key pharmacological pathways and targets of Qi Fu Yin acting on Alzheimer’s disease[J]. Experimental Gerontology, 2021, 149(18): 111336.

[14] 曹瑩, 苗啟廣, 劉家辰, 等. AdaBoost算法研究進展與展望[J]. 自動化學報, 2013, 39(6): 745.

[15] 鄭峰, 楊新. 基于Adaboost算法的人臉檢測[J]. 計算機仿真, 2005, 22(9): 167.

[16] 蔡津津, 趙杰煜, 賀思敏. 基于AdaBoost方法的蛋白質磷酸化修飾規則抽取[J]. 計算機工程與設計, 2007, 28(11): 2623.

[17] 李闖, 丁曉青, 吳佑壽. 一種基于直方圖特征和AdaBoost的圖像中的文字定位算法[J]. 中國圖象圖形學報, 2006, 11(3): 325.

(責任編輯:劉 飚)

主站蜘蛛池模板: 国产福利2021最新在线观看| 欧美在线视频不卡| 欧美一区二区三区欧美日韩亚洲| 欧美综合成人| 国产裸舞福利在线视频合集| 国产成人精品在线| 色婷婷成人| 久久中文电影| 亚洲 欧美 日韩综合一区| 欧洲日本亚洲中文字幕| 岛国精品一区免费视频在线观看 | 91口爆吞精国产对白第三集| 亚洲欧美色中文字幕| 久久这里只有精品23| 亚洲中文字幕av无码区| 国产精品毛片一区视频播| 亚洲人成人伊人成综合网无码| 伊伊人成亚洲综合人网7777| 超薄丝袜足j国产在线视频| a欧美在线| www.亚洲一区| 国产性生交xxxxx免费| 欧美日韩免费| 国产三级成人| 国产97视频在线观看| 91久久国产综合精品| 久久a级片| 国内精品久久人妻无码大片高| 亚洲三级网站| …亚洲 欧洲 另类 春色| 久久婷婷人人澡人人爱91| 亚洲国产综合第一精品小说| 亚洲无码一区在线观看| 日本不卡在线播放| 91高清在线视频| 青青草91视频| 国产成人精品男人的天堂下载 | 日韩av资源在线| 国产在线精品美女观看| 乱人伦视频中文字幕在线| 成人亚洲国产| 亚洲视频二| 日本午夜在线视频| 国产日韩丝袜一二三区| 国内精自线i品一区202| 四虎永久免费网站| 久久青草免费91线频观看不卡| 亚洲Av激情网五月天| 高清免费毛片| 国产69囗曝护士吞精在线视频| 欧美午夜网| 亚洲欧美不卡| 四虎亚洲精品| 免费观看成人久久网免费观看| 色综合热无码热国产| 久久99精品久久久大学生| 国产拍在线| 欧美午夜小视频| 久久香蕉国产线看观看式| 国产麻豆福利av在线播放| 欧美综合区自拍亚洲综合绿色 | 亚洲成A人V欧美综合| 亚洲制服丝袜第一页| 国产黄色爱视频| 午夜视频www| 国产av一码二码三码无码 | 色综合激情网| 国产日韩精品欧美一区灰| 午夜老司机永久免费看片| 欧美日韩第二页| 国产经典在线观看一区| 999国内精品久久免费视频| 国产午夜看片| 国产成人AV综合久久| 国产日韩欧美精品区性色| 欧美 国产 人人视频| 毛片a级毛片免费观看免下载| 新SSS无码手机在线观看| 国产日韩AV高潮在线| 一级毛片中文字幕| 欧美啪啪一区| 女同国产精品一区二区|