999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

化合物ADMET性質預測平臺的構建

2017-11-01 12:33:17周雪松
生物信息學 2017年3期
關鍵詞:性質方法模型

李 曉,李 達,周雪松,趙 勇*

(1. 北京市科學技術研究院 北京市計算中心,北京 100094;2. 北京北科德源生物醫藥科技有限公司,北京 100094)

化合物ADMET性質預測平臺的構建

李 曉1,2,李 達2,周雪松2,趙 勇1,2*

(1. 北京市科學技術研究院 北京市計算中心,北京 100094;2. 北京北科德源生物醫藥科技有限公司,北京 100094)

在藥物研發早期階段對化合物成藥性和安全性進行評估,對于提高藥物研發成功率、降低研發成本具有十分重要的意義。為了能夠幫助藥物研究工作者快速準確地判斷候選化合物的成藥性與安全性,開發了一個基于計算機方法的化合物ADMET性質預測平臺。首先,通過文本挖掘的方法收集了化合物藥代動力學性質和毒性(ADMET)的高質量實驗數據。然后,根據原始文獻復原了13個預測模型,同時采用支持向量機方法自建了15個具有較高預測能力的計算模型。最后,基于分布式架構,結合高性能計算集群優勢,開發了化合物ADMET性質預測平臺(http://www.vslead.com/?r=admet/index),用于預測28種重要的化合物ADMET性質。研究者可以使用這一平臺快捷方便地對藥物研究中比較重要的ADMET性質進行預測,在藥物研發早期對候選化合物進行成藥性評價和風險評估,有助于提高藥物研的成功率,節省研發時間和經費的投入。

藥物研發;ADMET性質;機器學習

創新藥物研發是一個耗資巨大、周期漫長、風險極高的產業。據統計,平均每10 000個新化學實體(NCEs)中只有1個最終可能成為藥物,并且整個過程要花費10~12年時間和12~20億美元的投入[1]。導致藥物在臨床前和臨床研究階段研發失敗的原因是多方面的,主要包括藥效不明顯、毒性及副作用等安全性問題、藥代動力學性質不理想以及商業因素等。藥代動力學性質是指化合物在體內的行為,包括吸收(adsorption)、分布(distribution)和清除(excretion)過程,簡稱ADME,與毒性(toxicity)合稱ADMET性質。ADMET性質是衡量化合物成藥性最重要的參考指標[2-3]。上世紀90年代之前,導致藥物研發失敗的主要因素中,ADME性質不理想所占的比例達到39%,隨著人們加大了對藥代動力學研究的重視和投入,這一比例逐漸下降到了10%以下。毒性和副作用等安全性因素所占的比例則從21%上升到接近30%,成為藥效因素之外,導致藥物研發失敗的最主要原因[4]。遵循“Fail early, fail cheaply”(失敗越早,損失越小)的原則,很多藥物化學家提出在藥物開發的早期,甚至在先導化合物發現階段就應該進行化合物的ADMET性質評價,選擇ADMET性質理想的化合物進行實驗篩選,可從一定程度上緩解實驗篩選的經濟壓力;同時,將本來是在藥物研發過程后期才考慮的毒性和代謝問題,提前到先導化合物發現的前期階段來完成,可以有效提高候選藥物后期開發的成功率。

面對目前組合化學蛋白質組學和計算機藥物篩選的快速發展,常規的生物試驗方法(包括體外試驗和體內試驗)顯得比較昂貴和滯后[5-6]。如何快速、廉價地在藥物研發早期進行化合物ADMET性質預測成為各大制藥公司和研究機構十分關心和需要迫切解決的問題。近年來,利用計算方法預測藥物的ADMET性質引起了國內外科學家的廣泛關注,這一方法的基本思想是根據已知分子的ADMET性質數據,通過機器學習和模式識別方法建立計算預測模型,從而預測未知分子的ADMET性質。與實驗方法相比,使用計算機方法對化合物進行ADMET性質預測具有明顯的優勢[7-9].首先,計算機方法可以快速地對大批量化合物進行處理和預測,而且花費極低;其次,只要化合物結構已知,即使化合物尚未合成出來,也可以通過計算機模型預測該化合物的ADMET性質。

本文針對人體小腸吸收、血腦屏障透過、人體表觀分布體積、清除率、致癌性、急性毒性、發育毒性、肝毒性、生殖毒性等28個ADMET相關的性質,使用機器學習方法分別建立預測模型,構建了一個覆蓋重要的吸收、分布、代謝、排泄及毒性性質評價的化合物ADMET性質預測平臺,供國內外研究者使用。

1 材料與方法

1.1 數據收集與整理

高質量的實驗數據,是保證ADMET預測模型構建成功的關鍵。本文采用文本挖掘和手工核對方法從文獻報道和專業數據庫中收集整理已有的化合物ADMET性質實驗數據。通過文獻交叉參照等方式對收集到的數據進行匯總和去冗余、除錯等處理。經過整理,得到超過11萬條化合物ADMET相關的試驗數據。保存的數據包括化合物分子的名稱、ADMET相關的性質、實驗測試方法和材料、分子結構信息、數據來源(原始文獻來源)等。這里收錄了28種ADMET相關的性質端點(endpoint),包括人體小腸吸收[10]、P-糖蛋白抑制劑和底物[11-12]、血腦屏障通透性[10,13]、人體表觀分布體積[14]、血漿蛋白結合率[15]、CYP450底物和抑制劑(CYP1A1、1A2、2C9、2C19、2D6和3A4)[16-18]、腎清除率[14]、大鼠口服毒性[19-20]、AMES致突變毒性[21]、慢性毒性[22]、發育毒性[23]、肝毒性[24-26]、眼毒性[27]、生殖毒性[23]、hERG通道抑制性[28- 29]、致癌性[30]、鳥毒性[31]、魚毒性[32]和昆蟲毒性[33]等。

1.2 模型構建

在化合物ADMET性質預測模型構建過程中,需要選擇適當的分子結構表征方式和建模方法。分子結構的表征通常采用分子描述符和分子指紋方式[34-35]。分子描述符是對分子物理化學性質的數學度量,如分子量、脂水分配系數、原子數目等。分子指紋則是根據分子片段描述分子,其實現方法主要是對分子結構進行切分,獲得一個個的片段作為分子結構的表征。收集到的針對不同ADMET性質端點建立預測模型的文獻中,大部分都明確給出了建模所用的分子描述符和分子指紋類型。

目前化合物ADMET預測研究中,機器學習是占據主導地位的建模方法。機器學習方法從觀測數據(樣本)出發尋找規律,利用這些規律對未來數據或無法預測的數據進行預測。其中諸如支持向量機(support vector machine, SVM)[36]、決策樹(decision tree, DT)[37]、樸素貝葉斯(Na?ve Bayes, NB)[38]、k-最近鄰算法(k-Nearest Neighborhoods, kNN)[39]、人工神經網絡(artificial neuron network, ANN)[40]等算法大量成功的應用實例證明了這些機器學習算法的有效性和實用性。在本文中,將支持向量機算法作為首選的建模方法。支持向量機是Vapnik等[41]1995年提出的一種機器學習方法,它在解決小樣本、非線性以及高維模式識別問題中表現出許多特有的優勢,能夠推廣應用到函數擬合等其他機器學習問題中。對于非線性問題的處理,SVM也可以通過松弛變量(slack variables)和核函數(Kernel Functions)實現。因此,SVM已經成為目前應用最廣泛的QSAR建模方法之一。不同的核函數都有各自的關鍵參數,如RBF核函數的懲罰因子C和核參數γ等。本文使用臺灣大學林智仁教授[42]開發的libsvm工具箱進行模型的復原與構建。

本文把收集到的針對不同ADMET性質端點建立預測模型的文獻分為3類:使用支持向量機算法并提供關鍵參數的、使用支持向量機算法但未提供關鍵參數的以及未使用支持向量機算法建模的。對于第1類,本文直接按照文獻中提供的參數復原模型;對于第2類,本文通過郵件向文獻原作者請求提供主要參數,然后實現模型復原;對于第3類以及無法獲取原作者使用的分子描述符的文獻,本文使用文獻中的化合物ADMET性質數據,通過支持向量機算法結合分子指紋方式與分子描述符方式,構建模型并進行驗證。

這里以hERG通道抑制性為例,介紹使用libsvm進行參數選擇與模型訓練的過程。

經過文獻調研,本文選擇文獻[29]中的數據做為訓練集,用于模型構建;使用文獻[28]中的數據作為驗證集進行模型驗證。這里將hERG抑制活性IC50≥10 μM的化合物歸類為hERG抑制劑,IC50<1 μM的化合物歸類為非抑制劑。所有數據經過去重復、去除混合物、去除無機物等預處理,最終訓練集剩余962個抑制劑和966個非抑制劑,測試集剩余抑制劑與非抑制劑數量分別為235個和363個。

本文采用一種常見的分子指紋MACCS keys(MACCS)表征分子結構。MACCS分子指紋包含了166個結構片段,這種分子指紋可以使用PaDEL-Descriptor軟件計算得到[43]。模型的構建采用的是libsvm工具箱,核函數采用RBF核函數。如上所述,使用RBF核函數需要確定兩個關鍵參數懲罰因子C和核參數γ。通過libsvm自帶的網格搜索算法結合五折交叉驗證方法對這兩個關鍵參數進行了優化,得到最優參數組合為(3.030 0,0. 018 8)。使用這一參數組合訓練得到的模型,對訓練集進行五折交叉驗證,得到整體預測準確率為85.94%,敏感率與特異性分別為85.14%、86.75%。使用驗證集進行驗證,得到的整體預測準確率、敏感率與特異性分別為82.61%、80.85%、83.75%,表現出很好的預測能力。

2 結果與討論

2.1 ADMET性質預測模型

本文復原或者構建了25個分類模型(其中11個根據原始文獻提供的參數復原的模型和14個自建模型)和3個回歸模型(其中2個根據原始文獻提供的參數復原的模型和1個自建模型),用于預測化合物的28種ADMET相關的性質。經過外部數據集的驗證,分類模型的整體預測準確率都在75%以上,其中大部分(19個)模型的整體預測準確率超過了80%;3個回歸模型中,兩個模型的決定系數R2超過了0.7(見表1)。根據原始文獻復原的模型,預測能力已經得到了認可,本文自建的模型也都表現出了較高的預測能力,這樣就可以保證化合物ADMET性質預測結果的準確性。

2.2 ADMET性質預測平臺

基于分布式虛擬篩選架構,結合高性能計算集群優勢,本文搭建了化合物ADMET性質預測平臺(http://www.vslead.com/?r=admet/index),為研究者提供在線的化合物ADMET性質預測服務。平臺界面簡潔友好,操作簡單方便。圖1(a)展示了平臺的任務提交界面。

用戶進行化合物ADMET性質預測的主要步驟包括:1)輸入任務名稱,用戶可任意擬定一個名稱作為本次ADMET預測的任務名稱;2)輸入任務描述,簡要描述項目研究內容,幫助用戶備注篩選任務細節;3)上傳小分子文件或者輸入SMILES分子式,平臺目前支持3種小分子格式文件,即mol2、sdf和smi,也支持SMILES分子式輸入,用戶可以自由選擇上傳小分子文件或者輸入SMILES分子式的方式提交化合物結構;4)任務提交,用戶完成上述步驟后,可以點擊下方的“提交訂單”按鈕,提交本次化合物ADMET性質預測任務。點擊頁面中的問號圖標可以顯示每一步驟的說明。用戶提交任務并完成支付后,就可以在“查看任務”板塊中看到自己提交的任務(如圖1(b)所示),點擊任務名稱可以顯示任務詳情,點擊“操作”欄下的“查看分析結果”按鈕,可以查看本次提交的小分子化合物ADMET性質預測結果(如圖1(c)所示)。在平臺使用過程中,用戶也可以通過點擊左側的“平臺簡介”和“幫助文檔”查看關于平臺的基本情況介紹和使用方法。

本文搭建的化合物ADMET性質預測平臺整合了28個模型,涵蓋了目前比較重要的吸收、分布、代謝、排泄及毒性性質。研究者可以快捷方便地同時預測28種ADMET性質,在藥物研發早期對候選化合物進行成藥性評價和風險評估,有助于降低藥物研發的失敗率,節省研發時間和經費的投入。平臺中各個模型,在構建過程中都采用了較全面的目前已知的ADMET性質實驗數據,涵蓋了較大的化學空間,在最大程度上保證了模型的應用域;平臺中部分模型直接采用高質量文獻中的建模數據和參數,自建模型也采用了目前最先進的建模方法,可以保證各模型具有很好的預測能力。

圖1 ADMET性質預測平臺頁面截圖Fig.1 A screenshot of the platform for estimation of chemical ADMET properties

注:(a)平臺任務提交界面;(b)平臺任務查看界面;(c)化合物ADMET性質預測結果展示頁面。

為了更方便為用戶提供服務,平臺目前只對注冊用戶開放使用。平臺的支付系統是為將來對商業用戶開放使用進行準備。當前狀態下,使用本平臺,支付頁面實際需要付款金額為0元,因而是供用戶免費使用的。

使用平臺預測化合物ADMET性質具有一些限制條件:首先,用于ADMET性質預測模型構建的化合物都是小分子化合物,因此平臺只適用于小分子化合物的ADMET性質預測,不支持大分子化合物;其次,用戶提交的小分子必須是單一的有機化合物,平臺不支持無機物、混合物、水合物、有機鹽等化合物的ADMET性質預測;第三,大多數模型構建過程中,只考慮了化合物的二維結構特征,因此對于二維結構相同但三維構象不同的化合物,平臺的預測結果沒有區分。

另外需要說明的是,鑒于目前機器學習算法與可用數據的局限性以及化合物ADMET性質的復雜性,這里的化合物ADMET性質預測平臺與其他計算機輔助系統一樣,預測結果可以提供有效的輔助與參考作用,但并不能完全替代生物實驗結果。對于化合物的ADMET性質,還是需要用戶結合平臺預測結果與人工專家經驗進行綜合判斷,以助于提高判斷的準確率。

3 結 論

1)本文借助文本挖掘、機器學習等技術,構建了28種重要的ADMET性質預測模型,經過檢驗,模型都表現出了較高的預測能力,這樣就可以保證化合物ADMET性質預測結果的準確性。

2)在構建的機器學習模型基礎上,本文基于分布式虛擬篩選架構,結合高性能計算集群優勢,搭建了化合物ADMET性質預測平臺(http://www.vslead.com/?r=admet/index)。平臺界面簡潔友好,操作簡單方便。

3)這一平臺可以幫助研究者在藥物研發早期階段,快速準確地判斷候選化合物的成藥性和安全性,進而降低藥物研發的失敗率,節省研發時間和經費的投入。

References)

[1]PAUL S M, MYTELKA D S, DUNWIDDIE C T, et al. How to improve R&D productivity: the pharmaceutical industry’s grand challenge[J]. Nature Reviews Drug Discovery. 2010, 9(3): 203-214. DOI: 10.1038/nrd3078.

[2]郭宗儒. 藥物分子設計的策略: 藥理活性與成藥性[J]. 藥學學報, 2010, 45(5): 539-547. DOI: 10.16438/j.0513-4870.2010.05.016.

GUO Zongru. Strategy of molecular drug design: activity and druggability[J]. Acta Pharmaceutica Sinica, 2010, 45(5): 539-547. DOI: 10.16438/j.0513-4870.2010.05.016.

[3]李曉, 孔德信. 化合物成藥性的預測方法 [J]. 計算機與應用化學, 2012, 29(8): 999-1003.

LI Xiao, KONG Dexin. Predicting ligand druggability for drug discovery[J]. Computers and Applied Chemistry, 2012, 29(8):999-1003.

[4]KOLA I, LANDIS J. Can the pharmaceutical industry reduce attrition rates?[J]. Nature Reviews Drug Discovery, 2004, 3(8): 711-716. DOI: 10.1038/nrd1470.

[5]MODI S, HUGHES M, GARROW A, et al. The value of in silico chemistry in the safety assessment of chemicals in the consumer goods and pharmaceutical industries[J]. Drug Discovery Today, 2012, 17(3/4): 135-142. DOI: 10.1016/j.drudis.2011.10.022.

[6]NIGSCH F, MACALUSO N J M, MITCHELL J B O, et al. Computational toxicology: an overview of the sources of data and of modelling methods[J]. Expert Opinion on Drug Metabolism & Toxicology, 2009, 5(1): 1-14. DOI: 10.1517/17425250802660467.

[7]CHENG Feixiong, LI Weihua, LIU Guixia, et al. In silico ADMET prediction: recent advances, current challenges and future trends[J]. Current Topics in Medicinal Chemistry, 2013,13(11): 1273-1289. DOI:10.2174/15680266113139990033.

[8]GLEESON M P, MODI S, BENDER A, et al. The challenges involved in modeling toxicity data in silico: a review [J]. Current Pharmaceutical Design, 2012, 18(9): 1266-1291. DOI: 10.2174/138161212799436359.

[9]MERLOT C. Computational toxicology-a tool for early safety evaluation[J]. Drug Discovery Today,2010, 15(1/2): 16-22. DOI: 10.1016/j.drudis.2009.09.010.

[10]SHEN Jie, CHENG Feixiong, XU You, et al. Estimation of ADME properties with substructure pattern recognition[J]. Journal of Chemical Information and Modeling, 2010, 50(6): 1034-1041. DOI: 10.1021/ci100104j.

[11]BROCCATELLI F, CAROSATI E, NERI A, et al. A novel approach for predicting P-glycoprotein (ABCB1) inhibition using molecular interaction fields[J]. Journal of Medicinal Chemistry, 2011, 54(6): 1740-1751. DOI: 10.1021/jm101421d.

[12]WANG Zhi, CHEN Yuanying, LIANG Hu, et al. P-glycoprotein substrate models using support vector machines based on a comprehensive data set[J]. Journal of Chemical Information and Modeling, 2011, 51(6): 1447-1456. DOI: 10.1021/ci2001583.

[13]HOU T J, XU X J. ADME evaluation in drug discovery. 3. Modeling blood-brain barrier partitioning using simple molecular descriptors[J]. Journal of Chemical Information and Computer Sciences, 2003, 43(6): 2137-2152. DOI: 10.1021/ci034134i.

[14]GOMBAR V K, HALL S D. Quantitative structure-activity relationship models of clinical pharmacokinetics: clearance and volume of distribution[J]. Journal of Chemical Information and Modeling, 2013, 53(4): 948-957. DOI: 10.1021/ci400001u.

[15]ZHU Xiangwei, SEDYKH A, ZHU Hao, et al. The use of pseudo-equilibrium constant affords improved QSAR models of human plasma protein binding [J]. Pharmaceutical Research, 2013, 30(7): 1790-1798. DOI: 10.1007/s11095-013-1023-6.

[16]HAMMANN F, GUTMANN H, BAUMANN U, et al. Classification of cytochrome p(450) activities using machine learning methods[J]. Molecular Pharmaceutics, 2009, 6(6): 1920-1926. DOI: 10.1021/mp900217x.

[17]CARBON-MANGELS M, HUTTER M C. Selecting relevant descriptors for classification by bayesian estimates: a comparison with decision trees and support vector machines approaches for disparate data sets[J]. Molecular Informatics, 2011, 30(10): 885-895. DOI: 10.1002/minf.201100069.

[18]CHENG Feixiong, YU Yue, SHEN Jie, et al. Classification of cytochrome P450inhibitors and noninhibitors using combined classifiers[J]. Journal of Chemical Information and Modeling, 2011, 51(5): 996-1011. DOI: 10.1021/ci200028n.

[19]ZHU Hao, MARTIN T M, YE Lin, et al. Quantitative structure-activity relationship modeling of rat acute toxicity by oral exposure[J]. Chemical Research in Toxicology, 2009, 22(12): 1913-1921. DOI: 10.1021/tx900189p.

[20]LI Xiao, CHEN Lei, CHENG Feixiong, et al. In silico prediction of chemical acute oral toxicity using multi-classification methods[J]. Journal of Chemical Information and Modeling, 2014, 54(4):1061-1069. DOI:10.1021/ci5000467.

[21]XU Congying, CHENG Feixiong, CHEN Lei, et al. In silico prediction of chemical Ames mutagenicity[J]. Journal of Chemical Information and Modeling, 2012, 52(11): 2840-2847. DOI: 10.1021/ci300400a.

[22]MAZZATORTA P, ESTEVEZ M D, COULET M, et al. Modeling oral rat chronic toxicity[J]. Journal of Chemical Information and Modeling, 2008, 48(10): 1949-1954. DOI: 10.1021/ci8001974.

[23]PLUNKETT L M, KAPLAN A M AND BECKER R A. Challenges in using the ToxRefDB as a resource for toxicity prediction modeling[J]. Regulatory Toxicology and Pharmacology, 2015, 72(3): 610-614. DOI: 10.1016/j.yrtph.2015.05.013.

[24]FOURCHES D, BARNES J C, DAY N C, et al. Cheminformatics analysis of assertions mined from literature that describe drug-induced liver injury in different species[J]. Chemical Research in Toxicology, 2010, 23(1): 171-183. DOI: 10.1021/tx900326k.

[25]LIEW C Y, LIM Y C, YAP C W. Mixed learning algorithms and features ensemble in hepatotoxicity prediction[J]. Journal of Computer-Aided Molecular Design, 2011, 25(9): 855-871. DOI: 10.1007/s10822-011-9468-3.

[26]HUANG S H, TUNG C W, FULOP F, et al. Developing a QSAR model for hepatotoxicity screening of the active compounds in traditional Chinese medicines[J]. Food and Chemical Toxicology, 2015, 78: 71-77. DOI: 10.1016/j.fct.2015.01.020.

[27]SOLIMEO R, ZHANG Jun, KIM M, et al. Predicting chemical ocular toxicity using a combinatorial QSAR approach[J]. Chemical Research in Toxicology, 2012, 25(12): 2763-2769. DOI: 10.1021/tx300393v.

[28]DODDAREDDY M R, KLAASSE E C, SHAGUFTA, et al. Prospective validation of a comprehensive in silico hERG model and its applications to commercial compound and drug databases[J]. ChemMedChem, 2010, 5(5): 716-729. DOI: 10.1002/cmdc.201000024.

[29]CZODROWSKI P. hERG me out [J]. Journal of Chemical Information and Modeling, 2013, 53(9): 2240-2251. DOI: 10.1021/ci400308z.

[30]LI Xiao, DU Zheng, WANG Jie, et al. In silico estimation of chemical carcinogenicity with binary and ternary classification methods[J]. Molecular Informatics, 2015, 34(4): 228-235. DOI: 10.1002/minf.201400127.

[31]ZHANG Cheng, CHENG Feixiong, SUN Lu, et al. In silico prediction of chemical toxicity on avian species using chemical category approaches[J]. Chemosphere, 2015, 122: 280-287. DOI: 10.1016/j.chemosphere.2014.12.001.

[32]SUN Lu, ZHANG Chen, CHEN Yingjie, et al. In silico prediction of chemical aquatic toxicity with chemical category approaches and substructural alerts[J]. Toxicology Researc, 2015, 4(2): 452-463. DOI: 10.1039/C4TX00174E.

[33]SINGH K P, GUPTA S, BASANT N, et al. QSTR modeling for qualitative and quantitative toxicity predictions of diverse chemical pesticides in honey bee for regulatory purposes[J]. Chemical Research in Toxicology, 2014, 27(9):1504-1515. DOI: 10.1021/tx500100m.

[34]DONG Jie, CAO Dongsheng, MIAO Hongyu, et al. ChemDes: an integrated web-based platform for molecular descriptor and fingerprint computation[J]. Journal of Cheminformatics, 2015, 7(1): 1-10. DOI: 10.1186/s13321-015-0109-z.

[35]LI Xiao, CHEN Lei, CHENG Feixiong, et al. In silico prediction of chemical acute oral toxicity using multi-classification methods[J]. Journal of Chemical Information and Modeling, 2014, 54(4): 1061-1069. DOI: 10.1021/ci5000467.

[36]NOBLE W S. What is a support vector machine?[J]. Nature Biotechnology, 2006, 24(12): 1565-1567. DOI: 10.1038/nbt1206-1565.

[37]QUINLAN J R. Induction of decision trees[J]. Machine Learning. 1986, 1(1): 81-106. DOI: 10.1023/A:1022643204877.

[38]FRANK E, TRIGG L, HOLMES G, et al. Technical note: naive bayes for regression[J]. Machine Learning, 2000, 41(1): 5-25. DOI: 10.1023/A:1007670802811.

[39]LI Lili, ZHANG Yanxia, ZHAO Yongheng. k-Nearest Neighbors for automated classification of celestial objects[J]. Science in China Series G: Physics, Mechanics and Astronomy, 2008, 51(7): 916-922. DOI: 10.1007/s11433-008-0088-4.

[40]OLAWOYIN R. Application of backpropagation artificial neural network prediction model for the PAH bioremediation of polluted soil[J]. Chemosphere, 2016, 161: 145-150. DOI: 10.1016/j.chemosphere.2016.07.003.

[41]CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning 1995, 20(3):273-297. DOI: 10.1007/BF00994018.

[42]CHANG C C, LIN C J. LIBSVM: a library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 1-27. DOI: 10.1145/1961189.1961199.

[43]YAP C W. PaDEL-descriptor: an open source software to calculate molecular descriptors and fingerprints[J]. Journal of Computational Chemistry, 2011, 32(7): 1466-1474. DOI: 10.1002/jcc.21707.

DevelopmentoftheplatformforpredictionofchemicalADMETproperties

LI Xiao1,2, LI Da2, ZHOU Xuesong2, ZHAO Yong1,2*

(1.BeijingComputingCenter,BeijingAcademyofScienceandTechnology,Beijing100094,China;2.BeijingBeikeDeyuanBio-PharmTechnologyCo.,Ltd.,Beijing100094,China)

It is very essential to estimate the druggability and toxicity of chemicals in the early stages of drug discovery. In order to make it available for drug researchers to estimate the druggability and toxicity of candidate compounds rapidly and accurately, we developed a platform for estimation of chemical ADMET properties based on in silico methods in this study. Firstly, we collected quality data of chemical pharmacokinetic and toxic properties (ADMET) with text mining approaches. Then, 13 predictive models were reproduced on the basis of original literature. Meanwhile, another 15 models were built with support vector machine (SVM). Finally, we developed a platform for estimation of chemical ADMET properties based on distributed storage architectures. This tool could be used to predict 28 important ADMET related properties quickly and easily, and its application in drug discovery could be helpful to reduce the time and money.

Drug discovery; ADMET properties; Machine learning

R91

A

1672-5565(2017)03-179-07

10.3969/j.issn.1672-5565.201704003

2017-04-11;

2017-07-21.

北京市科技型中小企業促進專項項目(Z16010101204).

李曉,男,博士,工程師,研究方向:藥物設計與藥物信息;E-mail:lixiao@bcc.ac.cn.

*通信作者:趙勇,男,博士,北京市特聘專家,研究方向:生物信息學與創新藥物研究; E-mail:zhaoyong@bcc.ac.cn.

猜你喜歡
性質方法模型
一半模型
隨機變量的分布列性質的應用
重要模型『一線三等角』
完全平方數的性質及其應用
中等數學(2020年6期)2020-09-21 09:32:38
重尾非線性自回歸模型自加權M-估計的漸近分布
九點圓的性質和應用
中等數學(2019年6期)2019-08-30 03:41:46
厲害了,我的性質
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 成人免费网站在线观看| 成人午夜精品一级毛片| 亚洲一区国色天香| 国产一区免费在线观看| 亚洲精品动漫| 色综合五月婷婷| 久久综合九色综合97网| 欧美亚洲一区二区三区导航| 久久国产拍爱| 青草精品视频| 天天色综网| 亚洲黄色激情网站| 久久中文字幕不卡一二区| 午夜欧美理论2019理论| 国产欧美精品一区aⅴ影院| 毛片免费在线视频| 成年人国产网站| 成人在线综合| 青青青视频免费一区二区| 在线中文字幕网| aa级毛片毛片免费观看久| 日韩123欧美字幕| 在线免费不卡视频| 性视频久久| 毛片a级毛片免费观看免下载| 人人艹人人爽| 无码不卡的中文字幕视频| 精品亚洲欧美中文字幕在线看 | 制服丝袜国产精品| 综合社区亚洲熟妇p| 在线色综合| 亚洲色图欧美在线| 喷潮白浆直流在线播放| 精品国产污污免费网站| 免费人成网站在线高清| 91区国产福利在线观看午夜| 亚洲码一区二区三区| 日韩高清一区 | 亚洲成人一区在线| 999精品在线视频| 欧美亚洲日韩中文| 亚洲AV免费一区二区三区| 一本久道热中字伊人| 亚洲一区毛片| 四虎在线观看视频高清无码| 国产精品福利在线观看无码卡| 人妻21p大胆| 国产91丝袜在线观看| 亚洲精品卡2卡3卡4卡5卡区| 动漫精品中文字幕无码| 亚洲中文字幕23页在线| 久久久久中文字幕精品视频| 视频国产精品丝袜第一页| 欧美啪啪网| 成人午夜网址| 中文字幕av无码不卡免费| 亚洲欧美极品| h视频在线播放| 亚洲日韩日本中文在线| 国产av无码日韩av无码网站| 午夜国产理论| 日韩 欧美 小说 综合网 另类| 色网站在线免费观看| 久久99热66这里只有精品一| 国产永久在线视频| 精品国产免费观看一区| 成人免费黄色小视频| 国产成人高清精品免费5388| 免费a级毛片18以上观看精品| 欧美.成人.综合在线| 亚洲精品无码日韩国产不卡| 亚洲国产精品VA在线看黑人| 国产三级精品三级在线观看| 色婷婷在线影院| 九九热精品免费视频| 国产真实乱人视频| 国产精品无码久久久久久| 男女性午夜福利网站| 亚洲香蕉伊综合在人在线| 日本免费一级视频| 亚洲欧美色中文字幕| 亚洲天堂视频在线播放|