張 媛,劉雨桐,李 達,宋新蕊,周雪松,趙 勇
(北京市計算中心,北京 100094)
反向虛擬篩選平臺及應用
張媛*,劉雨桐*,李達,宋新蕊,周雪松,趙勇**
(北京市計算中心,北京 100094)
摘要:靶標確證是老藥新用、藥物毒副作用研究的關鍵。基于分子對接方法AutoDock Vina和內部構建的疾病靶標數據庫,采用分布式架構,構建了反向虛擬篩選平臺。應用該平臺對藥物吡斯的明進行靶標確證,最終成功找到其靶標乙酰膽堿酯酶,驗證了平臺的實用性和準確性。
關鍵詞:老藥新用;毒副作用;反向虛擬篩選;AutoDock Vina
隨著計算機科學和生物信息學的迅猛發展,越來越多的生命科學數據被挖掘出來,常規藥物發現過程面臨投資大和回報周期長的問題,計算機模擬藥物設計通過輔助藥物發現的靶標識別與確證、先導化合物發現與優化、臨床前研究等模塊,大大節省了藥物發現的時間與資金投入,成為生命科學領域最為前沿的技術之一。
近十年,藥物多靶標的研究成為越來越熱門的話題,截止目前,DrugBank數據庫中的7 759種藥物有28.5%(2 245個)是多靶標作用[1]。藥物作用于多個靶標是藥物毒副作用的根源,也是藥物新作用研究(老藥新用)的基礎,對于藥物研發有著重大意義。
反向虛擬篩選(Reverse virtual screening)是一種對給定藥物或活性小分子通過計算方法找到其潛在藥物靶標的技術[2]。對于已知藥物,反向虛擬篩選技術可以尋找其他潛在靶標,為藥物新作用研究、藥物毒副作用研究提供參考;對于活性小分子,反向虛擬篩選技術可以預測其潛在作用靶標,為活性化合物的后期改造和機制研究提供方向,尤其適用于藥理活性明確但靶標未知的中藥等的研究(見圖1)。
反向虛擬篩選技術越來越多地應用于藥物研發的各個方面。Bernard等運用反向分子對接方法發現了托非索泮(Tofisopam)的作用靶點[3]。托非索泮是一種外消旋體,80年代作為抗焦慮藥在亞洲和歐洲上市。托非索泮作用于磷酸二酯酶4,其S 型異構體與已上市的PDE4抑制劑咯利普蘭相比,抑制作用更強,且不存在嘔吐的副作用,為PDE4的高選擇性抑制劑的研究提供了參考意義。張明波等人對中藥中的一種活性物質槲皮素進行了研究[4],他們利用反向對接的方法把槲皮素與抗腫瘤靶標進行反向對接,確定了槲皮素抗腫瘤可能的作用靶標和分子機制,為槲皮素的抗腫瘤藥物研發奠定了基礎。林愛斌等人利用反向對接的方法預測異白花丹酮的人類疾病靶點[5],發現Vitamin D3 receptor GTPase Hras 和 Leuko-cyte elastase 可能是異白花丹酮的人類疾病靶點。許先進等人對持久性有機污染物4,4’-DDE和CB-153利用反向虛擬篩選的方法搜索生物體內潛在蛋白質受體[6],發現反向虛擬篩選的方法在理解污染物分子的致病機制方面有很大的幫助。Gianluigi Lauro等人對天然產物黃腐酚和異黃腐酚針對腫瘤相關靶標進行了反向虛擬篩選[7],發現了黃腐酚和異黃腐酚具有激酶活性,進一步證實了反向虛擬篩選方法的魯棒性。

圖 1 反向虛擬篩選和用途Fig.1 Reverse Virtual Screening and its usage
反向虛擬篩選分為基于受體的反向虛擬篩選和基于配體的反向虛擬篩選兩類。基于受體的反向虛擬篩選是將化合物一一對接到靶標的活性位點處,根據化合物-靶標的相互作用能或者藥效團匹配得分排序,得分越高,潛在靶標的可能性越大。常見的基于受體的反向虛擬篩選方法有idTarget[8],TarFisDock[9],Mdock[10]和PharmMapper[11]。
基于配體的反向虛擬篩選基于“Chemical similarity principle”原理[2],認為相似的化合物具有相似的化學性質,甚至有著相似的作用靶標。因此將提問化合物與數據庫中的化合物一一進行相似性匹配打分,相似性最高的化合物作用靶標即認為是提問化合物的潛在作用靶標。ChemMapper是基于化合物形狀和藥效匹配的反向虛擬篩選方法[12]。
反向虛擬篩選方法的成功率一方面取決于篩選方法的準確性,另一方面取決于數據庫構建的完整性和準確性。IdTarget采用改良的AutoDock方法,數據庫包含PDB庫中所有晶體結構,靶標針對性較差;TarFisDock基于DOCK方法[13],使用PDTD數據庫[14],該數據庫涵蓋了841個已知或者潛在藥物靶標及其治療領域,針對性完整性較好。
為了保證靶標數據庫的針對性和準確性,同時考慮靶標的結構完整性,我們選擇現有人類基因組的可成藥基因在PDB數據庫中有完整解析和部分解析的蛋白質結構構建了疾病靶標數據庫,同時,我們應用AutoDock Vina作為分子對接工具[15],結合疾病靶標數據庫構建了反向虛擬篩選平臺(http://reversedock.vslead.com/)。應用該平臺對藥物吡斯的明進行靶標確證,成功找到其靶標乙酰膽堿酯酶,驗證該平臺的實用性和準確性。
1材料與方法
反向虛擬篩選平臺關鍵數據在于疾病靶標數據庫的建立,該數據庫包含pdbqt格式的靶標三維晶體結構、活性位點參數文件和靶標生物信息,分別從靶標三維晶體結構獲取、靶標活性位點確定和靶標生物信息收集三方面來進行(見圖2)。
DGIdb是一個鑒定已知的和潛在的藥物-基因關系的網絡數據庫[16],其中收集的藥物-基因相互作用數據有多個來源,包括DrugBank[1]、TTD[17]、PharmGKB[18]等。從DGIdb數據庫中搜集人類基因組的可成藥基因,共獲取6 571條基因,篩選數據質量可靠的基因條目,通過NCBI網站獲取對應的蛋白序列,共得到12 946條蛋白序列。
應用本地Blast方法,以12 946條蛋白序列為查詢序列,從PDB數據庫中搜索相似序列,對于每一個匹配結果進行分析過濾。為了獲取全部基因序列和部分連續基因序列被解析出三維結構的靶標,避免由于三維結構的不連續而導致的篩選結果不可靠,選擇PDB數據庫中完全匹配的蛋白作為有完整解析結構的蛋白,將匹配長度小于查詢序列,但匹配度為100%并且gap是0,錯配是0的蛋白作為有部分解析結構的蛋白。

圖2 反向虛擬篩選平臺構建方法Fig.2 Method of Reverse Virtual Screening platform
獲取疾病靶標的三維結構后,對靶標的活性位點進行確定。活性位點確定的方法主要有兩種,一種方法是以小分子周圍范圍殘基為活性位點殘基,此方法找到的活性位點多是生物活性位點,缺點是該靶標必須有蛋白—小分子復合物晶體結構。另一種是通過活性位點預測軟件預測得到,如LIGSITE[19]、PocketPicker[20],該方法適用于所有有晶體結構的靶標,缺點是易出現假陽性活性位點。為確保口袋的準確性,采取第一種方法提取小分子6埃范圍內殘基為活性位點殘基,以其所占立方體劃定盒子,確定篩選活性位點中心和尺寸。
從PubMed、UniProt、PDB等數據庫收集靶標的對應數據庫編號,通過數據庫檢索,可得到靶標的文獻、序列、結構等信息;另外,從DrugBank數據庫收集了靶標對應藥物的CAS號、DrugBank編號、藥物名稱信息,為用戶更全面了解疾病靶標性質提供參考。
在內部構建數據庫的基礎上,應用AutoDock Vina方法,基于分布式虛擬篩選架構,結合高性能計算集群優勢,構建了反向虛擬篩選平臺。用戶提交小分子化合物文件、選擇要篩選的內部靶標數據庫(Whole或者part)、確定返回結果數(最多前100結果)即可提交反向虛擬篩選任務(見圖3)。
2結果與分析
構建了600多個靶標7 000多個活性位點的疾病靶標數據庫,其中具有完整結構的靶標有140個,部分結構的靶標有506個(見表1)。此外,還給出每個靶標的對應PubMed、EC、UniProt、CAS、DrugBank等生物信息學數據,為醫藥工作者的藥物研發提供幫助。

表 1 疾病靶標數據庫
成功構建了反向虛擬篩選服務平臺。用戶只需提供小分子化合物結構,即可得到其潛在作用靶標(見圖4)。

圖3 反向虛擬篩選平臺工作流程Fig.3 Reverse virtual screening platform workflow

圖4 反向虛擬篩選平臺頁面Fig.4 Reverse virtual screening interface
3反向虛擬篩選平臺應用
藥物吡斯的明對眼有縮瞳、降低眼內壓的作用,作為抗膽堿酯酶藥使用,其作用靶標是乙酰膽堿酯酶。用吡斯的明作為提問化合物,應用反向虛擬篩選平臺進行篩選,驗證該平臺是否能找到吡斯的明的作用靶標乙酰膽堿酯酶。
從DrugBank數據庫下載得到吡斯的明的sdf格式結構(見圖5a),針對part靶標數據庫,應用反向虛擬篩選平臺提交篩選任務,最后選擇返回前100結果。
結合模式圖(見圖5b)可以看到,吡斯的明的酯鍵與Ser125和Tyr337形成H鍵相互作用,苯環與Trp86形成好的pi-pi相互作用。
結果顯示,吡斯的明成功找到了其作用靶標乙酰膽堿酯酶。此外,結果文件還給出了乙酰膽堿酯酶的PubMed數據庫、UniProt數據庫、DrugBank數據庫的相關信息,為靶標分析提供更多參考(見圖6)。

圖5 吡斯的明結構和其結合模式圖Fig.5 Pyridostigmine structure and binding mode

圖6 吡斯的明反向虛擬篩選結果示例Fig.6 Result example of pyridostigmine reverse virtual screening
4結論
成功構建了疾病靶標數據庫,該數據庫包含了600多個疾病靶標的7 000多個活性位點,為化合物的疾病治療提供參考;成功構建了反向虛擬篩選平臺,應用該平臺成功找到了藥物吡斯的明的靶標乙酰膽堿酯酶,為反向虛擬篩選平臺的應用提供基礎。該平臺具有良好的實用性和準確性。
參考文獻
[1]LAW V, KNOX C, DJOUMBOU Y, et al. DrugBank 4.0: shedding new light on drug metabolism[J].Nucleic Acids Research, 2014, 42: 1091-1097.
[2]CERETO-MASSAGUE A, OJEDA M J, VALLS C, et al. Tools for in silico target fishing[J].Methods, 2015, 71: 98-103.
[3]BERNARD P,DUFRESNE-FAVETTA C,FAVETTA P,et al. Application of drug repositioning strategy to TOFISOPAM[J].Current Medicinal Chemistry, 2008, 15(30): 3196-3203.
[4]張明波 李莉, 孫艷濤, 等. 基于分子反向對接方法的槲皮素抗腫瘤機制研究[J].中國實驗方劑學雜志, 2012, 23: 145-148.
ZHANG Mingbo, LI Li, SUN Yantao, et al. Study on Antitumor Mechanism of Quercetin based on Molecular Reverse Docking Method[J]. Chinese Journal of Experimental Traditional Medical Formulae, 2012, 23: 145-148.
[5] 林愛斌 劉亮, 姚曉敏, 等. 異白花丹酮的人類疾病靶點預測研究[J].中藥藥理與臨床, 2015, 01:63-66.
LIN Aibing, LIU Liang, YAO Xiaomin, et al. Study on human disease-related target prediction of isozeylanone[J].Pharmacology and Clinics of Chinese Materia Medica,2015,01: 63-66.
[6] 許先進 蘇計國, 劉斌, 等. 持久性有機污染物4,4'-DDE和CB-153的反向虛擬篩選[J].物理化學學報, 2013, 10:2276-2285.
XU Xianjin,SU Jiguo,LIU Bin,et al.Reverse virtual screening of persistent organic pollutants 4,4'-DDE and CB-153[J].Acta PhysicoChimica Sinica,2013,10:2276-2285.
[7]LAURO G,MASULLO M,PIACENTE S,et al. Inverse Virtual Screening allows the discovery of the biological activity of natural compounds[J].Bioorganic & Medicinal Chemistry,2012,20(11): 3596-3602.
[8]WANG J C,CHU P Y,CHEN C M, et al. idTarget:a web server for identifying protein targets of small chemical molecules with robust scoring functions and a divide-and-conquer docking approach[J].Nucleic Acids Research,2012,40:393-399.
[9]LI H, GAO Z,KANG L,et al.TarFisDock:a web server for identifying drug targets with docking approach[J].Nucleic Acids Research, 2006, 34: 219-224.
[10]HUANG S Y and ZOU X.Construction and test of ligand decoy sets using MDock: community structure-activity resource benchmarks for binding mode prediction[J].Journal of Chemical Information and Modelling,2011,51(9):2107-2114.
[11]LIU X, OUYANG S,YU B,et al. PharmMapper server:a web server for potential drug target identification using pharmacophore mapping approach[J].Nucleic Acids Research,2010,38:609-614.
[12]GONG J,CAI C,LIU X,et al.ChemMapper:a versatile web server for exploring pharmacology and chemical structure association based on molecular 3D similarity method[J].Bioinformatics,2013,29(14):1827-1829.
[13]EWING T J, MAKINO S, SKILLMAN A G, et al.DOCK 4.0:search strategies for automated molecular docking of flexible molecule databases[J].Journal Computer Aided Molecular Design,2001,15(5):411-428.
[14]GAO Z, LI H, ZHANG H, et al. PDTD: a web-accessible protein database for drug target identification[J].BMC Bioinformatics,2008,9:104.
[15]TROTT O and OLSON A J. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading[J].Journal of Computational Chemistry, 2010, 31(2): 455-461.
[16]GRIFFITH M, GRIFFITH O L, COFFMAN A C, et al. DGIdb: mining the druggable genome[J].Nature Methods, 2013,10(12):1209-1210.
[17]QIN C,ZHANG C,ZHU F,et al.Therapeutic target database update 2014:a resource for targeted therapeutics[J].Nucleic Acids Research, 2014, 42:1118-1123.
[18]THORN C F, KLEIN T E and ALTMAN R B.PharmGKB: the pharmacogenetics and pharmacogenomics knowledge base[J].Methods in Molecular Biology, 2005, 311:179-191.
[19]HENDLICH M, RIPPMANN F,BARNICKEL G. LIGSITE: automatic and efficient detection of potential small molecule-binding sites in proteins[J].Journal of Molecular Graphics and Modelling, 1997, 15(6): 359-363, 389.
[20]WEISEL M, PROSCHAK E and SCHNEIDER G. PocketPicker: analysis of ligand binding-sites with shape descriptors[J].Chemistry Central Journal, 2007,1: 7.
更正:本刊2007年第5卷第4期P157:“1.2置jdk1.4.2”更正為“1.2配置jdk1.4.2”。
Reverse virtual screening platform and its application
ZHANG Yuan*, LIU Yutong*,LI Da, SONG Xinrui, ZHOU Xuesong, ZHAO Yong**
(BeijingComputingCenter,Beijing100094,China)
Abstract:Computer based-target identification provides a unique tool for finding new application of old drugs and for the research on side effects of drug toxicity. Using molecular docking software AutoDock Vina and an in-house disease target database, we developed a Reverse Virtual Screening platform to identify protein targets for small molecules.The platform has been tested with pyridostigmine,a drug targeting acetylcholinesterase. This Reverse Virtual Screening successfully identified acetychlinesterase as pyridostigmine’s target,showing its applicability and accuracy in computer assisted drug design.
Keywords:New application of old drug;Side effects; Reverse virtual screening;AutoDock vina
中圖分類號:R91
文獻標志碼:A
文章編號:1672-5565(2015)04-251-06
doi:10.3969/j.issn.1672-5565.2015.04.08
作者簡介:張媛,女,碩士研究生,計算化學工程師,研究方向:反向虛擬篩選;E-mail:zhangyuan@bcc.ac.cn.*同等貢獻作者:劉雨桐,女,本科生,研究方向:生物信息;E-mail:liuyutong1008@hotmail.com.**通信作者:趙勇,男,博士,北京市特聘專家,研究方向:生物信息學與計算藥物;E-mail:zhaoyong@bcc.ac.cn.
基金項目:北京市東城區科技計劃(2015-2-006)支持;北京市科學技術研究院創新團隊計劃(IG201305C2)支持。
收稿日期:2015-09-29;修回日期:2015-11-17.