

摘要:在人工智能技術(shù)快速發(fā)展及大數(shù)據(jù)背景下,計(jì)算機(jī)輔助藥物設(shè)計(jì)(Computer-aided Drug Design,CADD)這一綜合性交叉學(xué)科面臨著新的發(fā)展變革。CADD在藥學(xué)、生物學(xué)、化學(xué)等領(lǐng)域有著廣泛的應(yīng)用,也是高校相應(yīng)專(zhuān)業(yè)中一門(mén)重要的課程。將針對(duì)CADD的課程特點(diǎn)和教學(xué)中存在的問(wèn)題,對(duì)CADD課程教學(xué)內(nèi)容的編排進(jìn)行探索,以推動(dòng)CADD課程教學(xué)改革并促進(jìn)藥學(xué)等領(lǐng)域創(chuàng)新,培養(yǎng)實(shí)用型人才。
關(guān)鍵詞:計(jì)算機(jī)輔助藥物設(shè)計(jì);高校教學(xué);內(nèi)容編排;改革;人才培養(yǎng)
一、前言
藥物設(shè)計(jì)是新藥研發(fā)的關(guān)鍵環(huán)節(jié),藥物發(fā)現(xiàn)的技術(shù)方法也在不斷進(jìn)步。21世紀(jì)初,計(jì)算機(jī)輔助藥物設(shè)計(jì)(Computer-aided Drug Design,CADD)逐步成為新興研究領(lǐng)域,成為新藥開(kāi)發(fā)中不可或缺的手段。CADD以計(jì)算機(jī)科學(xué)為基礎(chǔ),以醫(yī)學(xué)、生物化學(xué)、藥物化學(xué)、生物信息學(xué)、物理學(xué)等交叉滲透,使藥物分子設(shè)計(jì)趨于定向化和合理化[1],提高了藥物設(shè)計(jì)的效率,減輕了研發(fā)過(guò)程中人力、物力及財(cái)力的耗費(fèi)。
與此同時(shí),隨著計(jì)算機(jī)科學(xué)的發(fā)展,醫(yī)藥大數(shù)據(jù)和人工智能(Artificial intelligence,AI)時(shí)代已經(jīng)到來(lái),也為CADD注入了新的內(nèi)容。將藥物數(shù)據(jù)與AI算法相結(jié)合的人工智能輔助藥物設(shè)計(jì)(Artificial intelligence-aided Drug Design,AIDD)應(yīng)運(yùn)而生,彌補(bǔ)了傳統(tǒng)CADD的不足[2]。如何在當(dāng)今時(shí)代融合AIDD的內(nèi)容,深化CADD學(xué)科知識(shí)體系,使學(xué)生由淺入深地掌握并應(yīng)用CADD相關(guān)技術(shù),是該學(xué)科亟待解決的問(wèn)題。本文針對(duì)該學(xué)科現(xiàn)存的不足,為教材內(nèi)容編排提供了新的思路和探索方向,使其更加系統(tǒng)化和合理化,服務(wù)于廣大藥學(xué)研究者。
二、教學(xué)內(nèi)容現(xiàn)狀及不足
(一)缺乏系統(tǒng)性和重視性
目前關(guān)于CADD的教材較少,有些高校對(duì)CADD的課時(shí)安排不合理甚至并未開(kāi)設(shè)此課,忽視了CADD在藥學(xué)專(zhuān)業(yè)中的必要性。同時(shí),存在內(nèi)容編排冗雜的問(wèn)題,缺乏由淺入深的系統(tǒng)性,不利于學(xué)生的學(xué)習(xí)和理解。由于部分內(nèi)容晦澀難懂,在理論學(xué)習(xí)過(guò)程中顯得枯燥乏味,若未輔以案例援引或?qū)嵅倬毩?xí),易使初學(xué)者失去學(xué)習(xí)興趣。
(二)缺乏實(shí)用性
很多學(xué)生在CADD課程完成后仍然不具備應(yīng)用所學(xué)解決實(shí)際問(wèn)題的能力。可以通過(guò)“理論+實(shí)踐”以線上、線下相結(jié)合的方式,在理論教學(xué)的基礎(chǔ)上著重培養(yǎng)學(xué)生的應(yīng)用能力。理論學(xué)習(xí)使學(xué)生掌握CADD相關(guān)的原理和方法,而實(shí)踐操作可以使學(xué)生習(xí)得如何使用相關(guān)軟件工具進(jìn)行藥物設(shè)計(jì)。沈陽(yáng)藥科大學(xué)CADD課程教學(xué)組基于線上授課教學(xué)的限制,對(duì)CADD課程的教學(xué)模式展開(kāi)探討。通過(guò)對(duì)學(xué)生進(jìn)行問(wèn)卷調(diào)查發(fā)現(xiàn),學(xué)生們更傾向于理論與實(shí)踐相結(jié)合的混合教學(xué)模式,認(rèn)為這對(duì)他們將來(lái)的深造、求職有更大的幫助。
三、教學(xué)內(nèi)容編排
(一)CADD的起源及介紹
CADD的起源可追溯至1894年德國(guó)化學(xué)家Emil Fischer提出的“鎖鑰模型”(Lock-and-Key Model)[3],即用鎖與鑰匙的關(guān)系來(lái)類(lèi)比酶與底物間的專(zhuān)一性,酶與底物間的專(zhuān)一性來(lái)自其幾何結(jié)構(gòu)的互補(bǔ)性。該模型奠定了現(xiàn)代分子對(duì)接技術(shù)和“基于結(jié)構(gòu)的藥物設(shè)計(jì)”(Structure-Based Drug Design,SBDD)的基礎(chǔ)。隨著相應(yīng)學(xué)科的發(fā)展,受體和配體的概念逐漸被提出。1964年美國(guó)化學(xué)家Corwin Hansch開(kāi)發(fā)了一種定量構(gòu)效關(guān)系(Quantitative Structure Activity Relationship,QSAR)模型[4],通過(guò)數(shù)學(xué)函數(shù)式描述了化學(xué)結(jié)構(gòu)與生物活性間的定量關(guān)系,為“基于配體的藥物設(shè)計(jì)”(Ligand-based Drug Design,LBDD)奠定了思想基礎(chǔ)。20世紀(jì)70年代至90年代,分子圖形學(xué)、分子模擬技術(shù)、虛擬高通量篩選相繼被提出,使CADD日益發(fā)展,逐漸形成完整的體系。圖1簡(jiǎn)要概括了CADD的研究?jī)?nèi)容,即通過(guò)計(jì)算機(jī)的模擬、測(cè)試與計(jì)算,得出藥物分子(配體)與機(jī)體靶標(biāo)(受體生物大分子)之間的作用關(guān)系,從而設(shè)計(jì)出具有生物活性的藥物分子。
(二)基礎(chǔ)軟件的使用
在本課程學(xué)習(xí)前,學(xué)生應(yīng)具備生物化學(xué)、藥物化學(xué)及一定的計(jì)算機(jī)基礎(chǔ),在教學(xué)過(guò)程中可進(jìn)行靈活補(bǔ)充,更為重要的是學(xué)習(xí)應(yīng)用相應(yīng)軟件的操作。
首先是藥物和生物大分子的可視化繪制軟件,如較好上手的ChemDraw及Chem3D、PyMOL等。前兩者可以繪制出各種小分子平面、立體結(jié)構(gòu)和化學(xué)反應(yīng)方程式,展現(xiàn)化合物分子信息等。后者主要展現(xiàn)蛋白質(zhì)等生物大分子的立體構(gòu)象,觀察小分子與蛋白活性口袋之間的結(jié)合模式,并測(cè)量原子之間的距離、角度和二面角等。此外,還有分子對(duì)接軟件AutoDock, 常用于給出化合物分子和蛋白質(zhì)可能的結(jié)合模式。表1給出了在CADD的研究過(guò)程中還有許多功能強(qiáng)大的綜合應(yīng)用軟件。在教學(xué)過(guò)程中可因材施教,選擇合適的軟件進(jìn)行操作練習(xí)。
(三)公用藥物數(shù)據(jù)庫(kù)及個(gè)性化構(gòu)建
教學(xué)中應(yīng)介紹藥物設(shè)計(jì)中常用的數(shù)據(jù)庫(kù)。主要有生物靶點(diǎn)數(shù)據(jù)庫(kù)(如蛋白質(zhì)數(shù)據(jù)庫(kù)PDB、核酸數(shù)據(jù)庫(kù)NDB等)、小分子數(shù)據(jù)庫(kù)(如DrugBank、CheMBL、PubMed等)及毒性數(shù)據(jù)庫(kù)等,可以高效地為學(xué)生及研究者提供檢索服務(wù)。通過(guò)CADD技術(shù),我們也可以構(gòu)建酶庫(kù)或藥物數(shù)據(jù)庫(kù)。如張方博等基于計(jì)算機(jī)篩選構(gòu)建了“一帶一路”國(guó)家抗感染傳統(tǒng)藥物信息數(shù)據(jù)庫(kù)[5],為后續(xù)研究提供基礎(chǔ)。
(四)基于配體的藥物分子設(shè)計(jì)
基于配體的藥物分子設(shè)計(jì)(Ligand-based Drug Design,LBDD)是計(jì)算機(jī)輔助藥物設(shè)計(jì)的重要內(nèi)容,又稱(chēng)間接藥物設(shè)計(jì)。其主要由定量構(gòu)效關(guān)系(Quantitative Structure Activity Relationship,QSAR)與藥效團(tuán)構(gòu)建(Pharmacophore construction)兩部分組成。前者應(yīng)用數(shù)學(xué)函數(shù)模型來(lái)揭示配體的化學(xué)結(jié)構(gòu)參數(shù)和生物活性強(qiáng)度間的量變規(guī)律,用于指導(dǎo)配體分子的結(jié)構(gòu)優(yōu)化并預(yù)測(cè)同類(lèi)新型化合物的生物活性。如陳碩等[6]綜述了QSAR在抗病毒藥物設(shè)計(jì)及篩選中的研究進(jìn)展,通過(guò)構(gòu)建3D-QSAR模型預(yù)測(cè)新型抗病毒藥物作用活性及毒性評(píng)價(jià)。
藥效團(tuán)構(gòu)建則基于配體分子結(jié)構(gòu),將其中一些共性的、對(duì)生物活性產(chǎn)生較大影響的基團(tuán)或藥效團(tuán)進(jìn)行空間排列組合,建立藥效團(tuán)構(gòu)象。以此進(jìn)行活性預(yù)測(cè)并輔助分子對(duì)接等技術(shù)進(jìn)行虛擬篩選,為發(fā)現(xiàn)先導(dǎo)化合物提供理論依據(jù)。國(guó)外研究者探究JAK1抑制劑時(shí)以LBDD的藥效團(tuán)構(gòu)建與虛擬篩選和分子對(duì)接方法相結(jié)合,生成了27個(gè)具有5個(gè)和6個(gè)藥效團(tuán)特征的藥效團(tuán)模型,并對(duì)其進(jìn)行驗(yàn)證,最終確定5個(gè)效能較好的先導(dǎo)化合物[7]。
(五)基于受體的藥物分子設(shè)計(jì)
基于受體的藥物分子設(shè)計(jì),主要內(nèi)容即分子對(duì)接,是基于結(jié)構(gòu)藥物設(shè)計(jì)(Structure-based Drug Design,SBDD)的一種方法,指根據(jù)受體的三維結(jié)構(gòu),選定作用位點(diǎn),與配體小分子化合物進(jìn)行結(jié)合,分析復(fù)合物構(gòu)象及其性質(zhì)。其關(guān)鍵步驟首先通過(guò)在數(shù)據(jù)庫(kù)搜索構(gòu)建大量可能的復(fù)合構(gòu)象,再對(duì)所有復(fù)合結(jié)構(gòu)進(jìn)行評(píng)價(jià),選擇最優(yōu)化合物作為篩選結(jié)果。在教學(xué)中,可以設(shè)置具體課題實(shí)例,如以細(xì)菌RNA聚合酶抑制劑的虛擬篩選為例,使學(xué)生通過(guò)AutoDock等軟件進(jìn)行分子對(duì)接操作的練習(xí)[8]。
(六)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)及全新藥物設(shè)計(jì)
蛋白質(zhì)多樣化的生理功能是由其復(fù)雜的三維結(jié)構(gòu)所決定的。在藥物研發(fā)過(guò)程中,對(duì)于僅有一級(jí)序列而未知具體結(jié)構(gòu)的蛋白質(zhì),可以借助于同源模建的方法,為蛋白質(zhì)的設(shè)計(jì)或改造提供理論依據(jù),為藥物分子提供合理的靶點(diǎn)結(jié)構(gòu)。學(xué)生們應(yīng)掌握同源模建的主要步驟:序列查找,序列比對(duì),模板選擇,模型構(gòu)建、優(yōu)化及驗(yàn)證。
全新藥物設(shè)計(jì)是SBDD的另一種設(shè)計(jì)方法,通過(guò)定義蛋白質(zhì)活性位點(diǎn)、以活性口袋結(jié)構(gòu)特征設(shè)計(jì)配體分子、修飾分子構(gòu)象、配體分子的評(píng)估合成及活性測(cè)定等一系列步驟設(shè)計(jì)新型藥物。其中,對(duì)蛋白質(zhì)結(jié)合位點(diǎn)的預(yù)測(cè),又可分為基于幾何預(yù)測(cè)的方法、基于能量或理化性質(zhì)預(yù)測(cè)的方法及綜合預(yù)測(cè)方法。對(duì)此,部分內(nèi)容學(xué)生應(yīng)做到理解并具備應(yīng)用能力。
(七)分子動(dòng)力學(xué)模擬
體內(nèi)生物大分子的動(dòng)力過(guò)程往往是一個(gè)動(dòng)態(tài)過(guò)程,其動(dòng)態(tài)性質(zhì)結(jié)構(gòu)難以被準(zhǔn)確測(cè)定,是研究人員在藥物分子設(shè)計(jì)中的重大難題。而分子動(dòng)力學(xué)(Molecular dynamics,MD)模擬可以幫助我們解決這一問(wèn)題,是CADD中一項(xiàng)重要的內(nèi)容。
MD模擬主要采用經(jīng)典分子力學(xué)(molecular mechanics,MM)和量子力學(xué)(quantum mechanics,QM)理論方法從原子水平探索蛋白質(zhì)分子的動(dòng)態(tài)行為,分析生物大分子體系動(dòng)態(tài)模式,并檢測(cè)其藥物結(jié)合位點(diǎn)及驗(yàn)證對(duì)接結(jié)果[9]。在此處教學(xué)內(nèi)容中,理論部分較難理解,應(yīng)選擇合適的教學(xué)方法進(jìn)行講解。MD模擬的主要步驟包括體系分子結(jié)構(gòu)的預(yù)處理、配體小分子及復(fù)合物的拓?fù)湮募谱鳌Ⅲw系能量?jī)?yōu)化、動(dòng)力學(xué)模擬及結(jié)果分析。預(yù)處理后步驟均可運(yùn)用計(jì)算機(jī)指令幫助我們執(zhí)行。
(八)人工智能輔助藥物設(shè)計(jì)
傳統(tǒng)的CADD在應(yīng)用過(guò)程中存在著數(shù)據(jù)不足、可行性差等問(wèn)題而無(wú)法充分滿足研究需求。而人工智能的發(fā)展,可以幫助研究者通過(guò)AI技術(shù)優(yōu)化CADD現(xiàn)有設(shè)計(jì)方法,在藥物研發(fā)的靶點(diǎn)發(fā)現(xiàn)、先導(dǎo)化合物研究和化合物篩選、合成等方面,為CADD帶來(lái)顯著的效率提升,極大地增加了研發(fā)成功的可能性。例如,通過(guò)自然語(yǔ)言處理技術(shù),可以自動(dòng)分析大量相關(guān)文獻(xiàn)和數(shù)據(jù),以幫助研究者快速篩選出藥物潛在靶點(diǎn)。同時(shí),將分子模擬計(jì)算出的大量數(shù)據(jù)與AI算法(深度學(xué)習(xí))相融合,并建立生成式深度學(xué)習(xí)模型,挖掘輸入的化學(xué)小分子的數(shù)據(jù)特征,抓取分子的形成特點(diǎn),再利用分子模擬技術(shù)進(jìn)行分析,并將結(jié)果反饋給AI神經(jīng)網(wǎng)絡(luò),在此基礎(chǔ)上生成骨架新穎、具有特定生物活性的虛擬分子,使CADD逐漸向AIDD發(fā)展轉(zhuǎn)變 [10, 11]。
目前,已有研究者利用深度機(jī)器學(xué)習(xí)的藥物篩選與預(yù)測(cè)模型篩選獲得了候選藥物分子,甚至也誕生了首例進(jìn)入臨床Ⅰ期實(shí)驗(yàn)的AI藥物[2, 4]。在教學(xué)過(guò)程中應(yīng)穿插介紹前沿科研實(shí)例,幫助學(xué)生加深學(xué)科理解,并緊跟時(shí)代發(fā)展方向。
四、結(jié)語(yǔ)
綜上,筆者展示了CADD課程教學(xué)由淺入深的邏輯框架,明確了CADD過(guò)程中的重點(diǎn)內(nèi)容,可供高校教師參考來(lái)更加合理地進(jìn)行課程安排。CADD教學(xué)內(nèi)容的編排在總體上應(yīng)注重理論和實(shí)踐相結(jié)合,提供充足實(shí)踐機(jī)會(huì),強(qiáng)調(diào)學(xué)科交叉,在教學(xué)中結(jié)合最新研究成果進(jìn)行案例分析,培養(yǎng)學(xué)生的創(chuàng)新能力和解決實(shí)際問(wèn)題的能力。在具體教學(xué)過(guò)程中,采用何種教學(xué)、考核方法使學(xué)生能真正掌握課程技術(shù)還需要進(jìn)一步討論探索。在新時(shí)代,CADD及AIDD在藥物設(shè)計(jì)中發(fā)揮著更大的作用,希望本文能幫助高校培養(yǎng)更多實(shí)用型、創(chuàng)新型藥學(xué)人才,幫助學(xué)生了解并掌握CADD的內(nèi)核。
參考文獻(xiàn)
[1]劉景陶,劉映雪.計(jì)算機(jī)輔助藥物設(shè)計(jì)的原理及應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2016(33):52.
[2]張婷,陳娟,歐陽(yáng)昭連.基于專(zhuān)利分析的人工智能輔助藥物研發(fā)領(lǐng)域技術(shù)開(kāi)發(fā)態(tài)勢(shì)[J].中國(guó)新藥雜志,2022,31(04):305-311.
[3]謝治深,宋軍營(yíng),張振強(qiáng),等.計(jì)算機(jī)輔助藥物設(shè)計(jì)方法及其在新藥研發(fā)中的應(yīng)用[J].河南大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2019,38(02):148-152.
[4]周雙艷,袁帥,張文英.大數(shù)據(jù)時(shí)代計(jì)算機(jī)輔助藥物設(shè)計(jì)的教學(xué)思考[J].廣州化工,2021,49(17):177-178+181.
[5]張方博,唐璇,唐仕歡,等.“一帶一路”國(guó)家抗感染傳統(tǒng)藥物數(shù)據(jù)庫(kù)構(gòu)建[J].中國(guó)現(xiàn)代中藥,2022,24(02):187-197.
[6]陳碩,李非凡,孫國(guó)輝,等.QSAR建模及其在抗病毒藥物設(shè)計(jì)與篩選中的研究進(jìn)展[J].化學(xué)試劑,2021,43(07):895-905.
[7]Babu S, Nagarajan SK, Sathish S, Negi VS, Sohn H, Madhavan T. Identification of Potent and Selective JAK1 Lead Compounds Through Ligand-Based Drug Design Approaches[J]. Frontiers in Pharmacology, 2022,13:837369-837369.
[8]譚相端,呂良.基于AutoDock vina軟件的藥物設(shè)計(jì)學(xué)課程教學(xué)案例設(shè)計(jì)——以虛擬篩選細(xì)菌RNA聚合酶抑制劑為例[J].廣東化工,2022,49(11):222-224.
[9] Sara A, HK B. Applications of Molecular Dynamics Simulations in Drug Discovery[J]. Methods in molecular biology, 2024, 2714:127-141.
[10]王明陽(yáng),李丹,侯廷軍,等.基于深度學(xué)習(xí)的全新藥物設(shè)計(jì)研究進(jìn)展[J].中國(guó)科學(xué):化學(xué),2023,53(01):95-106.
[11]楊艷偉,胡文元,林志,等.大數(shù)據(jù)和人工智能技術(shù)用于計(jì)算機(jī)輔助藥物設(shè)計(jì)的研究進(jìn)展[J].藥物評(píng)價(jià)研究,2023,46(06):1369-1375.
基金項(xiàng)目:1.廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃項(xiàng)目“醫(yī)藥工業(yè)酶庫(kù)構(gòu)建與重點(diǎn)酶的典型應(yīng)用”(課題編號(hào):2022B1111050003);2.2023年成都大學(xué)研究生規(guī)劃教材建設(shè)“計(jì)算機(jī)輔助藥物設(shè)計(jì)理論及應(yīng)用(第二版)”
作者單位:成都大學(xué)藥學(xué)院
責(zé)任編輯:周航