劉海波,馬培,許利嘉,肖培根
中國醫學科學院 北京協和醫學院 藥用植物研究所 中草藥物質基礎與資源利用教育部重點實驗室,北京 100193
藥用植物親緣學(pharmacophylogeny)是研究藥用植物的親緣關系-化學成分-療效(藥理活性及傳統療效)之間相關性的一門邊緣學科,是藥用植物資源開發利用的基礎工具[1];是在對我國藥用植物資源深入開發利用的實踐中逐步建立起來的,屬于多學科交叉的研究領域,兼具學術價值和應用價值。20 世紀50 年代,國外在蛇根木Rauvolfia serpentina(L.)Benth.ex Kurz.中發現了能夠治療高血壓的藥物利血平。肖培根等老一輩科研人員受命在國內尋找替代性藥用植物資源。在此過程中發現,親緣關系較近的植物所含的天然產物成分及藥用功效也接近。在這一發現的指導下,經過不懈探索,最終在我國南方的蛇根木同屬植物蘿芙木R.verticillata(Lour.)Baill.中找到了藥效相似的生物堿。以此為契機,在很短的時間里,開發并生產出以“降壓靈”為代表的一批國產降壓制劑。此后,藥用植物親緣學又在胡黃連、安息香、阿拉伯膠、馬錢子、大風子、阿魏、矮莨菪等藥用植物資源研究開發中得到進一步的驗證和發展。
藥用植物親緣學的核心理念是臨近系統發育群中的植物物種具有較為接近的遺傳基因特征,這種基因序列上的相似性導致近緣植物體內各類次生代謝物的合成途徑比較接近,最終表現為化學成分具有較高相似度,即:1)特定次生代謝物更可能分布于親緣學接近的多個植物物種中;2)近緣植物中天然產物在分子骨架構成方面具有較高的相似度和衍生關系。上述2 種化學成分相似性在臨床應用中表現為整體層面接近的生物活性或治療效果。在實踐中,藥用植物親緣學的理念有效指導了藥用植物資源的深度開發利用,特別是在新藥用植物物種的發現方面,可以避免傳統研究方法中的盲目性,開展有的放矢的研究。
藥用植物親緣學是從科學實踐中來,經過提煉升華后應用于實踐的理論,其產生過程符合科學發展發現的總體規律。目前,我國在傳統藥物、植物化學、天然藥物等領域已經走在了世界前列。在新時期,藥用植物親緣學正在不斷擴展應用范圍,在藥用植物資源開發、中藥質量控制、種質鑒定、藥食同源品種研究等方面繼續發揮著積極作用。
藥用植物親緣學在發展過程中,不斷吸納各學科領域新思想和新興技術方法,保持自身鮮活的生命力,學科理論得到了持續豐富、創新和發展。2014 年,以郝大程為代表的一批青年科研人員,提出了“藥用基因組親緣學”的新理論,這是藥用植物親緣學的一個新的發展里程碑。近年來,包括系統生物學、分子生物學、基因組和其他組學為主體的生物大數據,以及以生物和化學信息學技術為代表的信息學技術,成功應用于藥用植物親緣學研究,產生了一批研究成果。藥用植物親緣學進入了又一個新的發展階段。本文匯總了近年來各類信息學方法及其應用,為科研人員學習和了解該學科的最新發展動態提供參考。
化學信息學(cheminformatics)是一門使用信息學方法解決化學問題、提高研究效率的學科。信息學方法已經與化學等傳統學科深度融合,因此,化學信息學的研究領域不斷擴展,滲透進入化學科學的各個分支。化學信息學包括以下幾個主要研究領域:化學文獻管理、化合物數據存儲與挖掘[2]、有機小分子結構與性質關系、有機分子的合成設計[3]、不同尺度上的分子模擬計算、分子可視化、各類圖譜的分析和預測等。
化學信息學在生命科學領域主要用于新藥研發,由此產生了計算機輔助藥物設計(computer aided drug design,CADD)這一子學科。目前,CADD 技術在化學藥、生物制品和中藥的上游研發過程中扮演著越來越重要的角色,促使藥物發現由以往“尋找發現”模式逐漸向“靶向設計”模式轉變[4],將個別藥物的研發周期由原來的20 年左右,縮短到3~5年。
隨著植物化學各類分離鑒定方法的發展,藥物學家從植物、真菌和其他藥用資源中得到越來越多的天然產物單體,但獲得的量一般較少,難以通過傳統實驗方法進行藥理檢測。基于結構的天然產物活性預測方法由此得到廣泛應用。天然產物的活性預測分為由靶點尋找活性化合物的虛擬篩選及由化合物結構預測其作用靶點的反向尋靶。這2 種方法本質都是評價“化合物-靶點”直接的作用強度及可靠性,因此具體算法基本一致。算法主要分為3 類,包括分子對接、藥效團匹配及小分子結構相似性。這3 種方法的理論基礎應用范圍均不相同,各具優缺點。
分子對接是通過受體自身的特征及與配體分子之間的相互作用模式來進行藥物設計,其理論依據的基礎是配體與受體之間結合的鎖匙模型,通過計算兩者之間的靜電作用、氫鍵作用、疏水作用、分子間作用力等預測兩者間的結合模式和親和力,從而進行藥物的虛擬篩選。這一方法是目前虛擬篩選的主流方法[5]。藥效團泛指藥物小分子中對活性起重要作用的藥效特征元素的空間排列形式,主要包括氫鍵供體、氫鍵受體、正負電荷中心、芳環中心、疏水基團、親水基團及幾何構象體積限制。根據對這些藥效特征元素的歸納總結,能夠預測待測小分子的生物活性。小分子結構相似性是通過對具有相同機制的化合物先進行定量構象關系研究,再進行化合物數據庫搜索,本質上是一種數據庫搜索技術。大量網上化合物活性預測平臺使用的都是這一算法。
分子對接方法和分子動力學模擬方法通常用于分析活性分子與特定靶點之間的作用方式,用于提高虛擬篩選正確率、減少假陽性。在此基礎上,可以對中、低活性分子提出結構優化策略,設計出具有更高活性或選擇性的天然產物衍生物。其可能成為更適合的先導化合物候選分子。分子動力學模擬受體-配體復合分子體系的相互作用,研究結合模式,通過計算親和力預測配體的生物活性,與分子對接方法相比具有更高的可靠性,相關的軟件工具有Amber、GRMOACS、NAMD 等。近年來,超算技術的發展可以使各類分子動力學軟件工具的計算效率提高5~20倍。
組學是基于高通量分析的生物學方法集合,根據分析目標的不同可分為基因組、轉錄組、蛋白質組和代謝組等,以整體角度去研究生物體內DNA 轉錄、RNA 翻譯和修飾、蛋白質修飾和代謝產物的功能及變化情況。多組學方法的產生是生物大數據研究的開端,開始階段一般水平單一或組學有效信息有限,后期逐步實現了不同水平上各類數據的互補集成。近年來,該方法成功應用于冠心病痰瘀互結證[6]、腫瘤耐藥性等的研究[7],為闡明其遺傳調控機制和微觀物質基礎提供了有效途徑[8]。
組學及相關系統學是生命科學各分支和交叉學科的根基所在,具有“整體性”和“動態性”的特點,與中醫藥“整體觀”的指導思想十分契合,從而在中醫藥領域得到了廣泛應用。藥用植物親緣學引入組學方法后,拓展了藥用植物親緣學的方法和內容,在生藥學和藥用生物學等藥學相關領域更能起到提綱挈領的作用[1]。強化各種組學方法在藥用植物親緣學中的應用,可有力推動藥用植物資源的開發和可持續利用。
各種組學方法在藥用植物親緣學的相關研究可以解決2 類問題,一是比較物種基原、道地產區、藥用部位在基因組、轉錄組、蛋白質組水平上的差異,明確活性物質調控功能蛋白表達及活性成分形成的分子機制[9];二是探索含有同類化合物、相似化合物類群的不同種中藥對疾病模型在基因和蛋白水平上的擾動調控模式,進而闡明其作用機制和差異。組學方法的引入可有效拓展植物藥用部位、發展中藥替代品,也能對發掘民間草藥資源和拓展外來藥材品種起到指導作用。
基因組學是由美國科學家Thomas Roderick 于1986 年提出的,是對物種全部或特定基因進行基因作圖、基因定位和功能分析的一門科學[10]。藥用植物相關基因組研究主要包括全基因組和葉綠體基因組2 類方法。前者用于揭示物種起源、進化、生長發育及活性成分合成代謝的遺傳信息,后者更多用于系統發育研究和物種進化。基因組方法在藥用植物領域有多方面的應用[11]:1)明確藥用植物類群間的系統發育和親緣關系;2)推測現存藥用植物/道地藥材的起源和空間分布格局及其形成機制;3)探討藥用植物的多樣化進程和成因;4)基于生物多樣性探討藥用化合物多樣性,促進生合途徑解析和創新藥物發現;5)預測藥用植物多樣性動態變化,提出相應的保護性開發策略,促進人工栽培和分子育種。近年來,這一領域研究成果較多,如采用matK和rps16基因做DNA 條形碼序列,成功區分了黃精屬的主要藥用植物等[12]。
轉錄組是連接基因組與蛋白質組的紐帶,研究特定發育階段或功能狀態下細胞中轉錄RNA 的總體情況,包括編碼蛋白的mRNA 和非編碼RNAs(rRNA、tRNA、lncRNA、microRNA)。通過轉錄組分析可獲取基因表達、可變剪接類型等信息,為功能基因挖掘、藥用植物活性成分的生物合成與調控、藥用植物種質資源評估與擴大、探索藥材道地性分子機制提供了新的思路和方法。陳進芳等[13]針對漆酶基因挖掘唇形科8 種藥用植物的轉錄組數據,為唇形科藥用植物藥效物質的代謝調控及關鍵酶基因的定點突變提供參考。
蛋白質組學研究特定生理或病理狀態下物種體內蛋白質的構成、表達及相互作用[14]。目前,主要采用多維液相色譜進行分離并采用質譜技術進行鑒定。中藥藥效活性成分的合成和分布局限于植物特定的器官、組織或細胞內,并且在藥用植物生長發育過程中處于動態變化。這種變化由植物體內差異表達蛋白質組直接調控,展現出時間效應(不同發育階段)和空間效應(不同種屬或同一種屬、同一植物的不同藥用部位差異)。差異蛋白質組還可以反映出遺傳物質和環境因子(溫度、鹽分、紫外線照射等)的分子調控機制[15]。Yuan 等[16]基于蛋白質組學研究了缺水脅迫對黃芩中黃酮類成分含量及組成變化的內在影響機制,發現缺水可產生15 個上調蛋白和3個下調蛋白。
代謝組學研究生物體在病理生理刺激或遺傳因素改變的條件下,內源性小分子代謝物種類、數量的動態變化規律及相互關系[17]。經典分析方法有核磁共振、液相色譜-質譜聯用、氣相色譜-質譜聯用等技術。植物代謝組學方法可以揭示基因或環境對植物代謝物的影響,揭示中藥活性成分在機體內的代謝機制,在藥材鑒別及質量評價、中藥炮制機制、藥用植物次級代謝途徑機制、輔助育種、天然藥物開發方面有廣泛的應用[18]。龐溢媛等[19]通過超高效液相色譜串聯質譜技術(UHPLC-MS/MS)明確了不同采收時期黃芩的差異代謝物及含量變化,有助于藥材采收及質量評價。
系統生物學是一門研究生物系統組成成分的構成與相互關系的結構、動態與發生,以系統論和實驗、計算方法整合研究為特征的生物學。該學科是生物科學由“分析”思想主導,轉向“分析”與“綜合”并重的產物。系統生物學的思路與現代生物科學誕生以來不斷分解的思路不同,在繼續探究生物體每個結構單元的構成及功能的同時,開始研究基因、蛋白質、核酸及其他生物體內活性分子之間的相互作用,進而研究細胞內代謝通路、信號傳導通路、基因調控網路、生物系統組成之間相互關系和功能。在這一思想指導下,人們對藥物研究的方法也發生了改變。
系統生物學的發展與組學方法有緊密聯系。單一組學發展到一定階段,對組學間的交叉融合研究提出了更高的要求。在某種程度上,系統生物學可以看作綜合研究組學的理論體系,對生物學、計算機科學、工程學、生物信息學、物理學等多學科進行交叉融合,通過研究生物系統中不同部分(基因、蛋白質、代謝物等)之間的相互關系和相互作用,從整體性、動態性、多維度、多角度解析生命活動過程及機制,更有助于系統深入地揭示生物體遺傳和功能的關系。
2007 年,英國藥理學家Hopkins 提出網絡藥理學概念,突破了“一個基因,一種藥物,一種疾病”的范式,為創新藥物發現提供了新的框架。網絡藥理學屬于系統生物學、生物信息學和高通量組學分析的藥理學分支學科,通過網絡方法解析藥物、靶點和疾病之間的相互關系,根據分析結果研發和設計具有多種效應的藥物[20]。網絡藥理學具有整體性、系統性的特點,與中醫藥整體觀的原則不謀而合。因此,網絡藥理學方法的引入與中藥多成分、多靶點作用特點相結合,推動了中藥的現代化研究的進程[21-22]。
整合藥理學(integrative pharmacology)是研究多成分藥物與機體相互作用及其整合規律和作用原理的一門學科,可以視為網絡藥理學與中藥學深度融合的產物,強調“整體與局部”“體內與體外”“體內過程與活性評價”等多層次、多環節的整合研究[23-24]。中國中醫科學院還開發了中藥整合藥理學計算平臺[25],在此平臺基礎上開展了大量相關研究。
全球科學發展已進入大科學時代。科學創新活動由過去科研人員小團體合作進入到廣域協作模式,大數據和信息技術的高速發展正在帶動各個科學領域研究范式發生革命性變化。在生物醫藥領域,在高通量篩選、高通量測序、高效色譜等技術的支持下,化學、藥理、生物、基因等各領域的數據總量突飛猛進。最新的L1000 技術可同時快速測定近千個基因表達差異,覆蓋評估3 萬多個基因變化情況。科研數據的存儲、傳輸和分析處理能力也在飛速提升,新藥研發由過去的實驗室“濕模式”正在向計算與實驗緊密結合的“干濕并重模式”轉變。藥用植物親緣學在這一大背景下,必須吸納各類新技術,充分利用各學科產生的數據資源,才能與時俱進,煥發新的生命力。
全球現存種子植物超過300 000 種,中國有超過10 000 種藥用植物,約87%的中藥材屬于植物藥。未來,對這一巨大資源寶庫的開發利用仍有很大空間。具有類藥結構的天然產物集中分布于特定的物種群。目前,已發現的活性分子有較大比例分布于144 個植物科中,說明具有活性的天然產物在植物和微生物中的分布是有規律可循的。藥用植物親緣學研究發現,活性天然產物在木蘭亞綱(Magnoliidae)[26]、金縷梅亞綱(Hamamelidae)和石竹亞綱(Caryophyllidae)[27]的藥用植物中數量較多。這些規律對藥用植物學術研究和開發利用具有重要的指導作用。
在化學藥和天然藥物領域,天然產物及其衍生物具有較高的成藥性。因此,其在新藥研發中一直占據比較重要的地位,超過1/3臨床用藥來自天然產物和/或其衍生物。植物和微生物是活性天然產物的主要資源。近年來,來源于海洋生物的天然產物以其新穎的結構引起了藥物學家的關注[28-30]。目前,已解析的天然產物結構數量超過42 萬,篩選新活性天然產物的難度持續增加。CADD 技術及人工智能技術的廣泛應用有助于提高新藥研發效率。疾病研究和藥物治療進入多組學整合階段。多數疾病涉及多條生物途徑及功能蛋白的協同變化,這往往是單靶點藥物脫靶、無效或產生不良反應的原因。多組學整體評估藥物對多個疾病核心基因的調控,有望解決這些問題,是當前藥物研發的熱點。
30 年前,以肖培根院士為代表的老一代科研人員通過多年中藥資源開發的實踐,提出藥用植物親緣學理論并成功應用于藥用植物資源的研究和開發,這是藥用植物親緣學的第一階段。基因組學的融入,深化了對藥用植物親緣關系的認識層次,這是藥用植物親緣學發展的第二階段。未來,以各類組學、高通量藥理活性篩選、天然產物化學等學科產生的大數據為基礎,結合化學信息學、生物信息學、分子模擬等信息技術,藥用植物親緣學的發展將進入一個新階段。
以往藥用植物親緣學的應用多根據“近緣物種具有相似的化學成分”這一基本設定。下一階段,近緣植物的內涵將拓展為“近緣物種具有相似的基因、相似的功能蛋白、相似的生物合成途徑、相似的生物代謝/信號傳導網絡”。由此,能夠在轉錄水平上評估近源物種的化學成分對疾病模型的調控,發現活性化合物的協同調控作用,探究中藥基原植物在轉錄組和蛋白組上的變化與化學成分異質性之間的相關性,進而拓展藥用植物親緣學理論在合成生物學等研究中的新應用。例如,中國科學院上海植物生理生態研究所與上海藥物研究所合作,已經從親緣關系較近的人參和三七中克隆和鑒定了合成人參皂苷CK、人參皂苷Rh2、人參皂苷Rg3、人參皂苷Rh1和人參皂苷F1所需的關鍵糖基轉移酶和細胞色素P450 還原酶,很好地解析了人參和三七中皂苷的生物合成途徑。
大數據與信息學方法結合,拓寬了藥用植物親緣學的研究空間,并為這一理論探索出新的應用領域。藥用植物親緣學這一傳統交叉學科必將在新時期煥發新的生命力,繼續為我國傳統藥學發展作出貢獻。