李 晴 沈陳金鑫 薛付沖 李賢慧 鄭 豪耿倚云 許靜遠 鄧張雙 周怡青
(1.常熟理工學院 生物與食品工程學院,江蘇 蘇州 215500;2.中國輕工業功能酵母重點實驗室(三峽大學生物與制藥學院),湖北 宜昌 443002)
相較于化學合成的小分子藥物,天然產物在結構新穎性、生物相容性和功能多樣性等方面具有明顯的優勢,并且在長期進化的過程中得到自然篩選優化.在新藥研發和臨床用藥中天然產物及其衍生物占有很大比重.據統計在1939年至2016年間,美國FDA批準上市的藥物中,有相當數量含有天然產物的分子片段(50%以上),甚至直接來源于天然產物[1].
從植物中提取是獲得天然產物的傳統手段.但是,由于植物資源的限制以及天然產物在植物中微小的含量,往往很難獲得足夠的樣品用于天然產物活性的研究與開發.合成生物學的發展為植物天然產物的獲取提供了新的途徑,通過天然產物合成途徑的解析和細胞工廠的構建,可以以葡萄糖為原料大量合成目標天然產物,從而為天然產物的研究和開發提供充足的原料[2].自然界中種類繁多,形態各異的植物產生了大量結構復雜多樣的天然產物(或者稱為次生代謝產物).這些天然產物既可以作為內源性小分子參與植物重要生理活動,例如調控植物自身的生長發育(例如赤霉素、脫落酸等植物激素)以及抵御病蟲害(例如豌豆素、白藜蘆醇等植保素),同時也是治療人類重大疾病的創新藥物分子的主要來源,例如:嗎啡、阿司匹林、紫杉醇,喜樹堿、青蒿素等.因此,解析植物天然產物的生物合成途徑對于植物生物學研究、生態學研究,以及開發創新藥物治療人類重大疾病和植物保護分子都具有重要意義[3].
傳統生物學研究原核生物天然產物的生物合成途徑的方法主要是通過基于功能基因組學和生物信息學的cDNA克隆測序及表達序列標簽(ESTs)特性分析[4].由于原核生物中催化功能相近的蛋白的基因同源性高,并且成簇(clusters)存在,在使用上述方法時更為方便快速.但在研究真核生物體系次生代謝產物的生物合成途徑時,由于真核生物復雜的機體狀態和不同的環境條件,次生代謝產物的生物合成途徑也會千差萬別,再使用和原核生物一樣的方法進行研究,不僅工作量巨大,而且對于復雜生物體中的酶催化反應可能并不適用.此外,細胞中的蛋白表達水平可能并不對應負責細胞代謝、調控和信號傳導的酶活性.例如一些反應可能需要幾種不同的蛋白協同作用,共同催化反應的進行,而基因組轉錄不一定能夠發現這些蛋白;再者,由于蛋白質的活性被很多翻譯后修飾事件所控制,如磷酸化、甲基化、糖基化等,這些修飾后的活性蛋白的含量才能真正反映蛋白質在生理條件下的功能狀態,因此僅僅在表達層面研究蛋白是不全面的.
與原核生物相比,研究來源于真核生物的天然產物的生物合成途徑存在著更大的挑戰.首先,真核生物基因組龐大,遺傳背景復雜,難以獲取高質量基因組序列;其次,真核生物,特別是植物天然產物生物合成基因大多數情況下并不成簇分布在植物基因組中,無法利用原核生物天然產物生物合成研究中常用的基因簇挖掘(genome mining)的方法來鑒定植物天然產物生物合成途徑;最后,植物等真核生物生長周期相對原核生物更長,遺傳操作相對復雜,很難通過體內敲除直接驗證相關基因的功能.目前,在植物天然產物生物合成研究中的方法十分有限,包括了轉錄組分析、活性導向蛋白分離以及基于同源性的反向遺傳學研究等[5].但這幾種方法也有自身的一定局限性,不能有效促進植物中全新功能蛋白的發現,因此,開發出新穎高效的研究方法對于植物天然產物生物合成來說具有重要意義.
鑒于基因組或轉錄組層面研究蛋白功能存在上述缺陷,21世紀初,來自美國Scripps研究所的Benjamin Cravatt教授首次提出了基于活性/親和性蛋白質譜(Activity/affinity-based protein profiling,ABPP)的概念,在功能蛋白質組層面研究蛋白功能[6].ABPP運用基于活性分子設計合成的高選擇性的分子探針(activity-based probe,ABPs)對蛋白質的功能與結構進行研究,它不僅應用于鑒別與活性分子相互作用的蛋白質,同時也對其相互作用模式進行研究,在經典蛋白質組學與功能蛋白質組學間起到橋梁作用.基于活性探針(ABPs)能夠在復雜的生物樣品中特異性地標記處于功能狀態下的蛋白質,該技術可以更直接地獲取目標蛋白功能/結構層面的重要信息,而不僅僅是蛋白表達層面,因此具有更為重要的意義.ABPP策略彌補了其他蛋白質組學方法的不足,已經成為功能蛋白質組學研究的主要策略之一(如圖1所示).根據探針結合蛋白的功能可分為3類:受體靶標(天然產物在異源體系發揮藥效的生理靶標)、轉運蛋白(天然產物在生源或異源物種的細胞器轉運)、代謝酶(催化天然產物生源合成或分解,或稱催化元件).截至目前,化學蛋白質組學策略已經廣泛用于藥用天然產物的異源(人)靶標或受體發現,本綜述將通過近10年來的4組實例介紹該策略用于天然產物生物合成途徑相關酶類挖掘方面的提出、發展以及應用.

圖1 基于分子探針和化學蛋白質組學的天然產物生物合成途徑(代謝酶)的解析策略
膽固醇(cholesterol)是人體組織細胞所不可缺少的重要代謝物.作為ABPP技術的創始人和引領者,Cravatt研究組在2013年合成了一系列基于膽固醇分子骨架的光親和探針(如圖2(a)所示),用于在哺乳動物細胞(HeLa)的活性蛋白質組中篩選膽固醇結合蛋白[7].結果發現,該探針能夠標記并富集膽固醇生源合成途徑中幾乎所有的酶(如圖2(b)所示).盡管該研究并不是在植物體系內完成,其結果首次給出了明確的提示:基于酶催化的底物或產物的衍生探針,通過化學蛋白質組學策略標記、富集并鑒定天然產物生物合成途徑中的催化元件是完全可行的.

圖2 活性/親和性導向的蛋白質譜技術(ABPP)應用于膽固醇生物合成途徑蛋白的富集[7]
2017年,北京大學的研究人員運用類似策略,以天然膽酸(Bile acid)分子結構為基礎,設計并優化了一系列可以模擬膽酸生物學功能的光親和探針,結合基于活細胞穩定同位素標記(Stable Isotope Labeling by Amino acids in Cell culture,SILAC)的定量蛋白質組學技術,在細胞水平上全面探尋了哺乳動物體內可以和膽酸分子特異性相互作用的潛在蛋白靶點[8].該方法成功鑒定到了600多個高置信度的膽酸相互作用蛋白,其中涵蓋了膽酸的內源受體、轉運體及其生物合成途徑的催化元件.
原花青素(Proanthocyanidin)是一類由兒茶素(Catechin)、表兒茶素(epi-Catechin)或沒食子酸聚合而成的多酚類黃酮化合物.廣泛存在于水果、蔬菜、花朵、堅果和樹皮中.在植物體內可轉變為花青素.流行病學資料表明花青素有降低腸胃癌癥風險、心血管病風險及預防女性尿路感染等作用[9].無色花色素雙加氧酶(Leucoanthocyanidin dioxygenase,LDOX)是花色素生物合成最后步驟的關鍵酶之一,催化無色花色素(Leucoanthocyanidin)氧化聚合并生成帶有顏色的原花青素.
2011年,Chaluneau等設計并合成了一系列固載黃酮類天然產物的樹脂(如圖3(a)所示),并在蛋白質組富集潛在的催化原花青素生物合成最后一步的酶[10].在初步的可行性分析實驗中他們發現,通過對黃酮B環的鄰苯二酚結構的一個羥基進行化學衍生所獲得的樹脂無法富集LDOX蛋白,而對A環C3位進行化學修飾獲得的樹脂成功特異性富集了LDOX蛋白.2014年,Carrie等對兒茶素和表兒茶素進行化學衍生,合成了生物素化的探針(如圖3(b)所示)[11].由于大部分天然黃酮含有鄰苯二酚結構,可以通過高碘酸鈉處理將其氧化成具有強親電活性的鄰苯醌結構并共價修飾包括生物合成酶在內的潛在的結合蛋白(如圖3(c)所示).將該系列生物素化探針與LDOX共孵育后,加入高碘酸鈉,使探針在原位(in situ)選擇性共價修飾LDOX.結果顯示,在高碘酸鈉存在下,探針成功結合了LDOX蛋白,且其結合程度大大優于傳統的光親和探針(如圖3(d)所示).加入還原劑抗壞血酸鈉顯著降低探針標記,證明鄰二醌中間體在標記中是不可或缺的.同時,在體系內加入BSA蛋白后,探針仍然主要結合LDOX,說明該結合是具有結構選擇性的.盡管該探針最終未被用于植物中黃酮生物合成元件的挖掘,它首次證明了將基于親和性探針用于植物天然產物生物合成酶的標記是完全可行的.

圖3 原花青素生物合成途徑LDOX酶的富集和標記[10-11]
桑白皮是來源于桑科植物根皮的一種傳統中藥,具有止咳、平喘、抗炎等功效,其作為“復方SH”的主要成分已被泰國政府批準用于治療艾滋病.桑白皮中含有一類特殊的Diels-Alder(D-A)類型天然產物,它們具有共同的環己烯骨架結構,具有多樣的生物活性.生源上,這類天然產物是由查爾酮(親二烯體)和不同二烯體發生分子間Diels-Alder反應形成的.揭示桑樹中全新的分子間Diels-Alder反應酶,不僅會極大地豐富對D-A反應酶的認知,也會促進桑科植物中這類具有重要生物活性的D-A類型天然產物的開發和利用.
為了找尋桑樹愈傷組織中催化morachalcone A(2)和二烯體(4)發生分子間D-A反應的酶,北京大學雷曉光研究組與合作者開發了一種基于天然生物合成中間體探針(Biosynthetic Intermediate Probes,BIPs)的化學蛋白質組學策略,對親二烯體morachalcone A進行化學衍生合成光親和探針(如圖4(a)~(b)所示),與具有高催化活性的桑樹愈傷組織蛋白組分孵育并進行紫外交聯,然后進行后續的靶標富集實驗(如圖4(c)所示),洗脫后通過銀染找到了可能與探針分子存在相互作用的蛋白,并對互作蛋白膠內酶切后的肽段進行質譜檢測[12].結果表明,被探針富集的條帶中包含了BBE-like protein,暗示桑樹中的BBE-like protein很可能是D-A反應酶.隨后,研究人員對桑樹愈傷組織進行了轉錄組測序,共鑒定出了14個BBE-like protein家族蛋白,并對轉錄水平最高的兩個基因(Ma MO和MaDA)進行了表達純化以及功能驗證.酶學活性測試發現,Ma MO能夠氧化moracin C(3)生成二烯體(4),而MaDA能夠催化二烯體(4)和morachalcone A(2)發生分子間環化反應.后續生化實驗結果表明,作為一個催化分子間Diels-Alder反應的酶,MaDA對二烯體和親二烯體都具有很好的底物兼容性,可作為一種高效的生物催化劑,用于D-A類型化合物的合成.

圖4 分子探針技術應用于桑白皮中D-A類型天然產物生物合成途徑相關蛋白的挖掘[12]
綜上,基于生物合成中間體探針的化學蛋白質組學策略從蛋白和底物結合的角度為植物天然產物生物合成途徑的研究提供了新的思路.近期,該研究組與合作者報道了自然界中催化不同endo/exo選擇性Diels-Alder反應的酶,利用這兩類酶實現了一系列D-A產物的高效精準合成,并解析了這兩類不同反應的催化機制,為后續D-A反應酶的開發和在藥物合成上的應用奠定了基礎[13].
隨著20世紀60年代世界范圍內禁止使用甜精和糖精等合成甜味劑,及后來對蔗糖攝食過多的危害性的不斷認識,出現了以天然作物生產甜味劑替代蔗糖的發展要求.甜菊糖苷(Stevioside),簡稱甜菊糖,是從甜葉菊(Stevia rebaudiana Bertoni)葉片中提取得到的一種高甜度、低熱量的天然甜味劑,其甜度相當于蔗糖的200~350倍,熱量是蔗糖的200~300分之一,是目前國內外公認的可替代蔗糖的理想的健康新糖源.現已鑒定出甜葉菊中的甜味成分均屬甙類,是雙萜衍生物甜菊醇(steviol)糖基化后生成的多種糖苷類化合物.目前的研究發現該類糖基化反應都是由UDP依賴型糖基轉移酶催化的,該類酶將一個糖基從一個活化的供體(通常是UDP-葡萄糖)轉移到受體分子上.隨著研究技術的發展,目前有34種甜菊糖甙類化合物被鑒定并報道.但是,在甜葉菊中只發現了數十種UGT轉移酶,且只有有限的幾個糖基轉移酶可以確證在甜菊糖苷的生物合成中起到作用[14].
針對這一不對等的數據信息積累和發展,為高效解析甜菊糖苷生物合成途徑,挖掘新的UGT元件,Li等利用活性分子探針導向的定量化學蛋白質組學策略,以二萜貝殼杉稀骨架衍生的甜菊醇(steviol)為基本結構設計化學小分子探針ST-Dayne和ST-yne,分別實現在非模式植物的富產甜菊糖苷同源宿主(甜葉菊)和不產該類化合物異源(擬南芥)模式植物的活性蛋白質組中標記并富集目標作用蛋白,從與甜菊醇骨架結合的蛋白中篩選具有特定催化活性的糖基轉移酶[15-16].同時他們還基于非模式植物的轉錄組數據構建了蛋白質組數據庫,從而依托成熟的質譜技術解析蛋白質序列,高通量獲取甜菊糖苷生物合成途徑中的多種轉糖酶元件.該研究發現,甜葉菊來源的UGT73E1、UGT76G3和擬南芥來源的UGT73C1等糖基轉移酶可以作為潛在的生物合成元件獲得新穎的代謝產物.進一步利用光親和探針標記技術,他們還成功解析了各轉糖酶的底物結合位點,結合分子對接模擬計算對二萜化合物的糖基轉移酶的底物專一性識別機制進行了解析.同時基于分子探針的設計,通過先活性反應對代謝合成物富集然后解離代謝組分析的策略獲得關鍵代謝相關信息.以上兩方面相關功能蛋白酶和代謝物的解析信息實現了合成途徑的成功繪制(如圖5所示).

圖5 分子探針技術應用于甜菊糖苷代謝物解析和轉糖酶元件的篩選[15-16]
盡管從概念上實現了基于化學蛋白質組學挖掘天然產物生物合成途徑轉糖酶元件這一設想并在甜葉菊和擬南芥等高等植物體系獲得一定成功,該策略仍然存在一定缺陷:首先,基于糖基受體底物,即甜菊醇(Steviol)衍生的含有報告基團(炔基)和光親和基團(偶氮丙啶)的“全功能探針”ST-Dayne的選擇性較差,富集大量非轉糖酶蛋白;其次,衍生化引起探針結構改變,無法完整覆蓋甜菊糖苷的合成途徑;再次,無法通過組學結果確認轉糖酶及其對應的酶反應底物和產物,活性表征完全依賴于后期異源表達和生化驗證,甚至需要通過大量正交實驗進行篩查.為解決以上問題,Wong等開發了一種雙分子探針策略,基于轉糖酶的催化活性原位合成探針[17].具體而言,在糖基受體分子上衍生報告基團(炔基,alkyne)塊;在糖基供體(UDP-glucose)分子上衍生光親和模塊(diazirine),這兩個模塊分別使用時均無法通過化學蛋白質組學方法富集蛋白.但是,在特異性轉糖酶的催化下,這兩個模塊“合二為一”,生成同時含有報告基團和光親和基團的產物“全功能探針”,并在紫外激發下在原位特異性標記催化其生成的轉糖酶,最后通過傳統的化學蛋白質組學方法鑒定該轉糖酶.利用該方法,研究人員不僅成功驗證了前期鑒定功能的UGT85C2,UGT73C1,UGT91D2等轉糖酶,還在擬南芥中發現一個轉糖酶UGT73C5可同時催化甜菊醇C13-羥基和C19-羧基的糖基化,為由甜菊醇一步合成甜茶素提供了全新的轉糖酶元件(如圖6所示).

圖6 雙分子探針策略應用于甜菊糖苷轉糖酶元件的篩選[17]
化學蛋白質組學技術利用小分子探針,在復雜的細胞或組織的蛋白質組樣品中直接監測和讀取靶標蛋白的活性和結構狀態,并通過探針上的報告基團將被標記的靶標蛋白富集出來,利用在生物大分子質譜上加以檢測和分析,這一創新性技術極大地加速了蛋白質功能的研究.傳統的天然產物生物合成途徑解析策略旨在基因/轉錄組和代謝組之間建立直接聯系(如圖6所示).隨著高分辨蛋白質譜技術的發展,越來越多的研究人員開始聚焦基因/轉錄組與代謝組之前的重要橋梁-蛋白質組(如圖7所示).

圖7 傳統基因組策略和基于分子探針的化學蛋白質組學策略研究天然產物生物合成途徑(代謝酶)
近10年來,化學蛋白質組學技術在天然產物生物合成途徑解析領域取得了一定進展,但還存在以下幾個缺陷:1)蛋白質組學發展至今,仍依賴基因組或轉錄組數據進行比對,從頭測序技術尚不成熟,限制了其在非模式植物的進一步應用;2)分子探針的構建可能對天然產物-代謝酶結合造成影響;3)植物和某些微生物中含有大量次級代謝產物,難以獲取高質量活性蛋白.以上缺陷仍需在未來的研究中不斷改進和克服.