
中圖分類號:Q81
文獻標志碼:A
近年來,人工智能技術在蛋白質研究中的應用引發了蛋白結構與功能預測領域的革命性突破,也為人工酶的從頭設計(denovodesign)提供了新的方法和工具,如圖1所示。2020年,Madani等發表了基于語言生成模型的蛋白生成模型ProGen,該模型的訓練采用了來自1.9萬個蛋白家族的總計2.8億條蛋白序列。運用該模型,Madani等獲得了序列有別于天然酶的溶菌酶、馬來酸脫氫酶等人工酶[2]。2021年,Baker團隊[3提出了用于從頭設計蛋白質的深度網絡幻想方法,所設計的蛋白質序列中有約20% 能夠在細菌中順利表達,且蛋白折疊結構與預測結果相似。2022年,Baker團隊[4開發了“hallucination”和\"inpainting\"這兩種可用于生成包含功能位點的骨架結構的深度學習方法,展示了其在蛋白設計領域的應用潛力,但并未對所設計的酶進行活性驗證。2023年,他們在RoseTTAFold基礎上結合去噪擴散概率模型,開發出模型RFdiffusion5。該模型可從最小活性位點(催化殘基主鏈)構象出發,通過去噪迭代生成完整的新骨架,在單體蛋白質、對稱寡聚體、蛋白質結合蛋白的設計任務中表現出色。Baker團隊還開發了用于生成給定蛋白骨架的氨基酸序列的逆折疊模型ProteinMPNN和LigandMPNN[7,并在金屬離子、小分子以及DNA結合蛋白的設計中進行了實驗驗證。這類模型還能對天然蛋白質的氨基酸序列進行優化,提高其結構穩定性和可表達性[8。在酶的設計方面,Yang團隊開發了基于綜合計算評分蛋白質序列篩選標準COMPSS(Co-evolutionaryandMotif-based ProteinSequenceScreening),它能夠從人工智能生成的候選序列中高效識別出具有活性的酶。經過三輪迭代優化,最終篩選出的蘋果酸脫氫酶和銅鋅超氧化物歧化酶的人工酶能夠在大腸桿菌中表達、純化,且具備催化活性。Baker團隊lio通過RosettaMatch算法將血紅素結合位點整合至環形支架中心空腔,接著利用Rosetta組合方法設計血紅素結合位點兩側的氨基酸序列,獲得了活性口袋大、可塑性和穩定性高的人工血紅素酶。基于圖神經網絡算法,Baker團隊采用全家族幻覺(Family-widehallucination)算法和基于軟件Rosetta的序列設計,對核轉運因子2(NTF2)家族的蛋白骨架結構進行幻想生成,并對底物結合的口袋精細調整,成功構建了一種小型的高熱穩定性的熒光素酶,展示了人工酶設計的巨大潛力[。但是,由于熒光素酶催化機制簡單,在設計過程中僅需要考慮人工酶的活性中心對目標底物二苯四嗪陰離子的穩定化作用,并不涉及更復雜的蛋白分子動力學,因此該方法并不適用于其他復雜酶的設計。對具有更復雜的活性位點、并需要介導多步復雜催化反應的酶,其設計仍然面臨諸多挑戰。并且,上述方法所設計出的蛋白,其骨架多樣性仍受限于所選擇的天然蛋白家族模板。如何突破進化限制,設計具有不同蛋白骨架或折疊形式的人工酶,也是人工酶設計領域的難題。

絲氨酸水解酶(Serinehydrolase)是一類以絲氨酸的羥基為親核基團,通過進攻羰基來實現酯鍵、酰胺鍵水解的酶。絲氨酸水解酶廣泛參與包括脂質代謝、蛋白質降解、信號轉導、代謝調控等多種生理代謝過程,在疾病治療方面也發揮著重要作用。例如,乙酰膽堿酯酶調節神經遞質乙酰膽堿的代謝,其異常與阿爾茨海默病相關[12]。脂肪酸酰胺水解酶能夠降解內源性大麻素類物質 N. -花生酰乙醇胺,影響內源性大麻素系統的功能,進而對腫瘤細胞的生長、增殖、凋亡等生理過程產生影響[13]。絲氨酸水解酶還是一類重要的工業酶。例如,脂肪酶在油脂改性、肉類脫脂、酯類香料合成以及日化洗滌劑等領域中具有廣泛的應用。最近發現的可催化聚酯塑料高效降解的角質酶、聚對苯二甲酸乙二醇酯(PET)水解酶等也都屬于絲氨酸水解酶[14-15]。這類酶通過酸堿催化機制加速底物的水解,其活性中心由一個絲氨酸殘基、一個酸殘基(通常為谷氨酸或天冬氨酸)和一個堿殘基(通常為組氨酸)組成,構成一組催化三聯體。絲氨酸的羥基作為親核基團攻擊底物的羰基碳原子,形成四面體中間產物,同時酸殘基和堿殘基協同調節質子轉移,促進反應進行。氧負離子穴通過氫鍵網絡穩定過渡態的氧負離子,降低反應活化能,從而加速底物的水解[16]。
絲氨酸水解酶清晰的催化機制為其從頭設計奠定了基礎。Guallar團隊[7]利用天然蛋白骨架,在無催化活性的FragaceatoxinC蛋白質納米孔中構建了8組催化三聯體,實現了對PET納米顆粒的水解,但對微米級以上的PET顆粒無水解活性。這類復雜催化酶的設計需要綜合評價關鍵催化殘基在整個反應進程中結合底物的位置變化。為解決這個問題,
Baker團隊[18]開發了反應路徑預組織評估工具PLACER,利用深度神經網絡模擬催化循環中的關鍵狀態,評估各反應步驟的活性位點兼容性和多態預組織程度。基于RFdiffusion和PLACER設計人工絲氨酸水解酶的工作流程如圖2(a)所示,通過整合RFdiffusion和PLACER,從頭設計了具有全新折疊結構和酯催化活性的人工絲氨酸水解酶。以4-甲基香豆素苯乙酸酯為底物,最佳的人工酶的催化效率(kcat/Km) 達到 2.2×105mol/(L?s) (轉化數( kcat) 為 0.057s-1 米氏常數 (Km) 為 0.26μmol/L )。這項研究展示了人工智能在蛋白質設計中的巨大潛力。但是,該人工酶與天然絲氨酸水解酶相比,其催化效率仍然較低(例如,乙酰膽堿酯酶對乙酰膽堿的 kcat/Km 值超過108mol/(L?s)[19]) ,且 kcat 僅為 0.057s-1 ,難以滿足實際應用的需要。
除了小分子底物,很多絲氨酸水解酶還能高效地催化蛋白、聚酯等大分子的降解。這類酶的設計不僅要求相關的活性位點滿足特定的幾何排布和預組織方式,還需要保持活性位點位于蛋白表面。本課題組2展示了以已知的天然酶活性位點為基礎、將深度學習算法和常規分子模擬相結合的工作流程,用于設計全新的PET水解酶。我們首先從天然的枝葉堆肥角質酶(LCC)中提取了含有催化三聯體基序的二級結構片段,然后利用改進的RoseTTAFold網絡 (RFjoint) 生成用于支撐所提取基序的蛋白質序列,并使用AlphaFold2對新的序列進行蛋白結構預測。基于 RFjoint 和傳統計算篩選策略設計人工PET水解酶的工作流程如圖2(b)所示。在此基礎上,通過評估以下指標篩選具有潛在催化活性的序列:(1)結構預測建模得分(TemplateModeling score,TM-score gt;0.7 0;(2)每個殘基局部距離差檢驗的預測值(per-residue Local Distance Difference Test,pLDDT gt;70 );(3)基序復現精度均方根偏差(MotifRMSDlt;2.5AA 1AA=1×10-10m) ;(4)模式底物2-羥乙基-(對苯二甲酸單羥乙基 )3 的結合能(Binding energy,-16.7kJ/mol~0 ;(5)催化距離約束(絲氨酸殘基上的氧原子與底物羰基碳間距小于 4AA ;(6分子動力學模擬(MDsimulation)穩定性( 20ns 分子動力學模擬中骨架 a 碳原子的RMSD小于 5AA )。最后,通過實驗驗證和序列優化,成功地開發出了比LCC序列長度短 30% 的人工酶,且能復制PET水解活性。其中,人工酶RsPETasel表現突出,其 kcat/Km 與LCC相當,且具備良好的熱穩定性(熔融溫度為 56°C ),但與LCC的序列相似性僅為 34% 。該策略的成功實施,證明可以在保留酶的核心功能結構的前提下,盡可能去除冗余序列,獲得尺寸更小、折疊更緊湊的新酶。該方法有望應用于更多種類的絲氨酸水解酶的設計中,幫助人們獲得更多的“微型酶”,提高酶的結構穩定性和催化效率,降低酶的生產成本。

人工智能技術在絲氨酸水解酶設計方面的突破,為具有復雜催化機制的酶的設計奠定了基礎。近年來,各類新的深度學習算法不斷涌現,在新催化中心設計、蛋白質骨架構建和氨基酸序列生成等方面展現出強大的能力,顯著提升了人工酶的設計成功率。這些人工酶的構建不僅有效地擴展了酶的序列和結構多樣性,也為理解蛋白質序列與功能之間的映射關系、蛋白動力學和催化活性之間的關系提供了新的研究途徑。隨著人工酶在穩定性、專一性及催化效率等方面不斷接近甚至超越天然酶,高性能人工酶有望替代天然酶,在醫藥合成、食品加工、生物能源、環境治理等關鍵領域實現廣泛應用,推動相關產業技術的深度變革與創新發展。
參考文獻:
[1] MADANI A,MCCANNB,NAIKN,etal.ProGen:Languagemodeling for protein generation[EB/OL]. (2020-03- 07)[2020-05-29].https://www.biorxiv.org/content/10.1101/ 2020.03.07.982272v2.
[2] MADANI A,KRAUSEB,GREENEER,etal.Large language models generate functional protein sequences across diverse families[J].Nature Biotechnology,2023, 41(8): 1099-1106.
[3] ANISHCHENKOI,PELLOCKSJ,CHIDYAUSIKU M, et al. De novo protein design by deep network hallucination[J]. Nature,2021, 600(7889): 547-552.
[4] WANG J,LISANZA S, JUERGENSD, et al. Scaffolding protein functional sites using deep learning[J].Science, 2022,377:387-394.
[5] WATSONJL,JUERGENSD, BENNETT NR,et al. De novo design of protein structure and function with RFdiffusion[J].Nature,2023, 620(7976):1089-1100.
[6] DAUPARASJ,ANISHCHENKOI,BENNETTN,etal. Robust deep learning-based protein sequence design using ProteinMPNN[J].Science,2022,378(6615): 49-56.
[7] DAUPARASJ,LEEGR,PECORAROR,etal.Atomic context-conditioned protein sequence design using LigandMPNN[J].NatureMethods,2025,22:717-723.
[8] SUMIDAKH,NUNEZ-FRANCOR,KALVETI, etal. Improvingproteinexpression,stability,and functionwith ProteinMPNN[J].Journalof theAmericanChemicalSociety,2024,146(3): 2054-2061.
[9] JOHNSON SR,FU X, VIKNANDER S,et al. Computational scoring and experimental evaluation of enzymes generated by neural networks[J].Nature Biotechnology,2025, 43:396-405.
[10] KALVET I,ORTMAYER M, ZHAO J,et al.Design ofheme enzymes with a tunable substrate binding pocket adjacent to an open metal coordination site[J]. Journal of theAmerican Chemical Society,2023,145(26):14307- 14315.
[11] YEHAH W,NORNC,KIPNISY,et al. De novo design ofluciferases using deep learning[J].Nature,2023, 614(7949): 774-780.
[12] REMYA R S, RAMALAKSHMI N, NALINI C N, et al. Design synthesis and in vitro evaluation of tacrine-flavone hybrids as multifunctional cholinesterase inhibitors for Alzheimer's disease[J]. Current Computer-Aided Drug Design,2022,18(4): 271-292.
[13] TIANM, TIAN Z,YAO D, et al.A NIR fluorescent probe for fatty acid amide hydrolase bioimaging and its application in development of inhibitors[J].Journal of Materials Chemistry B,2021,9(32): 6460-6465.
[14] HAN X,LIU W,HUANG JW,et al. Structural insight into catalytic mechanismofPEThydrolase[J].Nature Communication,2017,8:2106.
[15] SULAIMAN S,YOU D J,KANAYA E,et al. Crystal structure and thermodynamic and kinetic stabilityof metagenome-derived LC-cutinase[J].Biochemistry,2014, 53(11): 1858-1869.
[16] DU S,KRETSCH R C,PARRES-GOLD J,et al. Conformational ensembles reveal the origins of serine protease catalysis[J]. Science,2025,387(6735):eado5068.
[17] ROBLES-MARTIN A, AMIGOT-SANCHEZ R, FERNANDEZ-LOPEZ L,et al. Sub-micro- and nano-sized polyethylene terephthalate deconstruction with engineered protein nanopores[J]. Nature Catalysis,2023,6(12):1174- 1185.
[18] LAUKO A,PELLOCK SJ, SUMIDAKH, et al. Computational design of serine hydrolases[J]. Science,2025, 388(5744): eadu2454.
[19] BAR-EVENA,NOORE,SAVIRY, et al. The moderately efficient enzyme:Evolutionaryand physico-chemical trends shaping enzyme parameters[J].Biochemistry,2011, 50(21): 4402-4410.
[20] DINGY,ZHANG S,KONGX,et al.Replicating PET hydrolytic activity by positioning active sites with smaller synthetic protein scaffolds[J]. Advanced Science,2025, 12(18): 2500859.
Recent Advances in Artificial Intelligence-Enabled Design of Serine Hydrolases
ZHANG Yifei,DING Yujing,SHE Ao (State Key Laboratory of Chemical Resources Engineering, Beijing Advanced Innovation Center for Soft Mater Science and Engineering, Beijing University of Chemical Technology, Beijing l0oo29, China)
Abstract:Recent advances in artificial intelligence have revolutionized the structure predictionand functional design of proteins,providing novel methodsand tools for the de novo design of artificial enzymes.Serine hydrolases have emergedas arepresentative model in the task of artificial enzyme design due to their well-defined catalytic mechanism.This reviewsummarizes key deep learning algorithms recently developed for artificial enzyme engineering andhighlights their typical applications,witha focusonthe latest successs in designingartificial serine hydrolases. These breakthroughs pave the way for the development of artificial enzymes with enhanced catalytic eficiency and stability, marking a new stage in enzyme design that could transform biomanufacturing and related industries.
Key words: artificial intelligence;computational enzyme design;deep learning; protein enginering;serine hydrolase
(責任編輯:李娟)