霍爾頓?索普
1957年,約翰?肯德魯(John C. Kendrew)和馬克斯?佩魯茨(Max F. Perutz)通過X射線晶體學方法揭示了第一個蛋白質結構——肌紅蛋白的三級結構。之后,他們又確定了血紅蛋白結構。作為一名生物無機化學家,我對此深感欣喜——觀察著過去只能想象的東西,必定是一種非凡的體驗。
不久后,克里斯蒂安?安芬森(Christian B. An fi nsen Jr.)提出蛋白質的結構是熱力學穩定的。我們似乎可以根據蛋白質的氨基酸序列來預測其三維結構。這一眾所周知的“蛋白質折疊問題”始終困擾著科學家,直到2021年,AI預測蛋白質三維結構的成果發表,毫無疑問地成為我們心中的2021年度科學突破之一。
我成為一名生物化學家的時候,科學界還只能描述卻無法解決蛋白質折疊問題,化學力場和分子動力學建模尚不足以幫助我們解決問題。從頭合成蛋白質是令人興奮的工作,但組裝復雜結構和多蛋白質卻顯得遙不可及。2006年,我離開實驗室,轉向了行政工作,當時的我認為蛋白質折疊問題永遠得不到解決。
此后的15年間發生了很多事情。在冷凍電子顯微鏡技術發展起來后,蛋白質結構的揭示工作越發高效快速——天價的冷凍電鏡能在無結晶樣品的情況下確定蛋白質三維結構。另一方面,CASP競賽(蛋白質結構預測的關鍵評估競賽,被譽為蛋白質結構預測的奧林匹克競賽,每兩年舉辦一次)在全球科學界掀起風潮。參賽科學家借助算法工具來“預測”已知蛋白質結構,結果的匹配程度可顯示預測算法的精確性。
Alphabet公司的英國子公司 DeepMind通過CASP競賽展示了人工智能的驚人潛力。他們的AlphaFold算法在2020年秋季的CASP 會議上給華盛頓大學研究員白敏京(Minkyung Baek)留下了深刻印象。白敏京和同事設計了 RoseTTAFold算法,能以較少的計算能力預測蛋白質復合物的結構。DeepMind和白敏京等人的方法分別在《自然》和《科學》上同時發表。AlphaFold和RoseTTAFold都可供研究者免費使用(就像蛋白質結構預測數據庫一樣),于是科學家立即開始借助這些算法獲得蛋白質結構。
現在,我們可以得到不符合實驗方法的蛋白質樣品的結構,也能在不滿足實驗方法要求的實驗室里獲得蛋白質結構。這是兩個維度的突破。一方面,它解決了一個困擾學界50年的科學問題,正如費馬大定理的證明或引力波的發現。另一方面,它是一項改變游戲規則的技術,就像CRISPR或冷凍電鏡,將大大加速科學發現。無論出于何種理由,AI預測蛋白質結構這一研究進展必成為《科學》2021年度突破。
科學在取得突破的同時,也遭遇 “損害”。神經病學教授喬爾?珀爾馬特(Joel Perlmutter)在一篇社論中討論了美國食品藥品管理局(FDA)對阿爾茨海默病新藥阿杜那單抗的極為糟糕的批準。珀爾馬特辭職以抗議為FDA提供藥物建議的委員會。在氣候問題方面的持續不作為使得 1.5℃目標不太可能實現。一些國家的政府官員以新的方式攻擊科學家,并利用社交媒體等破壞科學在很多方面的權威,例如新冠疫苗問題和氣候問題。
就科學成就而言,蛋白質折疊方面的突破是有史以來最偉大的一項里程碑事件。與此同時,人們失去對科學權威的尊重是令人沮喪的悲劇,而且這種趨勢很難短期被逆轉。
2021年是最好的時代,也是最壞的時代。科學的“兩極”還將持續一段時間。