2024年諾貝爾科學獎項頒給了微小RNA的發現者、人工智能模型的先驅以及那些將人工智能用于蛋白質結構預測的人。顯然,人工智能在2024年諾貝爾獎中大獲全勝。
諾貝爾科學獎一直在用自己的方式表彰人類智慧。2024年,人工智能(AI)的變革潛力首次得到諾貝爾獎的認可。10月8日,瑞典皇家科學院將物理學獎授予普林斯頓大學的約翰 · 霍普菲爾德(John Hopfield)和多倫多大學的杰弗里 · 辛頓(Geoffrey Hinton),以表彰倆人在計算機科學領域取得的突破。他們的成果對當今許多最強大AI模型的開發至關重要。
10月9日,一款神奇AI模型的開發者也接到斯德哥爾摩的來電。他們就是谷歌人工智能公司DeepMind的核心人物,德米斯 · 哈薩比斯(Demis Hassabis)和約翰 · 江珀(John Jumper),因創造能精準預測蛋白質三維結構的AlphaFold而獲得化學獎。
長期以來,蛋白質結構預測是生物化學領域的重大挑戰。當然,這兩位只分得一半榮譽,另一半授予華盛頓大學的生物化學家大衛 · 貝克(David Baker),以表彰他利用計算機輔助設計新蛋白質的工作。
人工智能并不是這次結果揭曉的唯一共同點。在一些嚴謹的人士看來,2024年諾獎委員會對物理獎和化學獎的頒發是“越界”的,因為人工智能研究屬于計算機科學,而蛋白質研究則應歸屬于生物學。
破界
這種靈活“跨界”并非史無前例。例如,1973年,3位常與蜜蜂、鵝和棘魚打交道的動物行為學先鋒被“強行”授予諾貝爾生理學或醫學獎。不過辛頓和霍普菲爾德所做出的諾獎成就有更深遠的影響。
2024年諾貝爾科學獎獲得者:杰弗里·辛頓(左一)、約翰·霍普菲爾德(左二)、德米斯·哈薩比斯(左三)、大衛·貝克(左四)、約翰·江珀(右三)、加里·魯夫昆(右二)、維克多·安布羅斯(右一)
兩位大師都在1980年代初完成了他們的關鍵工作,但當時計算機硬件無法充分利用它。霍普菲爾德設計了一種后來被稱為霍普菲爾德神經網絡的人工神經網絡,其構建模式類似物理學中的自旋玻璃模型——這讓瑞典皇家科學院有理由稱這屬于“物理學”。辛頓的貢獻是使用所謂的反向傳播算法來訓練神經網絡。
人工神經網絡是計算機程序,大致基于人們認為的真實生物神經細胞或神經元網絡的工作方式。具體而言,此類網絡中“節點”(相當于神經元)之間連接的強度(稱為權重)具有可塑性。這種可塑性賦予網絡根據過往表現以不同方式處理信息的能力,換言之,就是學習能力。霍普菲爾德網絡中每個節點都連接到除自身之外的所有節點,這種網絡特別擅長“從稀疏或嘈雜的數據中提取模式”。
辛頓通過他設計的算法,讓神經網絡在三維空間中工作,增強神經網絡的學習能力。霍普菲爾德網絡及其同類網絡本質上是二維的。盡管它們實際上僅作為軟件中的模擬而存在,但它們可以被視為節點的物理層。但是,將這些層堆疊在一起,信號在層之間來回移動(即反向傳播和前向傳播)時通過調整權重來訓練它們,您將擁有一個更加復雜的學習系統。
此外,辛頓博士還利用物理學的一個分支,即統計力學,對霍普菲爾德的網絡做出改進,創建了玻爾茲曼機。玻爾茲曼機可用于創建以無人監督的方式學習的系統,無須明確教授即可發現數據中的模式。[統計力學是熱力學第二定律的基礎,由與阿爾弗雷德 · 諾貝爾(Alfred Nobel)同時代的路德維希 · 玻爾茲曼(Ludwig Boltzmann)創立。]
因此,這兩位研究人員的工作讓機器學習真正發揮了作用。人工智能模型現在不僅能學習,還可以創造(或者,用懷疑論者的話說,以最復雜方式重組和照搬)。這些工具已經從執行高度特化的任務,例如識別組織樣本中的癌細胞或精簡大量粒子物理數據,轉變至能應付從為本科生寫論文到運行機器人的各種事務。
接受媒體采訪時,辛頓博士似乎流露出對自己的成果既擔心又自豪的態度。他和領域內許多人一樣,擔心超越人類的機器智能會怎樣對待創造它自己的人。另一方面,他也沉思:通過協助腦力勞動,AI能否帶來如工業革命之于體力勞動那樣巨大的影響?
這樣的沉思來得正是時候。不到24小時后頒發的諾貝爾化學獎似乎是對上述問題的回復。瑞典皇家科學院表彰了利用AI模型預測蛋白質結構的3位先鋒。
折疊
蛋白質是生命的主要化學組成部分。它們的基本組成單位是氨基酸,這些小分子排列成長鏈,以相當復雜和特定的方式折疊。最終的折疊形態,也就是蛋白質三維結構,決定其生物功能。換言之,我們要了解蛋白質——進而理解生物學——就必須了解蛋白質結構。
貝克博士通過實踐獲得了這種理解。他在2003年的一篇具有里程碑意義的論文中介紹了自己設計的全新蛋白質。據稱,借助計算機程序Rosetta,他發現了一種能以此前從未見于自然界的方式折疊的氨基酸序列。貝克在實驗室重新創建該序列并制得蛋白質,接著用X射線晶體學技術確定其最終結構——與他設想的折疊形態非常接近。Rosetta(現在叫作Rosetta Common)很快成為全球蛋白質化學家使用的軟件包。蛋白質計算設計已在各個方面發揮作用,例如疫苗開發和有毒化學物質檢測。
另一方面,若要根據蛋白質的氨基酸序列預測其三維結構,那就是更艱巨的任務了。鑒于蛋白質可以折疊出近乎無限種形態——據估計,一個復雜蛋白質有10300種可能的空間結構——因此即使用計算機也只能獲得有限結果。DeepMind的AlphaFold 1和2(均為人工神經網絡)分別于2018年和2020年發布,是第一種接近無限可能的神經網絡。AlphaFold 2目前擁有一個包含超過2億種蛋白質結構預測的數據庫,預測準確率高達約90%。
在此次諾貝爾獎結果揭曉前,2024年德米斯和江珀出現于各大科技獎項的候選人名單中,當然,許多人質疑,現在就向AlphaFold致敬是否為時過早。可無論如何,AlphaFold正改變科學。
DeepMind表示,大約200萬科學家已經在研究中使用此工具。2024年5月發布的AlphaFold 3不再局限于蛋白質研究,還能預測大量其他生物分子的結構,諸如DNA,以及可能作為藥物發揮作用的小分子;它也可以預測不同結構的不同分子怎樣組合到一起,例如病毒的刺突蛋白如何與宿主體內的抗體和糖相互作用。
“見微知著”
2024年的諾貝爾生理學或醫學獎與AI毫無關聯,也沒有受到所謂跨學科的爭議。評審團隊繼續關注分子和細胞層面的“最微小”成果(而非生理學或器官方面的研究)的趨勢,因為最令人興奮的科學前沿正是在這些微觀尺度上。
馬薩諸塞大學醫學院的維克多 · 安布羅斯(Victor Ambros)和麻省總醫院的加里 · 魯夫昆(Gary Ruvkun)因發現微小RNA(miRNA)及其在“轉錄后基因調控”中的作用而共同獲獎。微小RNA是一類僅由20~24個核苷酸組成的小分子非編碼RNA,在細胞的運作中發揮關鍵作用。
每個人體細胞的細胞核內都有一套完整指令用于創建人體,那就是基因組。生物學的一個重要問題是,同一套基因和指令怎樣導致身體產生從肌肉細胞到肝細胞各種不同類型的細胞。答案是,并非細胞核內所有基因都會轉化為蛋白質。不同類型的細胞遵循自己的發育途徑,只選用與自己生長發育相關的遺傳指令。而能在一定程度上控制它們的選擇的,正是由安布羅斯和魯夫昆發現的微小RNA分子。
微小RNA主要通過與細胞內另一種分子的靶標部分結合來發揮作用,它就是信使RNA(mRNA)——負責將信息從基因組的DNA傳遞到細胞內的蛋白質制造工廠 。通過干擾mRNA,miRNA可以改變或阻止蛋白質的產生。值得一提的是,2023年諾貝爾生理學或醫學獎授予了mRNA疫苗領域的兩位先驅。
微小RNA首次發現于1993年,現已知人類基因組中有超過1000種這樣的小分子。它們的生物學影響不可謂不深遠:微小RNA分子的調節異常可能導致癌癥和癲癇;編碼miRNA分子的基因突變會引發先天性聽力喪失等疾病,并被認為與許多眼部疾病的病理有關,例如白內障、青光眼和黃斑變性;此外,miRNA分子似乎也是許多骨骼疾病的一大成因,如骨質疏松癥、骨肉瘤和骨轉移等。
1980年代末,安布羅斯和魯夫昆在麻省理工學院的同一實驗室工作,并利用生物學研究中的關鍵工具秀麗隱桿線蟲(Caenorhabditis elegans)發現了miRNA分子。他們當時正研究秀麗隱桿線蟲的兩種突變株,這些株系的基因存在缺陷,而線蟲的發育和工作方式又由基因決定。二人觀察到,一種名為lin-4的基因會產生一種異常短小的RNA分子,該分子不編碼任何蛋白質,而且似乎能抑制另一個基因的活性。
瑞典卡羅林斯卡醫學院的諾貝爾委員會在揭曉獲獎名單時指出,當科學家發表他們的研究成果時,他們遭遇了“來自科學界的幾乎震耳欲聾的沉默”。人們起初認為秀麗隱桿線蟲體內這種不尋常的基因調控機制是該生物所特有的一種特性,與人類或其他更復雜的生物無關。但這種觀點后來發生了轉變,因為大家發現,編碼miRNA的基因遍布整個動物界。
丹麥制藥巨頭諾和諾德是嘗試利用miRNA制造藥物的公司之一。2024年,他們收購了德國生物制藥企業Cardior,后者研發的miR-132反義抑制劑CDR132L能阻斷特定miRNA,有望幫助患慢性心力衰竭和心臟肥大(心壁增厚和變硬)的病人。
追諾路萬條
對于世界各地越來越多依靠人工智能進行研究的科學家來說,2024年諾貝爾獎傳遞了有趣的信號——或許他們有一天也能獲得科學界最高獎項。江珀表示:“我希望我們未來將會迎來許多乘勢AI的不可思議的科學突破。”
資料來源 The Economist