

2024年的諾貝爾物理學獎和化學獎有一個共同的特點,都青睞人工智能(AI)。物理學獎頒給了美國新澤西州普林斯頓大學的約翰-霍普菲爾德和加拿大多倫多大學的杰弗里-辛頓,以表彰他們利用人工神經網絡實現機器學習的基礎發現和發明。化學獎授予3位科學家,其中一半授予美國華盛頓大學的戴維-貝克,以表彰他在蛋白質設計方面的貢獻;另一半則共同授予英國倫敦谷歌旗下人工智能公司“深層思維”的德米斯-哈薩比斯和約翰·江珀,以表彰他們在蛋白質結構預測方面的貢獻。
概括地講,就是霍普菲爾德模擬人腦神經網絡發明了一個人工神經網絡,辛頓發明了人工神經網絡的訓練算法,貝克利用AI軟件設計出全新的蛋白質,哈薩比斯和江珀利用人工神經網絡快速而準確地預測蛋白質結構。
物理學獎頒給了AI科學家
20世紀80年代,霍普菲爾德研發了一個人工智能網絡,它相當于物理學中自旋系統中的能量,并通過查找節點之間的連接值進行訓練,而節點就相當于像素。當這個網絡收到失真或不完整的圖像時,會有條不紊地通過節點并更新它們的值。因此,網絡能逐步工作以找到與它所傳送的不完美圖像最相似的已保存圖像。
辛頓則利用霍普菲爾德的網絡來使用物理工具,如使用玻爾茲曼機,由此可以學習識別給定數據類型中的特征元素。辛頓通過向機器提供規范示例來訓練機器,而玻爾茲曼機可用于對圖像進行分類或創建訓練它的模式類型。辛頓以這項工作為基礎,幫助啟動了當前機器學習突飛猛進的發展。
人工智能有三大基石,分別是數據、算力、算法。物理研究包括理論推導和實驗,后者也要用計算機模擬。機器學習,即深度學習,其實是一種算法,本質上是數學領域的問題。如果數據充足,就可以搭建一個神經網絡,然后通過訓練神經網絡模型(機器學習)找到數據之間隱藏的規律。
辛頓開啟和奠定了算法基礎,包括證明反向傳播算法、發明玻爾茲曼機、改進卷積神經網絡。由于研發了深度卷積神經網絡,他被譽為“深度學習教父”。深度卷積神經網絡直接促使了AI識圖功能的大爆發,現在被廣泛應用的人臉識別技術正來源于此。
同時,人們熟知的大型語言模型(LLM)就是基于大量數據進行預訓練的超大型深度學習模型。它的底層轉換器是一組神經網絡,這些神經網絡由具有自注意力功能的編碼器和解碼器組成。編碼器和解碼器從一系列文本中提取含義,并理解其中的單詞和短語之間的關系,以及語法。OpenAI的GPT系列就是大語言模型的典型代表。
因此,人工神經網絡和深度學習并非只用于數據處理,而是有廣泛的用途,相當于擴大了數億人的大腦功能,可以進行歸納和推理,幫助人作出正確的決策。這也是為何2024年諾貝爾物理學獎授予這一基礎發現和發明的原因。
化學獎也和人工智能有關
在2024年諾貝爾化學獎方面,貝克研發的計算機化的方法實現了許多人認為的不可能的事情——創造了以前不存在的蛋白質;哈薩比斯和江珀則利用人工智能成功解決了化學家50多年來一直在努力解決的問題——根據氨基酸序列預測蛋白質的三維結構。
2003年,貝克成功地使用人工智能模型羅塞塔(Rosetta)設計了一種不同于任何其他蛋白質的新蛋白質。這個發現的重要意義在于:人類可以設計和創造蛋白質,包括無數種藥物、疫苗,以及作為納米材料和微型傳感器的蛋白質。
哈薩比斯和江珀則專注于蛋白質結構的預測。在蛋白質中,氨基酸以長鏈的形式連接在一起,這些長鏈折疊形成三維結構,這對蛋白質的功能起決定性作用。20世紀70年代以來,研究人員一直試圖從氨基酸序列中預測蛋白質的結構,但這似乎難于上青天。尤其是蛋白質折疊,被視為難上加難。以前,研究人員只能用實驗方法去測定蛋白質的三維構型,而這需要大量的人力、物力和時間,需要復雜的儀器與專家級專業人員。然而,2000年,哈薩比斯和江珀推出了一個石破天驚的模型,它名為“阿爾法折疊-2”,對蛋白質結構的預測準確率達到90%。
阿爾法折疊能從蛋白質的一級結構,即氨基酸的排列序列來預測蛋白質的二級結構,即蛋白質分子中某一段肽鏈的局部空間結構,進而預測蛋白質的三級結構,即在二級結構的基礎上多段進一步折疊盤繞后形成的特定空間結構,以及預測蛋白質的四級結構,即蛋白質一蛋白質復合形成的結構,這是更為復雜的生物大分子。有了阿爾法折疊及其開放的源代碼,研究人員可以立體和全方位地分析所有蛋白質的結構。
當AI助力或者本身就融于物理學和化學之時,物理學和化學都有可能成為真正的“理綜”,未來的諾貝爾物理學獎和化學獎也有可能會融合為諾貝爾科學獎。