


科學智能(AI for Science,AI4S)是當前人工智能(AI)應用發展的一個重點方向。2024年4月29日,美國總統科學技術顧問委員會(PCAST)組織美國領域內權威專家,發布了《賦能研究:利用人工智能應對全球挑戰》報告(本文簡稱《報告》)。該報告提出AI4S發展的“三角”模型,詳細分析了AI4S的發展潛力、重點領域和面臨的挑戰,并為美國總統提供了清晰的建議。
《報告》是美國總統《關于安全、可靠和可信地開發和使用人工智能的行政令》中的一項研究任務。美國白宮圍繞人工智能發展的重點方向,不定期發布重要文件,包括:《人工智能權利法案藍圖:讓自動化系統服務于美國人民》 《美國國家人工智能研發戰略計劃》《關于安全、可靠和可信地開發和使用人工智能的行政令》?!秷蟾妗纷鳛椤蛾P于安全、可靠且可信賴的開發和使用人工智能的行政令》的指定任務,在美國的人工智能政策文件中占有重要地位。
《報告》是首份呈送美國總統的AI4S專案報告。美國能源部、國防部、衛生與公眾服務部等部門近年來已陸續發布本領域的AI4S報告。PCAST作為總統最高級別的科學政策顧問團,《報告》內容統籌協調了各部門的研究成果和政策建議,從更宏觀、更綜合的角度對AI4S的發展機遇和挑戰做出了回應。
《報告》預計將成為未來美國AI4S政策的基本依據。依據《關于安全、可靠和可信地開發和使用人工智能的行政令》中的要求,《報告》立足于解決重大的全球挑戰,解決當前科學研究過程中人工智能技術的應用障礙?!秷蟾妗返某雠_,為美國總統提供了新的科研組織模式和科研流程規范建議,將為美國政府在AI4S領域的下一步決策提供有力支撐。
《報告》的基本內容
《報告》的主體內容包括三部分,即AI4S的發展邏輯、發展方向和面臨挑戰。
AI4S發展邏輯——AI4S發展“三角”模型 "《報告》提出人工智能支持科學發展的三大關鍵要素:提升能力、共享資源和規范制度。三大要素在AI4S領域形成了一個互相作用、互相促進的良性循環,為科學研究的快速發展提供了強有力的支持。
“提升能力”,指科學家使用人工智能提升科研能力與效率??茖W家基于AI4S產生的創新成果能夠進一步促進“AI的資源共享”和“科研活動的規范”。
“共享資源”,指分享算力、數據、模型等AI4S基礎資源。推動AI4S資源的廣泛使用,一方面能加快“規范科研活動”的普及速度,同時也能助力更多科研團隊“提升能力”,提升整體科研水平。
“規范制度”,指科研全流程負責任使用人工智能工具。規范科研活動,有助于保證“AI資源共享”的質量,也在“提升科學家能力”過程中加速高質量成果產出。
提升能力、共享資源和規范制度的三角模型
“三角”模型解析了AI4S范式中的技術要素,以及三要素在提升科研效率中的協同作用,為評判AI4S科研工作流程提供了基礎的分析框架。
基于三角模型,AI4S的發展前景(如表1)主要分為三方面:一是科研能力提升,AI能夠協助科學家決策、處理日常任務、自動化實驗流程、承擔高通量計算模擬、分析復雜數據等任務;二是基礎資源共享,多模態科學模型能夠進行學科融合、降低科研成本、促進科研機構合作、使AI4S大科學計劃成為可能;三是規范科研制度,AI4S需要負責任的科研制度,這些科研制度將整合到科研工作全流程中。
AI4S發展方向:七大核心領域布局 "目前來看,AI并非在所有的科學領域都能夠高效應用?!秷蟾妗肪C合評估AI4S對社會經濟發展、公共安全、環境保護等關鍵領域的深遠影響,確定了七大核心領域。在生命科學領域推動疾病治療進展,在氣象科學領域減輕極端天氣事件的影響,在物理學和宇宙學領域探索新的規律,在集成電路領域增強半導體自動化設計能力,在材料科學研究領域開發超導體技術,在農業和藥物設計領域創新應用,以及在社會科學領域利用數據驅動政策制定。雖然AI4S能夠發揮作用的領域不僅限于此七大領域,但是《報告》撰寫組認為,這七個領域的科學研究與AI4S范式適配度高,在應對社會與全球挑戰方面具有先發優勢,預計可獲得較大收益。
AI4S面臨挑戰與行動建議 "《報告》深入調研美國AI4S科研現狀,提出當前發展階段面臨的挑戰,并給出相應行動建議。
鑒于表2中面臨的挑戰,《報告》提出了5條建議,其中2條是關于資源共享,2條關于制度規范,1條關于能力提升。
資源共享方面,《報告》考察了當前美國國會主導的國家人工智能研究資源(NAIRR)項目,該項目在2023至2025年期間的預算高達24億美元,涉及多個政府機構,如國防部高級研究計劃局(DARPA)、美國宇航局(NASA)等共同為獲批研究項目分享計算資源、內部AI模型和數據集?!秷蟾妗窂娬{,為了支持尖端研究,需要高質量數據和最先進的AI模型。因此,該報告建議在NAIRR的基礎上,一是擴大共享人工智能模型評測基準和計算資源,二是進一步對研究項目開放聯邦數據集,以促進科研創新和進步。
規范制度方面,《報告》指出,人工智能系統在缺乏適當基準指標、驗證程序和負責任使用的情況下,可能產生不可靠的輸出結果,對科學領域造成潛在危害。為此,《報告》建議:一是制定評估AI模型準確性、可重復性和可解釋性的標準,并開發識別數據偏見以及區分合成數據與真實數據的工具;二是在科研全階段采用負責任、透明和可信的AI使用原則,以管理潛在風險。
提升科學家研究能力方面,《報告》強調應新增相關科研項目,激勵科研人員完善AI4S的科研基礎設施。建議將科學數據標注、科學模型訓練等關鍵環節納入科研基金項目支持范圍,以激勵科研人員積極參與AI4S模型配套系統設施的開發研究工作。
借鑒與建議
面對AI4S領域的廣泛應用,“三角”模型可以作為發展的基本思路參考。“三角”模型強調在關鍵研究領域進行戰略布局,促進新興科研項目的培育,并以優化的科研管理體系為基石,旨在全面提升科研活動的效率。
為了進一步提高國家科研的整體實力,AI4S的研究布局可參考《報告》中提出的七大優先發展領域。各省市可依托本地產業基礎,有的放矢地推進AI4S的研究與應用。以上海市為例,其戰略舉措包括但不限于:首先,在生物醫藥領域,致力于新藥創制、基因研究、生物育種等前沿課題的探索;其次,在新材料領域,開展量子材料、超導材料、熱電材料、軟材料等創新材料的開發、性能預測以及合成路徑的設計研究。
在AI4S項目指南方面,增加AI相關基礎建設項目。在科研基金項目的支持范圍中,建議增加專門針對AI4S基礎建設的研究項目。一是將科學數據標注和科學模型訓練等關鍵活動納入科研基金項目的資助范圍。二是研究評估科學模型的基準數據集,以建立評估和比較不同AI4S模型性能的標準化方法。
在AI4S制度建設方面,健全智能科研管理體系。在科研管理規范方面,需要根據AI4S范式特征進行相應調整。一是在科研項目規則要求中實施全流程管控,以提升科研工作的效率,并防止人工智能輔助過程中可能出現的錯誤。二是應確保AI4S科研實踐符合倫理標準與安全要求,以促進科研的可持續發展。
在AI4S資源共享方面,增加科研設施共享項目。建議參考NAIRR機制,在重點學科與研究方向設立AI4S科研設施共享項目。推動國家學科數據庫之間以及與其他數據庫進行科研數據、科研模型等資源共享。推動科研云平臺、算力云服務平臺、數字孿生軟件平臺等基礎設施加強聯合,以打破AI4S科研資源壁壘,保證AI4S科研數據成果安全集中,提升AI4S研究生態縱深。
————————
本文作者吳琪為上海市科學學研究所科技與社會研究室博士后、助理研究員;李輝為上海市科學學研究所科技與社會研究室副主任、研究員。