
摘要:當前,人工智能領域的科技研發與應用,取得了諸多驕人的成果。尤其是生成式人工智能工具的廣泛應用,使人工智能驅動的科學研究(AI for Science)范式成為現階段引領人工智能研究的一種全新科學范式——“第五范式”。對此,科技部和國家自然科學基金委員會正式啟動了“人工智能驅動的科學研究”專項部署工作,基于跨學科融合的AI for Science的研究紛紛呈現。本文從此角度切入,對AI for Science理論做了簡要概述,分析了跨學科融合的AI for Science多元化投入的現狀,并針對其中存在的問題,研究了跨學科融合的AI for Science多元化投入機制。以期通過本文的分析與研究,能夠為這種全新范式的成熟與應用提供參考與借鑒。
關鍵詞:跨學科融合;AI for Science;人工智能驅動的科學研究
引言
新時代背景下,AI for Science在數字化和自動化研究領域方面取得了斐然的成績,如對高維數據的探究、對復雜系統的解析以及深度學習技術等方面,都要遠超人類水平,在物理學和生命科學領域所發現的知識也逐步轉化為多項應用成果。可以說,基于跨學科融合的AI for Science不僅極大地推動了科研創新,更在引領技術進步的基礎上形成了通用性新范式模式。然而,對于AI for Science所進行的多元化投入方面,卻仍面臨多樣化的挑戰,若應對不善會使AI for Science的發展出現滯后性[1]。因此,對于“基于跨學科融合的AI for Science多元化投入機制”的研究具有極大的應用價值與現實意義。
1. AI for Science 理論概述
AI for Science即人工智能驅動的科學研究,被稱為科學發現的“第五范式”。其作為人工智能發展的前沿領域,包含合成數據、科學模型、科學研究閉環三項要素。與傳統的人工智能研究模式不同,AI for Science更趨向于跨學科領域的研究與應用,為跨學科的融合進行人工智能的賦能。
2. 跨學科融合AI for Science多元化投入現狀
2.1 資金分配不足
現階段,雖然我國致力于人工智能領域的科學研究與發展,但在各項科研資金的投入方面,仍然較為傾向于傳統科研領域。
一方面,基礎研究資金極為有限。在進行AI for Science項目時,通常需要數量龐大的算力與數據等作為支撐,這些無論是從獲取還是維護角度,所需的資金數額都是巨大的。現階段,在科研資金的分配上,更傾向于已經投入應用且有不錯前景的科學領域。作為新興的跨學科融合領域,AI for Science在現有科研資金的分配上并不占據優勢。
另一方面,AI for Science所涉及的跨學科融合,需要跨學科團隊之間進行協作[2],由此也需要為跨學科團隊之間的溝通交流與協作投入更多的資金。例如,建立跨學科的聯合實驗室、組織各學科交流與研討的會議活動等,都需要大量資金支持。此外,AI for Science作為新興科研范式,其項目科研周期相對較長,科研成果的未知性較大,且未必會在短期內得到收益,也導致此方面的資金分配不足。
2.2 人才短缺及跨學科能力培養欠缺
首先,復合型人才短缺。對于AI for Science領域而言,所需要的人才不僅要精通人工智能技術,還要兼備較為深厚的科學背景與底蘊,在對AI for Science未能達到研究深度的階段,這類人才極為緊缺。這就需要專業人才的多學科涉獵與深度學習,而這無疑需要花費相對較長的培養時間。中國勞動和社會保障科學研究院發布的《中國人工智能人才發展報告(2022)》指出,我國人工智能人才存量數約為94.88萬人,其中本科占68.2%,碩士占9.3%,博士僅占0.1%??梢?,高學歷復合型人才更為稀少[3]。
其次,培養模式差異。據新京報報道,當前,我國已有498所高校開設了“人工智能”本科專業,209所高校成功備案或申報“智能科學與技術”本科專業,在一定程度上表明了AI專業呈現出的大爆發趨勢[4]。通過對我國高校進行調研后發現,現階段我國高校所采用的人才培養模式主要有三種,分別為“原有專業+人工智能專業培養”“新增人工智能專業培養”“重組原有專業+人工智能學院培養”。但在人才培養過程中發現,這些培養方式不僅缺少科研的領軍人才,更缺少針對人才培養的課程建設經驗。部分高校教師表示,人工智能技術專業需要大量的實踐教學,但大多數高校所能給予的數據算力不足以支撐大規模的教學與訓練需求,導致相應的跨學科復合型人才缺乏。
2.3 數據共享缺乏安全性
在跨學科AI for Science項目中,往往會涉及多種形式的數據隱私保護情況。例如,生物醫學、健康科學等學科領域,在進行人工智能融合研究時,會面對用戶的個人身份或健康狀況等隱私信息,若對此類數據信息進行共享,則很有可能會導致個人隱私泄露。因此,在保護個人隱私安全性的同時實現數據共享,將成為跨學科融合中的一大難題??鐚W科融合的AI for Science作為全新的研究范式,所產生的各類科研數據不僅具有創新性,更具有巨大的商業價值,因而此類科研數據大多涉及知識產權問題。如何在確保知識產權的基礎上,使所共享的數據信息仍具有創新性和商業價值,也成為跨學科融合的重要問題。
2.4 技術成熟度偏低
現階段,AI for Science技術尚處于發展階段,雖然發展速度不斷加快,但技術的成熟度仍然偏低。
一方面,AI for Science不再是單一學科研究領域的問題,而是多學科、跨學科相融合的全新研究領域,因而對復合型人才及交叉領域人才有極大的需求量。加之AI for Science在算力與數據等方面存在挑戰,如數據的精準性、數據模型構建的可解釋性、計算資源等方面,都缺少極為成熟的技術作為支撐。
另一方面,針對AI for Science所實施的體系化布局尚不完善,雖然在一些基礎科學領域中人工智能應用愈發廣泛,但在數據的生成、標注、選擇等方面,仍有待精化,由此也導致跨學科的AI for Science技術存在成熟度偏低的問題。除此之外,人工智能的可解釋性也是眾多科技人才不斷探索并力求提高技術成熟度的目標之一。
3. 跨學科融合的AI for Science多元化投入機制完善措施
3.1 建立專項基金,優化資金分配
針對AI for Science多元化投入資金分配不足的現狀,可通過建立專項基金與優化資金分配來予以改善。2023年3月,為貫徹落實《新一代人工智能發展規劃》,科技部會同國家自然科學基金委員會,啟動了“人工智能驅動的科學研究”專項部署工作。其中明確指出,“將推進面向重大科學問題的人工智能模型和算法創新,發展一批針對典型科研領域的‘人工智能驅動的科學研究’專用平臺,加快推動國家新一代人工智能公共版圖開放創新平臺建設,支持高性能計算中心與智算中心異構融合發展”[5]。基于此現狀,AI for Science多元化投入資金問題,可借鑒一些?。ㄗ灾螀^、直轄市)的AI for Science領域發展措施,建立專項基金。例如,2021年,上海市科學技術委員會首次推出“基礎研究特區”制度,分別在復旦大學、上海交通大學、中國科學院上海分院設立“特區”,并以5年為一個周期,每年為這些“特區”投入2000萬元,致力于交叉融合領域的科學探索[6]。除此之外,仍須實施多項步驟予以完善,如依照國家的戰略發展方向和前沿科技研發趨勢,明確AI for Science專項基金的研究領域及目標。在此基礎上,制定與之配套的資金管理與分配機制,以此確保AI for Science專項基金能夠應用于相關跨學科領域技術的研發[7]。同時,聘用人工智能領域專家建立專項基金專家委員會,對專項基金的應用進行公開與透明的評審與監督。這種專項基金將使AI for Science項目專款專用,形成更為公平、公正化的項目評估與資金分配體系。
3.2 跨學科教育+產學研合作
為改善跨學科融合的AI for Science投入問題,可通過加強高校跨學科教育及培養,并采用產、學、研合作模式予以解決。對此,高校除設立人工智能技術專業外,還應針對AI for Science的實踐應用特征,開設多樣化的跨學科課程,使人工智能與多種科學領域進行交互、交叉與融合。針對高校人才培養方向的不同,可在結合自身學科優勢的基礎上,構建與AI for Science相匹配的人工智能課程體系。針對AI for Science跨學科領域的關鍵性核心技術,實施有針對性的高端人才培養計劃。在此基礎上,還應加強高校人工智能方面的基礎設施建設與交叉微專業構建,以此提升并優化高校在人工智能方面的算力資源,并分配好智能算力和通用算力之間的配比。
在產學研合作方面,要強化政府職能部門、高校、企業之間的溝通與交流[8]。一方面,建立針對人工智能人才培養目標的引導機制與互動機制。高校和企業進行人工智能技術專業課程的協同開發,并在合作企業內設立實訓基地。高校與企業通過工學交替、定向培養等方式,為企業產業鏈的細分環節輸送專業性人工智能技術人才。另一方面,應由政府職能部門牽頭,建設一批適用于高校與企業的人工智能產教融合創新實驗室,將企業較為成熟的人才培養模式納入高??鐚W科教育和產學研合作模式,為完善AI for Science的多元化投入機制奠定人才基礎。
3.3 構建數據共享平臺,加強數據保護
跨學科融合AI for Science的數據共享安全問題,是全社會乃至全世界共同面臨的問題。為此,需要政府職能部門與科研機構共同構建可供數據共享的平臺。
一方面,加強數據安全和對個人隱私的保護。通過制定數據使用規范,利用數據加密技術、匿名處理技術等,保障共享數據的安全性,并確保個人隱私不會因數據共享而泄露。
另一方面,要促進共享數據的開放程度與利用率。d936caae71244a503ce7ec98328e6bbb例如,對于達到準入標準而進入共享平臺的用戶,可通過分享數據信息來增加信用等級,當信用等級提升后,可查閱和應用開放程度更低、保密等級更高的數據信息,在增加共享數據信息利用率的同時,也能形成數據共享的良性循環。
3.4 加強技術研發,構建轉化平臺
一方面,加強技術研發。這是為AI for Science提供可解釋性的重要途徑之一。針對現階段跨學科AI技術研發的不成熟性,可從系統工程角度入手,對跨學科資源加以整合與優化,使之形成可協同、可創新的“學科生態系統”。例如,2023年10月第六期CCF秀湖會議,就針對AI for Science提出了跨學科交流平臺的構建意向,并提出要通過量子計算模擬器的開發,解決傳統計算平臺不足以支撐大規模算力的問題,如構建“量子計算云平臺”等,解決當前GPU算力受限問題[9]。
另一方面,搭建針對跨學科的技術轉化平臺。該平臺通過對AI+Science的整合,為科學研究提供多種形式的功能,如數據處理、模型訓練、學科融合前景、技術完善與應用等,以此促進科學發現與技術創新[10]。
結語
AI for Science正處于快速發展階段,也正在致力于打破學科壁壘,形成一種全新的科學研究范式。未來,AI for Science將通過某一模型解決不同科學領域中的眾多難題,也能通過一種更為普及化的科學探究范式,使人們都可以參與科學發展研究。對于現階段跨學科融合的AI for Science在多元化投入機制中存在的問題,也必將隨著AI for Science的深度研發而尋求到更科學的解決對策。
參考文獻:
[1]劉夢迪,李倫.劃分科學研究范式的另一種視角——從AI for Science談起[EB/OL].(2024-07-01)[2024-08-08].https://doi.org/10.16192/j.cnki.1003-2053. 20240628.004.
[2]高杲.AIforScience人工智能的風終于吹到了科學界[N].四川日報,2024-05-28(9).
[3]張曉靜.加強人才培養,推動AI產業發展[EB/OL].(2023-05-15)[2024-08-08].http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2023-05/15/content_553196.htm.
[4]叢林.高校開設人工智能專業不宜大干快上|新京報快評[EB/OL].(2024-06-27)[2024-08-08].https://www.163.com/dy/article/J5NNNIV10512D1R0.html.
[5]宋晨.科技部啟動“人工智能驅動的科學研究”專項部署工作[EB/OL].(2023-03-27)[2024-08-08].https://cj.sina.com.cn/articles/view/1699432410/654b47da0200132t6.
[6]吳振東.復旦大學:在創新的源頭“種好自己的樹”[EB/OL].(2024-08-23)[2024-08-28].http://www.news.cn/local/20240823/1286eb19b0f746ce8798a205021e5ff3/c.html.
[7]李建會,楊寧.AI for Science:科學研究范式的新革命[J].廣東社會科學,2023(6):81-92,289-290.
[8]周江林.AI4S對我國高?;A研究的影響機理及實踐邊界[J].教育發展研究,2023,43(21):31-38.
[9]范昕茹.探索AI for Science“復旦范式”[N].IT時報,2023-07-07(3).
[10]楊小康,許巖巖,陳露,等.AI for Science:智能化科學設施變革基礎研究[J].中國科學院院刊,2024,39(1):59-69.
作者簡介:陸會會,碩士研究生,研究實習員,luhuihui@shu.edu.cn,研究方向:管理學;趙志華,碩士研究生,講師,研究方向:美術史;彭亞新,博士研究生,教授,研究方向:人工智能驅動的科學研究(AI for Science)。