陸偉,馬永強,劉家偉,楊金慶,程齊凱
(1. 武漢大學信息管理學院,武漢 430072;2. 武漢大學信息檢索與知識挖掘研究所,武漢 430072;3. 華中師范大學信息管理學院,武漢 430079)
2022年年末,OpenAI發布的ChatGPT[1]在人機對話、文本生成等方面展現出令人驚艷的性能,讓人們看到了人工智能大模型在賦能科研創新方面的巨大潛力[2-4]。以大數據、人工智能為代表的數智技術作為一種新的生產力正被廣泛地應用于科學和工程等領域[5-6]。2023年3月27日,科技部啟動了“人工智能驅動的科學研究”(AI for Science)專項部署工作[7]。以大模型為主要特征的數智技術對資源獲取、組織開發、傳遞利用、存儲檢索等信息資源管理學科核心任務[8]和文獻情報工作[9]都具有重要的影響。
ChatGPT系列模型的升級過程,正是面向大規模數據的知識獲取能力不斷提升的過程??蒲袆撔率且豁椫R密集型的活動,高質量、高密度的知識輸入是科研創新得以開展的基礎,并且貫穿了科研創新的全過程。從供給側來看,雖然科技信息資源管理與知識服務能夠為科研創新提供較為準確的信息以及常規知識聚合服務,但是仍未能與科研創新活動形成深度嵌入。從需求側來看,為了獲得支撐科研活動開展的信息和知識,在科研創新過程中的各個環節,科研人員面臨著信息處理能力和認知能力有限等挑戰。然而,如何為科研人員提供個性化、細粒度、場景化的知識仍未得到有效解決。為此,現有科技信息資源管理理論方法、技術手段和服務模式亟須推進“供給側改革”。本文認為,以嵌入科研創新活動的形式,使用數智技術為科研人員提供創新輔助服務,面向文獻閱讀與梳理、科研問題發現和假設構建、實驗設計與驗證和論文撰寫等主要環節,為科研人員提供個性化、細粒度、場景化的知識,實現對科研創新活動的賦能。
當前,已有研究人員試圖將大數據與人工智能技術應用于科研創新場景,以解決科學研究中的現實問題。例如,基于大數據和自然語言處理技術對科技信息資源進行全面評價[10-11]、細粒度理解[12-14]和提供知識服務[15-16]。其中,面向科研活動的人工智能模型開發通常是基于分治的思想,即模型僅僅面向特定的任務,如論文摘要自動生成[12]、引用意圖識別[14]、論文版式識別[17]等;面向單個學科,如面向生物醫學和計算機科學領域的SciBERT[18]、面向化學領域的ChemBERT[19]和面向生物學領域BioGPT[20]。然而,創新活動實際上包含一系列的過程,是一項系統性的工作。單靠某一個人工智能模型并不能有效解決科研人員創新活動中遇到的復雜問題。因此,本文基于數智時代科研活動的新特點,總結了數智時代科研人員面臨的信息處理能力不足、認知能力有限等挑戰,針對數智時代科研活動的新特點和科研人員面臨的新挑戰,提出了基于數智技術的創新輔助框架,并進一步闡述了其功能定位、服務模式和在科研創新全過程中的關鍵賦能路徑。
科研人員是科研創新活動的主體??蒲腥藛T先通過閱讀科學文獻獲取相關的觀點和事實等信息,以從中獲得需要的知識;然后,通過相關儀器設備發現新的事實,從而得到新規律、新發現;最后,科研人員對新規律、新發現進行分析和綜合,形成科學成果,以學術論文、專利的形式進行發表。通過上述過程的不斷循環,新知識得以源源不斷地產生,具體過程如圖1所示。知識生產的循環過程中伴隨著新的科技信息資源的生成,這些資源可以作為數智時代人工智能大模型的知識源泉,實現對人工智能大模型的增強。

圖1 數智時代科技信息資源管理和科研創新變革
在大數據背景下,科學交流系統也發生了新的變化。其中,科學知識的載體形式更加多樣,交流渠道也更趨多元。借助社交媒體等工具,科學交流系統中的科研人員之間的信息流動速度更快[21]。依托互聯網平臺(如社交媒體、預印本網站、問答社區等)、在線會議工具(如Zoom、騰訊會議等),科研人員可以更加高效、快捷地獲取領域前沿的信息。同時,科學需要解決的問題也更加復雜,學科間交流合作更加頻繁。人工智能技術作為一種新的生產力工具,也越來越多地參與到科研創新活動中,例如,使用scite.ai、LitMaps進行文獻發現,使用AlphaFold進行蛋白質3D結構預測等。科研人員在獲得便利的同時,也面臨著信息處理能力不足和認知能力有限等問題。
面對數智時代科研活動發生的新變化和科研人員面臨的新挑戰,現有科技信息資源管理理論方法、技術手段和服務模式同樣面臨變革。在理論方法方面,傳統的“數據-信息-知識-情報”信息鏈轉變為創新嵌入的信息鏈。借助于大數據、人工智能等數智技術,數據與知識、數據與情報、信息與情報之間的跨越式轉換成為可能。在技術手段方面,現有的大型預訓練語言模型(如對話語言模型ChatGPT)展現了強大的信息加工、薈萃、整合和生成能力。對話式人工智能大模型可以為用戶提供比傳統的搜索引擎、推薦系統更加自然的交互方式,實現由“檢索+推薦”到“感知+檢索+推薦+生成”的技術范式轉變[22]。在服務模式方面,現有的以信息為中心的服務模式轉變為面向創新過程的創新服務,包括創新感知、創新嵌入和創新輔助等。
科學創新活動可以視為一種知識生產活動[23-24]。作為一種創造性的思維活動,科學知識生產的最初動力源于社會發展中人們所提出的各種各樣的問題,當前科研創新越來越多地與問題情境緊密結合,數智技術也越來越多地與其他學科進行深度嵌入。此外,為了解決復雜問題,各學科之間從各自獨立發展走向跨學科合作。
1.2.1 知識生產與問題情境緊密結合
問題情境是科研創新的切入點。隨著科學的進步和所需解決問題復雜性的不斷增加,以知識生產為目的的科研創新活動與一連串的問題情境之間的互動也越來越密切[25]。為了更好地解決問題,科研人員首先需要深入了解和刻畫所面對的問題情境,然后才能更好地確定研究方向,發現解決問題的途徑。在問題情境的驅動下,科研人員需要探索和開發新的途徑和方法來解決問題。以分子合成問題為例,傳統“試錯式”的研究模式存在周期長、成本高的問題。為此,研究人員嘗試使用人工智能技術實現化學合成路線自動化設計[26],以提升分子合成路線設計的效率。
1.2.2 數智技術與科研創新活動深度嵌入
數智技術作為一種新的生產力,越來越多地與科研創新活動進行深度結合與嵌入。一方面,數智技術越來越多地被用于解決具體的科學問題。例如,基于主動學習的量子實驗設計[27]、蛋白質結構預測模型AlphaFold[28]、基于AI(Artificial Intelli‐gence)的天氣和氣候基礎模型ClimaX[29]。另一方面,數智技術作為一種新的科研創新輔助工具,越來越多地被嵌入科研創新全過程的某些任務場景中。例如,Auer等[30]構建了開放研究知識圖譜,用于對解決特定研究任務的最新技術進行簡要概述;Pankratius等[31]和Pyzer-Knapp等[32]相繼對計算機輔助自動科學發現和人工智能輔助新材料發現進行了探索。
1.2.3 智能技術推動多學科合作走向深入
在產業界,企業之間通過專業化協作來共同完成產品的生產。作為一種知識生產活動,科研創新活動中學科之間的合作也廣泛存在,例如,化學學科的科研成果已經逐漸滲透到生物學,形成了化學生物學。打破了學科藩籬,促進了學科交叉,實現不同學科間科研人員的深度合作成為加快科技創新的關鍵。以解決科學問題、社會問題為中心的多學科合作,成為推動基礎研究、應用研究等各個領域發展的主要動力。2020年,國際純粹與應用化學聯合會(International Union of Pure and Applied Chemis‐try,IUPAC)將人工智能納入了“2020年化學領域十大新興技術”(Top Ten Emerging Technologies in Chemistry)[33],人工智能技術和化學研究的跨學科合作變得越來越緊密。
以問題解決為導向的科研活動可以視為一種認知的過程。為了解決設定的問題,需要問題解決者(即科研人員)運用并重組已有的信息、知識,朝著問題的目標狀態進行認知操作和運行。然而,在處理科研創新過程中的復雜任務時,科研人員自身能力也存在著諸多不足,主要表現在記憶能力、信息編碼能力和信息存儲能力等方面。上述諸多不足可以分為兩大方面:一是信息加工處理能力不足,無法有效應對任務環境中快速增加的信息;二是認知能力受限,無法以并行的方式解決復雜的科學問題。
1.3.1 信息加工處理能力不足
隨著數字基礎設施的發展,科學交流系統中的信息和知識載體已經從單一的紙質形式,擴展到了紙質和數字形式。科技信息檢索工具,如谷歌學術,可以幫助科研人員找到相關的文獻,但是檢索到的文獻并不能直接向科研人員提供其所需的知識。因此,科研人員需要花費時間來人工閱讀文獻,以獲取需要的知識。單就學術論文而言,其年發文量增長速率正在逐年上升,同時預印本網站上的論文數量也呈指數增長。面對不斷增加的文獻,科研人員只能通過逐篇閱讀的方式從大量的學術文獻中獲取所需的信息和知識。然而,有研究表明,科研人員每年閱讀的論文數量趨于平穩,平均每年只有250篇左右[34-35]。本文認為,“急劇增長的科技信息資源規模與科研人員有限的信息加工處理能力的矛盾”是阻礙科研效率提升的關鍵因素之一。
1.3.2 認知能力受限
認知是指人們獲得知識或應用知識的過程,包含感覺、知覺、記憶、思維、想象和語言等。在科研創新活動中,科研人員通過自身的認知能力來發現、理解和解決問題,這些活動包括文獻閱讀與梳理、科研問題發現和假設構建、實驗設計與驗證和論文撰寫等。傳統的科學研究主要是基于“假設構建-實驗驗證”的模式,其本質上是一種不斷試錯的方法。這種方法不僅依賴于科研人員的個人經驗,而且需要花費大量的時間進行驗證??茖W研究是一個在科學知識空間中進行搜索的過程[31,36],其中科學知識空間包括了理論空間、概念空間、實驗空間和設備空間等。即使在狹窄的領域內,也有巨大的潛在方向可供探索。受限于人類大腦有限的認知能力[5],科研人員只能處理科學知識空間中的小部分。此外,科研人員在科學知識空間中進行搜索的過程,也會受到自身認知偏見的影響[37]。
當前,面向科研創新的應用和服務通常是面向創新全過程中的單個任務,應用服務之間缺乏聯動協調,形成了一個個數據孤島。這阻礙了科研活動中知識的有效循環和流動。為此,基于人工智能大模型,本文構建了一個面向科研創新活動的創新輔助框架(圖2)。該框架可以推動科技信息資源管理與知識服務向智能化轉型。針對當前科研人員所面臨的信息加工處理能力不足和認知能力受限的問題,本節首先闡述了創新輔助框架在科研創新中的定位,即作為智能知識轉換器、智能科研助理和智能服務平臺;其次,基于數智時代科技信息資源管理理論、技術與服務模式變革,提出了對話式的信息服務模式和基于API(application programming in‐terface)接口的插件式的智能服務模式,用于提升科研人員的信息加工處理能力和認知能力,從而更好地輔助科研人員開展科研活動;最后,針對科研創新活動的主要環節——文獻閱讀與梳理、科研問題發現和假設構建、實驗設計與驗證和論文撰寫,闡釋了數智時代創新輔助框架的賦能路徑。

圖2 基于人工智能大模型的創新輔助框架示意圖
Krenn等[38]指出,人工智能在科學研究中發揮作用的三個維度:①作為工具的人工智能;②作為靈感和概念來源的人工智能;③作為理解代理人的人工智能。本文提出的創新輔助框架在科研創新中的主要定位是:作為智能知識轉換器、作為智能科研助理和作為智能服務平臺。
2.1.1 作為智能知識轉換器
借助人工智能和大數據技術可以實現對大規模科技信息資源的高效利用,因而,數智技術具有提升科研活動中知識的流動速度的功能。傳統的科學研究范式中,科研人員需要花費大量的時間和精力來分析數據、閱讀和梳理文獻?;诖笠幠?萍夹畔①Y源、高性能計算和人工智能算法,構建面向科研創新活動的人工智能大模型成為可能。數智時代創新輔助服務可以基于學術文檔理解大模型和科學數據分析大模型等工具,實現數據與知識之間的快速轉換,從而彌補科研人員在信息加工處理能力和認知能力上的不足。
2.1.2 作為智能科研助理
數據-技術-人等之間的關系正在被重新定義[39],通過機器智能和人類智慧的深度結合,可以形成高效的人智協作(human-AI cooperation,HAIC)[40-41]科研創新模式,以實現對科研人員認知能力的增強。在科學數據的理解方面,人工智能如同一個“智能顯微鏡”,可以讓科研人員更好地理解復雜數據中隱含的關聯和模式。在研究結論的構建方面,依托人工智能算法對數據強大的分析和生成能力,基于數智技術的創新輔助服務,可以為科研人員提供對科學數據精確的分析和預測結果。在智能科研助理的輔助下,科研人員可以從依賴自身的先驗知識的研究模式,轉換到依托人工智能大模型進行研究的新模式,集中更多精力在機理機制的發現和分析上。
2.1.3 作為智能服務平臺
一方面,人工智能本身具有跨學科屬性[42],這使得人工智能的相關技術可以對其他學科產生影響,如物理、化學、材料和生物等領域。因此,基于人工智能技術的創新輔助服務天然地具有促進跨學科研究的功能。另一方面,當前大型語言模型可以出色地理解人類語言和完成人類指令[43-44]。因此,基于領域知識設計相應的指令,可以直接讓大模型生成指令對應的結果。這種以自然語言為信息交互媒介的使用方式極大地降低了大模型的使用門檻,使得不具有人工智能背景知識的用戶也可以快速掌握使用方法。因此,基于數智技術的創新輔助服務可以發揮智能技術服務平臺的作用,推動其他學科對智能技術的使用。
2.2.1 基于生成模型的對話式信息服務模式
在數智時代背景下,與微軟推出的新型檢索工具New Bing[45]思路類似,本文所構建的面向科研創新活動的創新輔助框架,突破了現有的“檢索+推薦”服務模式,轉換為“感知+檢索+推薦+生成”的模式[46]?;跀抵羌夹g的創新輔助框架能夠以更加自然的人機對話形式,為用戶提供其需要的知識。如圖3所示,智能助手針對用戶的問題,首先,自動調度和請求相關API接口,從互聯網資源和機構內資源中獲取相關文獻;其次,對獲取的文獻進行語義理解,得到用戶問題相關的資料片段;最后,借助人工智能大模型的信息整合和文本生成能力,為用戶提供其需要的答案?;诳蒲腥藛T提出的問題,智能助手就能夠從輸入的問題描述中理解真實的意圖,為科研人員提供其需要的知識。

圖3 數智時代創新輔助服務的服務模式示意圖
2.2.2 基于API接口的插件式智能服務模式
為了賦予大模型解決復雜任務的能力,OpenAI通過API接口將ChatGPT與外部應用(如Wolfram)進行連接[47]。類似地,本文所構建的面向科研創新活動的創新輔助框架,通過向科研人員和情報服務機構提供面向科技信息資源的大模型API,可以讓用戶便捷地調用相關服務。一方面,基于數智技術的創新輔助框架,能夠以插件的形式集成到其他的科技信息資源應用中,也可以與創新活動的具體環節進行嵌入,實現對創新全過程的賦能;另一方面,基于數智技術的創新輔助框架,作為一個智能中樞系統可以將復雜任務分解為簡單的子任務,其他垂直領域的應用和API接口可以作為子任務解決者,從而實現科研創新全過程中多樣化任務的解決。
從形式上看,科研創新活動主要分為兩種基本類型:①觀察和實驗;②思維[48]。這兩類活動都是對象性的。其中,科學家通過觀察具體的事物和現象,獲得相關的經驗和事實;通過思維活動構建相關理論和規律,形成科學知識;最終以學術論文的形式進行發表。從流程上看,科研創新活動則包括文獻閱讀與梳理、科研問題發現和假設構建、實驗設計與驗證和學術論文撰寫等主要環節。
2.3.1 文獻閱讀與梳理
閱讀文獻是科研人員獲取領域最新知識的關鍵途徑。科研人員的文獻閱讀過程是單線程的,因此,面對海量的學術文獻,科研人員面臨巨大的信息加工處理的負擔?;谌斯ぶ悄苣P偷膭撔螺o助框架需要具備對海量學術文獻進行批量化、并行化、細粒度的信息抽取、分析、歸納和總結能力。借助問答式檢索技術[15],數智時代創新輔助框架作為一個智能科研助手,能夠為科研人員提供獲取科技信息與知識的新途徑。通過創新輔助框架中的對話式信息服務模式,科研人員可以為自己的文獻閱讀需求添加上下文并與系統響應交互。在人機對話的過程中,智能科研助手可以為科研人員提供精細化、個性化的內容,幫助科研人員厘清自身的信息和知識需求。
2.3.2 科研問題發現和假設構建
科研選題包括研究問題的確定和假設的構建,是創新活動的關鍵環節??蒲羞x題對科研活動的成功與失敗具有決定性的影響。傳統的科研選題過程中,科研人員主要是基于自身的先驗知識和有限的領域知識,認知能力面臨巨大的負擔。本文提出的基于數智技術的創新輔助框架,通過構建面向學術文獻語義理解的大模型,能夠對海量科技信息資源進行分析,從而輔助科研人員更全面地了解本學科的研究空白和痛點、熱點;通過對科研人員研究經歷和個人愛好的建模,可以更好地感知科研人員的創新需求,為其推薦未完全解決的問題或者尚待解決的問題。此外,當前大模型自身仍存在局限性,如生成內容存在知識性錯誤的問題;因此,當前大模型所生成的研究問題和研究假設仍只能作為科研人員開展研究的參考。
2.3.3 實驗設計與分析
傳統的科學研究主要是基于“假設構建-實驗驗證”模式,其實質上是一種不斷試錯的方法[49],這需要研究人員花費大量的時間和精力??萍夹畔①Y源中包含大量的實驗相關信息,如實驗手冊和學術論文中的實驗過程以及實驗結果等。基于數智技術的創新輔助框架可以在對實驗相關信息資源的大數據分析和綜合的基礎上,提供面向特定研究問題的實驗方案,同時對實驗結果進行預判,為科研人員提供全面的參考。通過創新輔助框架中的基于API接口的插件式智能服務模式,可以把科研人員的實驗設計方案轉換為操作指令,然后通過外部接口與智能實驗機器人,如IBM RoboRXN進行交互,實現自動設置反應條件、自動記錄實驗結果。
2.3.4 學術論文寫作
學術論文是科研人員科研創新活動的結晶,其中包含科研人員發現的科學機理。當前,學術論文的寫作主要是由科研人員來完成。學術論文包含引言、相關研究、研究方法、實驗結果與分析和結論等章節,總篇幅通常達十數頁。在前述的文獻閱讀與梳理、科研問題發現和假設構建、實驗設計與分析等環節中,已經產生了大量與研究相關的內容。有研究表明,以ChatGPT為代表的大型語言模型可以生成媲美人類水平的文字內容[50]。因此,依托大型語言模型在文本生成方面的能力,基于數智技術的創新輔助框架可以為科研人員生成論文相關的文本內容。此外,通過對畫圖工具、統計分析工具API接口的調用,還可以基于科研人員的指令和相關實驗數據繪制出論文中需要的圖表。
AlphaFold預示著基于人工智能技術的科學智能所具有的廣闊前景和應用價值。2022年年末發布的ChatGPT讓人們看到了通用人工智能的曙光。當前,人類社會已經到了新一輪科技革命——智能革命的前夜。科研創新活動是一項知識密集型的工作,為了從大規??萍夹畔①Y源中獲得需要的知識,僅僅依靠科研人員個人的信息處理能力和認知能力將會越來越難以應對。人工智能技術作為一種高效的“知識轉換器”和“智能助理”,可以快速、并行化地處理海量的科技信息資源,從中萃取出有價值的知識,增強科研人員的信息處理能力和認知能力。在系統思維的指導下,本文對數智時代的創新輔助框架進行了探討,并提出了基于數智技術的創新輔助框架,以嵌入科研人員創新全過程中關鍵場景和任務的形式,可以實現對科研人員創新活動的賦能。
當前,大模型在生成內容的真實性和可靠性上仍存在不足,相信隨著數智技術的不斷成熟和進步,數智技術在科研創新中的應用會變得像數值模擬或微積分在物理學的應用一樣普遍,從而更好地賦能科技信息資源管理與知識服務。大數據、人工智能具有推動各個科學領域和各個經濟部門的創新和經濟增長的潛力,正逐漸成為國家科研創新生態系統的關鍵驅動力,數智賦能的科技信息資源管理與知識服務則可以更好地服務于國家重大科技發展戰略和科技創新。