1引言
科研評(píng)價(jià)作為科技創(chuàng)新的指揮棒,深刻影響著科技政策的治理邏輯與科研資源的配置格局[1]。然而,現(xiàn)行評(píng)價(jià)體系長(zhǎng)期面臨雙重制度性困境。其一,量化導(dǎo)向的價(jià)值異化。以科學(xué)引文索引(sciencecitationindex,SCI)論文數(shù)量、期刊影響因子等靜態(tài)指標(biāo)表征復(fù)雜科研活動(dòng),致使研究?jī)r(jià)值被降維成可計(jì)量的符號(hào)資本,催生出“五唯”的異化生態(tài)。其二,過(guò)程維度的評(píng)價(jià)缺失。傳統(tǒng)同行評(píng)議受限于效率瓶頸與主觀認(rèn)知偏差,致使科研選題的原創(chuàng)性論證、成果形成的知識(shí)演進(jìn)路徑等過(guò)程性貢獻(xiàn)長(zhǎng)期處于評(píng)價(jià)盲區(qū),跨學(xué)科研究的創(chuàng)新測(cè)度更因?qū)W科范式壁壘難以獲得公允評(píng)價(jià)[2]。當(dāng)前,以大語(yǔ)言模型為核心的人工智能技術(shù)集群為科研評(píng)價(jià)體系的優(yōu)化提供了技術(shù)可能性。具體而言,多模態(tài)大模型的語(yǔ)義推理能力、知識(shí)圖譜的動(dòng)態(tài)關(guān)聯(lián)挖掘技術(shù)以及區(qū)塊鏈的可信數(shù)據(jù)存證體系形成技術(shù)矩陣,共同驅(qū)動(dòng)評(píng)價(jià)體系向過(guò)程全流程可追溯、價(jià)值多維度可解釋、知識(shí)多主體可關(guān)聯(lián)的智能化范式演進(jìn)。
需要強(qiáng)調(diào)的是,技術(shù)賦能必須與評(píng)價(jià)理念的革新同步推進(jìn),通過(guò)算法透明性約束與人類(lèi)價(jià)值校準(zhǔn),規(guī)避評(píng)價(jià)體系的異化風(fēng)險(xiǎn)。這一協(xié)同路徑與《教育強(qiáng)國(guó)建設(shè)規(guī)劃綱要(2024—2035年)》提出的“促進(jìn)人工智能助力教育評(píng)價(jià)變革”形成戰(zhàn)略共振[3],前者為破解評(píng)價(jià)困局提供技術(shù)支撐,后者為體系重構(gòu)奠定制度基礎(chǔ)。基于此,本文構(gòu)建了“技術(shù)賦能一范式轉(zhuǎn)型一實(shí)踐路徑”的三維分析框架,如圖1所示,系統(tǒng)闡釋人工智能(ar-tificialintelligence,AI)技術(shù)作為方法性工具,通過(guò)過(guò)程數(shù)據(jù)追蹤、多維價(jià)值解析與跨主體知識(shí)關(guān)聯(lián)等機(jī)制,協(xié)同人類(lèi)專(zhuān)家構(gòu)建從結(jié)果量化到過(guò)程賦能的科研評(píng)價(jià)新范式,為教育強(qiáng)國(guó)戰(zhàn)略背景下的科研評(píng)價(jià)體系創(chuàng)新提供理論框架與實(shí)踐進(jìn)路。
2技術(shù)賦能:AI驅(qū)動(dòng)下科研評(píng)價(jià)的三重突破
2.1過(guò)程可溯:從人工評(píng)審到智能增強(qiáng)的過(guò)程追蹤AI技術(shù)正在重塑科研評(píng)價(jià)的效能邊界,其核心在于推動(dòng)評(píng)價(jià)模式從人工評(píng)審向智能增強(qiáng)的過(guò)程追蹤發(fā)展。傳統(tǒng)人工評(píng)審受限于處理速度與認(rèn)知負(fù)荷,主要依賴(lài)階段性成果的靜態(tài)評(píng)估,難以全面把握科研活動(dòng)的動(dòng)態(tài)發(fā)展過(guò)程,而AI驅(qū)動(dòng)的智能評(píng)價(jià)系統(tǒng)能夠高效采集科研活動(dòng)的過(guò)程性數(shù)據(jù),并通過(guò)深度學(xué)習(xí)算法提取文本內(nèi)容特征,構(gòu)建更為全面的過(guò)程評(píng)價(jià)框架。與此同時(shí),大語(yǔ)言模型的增量學(xué)習(xí)特性使其能夠持續(xù)追蹤研究進(jìn)展,通過(guò)知識(shí)演進(jìn)分析實(shí)現(xiàn)科研質(zhì)量的動(dòng)態(tài)監(jiān)測(cè)。結(jié)合語(yǔ)義推理和時(shí)序分析,科研評(píng)價(jià)能夠有效捕捉過(guò)程特征,為評(píng)價(jià)決策提供全流程的數(shù)據(jù)支持,進(jìn)而提升整體評(píng)價(jià)效能。
圖1研究分析框架Figure1Researchanalyticalframework

2.2價(jià)值可釋?zhuān)簭慕Y(jié)果截取到多維解釋的價(jià)值挖掘
AI技術(shù)能夠突破傳統(tǒng)評(píng)價(jià)體系對(duì)顯性成果的路徑依賴(lài),實(shí)現(xiàn)價(jià)值評(píng)估的多維度拓展。通過(guò)多源異構(gòu)數(shù)據(jù)的融合分析,AI技術(shù)能夠有效抽取方法創(chuàng)新度、研究貢獻(xiàn)度等關(guān)鍵信息,輔助識(shí)別研究過(guò)程中的創(chuàng)新要素、潛在價(jià)值等多維特征,進(jìn)而構(gòu)建科研活動(dòng)價(jià)值的全要素評(píng)估框架。這種AI賦能的評(píng)價(jià)方法通過(guò)生成多維可解釋標(biāo)簽,不僅可以突破傳統(tǒng)結(jié)果導(dǎo)向的局限,使科研價(jià)值評(píng)估從指標(biāo)主導(dǎo)擴(kuò)展到過(guò)程質(zhì)量、創(chuàng)新潛力和社會(huì)效益等多維層面,而且能有效解析科研過(guò)程的隱性?xún)r(jià)值,為專(zhuān)家評(píng)審提供更豐富的決策參考,推動(dòng)科研評(píng)價(jià)向更加系統(tǒng)化、綜合性的方向轉(zhuǎn)型發(fā)展。
2.3知識(shí)可聯(lián):從學(xué)科壁壘到交叉關(guān)聯(lián)的創(chuàng)新洞察
AI技術(shù)可以通過(guò)知識(shí)遷移重構(gòu)跨學(xué)科研究的評(píng)價(jià)體系,助力創(chuàng)新研判與決策支持。傳統(tǒng)評(píng)價(jià)體系受限于學(xué)科邊界劃分,難以準(zhǔn)確評(píng)估交叉研究的創(chuàng)新價(jià)值;而AI驅(qū)動(dòng)的科研評(píng)價(jià)能夠通過(guò)知識(shí)網(wǎng)絡(luò)建模技術(shù),動(dòng)態(tài)分析不同學(xué)科間的知識(shí)融合強(qiáng)度,識(shí)別潛在的知識(shí)溢出節(jié)點(diǎn),為跨學(xué)科研究提供多維度創(chuàng)新性評(píng)估標(biāo)準(zhǔn)[4]。這種技術(shù)賦能不僅可以解決交叉研究創(chuàng)新難測(cè)的困境,而且能夠推動(dòng)評(píng)價(jià)理念從學(xué)科本位向問(wèn)題導(dǎo)向轉(zhuǎn)變。隨著知識(shí)網(wǎng)絡(luò)跨越學(xué)科界限,科研評(píng)價(jià)決策將從單一主體的判斷轉(zhuǎn)向多元認(rèn)知的協(xié)同整合,共同推動(dòng)交叉學(xué)科創(chuàng)新價(jià)值的系統(tǒng)性評(píng)估。
3范式轉(zhuǎn)型:過(guò)程賦能的科研評(píng)價(jià)體系變革
3.1 評(píng)價(jià)目標(biāo)延伸:從成果計(jì)量到過(guò)程追溯的范 式突破
科研評(píng)價(jià)體系正經(jīng)歷由開(kāi)放科學(xué)運(yùn)動(dòng)與AI技術(shù)創(chuàng)新共同驅(qū)動(dòng)的認(rèn)知范式重構(gòu)。傳統(tǒng)評(píng)價(jià)體系受限于數(shù)據(jù)采集與分析技術(shù),往往將復(fù)雜的科研活動(dòng)簡(jiǎn)化為成果數(shù)量、影響因子等滯后性指標(biāo)。AI技術(shù)的介人使全過(guò)程數(shù)據(jù)采集與動(dòng)態(tài)分析成為可能,評(píng)價(jià)重心得以轉(zhuǎn)向科研創(chuàng)新過(guò)程的價(jià)值追溯。通過(guò)深度學(xué)習(xí)算法對(duì)科研選題、實(shí)驗(yàn)設(shè)計(jì)、知識(shí)演化等過(guò)程要素的深度挖掘,評(píng)價(jià)系統(tǒng)不僅能揭示科研成果的形成機(jī)理,更能識(shí)別隱性知識(shí)創(chuàng)新與跨學(xué)科協(xié)同等傳統(tǒng)指標(biāo)難以捕捉的價(jià)值維度。這種從成果計(jì)量到過(guò)程追溯的視角延伸,本質(zhì)上重構(gòu)了科研價(jià)值的認(rèn)知框架,驅(qū)動(dòng)評(píng)價(jià)目標(biāo)從結(jié)果端向過(guò)程端回溯前移,從而為診斷性、建設(shè)性評(píng)價(jià)建議提供更多的證據(jù)支撐。
3.2 評(píng)價(jià)維度拓展:從指標(biāo)裁定到多維診斷的范式升級(jí)
在推理大模型技術(shù)的推動(dòng)下,科研評(píng)價(jià)體系正經(jīng)歷多維化發(fā)展,其評(píng)估范式逐步從分?jǐn)?shù)式裁定向融合智能診斷的復(fù)合模式轉(zhuǎn)變。相較于傳統(tǒng)定量評(píng)價(jià)的標(biāo)準(zhǔn)化裁定模式,大語(yǔ)言模型賦能的評(píng)估系統(tǒng)通過(guò)多維度特征提取與關(guān)聯(lián)分析,能夠?yàn)榭蒲匈|(zhì)量評(píng)價(jià)提供更豐富的輔助診斷維度。
具體而言,多維診斷式評(píng)價(jià)可以基于深度語(yǔ)義理解生成研究原創(chuàng)性、創(chuàng)新性等概念化標(biāo)簽,運(yùn)用知識(shí)圖譜技術(shù)構(gòu)建方法創(chuàng)新性、學(xué)科交叉性等結(jié)構(gòu)化標(biāo)注體系,并結(jié)合動(dòng)態(tài)數(shù)據(jù)形成時(shí)序評(píng)估證據(jù)鏈,進(jìn)而實(shí)現(xiàn)對(duì)科研活動(dòng)特征的全方位識(shí)別。這種多模態(tài)標(biāo)簽體系不僅突破了傳統(tǒng)指標(biāo)的平面化局限,其可追溯的算法決策機(jī)制更構(gòu)建起透明化的決策證據(jù)鏈。當(dāng)評(píng)價(jià)結(jié)果從指標(biāo)分?jǐn)?shù)拓展為結(jié)構(gòu)化的多維科研畫(huà)像時(shí),決策支持系統(tǒng)則具備從總結(jié)式評(píng)價(jià)向診斷式評(píng)價(jià)躍遷的技術(shù)基礎(chǔ),使評(píng)價(jià)結(jié)果在保持實(shí)證嚴(yán)謹(jǐn)性的同時(shí),獲得了更豐富的人文闡釋空間。
3.3 評(píng)價(jià)主體重構(gòu):從人機(jī)交互到協(xié)同決策的范式進(jìn)化
AI技術(shù)的深度滲透正在重構(gòu)科研評(píng)價(jià)的決策范式,推動(dòng)形成人類(lèi)認(rèn)知與機(jī)器智能融合的評(píng)價(jià)系統(tǒng)。通過(guò)持續(xù)學(xué)習(xí)構(gòu)建多元化的評(píng)審知識(shí)庫(kù),AI技術(shù)能夠完成文獻(xiàn)瀕源、數(shù)據(jù)驗(yàn)證等程序性工作,從工具性存在進(jìn)化為具有認(rèn)知代理能力的評(píng)價(jià)協(xié)作者。與此同時(shí),借助生成式AI的多視角分析框架,可為專(zhuān)家決策提供創(chuàng)新潛力評(píng)估等深度洞察,并在結(jié)果追溯環(huán)節(jié)進(jìn)行評(píng)審一致性檢測(cè)與偏差預(yù)警。這種人機(jī)共治模式既非機(jī)械的功能替代,也不是簡(jiǎn)單的效率提升,而是構(gòu)建機(jī)器增強(qiáng)人類(lèi)的新型認(rèn)知范式。值得注意的是,這種進(jìn)化始終以人類(lèi)價(jià)值判斷為核心,AI系統(tǒng)主要承擔(dān)證據(jù)強(qiáng)化、偏誤校正等輔助功能,在保持科研評(píng)價(jià)人文屬性的同時(shí),實(shí)現(xiàn)評(píng)審效度與信度的有效提升。
4實(shí)踐路徑:數(shù)智科研評(píng)價(jià)生態(tài)的建構(gòu)邏輯
4.1挖掘過(guò)程數(shù)據(jù)要素,支撐數(shù)智評(píng)價(jià)全流程溯源
構(gòu)建數(shù)智評(píng)價(jià)體系的實(shí)踐起點(diǎn)在于有效挖掘過(guò)程數(shù)據(jù)要素,支撐評(píng)價(jià)的全流程溯源。其一,要構(gòu)建標(biāo)準(zhǔn)化的過(guò)程數(shù)據(jù)采集體系。針對(duì)科研活動(dòng)中的協(xié)作交流、成果傳播等關(guān)鍵環(huán)節(jié),制定統(tǒng)一的數(shù)據(jù)采集規(guī)范,著重獲取反映研究過(guò)程的原始數(shù)據(jù)。其二,要開(kāi)發(fā)智能化的數(shù)據(jù)處理流程。通過(guò)自然語(yǔ)言處理等技術(shù)手段,對(duì)采集的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行深度解析和特征提取,將其轉(zhuǎn)化為可量化分析的標(biāo)準(zhǔn)化指標(biāo),為評(píng)價(jià)提供客觀依據(jù)。具體而言,通過(guò)建立標(biāo)準(zhǔn)化的過(guò)程數(shù)據(jù)采集規(guī)范,并引入AI技術(shù)驅(qū)動(dòng)的智能分析工具,可有效助力科研評(píng)價(jià)數(shù)據(jù)的全流程標(biāo)準(zhǔn)化處理與深度解析。對(duì)過(guò)程數(shù)據(jù)要素進(jìn)行全流程溯源不僅可以為智能評(píng)價(jià)提供基礎(chǔ)支撐,更能通過(guò)數(shù)據(jù)價(jià)值的深度挖掘反哺開(kāi)放科學(xué)實(shí)踐,形成可持續(xù)的數(shù)據(jù)生態(tài)閉環(huán)。
4.2 設(shè)計(jì)動(dòng)態(tài)指標(biāo)體系,賦能多維價(jià)值智能診斷評(píng)估
推進(jìn)數(shù)智評(píng)價(jià)體系落地的核心在于構(gòu)建動(dòng)態(tài)演化的指標(biāo)體系,賦能多維價(jià)值評(píng)估的智能診斷。其一,要建立多維價(jià)值評(píng)估框架。基于科研活動(dòng)的過(guò)程貢獻(xiàn)、創(chuàng)新質(zhì)量和社會(huì)影響等維度,設(shè)計(jì)基礎(chǔ)指標(biāo)庫(kù),為不同類(lèi)型研究提供差異化診斷式評(píng)價(jià)。其二,開(kāi)發(fā)指標(biāo)動(dòng)態(tài)優(yōu)化機(jī)制。通過(guò)分析歷史評(píng)審數(shù)據(jù)和專(zhuān)家反饋,運(yùn)用機(jī)器學(xué)習(xí)技術(shù)自動(dòng)優(yōu)化調(diào)整指標(biāo)權(quán)重,使評(píng)價(jià)標(biāo)準(zhǔn)能夠隨學(xué)科發(fā)展而演進(jìn)。同時(shí),為確保評(píng)價(jià)過(guò)程的透明、可信,需進(jìn)一步優(yōu)化AI技術(shù)模型的透明性與可解釋性[5],將算法識(shí)別的關(guān)鍵特征轉(zhuǎn)化為可視化評(píng)估邏輯,支持評(píng)價(jià)結(jié)果的追溯驗(yàn)證。
具體而言,在建立多維價(jià)值評(píng)估框架的基礎(chǔ)上,可借助大語(yǔ)言模型的語(yǔ)義解析與微調(diào)能力生成診斷式評(píng)估標(biāo)簽,為指標(biāo)體系的動(dòng)態(tài)調(diào)整提供數(shù)據(jù)支撐。這一動(dòng)態(tài)評(píng)價(jià)機(jī)制旨在克服傳統(tǒng)靜態(tài)指標(biāo)的局限性,有效識(shí)別非常規(guī)研究的創(chuàng)新價(jià)值,并通過(guò)可解釋的評(píng)估邏輯來(lái)保障評(píng)價(jià)過(guò)程的公信力。
4.3 培育開(kāi)放協(xié)同生態(tài),推動(dòng)人本人機(jī)共治可信轉(zhuǎn)型
構(gòu)建數(shù)智化評(píng)價(jià)生態(tài)的關(guān)鍵,在于確立人機(jī)協(xié)同的治理范式。需要探索智能評(píng)審輔助系統(tǒng),在預(yù)評(píng)審階段,自動(dòng)驗(yàn)證數(shù)據(jù)質(zhì)量與方法合規(guī)性;在核心評(píng)審環(huán)節(jié),提供創(chuàng)新潛力評(píng)估;在結(jié)果公示階段,實(shí)現(xiàn)評(píng)審決策的偏差檢測(cè)與可解釋性追溯。同時(shí),建立多主體開(kāi)放協(xié)同機(jī)制,由技術(shù)團(tuán)隊(duì)持續(xù)優(yōu)化算法模型,領(lǐng)域?qū)<抑鲗?dǎo)評(píng)價(jià)規(guī)則迭代,倫理委員會(huì)監(jiān)督科研誠(chéng)信過(guò)程。通過(guò)建立動(dòng)態(tài)評(píng)估機(jī)制,定期檢驗(yàn)系統(tǒng)對(duì)新興研究范式的識(shí)別能力與適應(yīng)性,確保智能評(píng)價(jià)工具始終圍繞科研價(jià)值發(fā)現(xiàn)的核心目標(biāo)演進(jìn)。
具體而言,可建立人機(jī)協(xié)同的數(shù)據(jù)標(biāo)注機(jī)制,通過(guò)明確AI預(yù)標(biāo)注和人工糾偏復(fù)核的分工流程,將其嵌人現(xiàn)有同行評(píng)議體系,為專(zhuān)家決策提供結(jié)構(gòu)化參考依據(jù)。在充分發(fā)揮技術(shù)賦能優(yōu)勢(shì)的基礎(chǔ)上,保持人類(lèi)判斷的價(jià)值主導(dǎo)地位,進(jìn)而實(shí)現(xiàn)技術(shù)理性與人文關(guān)懷的深度融合。
科研評(píng)價(jià)作為跨越時(shí)空的復(fù)雜命題,在數(shù)智化浪潮中迎來(lái)范式重構(gòu)的歷史機(jī)遇。以大語(yǔ)言模型為代表的AI技術(shù),在拓展評(píng)價(jià)維度、強(qiáng)化過(guò)程追溯的同時(shí),更呼喚工具理性與價(jià)值判斷的動(dòng)態(tài)平衡。面向未來(lái),唯有在技術(shù)創(chuàng)新與人文關(guān)懷的協(xié)同演進(jìn)中,才能實(shí)現(xiàn)科研評(píng)價(jià)從結(jié)果計(jì)量向過(guò)程賦能的范式躍遷,為科學(xué)共同體注入可持續(xù)發(fā)展的智慧動(dòng)能。
參考文獻(xiàn):
[1] 劉作義,陳曉田.科學(xué)研究評(píng)價(jià)的性質(zhì)、作用、方法及程序[J].科研管理,2002,23(2):33-40.
[2] 劉夢(mèng)星,張紅霞.高校科研評(píng)價(jià)的問(wèn)題、走向與改革策略[J].高校教育管理,2021,15(1):117-124.
[3] 人民日?qǐng)?bào).中共中央國(guó)務(wù)院印發(fā)《教育強(qiáng)國(guó)建設(shè)規(guī)劃綱要(2024—2035年)》[N].人民日?qǐng)?bào),2025-01-20(6).
[4] KUSTERSR,MISEVICD,BERRYH,etal.Interdisciplinaryresearchinartificial intelligence:Challenges and opportunities[J]. Frontiers in Big Data,2020(3): 577974.
[5]張洋,吳婷婷,侯劍華.大模型驅(qū)動(dòng)科技創(chuàng)新評(píng)價(jià)若干問(wèn)題的思考[J].圖書(shū)情報(bào)知識(shí),2025,42(1):70-77,88.
作者貢獻(xiàn)說(shuō)明:
張琳:研究選題提出、研究框架設(shè)計(jì)、論文撰寫(xiě)與修改;
陳國(guó)梁:研究框架設(shè)計(jì)、研究資料收集、論文撰寫(xiě)與修改。
Abstract: [Purpose/Significance] Research evaluation is a crucial component of the scientific and technological innovation system. However,the curent evaluation framework has longbeen constrained bythedual challenges of value quantification distortion and the absence of process-oriented assessment, making it difficult to capture the multidimensional value of research activities.This study aims to reveal the new mechanisms of AI-driven research evaluation and explore scientifically sound and practical pathways.[Method/Process] A three-dimensional analytical framework of \"technological empowerment—paradigm shift—practical pathway” is constructed to systematicallillustrate the potential ofAI technologies in research evaluation.Drawing on the development of large language models and related technologies,the study investigates the traceability of research processes, the interpretabilityofresearch value,and the connectivityof knowledge.It further analyzes the transformation logic of evaluation paradigms from the perspectives of objectives,dimensions,and actors. [Result/Conclusion] The findings show that AI-driven research evaluation can extend evaluation objectives from outcome measurement to process tracing, expand evaluation dimensions from indicator-based judgments to multidimensional diagnosis,and reshape evaluation actors from human-machine interaction to collaborative decision-making.By mining process data elements,designing dynamic indicator systems,and fostering an open and collaborative ecosystem, research evaluation can,through the synergy of technological rationalityand human values,continuously evolve from result quantification to process empowerment.
Keywords: artificial intelligence research evaluationparadigm shift practical pathways