陳韻安 夏泰鳳



摘 要:我國高校長期以來沿用的以論文收錄數、引用率等量化指標為導向的科研評價體系已無法滿足將智力資源轉化為生產力的新時代發展要求,以質量、社會貢獻為導向的科研評價體系已成為高校科研評價改革的必然趨勢。在國家政府的宏觀引導下,美國、英國、澳大利亞等發達國家的科研評價體系導向均回歸到了對科研最原始的價值追求上,評價內容、評價指標日趨精細化。比較美國、英國、澳大利亞等發達國家的科研評價體系,建議建立以質量、社會貢獻為導向的科研評價體系,打造多元評價主體參與的長周期評價機制,并結合學科特點采用量質結合的分類評價手段。
關鍵詞:科研評價;國際比較;多元評價主體;長周期評價機制;分類評價
中圖分類號:G64 文獻標識碼:A 文章編號:0450-9889(2024)03-0027-05
在知識經濟時代背景下,高校科研的應用價值和社會屬性變得至關重要。近年來眾多國家都對高校科研評估體系進行了大刀闊斧的改革,力求促進本國科研實力和創新能力的提升。在國家政府的宏觀引導下,美國、英國、澳大利亞等發達國家的科研評價體系導向均回歸到了對科研最原始的價值追求上,評價內容、評價指標日趨精細化。我國教育部與科技部共同印發的《關于規范高等學校SCI論文相關指標使用樹立正確評價導向的若干意見》(教科技〔2020〕2號)也強調了建立以創新質量、社會貢獻為導向的科研評價體系的必要性。然而我國高校科研評價的歷史也僅短短40余載,經驗積累較少。這些發達國家科研評價體系演變的共同規律或許會對我國科研評價體系改革具有一定的參考價值,比如構建以“質量”和“貢獻”為價值引領的評價體系,打造多元評價主體參與的長周期評價機制,結合學科特點采取量質結合的分類評價手段。故而本文研究將通過對美國、英國、澳大利亞科研評價體系發展歷程的縱向梳理及橫向比較,揭示科研評價的演變邏輯和發展趨勢,為我國新時代教育背景下科研評價體系的構建提供鏡鑒。
一、科研體系的國際比較
(一)美國
美國國會咨詢服務部于19世紀末20世紀初對科技活動進行的評估可以看作是美國科研評價的雛形。二戰后美國開始尋求科技發展的創新與突破,將科研體系與工業發展和市場需求緊密綁定,其科研活動也由此帶上了強烈的實用色彩。1993年美國國會通過的《政府績效與結果法案》要求績效考核以一種可量化的方式進行測量,對高校教師科研工作的評價開始側重于發表論文的數量和刊物等級、論文引證、科研項目經費資助情況等量化指標,直至美國卡耐基教學促進基金會主席博耶在《學術反思:教授的工作重點領域》中明確指出“應以全面的學術觀來看待教師的科研工作”之后,“創造性”“學術貢獻”才被各高校陸續納入科研評價的考量維度。近年來,隨著美國各界對科學研究成效的關注度日益高漲,美國聯邦政府提出了發展科技政策方法學的倡議,并在此基礎上創建了“美國再投資中的科學與技術——測度研究在創新、競爭力以及科學上的影響”項目(Science and Technology in Americas Reinvestment—Measuring the Effect of Research on Innovation,Competitiveness and Science,簡稱STAR METRICS項目),用以測度美國聯邦政府科研投資的社會效益。
隨著科研評價導向“由量到質”的轉變,美國高校的科研評價指標也已經擴大到更廣泛的領域,對教師科研績效的評價并不完全依賴于專著數量、經費數額、論文引用率等量化指標,而更多地關注教師的創新能力、長期貢獻,以及包括學術影響和成果轉化所帶來的經濟效益在內的研究成果影響力。比如,加州大學伯克利分校將教師對專業的貢獻或教育的新觀點作為評價的重要內容,注重觀測教師科研工作的原創性思想和效果[1]。
由于政治體制的特殊性,美國并沒有統一的科研評價制度,但為了保障科研評價工作的可信度和客觀性,美國高校始終貫徹雙向匿名評價制度,甚至會邀請其他高校以及歐洲、亞洲的領域內權威專家擔任評價專家組成員以保證評價結果的公平性[2]。在科研評價標準的設置方面,不同高校的側重點也不盡相同,如人文科學類高校在設置評價標準時會更注重跨學科研究,對研究過程當中產出的成果也給予相當的關注。在評價方法方面,美國高校主要采用的是同行評議法和定量指標法相結合的方式對教師的科研工作作出綜合性評價。隨著高校教師科研評價維度的不斷更迭,一些衡量研究成果影響力的評價方法也被開發出來。如經濟回報率分析法通常被用以測量科技成果、專利等產生的外部效益,案例分析法、社會評價法常被用以測度科研成果對政策、實踐的影響。
(二)英國
英國政府于1919年成立了大學撥款委員會,為確定資助經費的撥付對象,對科研績效指標的設置進行了長期的探索。20世紀90年代,經濟形勢的惡化導致政府不得不縮減為科研預留的資金。當時如何保障高校的科研質量并提升高校撥款的效率與合理性成了亟待解決的問題,科研評估體系改革迫在眉睫,英國研究評估考核(Research Assessment Exercise,簡稱RAE)在此背景下應運而生。
RAE評價體系以同行評議為主,以學科為基礎將被評對象分為67個待評單元,由專家學者根據參評對象提供的材料進行評價。評價指標主要包括科研人員信息、主要研究成果、科研機構的政策情況、科研環境等。RAE模式有效提升了英國科研質量與實力,但在實踐過程中也出現了諸如評估結果虛高、片面追求評估指標、評估成本過高等問題。為了縮減成本,2008年英國高等教育基金委員會決定采用研究卓越框架(Research Excellence Framework,簡稱REF)。REF評價體系將評價單元縮減至36個,聘請領域內專家和少量的外部評審員從成果、影響力、環境三個維度對每份參評成果進行評分(見表1)[3]。其中,成果被賦予60%的權重,其評價標準包括“原創性”“重要性”和“嚴謹性”。影響力衡量的是研究成果的“影響廣度”和“社會意義”,參評人員須提交影響力案例報告以證明其研究成果對學術界以外的經濟、社會、文化、公共政策等各領域產生的影響,評估結果被賦予25%的權重。環境則以“活力”和“可持續性”為衡量標準,專家組根據參評人員提供的環境報告進行評分,評分賦予15%的權重[4]。
從RAE到REF的變遷呈現出英國科研評估的焦點由內在質量向外部效益的遞進。REF模式評估時間一般為6年,要求每位被評對象最多提供4項研究成果參評,較長的時間跨度和參評成果數量的限定很大程度上引導科研人員將更多的時間和精力投入到成果質量的打磨上,追求更高的社會回報。
在指標的選取上,RAE評價模式以“提高科研質量”為宗旨,采用的主要指標包括成果的原創性、學術影響力、研究團隊的規模和質量等。而REF模式更強調科研活動對經濟、社會發展的貢獻,評價指標的設置旨在考查成果是否原創,成果對社會發展的影響程度和重要性,以及成果對廣泛學科和研究基礎的貢獻程度。
(三)澳大利亞
澳大利亞對科研評估體系的探索可以追溯到20世紀70年代,其科研評估體系在國際形勢的變化和政府的不斷調整下日趨成熟,呈現出明顯的階段性特征(見表2)[6]。
1988年澳大利亞聯邦政府就業、教育與培訓部(Department of Education,Science and Training,簡稱DEST)引入“國家教育體系”,正式拉開了高校之間通過各自科研表現來競爭科研經費的角逐序幕,基于科研量(Research Quantum,簡稱RQ)的科研評價方式也逐漸形成[7]。由于RQ并未對保證財政科研撥款的合理性發揮出太大效力,1995年澳大利亞政府便采用了綜合指數(Composite Index,簡稱CI)評價指標體系來對高校科研工作進行評價。CI從“科研投入”和“科研產出”兩方面衡量參評高校在所有高校研究活動中所占的份額,其中,科研投入的考量因素包括高校通過各種渠道獲得的科研資金,科研產出的考量因素包括學術出版物、完成高等學位的人數等。盡管CI極大激發了高校人員的科研積極性,但澳大利亞同期的引文影響力卻日趨下滑,引用影響力較低的期刊也越來越多。
為了打造以質量為導向的科研評價制度,DEST開始進行科研質量框架(Research Quality Framework,簡稱RQF)設計。RQF體系包含13個評價單元,將科研成果的學術影響力、社會影響力、經濟效益等作為考量因素,旨在鼓勵科研人員投身到高質量研究中去,以優質的科研成果推動社會發展。但RQF未及實施,便被澳大利亞卓越研究評價(Excellence in Research for Australia,簡稱ERA)取而代之。ERA將評價單元縮減至8個,采用世界標準對科研成果的各項指標進行測度,對所有學科的科研質量進行綜合評價。2011年澳大利亞聯邦政府在審查公共財政資助的科研項目時,再次將目光聚焦到對科研影響力的評估上,于是一套獨立于ERA評估的影響力評價機制——社會互動與影響力評價(Engagement and Impact,簡稱EI)應運而出。自2018年起與ERA形成并行的配套評估機制,評估科研成果對社會的貢獻,引導高校加強與行業等科研服務對象之間的合作[8]。
在指標的選取上,RQ和CI關注的是高校獲得的各類資金以及科研人員的學術出版物數量,此類定量評價指標的采用在當時催生了大量科研出版物的出版。RQF采用的則是科研質量和科研影響力兩大類指標,每類指標均以“該研究在世界中的地位”為標準劃分為五個評價等級,用以探討世界的科研水平和衡量本國科研成果的內在學術價值及其產生的多方面社會效益。改革到ERA模式后,世界標準成了等級評定的依據,而評價指標則分為研究質量、研究活動、成果應用三類。其中,研究質量從出版物發表、引文分析、同行評議等方面進行考量,研究活動衡量研究收入、研究項目、成果產出的情況,成果應用則測度成果的商業化收入、專利、注冊設計等為社會帶來的實際效益。值得一提的是EI體系中“參與”和“影響”兩大評價因素,“參與”的評估指標多與外部資助的研究經費相關,而“影響”方面的測量則需要被評對象對其科研影響進行具體闡述(見表3)[9]。
二、國際科研評價體系的演變特點
盡管美、英、澳的科研評價體系在評價內容、評價方法上各具特色,但均遵循相同的演進邏輯和發展趨勢。主要表現為以下幾點。
(一)以國家政策為改革行動指南
美、英、澳科研體系的歷代改革均有明確的改革目的,并由國家政策積極引導推動,如英、澳兩國的科研評價體系改革是為了給政府撥款提供更合理的決策依據,美國的科研評價體系改革是為了給高校和科研工作者提供發展建議。這些國家的科研評價體系改革無一不是為了適應當時的社會背景和滿足時代需求,努力促成國家整體科研水平的提升,使科研始終為國家的整體發展服務。
(二)以實際效益為評估價值遵循
由于美、英、澳三國高校科研資金來源的多樣化,這些發達國家的科研評價結果也受到諸如政府、學術同行以及各類社會受眾等科研服務對象的關注和監督。隨著科研服務對象價值觀念的轉變,社會對科研成果的要求也逐漸從重“量”走向重“質”。美、英、澳近代科研評價體系的改革都旨在追求研究成果的創新性與應用率的最大化,要求科研人員不僅能夠創造出具有學術價值的成果,而且要實現成果的社會應用價值。美國提出的STAR METRICS項目,英國REF模式“影響力”指標的設置,澳大利亞測量成果帶來的實際效益,都體現出對“質”的強調,并在此基礎上追求“效益”的實現。這些效益不僅包括如成果商業化后給企業團體和個人帶來的微觀層面的經濟效益,而且包括如運用成果改善生態環境、提升公益福利等國家社會層面的效益。
(三)以評價效力為體系構建旨意
美、英、澳三國的科研評價內容從早期的單一方向轉向了如今的多維方向,評價指標的設置日益精細。比如,美國的科研評價在對發表論文數量和刊物等級等量化指標進行衡量的基礎上,還將“貢獻程度”“創造性”納入評價指標;澳大利亞在對高校的科研投入產出比進行測量的同時,也愈加強調對科研成果賦能社會發展的評價。此外,這些發達國家采用的評價方法也隨著評價導向的轉變漸趨多元。比如,美、英的評價方法從早期的同行評議逐漸轉向與引文計量、成果計數等計量方法相結合的評價手段轉變;澳大利亞則在計量指標的基礎上結合專家評審的評價方法,以確保評價結果的科學性、合理性。
三、對我國科研評價改革的啟示
近年來,《關于深化高校教師考核評價制度改革的指導意見》《關于規范高等學校SCI論文相關指標使用樹立正確評價導向的若干意見》等文件的陸續出臺體現出國家對高校科研評價工作的重視,也對飽受詬病的“五唯”學術風向予以一定程度的撥正,但要建立起符合新時代教育理念、助推國家創新驅動發展戰略深入落實的科研評價體系,我國應在立足本國國情的基礎上對國外經驗加以借鑒。基于上述分析,美、英、澳等發達國家的科研評價制度值得借鑒的經驗有以下幾個方面。
(一)構建以社會應用價值為導向的評價體系
首先,高校應將“質量”作為科研評價的核心目標,將科研評價界定為一項對價值進行研判的活動,而非純粹的數量統計活動[10]。其次,高校應強調科研產生的有利作用,引導科研人員投入到對民生公益、經濟增長、社會發展有切實提升的科研活動中去。如英國REF模式特設的“科研影響力”評價模塊,美國STAR METRICS項目對“科學研究影響力”的重點觀測,均成功推動了科研力量流向各行各業,實現了國家科研實力的躍升,形成了科研賦能產業、產業反哺科研的有效閉環。
(二)打造多評價主體參與的長周期評價機制
我國科研評價“重量輕質”的部分成因是我國科研評價績效管理多由高校科研行政管理部門主導,因此要破除以“滿足績效考核指標”為主的行政邏輯對科研評價的約束,建立包括行政管理部門、第三方評價機構、科研成果受益群體等科研利益相關者在內的多元主體長周期評價機制。一方面,適當延長科研評價周期以減少急功近利的科研“投機”行為,給予科研工作者穩定的環境和充裕的時間打造出具有重大社會意義的科研成果,也給予評審專家足夠的時間觀測科研成果的社會應用價值。另一方面,不同利益相關者從自身的角度出發,會對科研評價作出不同形式的利益表達。如高校行政管理部門行使其行政權力以確保評價實施落地,學會等第三方學術評價機構行使其學術權力以測度科研成果的學術質量,企業、社會受眾等科學研究服務對象充分表達其對科研成果的體驗和滿意程度,以觀測科研成果產生的外部效益。不同評價主體在評價過程中互為參補,才能保證評價結果的全面性、客觀性和公信力。
(三)探索學科特色量質結合的分類評價手段
根據國務院在《深化新時代教育評價改革總體方案》中“根據不同學科、不同崗位特點,堅持分類評價”的明確指示。一方面,高校應充分考慮到不同學科研究成果的差異性,以學科類別為基礎,制定與不同學科特點相契合的評價標準,杜絕以往單純以論文發表數量、課題立項數量、項目資助金額等量化標準“一刀切”的方式進行評價。另一方面,高校還應根據學科特質選取與之相匹配的評價方法進行多維度評價。如北京電影學院在進行教師科研評價時把出版發行或展映的藝術作品、展映級別、行業影響力選為評價指標,在評價過程中采用同行評議和“代表作制”,在整合同行專家評價意見的基礎上輔以作品數量等量化數據作為參考。此種通過多種評價方法針對多個評價指標相互補充印證形成的綜合性評價意見,更能對教師的科研工作進行精準研判[11]。
現階段我國高校科研評價仍陷于“五唯”“一刀切”量化評價導致的科研產出數量繁榮而質量下滑等現實的困境當中,要想沖破藩籬,則需要借鑒國際成熟經驗,需要在實踐中探索新時代教育背景下高校科研評價體系改革的可行之策,加速構建導向正確、機制合理、手段規范的科研評價體系,為我國學術的健康發展奠定基礎。
參考文獻
[1]王學松.試析美國高校教師科研績效評價機制[J].合作經濟與科技,2013(23):40-41.
[2]張爾秘,史萬兵.美國高校人文科學教師科研績效評價體系特征與借鑒[J].沈陽師范大學學報(社會科學版),2020,44(1):98-104.
[3]李馨兒.英澳高校人文社科科研評價體系的變革與啟示[D].南京:南京農業大學,2022.
[4]蔣玉梅.全球科研評價體系的演進與發展:以美國、英國、澳大利亞、荷蘭四國為例[J].國家教育行政學院學報,2013(9):81-86.
[5]Research Excellence Framework 2021.Guidance on REF 2021 results [EB/OL]. (2022-05-12). https://ref.ac.uk/guidance-on-results/guidance-on-ref-2021-results/#2021.
[6]易凡,余小波.澳大利亞學科評估:發展動向與啟示[EB/OL].中國高校人文社會科學信息網.https://www.sinoss.net/upload/resources/file/2023/03/14/31402.pdf.
[7]李夏.從RQF到ERA:澳大利亞高校科研評價制度改革研究[D].重慶:西南大學,2019.
[8]張強.移植與創新:澳、英大學科研影響力評價機制的比較研究[J].上海教育評估研究,2020(6):49-54.
[9]Australian Government:Australian Research Council. EI 2018 Framework [EB/OL]. https://www.arc.gov. au/sites/default/files/2022-07/era_ei_2018_framework_0.pdf.
[10]劉寶存,商潤澤.新時代高校科研評價的現實困境、邏輯遵循與實現路徑[J].北京教育(高教),2022(4):13-17.
[11]徐良生.高校人文社科研究評價體系的自主創新探索[J].高校教育管理,2015(2):48-53.
注:本文系廣西教育科學“十四五”規劃2022年度專項課題“廣西高校教師科研評價體系構建研究”(2022ZJY464)的研究成果。
(責編 盧建龍)