何光喜 石長慧 樊立宏
近日,兩則科技新聞頗受關注:屠呦呦研究員在瑞典領取了諾貝爾生理學或醫學獎;SCI數據庫將被湯森路透出售。這兩則看似無關的新聞,卻有著內在的聯系——論文。屠呦呦較少發表論文,是否就等同于論文考核評價科研人員的機制一無是處?而其中最核心的問題是:究竟什么樣的評價機制,才是符合科學技術發展規律的機制,才是能夠最大程度調動起科技人員創新積極性的機制?本文對這些問題進行了討論,并提出改進我國科研人員評價機制的政策建議。

屠呦呦獲獎或可反向證明發表論文對科研工作的重要性
一般認為,論文評價更適用于基礎研究領域的評價實踐。事實上,在應用研究領域,以論文的方式對研究過程、研究方法及其背后的科學理論進行總結交流也非常必要。
以此次屠呦呦研究員獲獎為例,這么好的成果之所以時隔這么久才獲獎,在很大程度上恰恰是由于缺乏論文特別是高聲譽的期刊論文這種學術界的“硬通貨”成果形式,使得國際學術界同行難以及時了解相關成果。而其最終獲獎,在很大程度上要歸功于許多海外華人科學家的不懈奔走推廣,在此過程中付出的是時間成本和相當高的交易成本。設想如果屠呦呦當初比較早地就把自己的研究發現在高質量的學術刊物(特別是當前占據國際學術界主導地位的英文刊物)上發表,或許這個獎項會來得更早、更容易些。
緣何以論文為考評依據
論文兼具交流展示和考核評價的雙重功能,以論文為核心的考評機制是規模化科研模式下的產物
現代科學誕生之初,論文的主要功能在于“交流展示”。一方面,科研人員通過撰寫和發表論文總結自己的工作成果,與學術同行進行交流;另一方面,在科學獎勵回報系統的核心——研究發現的“優先權”之爭方面,論文始終是“優先權”展示的最有力工具。
隨著科研活動逐步“建制化”,論文的考核評價功能變得日益突出。特別是二戰以來,政府和商業對科研活動資助規模日益擴大,科研模式已從先前的個體作坊式轉型為現代的規?;a,科學共同體也逐漸轉變成一個競爭日益加劇的學術勞動力市場:在這個市場上,出資方更加重視對科研人員工作效率及產出的考核評價,科研人員也更加需要釋放信號展示自己的價值,以獲得雇主、同行和社會的認可。
如果說在個體作坊時代,尚可以通過同行評議,以一人(事)一議的規模對科研人員的水平和績效進行定性化考評,那么,在現代的規?;蒲袝r代,巨大的考評工作量和過細的學科分工,已經使得這種理想化的評價模式變得不太現實。而基于同行評議的學術期刊及基于文獻計量學的引文分析法(影響因子)的興起,恰恰使得論文作為一種批量化的“同行評議”,能夠成為規?;蒲心J较聦蒲腥藛T考核評價的“硬通貨”。與理想的同行評議相比,以論文為核心的定量化評價的精細化和有效性顯然更低。但其最大優點卻是,作為能夠在一定程度上有效反映科研人員價值、降低學術勞動力市場交易成本的“信號”機制,同時又便于大規模的實踐應用,因而更適用于現代的規模化科研模式。打個不太恰當的比方,理想的同行評議類似于小規模自然經濟交易中的“以物易物”(只適用于對少數科學精英的評價實踐),論文評價卻類似于大規模商品經濟交易中的“貨幣”。
正是在這種背景下,以論文為核心的定量化考核評價在世界范圍內廣為擴散,成為驅使科研人員追求論文發表的重要動力。事實上,在歐美發達國家,青年科研人員也普遍面臨為了追求“終身研究職位”(Tenure)而發表論文的壓力;對獲得了Tenure職位的科研人員,也有越來越多的科研機構從以往不加考評轉向探索“適度”的考評機制。
正面作用
對以論文為核心的考評機制的一個批評是,過度重視定量化指標會使得科研活動重量不重質,影響科研水平提高。事實上,近十幾年來,我國科研論文的產出無論是“量”還是“質”都呈現出持續上升態勢。以SCI數據庫收錄論文為例,從數量上看,2013年我國內地共發表SCI論文23.14萬篇,與2D02年(4.04萬篇)相比,年均增長率高達17%,遠高于同期世界平均水平;占世界SCI論文總數的比重,從2D02年的4.2%提高到2013年的13.5%,已連續5年位居世界第2位。
從質量上看,2D04~2014年間,我國科技人員發表SCI論文被引用次數排在世界第4位,與1994~2D04年間的第18位相比,被引用次數的世界排名持續提升。從平均每篇論文的被引用次數看,我國為7.57次,與世界平均值(11.05次)還有不小差距,但比2013年提高了9.4%,提升速度顯著超過其他國家。2013年,我國學者在CNS刊物(Ce]]、Nature、Scl ence及其子刊)發表的論文數居世界第6位,比2012年上升了3位;2014年發表的CNS論文數又比2013年增長了73.3%,遠高于其他國家增速。Nature出版集團發布的反映高質量論文發表的“自然指數”(NatureIndeX)顯示,2014年我國高質量論文的WFC總分(加權分值計數)位居世界第二,比2013年提高了16%;美國WFC總分雖然仍遠高于我國,但比2013年下降了3.5%。
量變是質變的基礎。從科研規律看,科研論文的影響有一個累積和滯后過程。我國正是在過去十幾年科研論文數量的積累和大幅增長的基礎上,才有了近年來論文被引用數量的明顯上升和高質量論文的涌現。這既是多年來科研投入增加、科研條件改善和研究人員素質提高的結果,也在很大程度上得益于管理部門和科研單位對科研論文產出的考評和激勵導向。
負面作用
論文考評的必要性和重要性并不意味著我國當前的考評實踐沒有問題。這些問題主要表現如下:
一是“科研優先”的傾向,導致對部分科技人員的定位和考評出現錯位。當前科技界處處體現出“科研優先”的傾向,使得各類科技組織不管自身的研究水平、服務領域和范圍如何,都把從事科研作為考評科技人員的重要標準,使得許多本不應做科研的人也來做科研,本不需要發表論文的人也去發論文。
二是考評活動對考評對象缺乏有效分類,存在“泛化”傾向。許多科研單位對從事科研活動的人員,不管其科研活動的性質是什么,都以科研論文為最重要甚至唯一的標準加以考核評價,忽視了他們在其他方面的重要貢獻。
三是考評活動急功近利,存在“過度”傾向。譬如,考評周期過短,一般至少一年考評一次;考評活動過于頻繁,評完職稱還要定期崗位聘任;沒有建立有效的Tenure制,使得即便是已經取得優秀成果的、資深的科研人員,也始終處于過度的考評壓力之下。
這些問題造成了科研資源的大量浪費和無效配置,同時也在很大程度上敗壞了學術風氣,使得許多科研人員疲于應付考評,難以潛心研究,不敢做高風險、需要長期積累的科研活動,從而影響高質量的研究成果產出。
改革
總體而言,筆者認為,盡管存在種種問題,對科研人員發表論文的考核評價仍是必要的。政策方向不應是取消或弱化論文評價,而是針對具體的問題,進行更有針對性、更精準和更有質量的評價。
一是相關部門應對所屬科研機構的定位和評價制度進行反思和改革。對相關機構考核評價和提供支持時,不宜僅以論文、項目等量化指標作為衡量機構科研能力和科研成果的主要標準,要按照其功能和職責定位重視其“履責”情況。例如,教育部門應把大學區分為研究型大學和教學型大學,不應都以科研產出作為重要考核指標。只有主管部門率先改變急功近利、唯科研是舉的導向,科研機構才能根據自身實際情況做好機構定位,不至于一擁而上地把科研成果作為考核科技人員的主要標準。
二是在科研機構建立有差別的人才評價體系。科研機構應針對從事不同科研任務的科研人員,建立包括學術論文、專利、社會經濟指標在內的多元化評價標準,給論文以不同的權重,避免“唯論文”論。在部分機構探索建立Tenure制,為少數經考核確實具有較強科研能力的科研人員設立“終身研究”崗位,采取更為寬松的考評標準,提供相對自由的科研環境;同時,加強對普通科研人員的考核,設立更嚴格的淘汰機制,逐步引導不具備科研能力的人員退出科研領域。
三是進一步切實落實以“用人自主權”為核心的科研單位自主權,將科技評價和人才評價的權力進一步下放到科研單位。例如,取消全國統一的職稱評審制度,將職稱評審等人才評價權力下放到用人單位,以便真正貫徹落實同行評議和崗位管理。鼓勵用人單位自主探索適應本單位特點的科技評價和人才評價機制,為各種創新性的探索提供政策空間,為成功的探索經驗提供后續的制度性保障。