■丁?;?/p>
大學學術評價,如何與時俱進
■丁福虎
一種先進的學術評價方法,只要隨著時間的流逝,就不可避免地被一些趨利蟲尋找出漏洞,并以極快的速度加以利用和傳播,這就像夏天的米要出蟲子一樣,學術創新工作產生了功利化行為之后尤其如此。事實上,學術不端行為與學術評價之間的博弈,從來都沒有停止過。關于學術成果之間數量與質量的關系,學術界與學術評價領域也是有定評的,比如同行評議、核心期刊、期刊影響因子、引文分析等評價方法都在一定的時期取得過積極的效果,但也被一些趨利蟲多方利用,可謂有利有弊。2005年美國科學家赫希又提出了“高影響力論文”的概念,簡稱H指數。通俗講,H指數就是一個學術人員發表了H篇被引用次數不少于H次的論文,這個H的數值就是該學術人員的H指數。例如赫希本人的H指數是49,這表示在他已發表的論文中,每篇被引用了49次以上的論文總共有49篇。赫希認為H指數能夠比較準確地反映一個人的學術成就大小。之后,一些旨在評價學術人員績效的新方法不斷問世。由于這些評價方法能夠兼顧學術論文的數量與質量,在應用上簡單明了,而且對目前重“量”輕“質”、重“表”輕“里”的學術評價標準具有明顯的超越性,因而在國內學術界引起了很大的轟動,并產生了一批比較可觀的學術成果。
我們知道,赫希的H指數是49,這首先是他要發表49篇論文。事實上這只是他發表眾多論文中的佼佼者。其次是這些論文要被有相當水準的科學工作者在研究工作中進行引用,并且引用之后能夠發表并進入某些有一定質量的數據庫源期刊上;引文條數達2401次以上,這相當于至少有2401人次的同行科學家對他的工作進行了公開的表決。您想,想擺平這么多人會有多么不容易,而且這些人的論文發表還要受到期刊編輯和審稿專家的嚴格審查。其三是被引用的時間要相對快速和集中,不能像孟德爾那樣石沉大海,生前不為人知!所以說,能夠鉆H指數評價體系空子的人,要有相當的學術貢獻和相當長的學術經歷才可以。H指數的研究還表明,美國研究型大學晉升副教授H指數為10~12,晉升正教授的H指數為18,美國科學院院士一般在45以上。那么在國內呢?筆者曾經利用中國知網,調查了某省10多所本科院校中的法學和經濟學學術人員,每個學科隨機抽取14位任職多年的正教授,他們從事學術工作的時間通常都在20年以上;之后以論文的第一作者進行文獻全庫檢索,統計數據顯示這些正教授的H指數大約為4。那么,H指數4是一種什么樣的學術概念呢?根據H指數的定義,可以得知H指數4就是一個學術人員發表了4篇被引證次數不少于4次的論文,理論上相當于有16人次以上的同行科學家對他的工作進行了公開的表決,按照通常的標準來判斷,如果論文被引證4次,個人的自引一般會在一兩次之間,這是個人課題深入研究的一項基本標志;而其他同行的引證僅有兩三次。如果一篇論文在發表之后的引證次數達不到4次,這就表明該項研究很少能引起同行之間的關注,甚至個人也缺乏持續深入的研究,這必將導致學術創新的萎縮或低水平重復研究,百家爭鳴從何談起?H指數4與美國研究型大學晉升正教授的H指數18相比較,可謂極其懸殊!同時,筆者利用中國知網,調查了某地2009年晉升的20多名正教授,發現他們的平均H指數只有2.47,而人文社科類的平均H指數只有2.25。其中H指數達到4的僅占28.57%。H指數4,這個不算太高的學術指標,為何就這么難以逾越呢?
筆者從事學術管理工作二十多年,認為這種狀況主要是由以下原因造成的。
首先是學術不端,有恃無恐。在今天,學術研究工作已經成為一種謀生的職業。學術工作者雖然具有較高的人文素質,但驅利的軟肋人人皆有,一旦有合適的條件和機會,就不可避免地陷入其中。學術不端行為產生的直接原因,一是當代學術出版物和學術文獻呈指數曲線增長,同一學科的專家都不能窮盡本學科的文獻,因此作弊者極少能被發現。當學術不端行為被發現的概率接近或低于自然災害發生的概率時,學術道德的免疫防線就會開始崩潰。作偽者就會認為搞不端行為的方式非常劃算,如果有人被偶爾揭露出來,他們會認為是自己不夠幸運,還認為這種不幸運在人類社會中普遍存在。二是學術研究高度專業化之后,許多領域的前沿工作很多都是資歷較淺的學者在開展。但由于資歷的局限,他們很少有參與評價的機會。而有資歷參加評價的,大多又不是真正的同行,也很少在前沿領域繼續活動,這就使得不端行為有了可乘之機。在這種投機心理的支配下,作偽者便會前赴后繼,舍生忘死地去搞不端行為。這時再加上發現后懲治不力,這種示范效應會使學術不端行為像決堤的洪水一樣泛濫成災。中國傳媒大學一項關于大學生網絡道德現狀的調查顯示:超過53%的大學生承認自己抄襲論文,認為抄襲是一種學術敗壞的占38%??磥恚瑢W術不端就是一塊“臭豆腐”,雖然臭不可聞,但吃起來卻很“香”!
其次是評價滯后,本末倒置。學術界中的意志不堅定者為了無償占有知識創新的勞動價值,在與評價者進行博弈時可謂機關算盡:當評價者只是盯著紙質材料時,非法期刊、假書號、假證書便開始“一條龍”出現。當評價者學會了網絡查詢時,各種“槍手”在網絡中滿天飛,商業出版物比比皆是,甚至還誕生了驗證假學歷的假網站。由于造假者的成本低下,致使造假者捷足先登。而又由于晉升指標的限制,導致真正打硬仗的創新者被甩在造假者的身后,就像《紅樓夢》里面一副對聯形容的那樣:“假作真時真亦假,無為有處有還無”。學術界有人強烈抨擊論文的考核標準,說是“逼良為娼”,卻不知搞不端行為的人壓根就不講學術規則。最為可怕的是評價的本末倒置,起點優勢有時竟然會優于終點評價,站在起跑線上的成績會比終點沖線時更加厲害。比如,論文數量會高于論文的質量,研究經費的數量會高于研究成果的質量,年輕時取得的學歷優勢會高于一個人取得的終身成就。
其三是狐貍洞口,由誰來堵?有一則民間故事講,有一窩狐貍的洞穴有一前一后兩個洞口,四處透風,小狐貍怕不安全想堵住其中的一個。老狐貍告誡小狐貍:“堵住了洞口,獵人來了往何處跑?”事實上,一些單位也知道現行評價機制的弊端和漏洞,但是大家都存在泡沫績效,自己把泡沫擠得太干,如何參與社會大蛋糕的分配?都說職稱貶值,但沒有那么多的增量職稱,如何來增加學術人員的工資?如何來實現大學的擴招?如果真的堵住了漏洞,管理者自身的利益調控幅度會更小。所以說學術評價一日不作為,學術不端行為便難以有大的改觀。
那么如何改進現行的評價機制,逐漸提高學術人員的學風水平呢?
一是改革評價觀念,“終點優于起點”?!敖K點優于起點”理論,可以在很大程度上修正學術評價的一些失誤,減少學術評價的漏洞發生。在作物的生長階段中,有發芽、生根、開花、結果等環節,根據“終點優于起點”的理論,開花優于發芽,結果又優于開花。在體育競賽中,進入決賽的成績一般要優于復賽,進入復賽的成績一般又優于初賽。而在學術評價當中,研究項目一般可以分為課題中標、經費劃撥、階段成果、最終成果、成果應用等階段,倘若有人將課題中標的評價高于成果應用階段,則屬于本末倒置;如果一項成果應用在國內取得了空前的成就,卻不如一項國家級科研項目更實惠,也屬于本末倒置。在學術論文的評價中,論文發表、論文被引、H指數是一個遞進的發展過程,如果出現了論文發表數量的評價優于引文數量的評價,那是在渾水摸魚,也應屬于本末倒置。弄清楚了“終點優于起點”的理論,學術評價就不會迷失大方向,學術評價的創新就會日新月異。
二是區分不同對象,制定相應措施。筆者在中國知網上對幾所高校新晉升的中級、副高級、正高級三類職稱進行第一作者全文檢索,發現新晉中級職稱的文獻收錄平均為2.66篇,引證次數平均為0.8次;新晉副高級職稱的全部文獻累加收錄平均為10.37篇,引證次數平均為9.12次,H指數1.88;而新晉正高級職稱的全部文獻累加收錄平均為22篇,H指數2.47。所以,中級職稱的評價看文獻收錄的數量,要比看容易造假的紙質期刊先進;副高級職稱的評價看文獻的引證次數,要比看文獻的收錄篇數先進,因為有引證的論文泡沫相對較少;正高級職稱的評價看文獻的H指數會更先進,因為H指數不便于搞“短、平、快”工程。但是這些評價必須在同一學科內進行。比如,成果鑒定本來是用于評價工程技術成果的,現在卻用來評價人文社科成果。美國的《社會科學引文索引》在全球范圍內收錄了四千多種人文社科類期刊,卻沒有中國大陸的一份期刊。按此標準,中國的人文社科學術水平竟然排在菲律賓和土耳其之后!所以說,美國標準在意識形態較濃厚的領域就不適應。
三是利用電子資源,減少人為干擾。學術評價之所以出現那么多不盡人意的地方,就在于人們肆無忌憚地加入了許多學術之外的調和劑。有人不適合從事學術工作,但在學術之外卻比較活躍。單位要把他們流動出去,既缺少相應的機制,又沒有合適的職位和社會保障,因而這項工作大多是虎頭蛇尾。幾百種非法期刊能夠順利擠入職稱評定的材料堆里,使“辦刊者”成為暴發戶,使造假者順利晉升,許多情況下并不是審查者不知情,而是他們不敢講出來。即使是有人敢于舉報,處理時大多數都是輕描淡寫。近年來,江蘇、福建、吉林、廣西、山東等省市開展職稱網絡評審,要求進行電子文獻檢索驗證,就是試圖在減少這些人為因素的干擾。如果各個部門建立了完善的電子檔案,利用權威的電子文獻,以及中國知網等部門研制的“學術不端行為監測系統”進行評價,可以在一定程度上提高評價的公信力。
四是公示評價材料,受理網絡舉報。學術不端行為的大面積淪陷,僅靠少數管理者是無能為力的。一方面是管理者在很多情況下不熟悉專業前沿;另一方面是管理者在明處,極易受到打擊報復。2010年8月,方舟子遇到襲擊,就是一個典型案例。如果將各種評價材料長時間公示在網絡上,吸引眾多的專業人員參與進來,由他們提供可靠的線索和準確的事實,然后由管理者去驗證,則會有效地打擊各種學術不端行為。尤其是將與被評價者有著切身利益沖突的群體調動起來,則可以明顯遏制學術不端行為發生的概率。
五是應用先進方法,提高博弈能力。任何學術評價方法都是特定時期的產物。在提高學術評價的博弈能力方面,我們可以向其他領域學習,比如體育界中的反興奮劑做法,治安領域的禁毒做法,以及政府查獲偽鈔的做法等,那是下了血本才有所收效的。假如我們的學術評價手段一直停留在紙質文獻時代,而面對千變萬化的網絡時代熟視無睹、無暇顧及、善惡混淆,一邊評價一邊心安理得裝“紅包”,心慈手軟、敷衍了事、你好我好大家都好,則學術評價也就失去了最基本的意義,我們的知識創新體系就會魚龍混雜,就會產生可怕的“劣幣趨良”和“鳩占鵲巢”現象,直到一個民族失去自己的基本思維能力。事實上,學術評價的前沿領域,都時刻不停地誕生著各種新理論和新方法。評價者只要虛心學習,勇于探索,無私無畏,不斷改進,就一定能夠有所超越。
(作者單位:河南科技學院)