摘 要:學術表現評價是高等學校做好人才引進培養、個人/團體績效評估、專業技術職務晉升等工作的前提和基礎,運用何種科學的方法進行學術評價是高等學校所面臨的重要課題。運用h指數和g指數相結合的信息計量學評價方法,運用SPSS軟件進行實證研究。研究表明,h指數在評價學者學術影響力時較好地綜合了學者科學產出的質量和數量,而g指數則在h指數的固有優勢的基礎上進一步優化了評價指標,以更客觀方法進行評價。
關鍵詞:h指數;g指數;學術評價
中圖分類號:F24 文獻標志碼:A 文章編號:1673-291X(2013)17-0245-03
引言
學術表現評價在高等學校工作中占有重要地位。高等學校科研及學術水平的高低對人才培養、技術創新、國民經濟發展都會產生深遠的影響,因此,構建和諧、高效、積極的學術表現評價機制是正確引導高校學術方向,促進高等學校學術健康發展的保障。
近年來,我國各高等學校根據自身的學科特點和學校發展定位制定了不同的學術評價標準和評價指標體系。在高校學術評價體系中,評價研究人員所發表論文質量時,往往以該文是否發表在本領域權威或者核心期刊上來判定;而管理者為簡化對研究人員學術水平、聲望及其論文學術價值的判斷,通常使用一定時期內論文發表的數量、論文總被引頻次、篇均被引次數等。但這種傳統引文評論方法對專家學者學術影響力的評價效果不能讓人滿意。論文數是指個人或單位在一定時間內發表的論文總數,但是論文數量無法說明論文的重要性和影響力,而且數千種學術期刊發表的論文水平良莠不齊,片面強調論文數量存在一定的弊端。平均引用次數,即總被引頻次除以總論文數的結果。該指標對發表論文少且每篇論文引證數高的人很有利,但不利于論文多產者。針對這些評價指標存在的不足,物理學家Hirsch(2005)提出h指數作為評價研究人員科學產出的標準,比利時著名科學計量學家Egghe(2006)提出了g指數。h指數和g指數提出后,受國內外學者的廣受關注,已經成為信息計量學研究的前沿領域。
一、h指數和g指數概述
(一)h指數
美國物理學家J E Hirsch(2005)提出的h指數在學界產生較大影響。他將h指數定義為:當且僅當一個科學家有N篇引文數至少為h的論文,同時其余論文的引文數都小于h時,該科學家h指數的值為h [1]。隨后Rousseau在Hirsch基礎上提出了h指數更精確的定義:將科學家S發表的論文按照引文數從高到低的順序排列,相同引文數的論文具有不同的序列號(對此沒有嚴格限制Rousseau建議按論文發表時間倒序排列),當且僅當前h篇論文每篇論文的引文數至少為h,同時第h+1篇論文的引文數小于h+1時則科學家S的h指數值為h [2]。
h指數的優點是明顯的。首先,和傳統的引文分析法相比較,h指數是一個非常簡單并且易于理解的復合指標,h指數兼顧個人科學產出的質量和數量,得出的影響力評價更為合理;其次h指數是動態的,不是靜止不變的,隨著時間推移,科研人員會產出更多的成果,并且科研人員以往的成果在未來的引用次數會只增不減,這對科研人員是一個極好的激勵[3]。目前,h指數已被越來越多的科研人員所接受,正如Hirsch所說,“你無法偽造它,因為它依賴的運作機制需要有個時間跨度。”研究過科學引文統計學的波斯頓大學的物理學家Sidney Redner也表示同意:“想要操縱整件事非常困難”[4]。但是h指數對于那些剛開始從事科學研究的人員和那些論文數量少而被引頻次高的學者而言是不利的,因為他們的論文產出和引文率相對較低。
(二)g指數
g指數是h指數的衍生指數,主要是為彌補h指數不能很好反映高被引論文的缺陷而提出的。Egghe(2006)提出了g指數:論文按被引次數排序后相對排前的累積被引至少g2次的最大論文序次g,亦即第(g+1)序次論文對應的累積引文數將小于(g+1)2。從定義可以看出g≥h,而按被引量排序靠前的文章的被引次數越大,g指數越大。
Egghe在分析h指數評價效果時,提出了一種基于學者以往貢獻的g指數——將論文按被引次數由高自低排序,將序號平方,被引次數按序號層層累加,當序號平方等于累計被引次數時,該序號則為g指數。如序號平方不是恰好等于而是小于對應的累計被引次數,則最接近累計被引次數的序號即為g指數。和h值一樣,g值越大說明該學者的學術影響力越大、學術成就越高,通常作為h指數的補充或提高[5]。Egghe認為h指數的優點是對低被引頻次文獻不敏感,但是它應該對所有高被引頻次文獻敏感。g指數很好地反映出了那些高被引文獻,體現了高被引文獻被引次數的增長對期刊學術影響力的影響。
二、h指數和g指數的計算與分析
本文選取某“211”高校教授作為實證研究對象,由于篇幅所限,現隨機選取某一級學科十位教授進行比較分析,利用CNKI數據庫的機構檢索功能(Affiliation Search),統計在1998—2012年期間這10位教授發表所有論文的被引總次數和被引篇數,并計算得出每位學者的篇均被引次數、h指數和g指數(如表1所示)。
表1 某一級學科1998—2012年度教授論文發表情況
結合數據統計過程中的一些發現對表1進行分析,可以得出以下論點。
1.在考察某高校某學科領域內專家教授的學術影響力時,被引總次數這個指標比較有利于發文較多的作者,而篇均被引次數則有利于發文較少的作者。這兩個指標均無法十分有效地衡量專家教授在其學科領域內的學術影響力,而h指數和g指數則較好地解決了這個問題,平衡發文的質量和數量,評價效果較好。
2.在對這10位教授進行學術表現評價分析時,發現教授論文的g指數都明顯高于h指數,而且存在h指數相對較低教授的g指數卻很高的情況,原因在于學術領域中有剛開始從事科學研究的人員和那些論文數量少卻有比較經典的文章使得被引頻次高的學者,而在h指數的計算中,這些著作的影響力并沒有得到充分展示,而g指數由于其和h指數不同的計算機制,在這方面表現較好,恰好彌補這這一缺陷。如表1中的龐教授雖然h指數不是最高,但g指數非常突出,體現了其在本學科領域中的影響力。
3.在對教授論文影響力進行評價時,是否排除自引一直是個具有爭議性的話題,所以很多時候評價作者影響力的論文不得不同時給出排除自引和不排除自引得到的兩種結果。在對h指數和g指數進行計算的過程中發現,這兩個評價指數對于自引具有較好的鑒別作用,雖然個別作者的自引數量較多,但對h指數和g指數影響并不大。
三、相關性分析
Pearson相關系數用來衡量兩個數據集合是否在一條線上面,它用來衡量定距變量間的線性關系[6]。相關系數的絕對值越大,相關性越強,相關系數越接近于1或-1,相關度越強,相關系數越接近于0,相關度越弱。通常情況下根據以下取值范圍判斷變量的相關強度:相關系數在0.8—1.0之間極強相關;在0.6—0.8之間強相關;在0.4—0.6之間中等程度相關;在0.2—0.4 之間弱相關;在0.0—0.2之間極弱相關或無相關。
(一)h指數和總被引次數的相關性分析
根據表1,可以得到h指數和被引總次數的關系(如圖1所示)。
圖1 h指數和被引總次數關系
利用SPSS軟件進行相關性分析,經檢驗h指數和總被引次數均符合正態分布,因此可以選擇Pearson相關來衡量相關性的強弱。經計算得到h指數和總被引次數相關系數大小及顯著性檢驗結果(如表2所示)。
表2 h指數和被引總次數相關性分析
相關分析是一種基于假設檢驗的統計分析方法,而顯著性水平(Significant level)反映了拒絕某一原假設時所犯錯誤的可能性。在本檢驗中,顯著性水平設為0.01,也即在原假設事實上正確的情況下,研究者接受這一假設的可能性為99%。本文的原假設是“相關系數為零”(即h指數和被引總次數之間不存在顯著的相關關系),經計算,統計量的相伴概率(即某特定取值及更極端可能值出現的準確概率,用p表示),在表3中即顯著性(雙側)為0.001,低于0.01。因此,可以認為“相關系數為零”的可能性很低,h指數和被引總次數之間存在顯著相關關系;相關系數r=0.916,說明總被引頻次和h指數之間存在極強的相關性。
(二)g指數和總被引次數的相關性分析
根據表1,可以得到g指數和被引總次數的關系(如圖2所示)。
圖2 g指數和被引總次數關系圖
利用SPSS軟件進行相關性分析,得到g指數和總被引次數相關系數大小及顯著性檢驗結果(如表3所示)。
表3 g指數和被引總次數相關性分析
**.在.01 水平(雙側)上顯著相關。
由表3可知,g指數和被引總次數之間存在顯著相關關系,相關系數r=0.879,說明總被引頻次和h指數之間存在極強的相關性。
(三)h指數和g指數的相關性分析
根據表1,利用SPSS統計軟件進行相關性分析,得到h指數和g指數相關系數大小及顯著性檢驗結果表(如表4所示)。
表4 h指數和g指數相關性分析
**.在.01 水平(雙側)上顯著相關。
由表4可知,h指數和g指數之間存在顯著相關關系,相關系數r=0.947,說明總被引頻次和h指數之間存在極強的相關性。
四、結論
通過以上的相關性分析得出,h指數、g指數與傳統引文評價的關系十分密切,相關系數也很大,h指數在評價高校學者某學科領域內的影響力時較好地綜合了學者科學產出的質量和數量,而g指數則在h指數固有優勢的基礎上進一步優化了高校學術表現評價指標,使其更趨于科學化、合理化。學術表現評價是考核科研工作者學術水平的一個主要指標,也是衡量高校辦學水平的重要指標之一。因此,采用科學的學術評價指標對高校學者進行學術評價,有著十分重要的現實意義[7]。
高等學校學術表現評價具有重要的實際應用價值,評價范圍并不僅僅局限于本文,可以將被評價學科著眼于全國乃至世界同類一級學科進行橫向比較,檢驗其學術成就,但在實際評價操作過程中應該注意以下幾點問題:第一,數據更新問題。必須定期相應地更新學科基準線,同時,不要將采集面板數據時間拉得過長,以免導致整個基準線失衡,使評價結果失真。第二,數據甄別問題。評價過程數據量較大,數據處理要保證準確性。例如,某個學者的個人經歷不同,不同時期在不同機構工作或學習,對其發表的文章要認真確認再綜合起來開展后期的分析與評價報告工作,盡量避免遺漏或范圍擴大。第三,數據庫選擇問題。評價的數據主要基于各類數據庫,因此,在實際評價中應根據學科分類來甄選數據庫,使評價結果更加科學合理[8]。
參考文獻:
[1] Hirsch,J.E.An Index to Quantify an Individual's Scientific Research Outputs[A].Proceedings of the National Academy of Sciences,
2005,102(46).
[2] Rousseau R.New Developments Related to The Hirsch Index[J].科學觀察,2006,(4).
[3] 丁楠,潘有能.h指數和g指數評價實證研究——基于CSSCI的統計分析[J].圖書與情報,2008,(12).
[4] Ball P.Index aims for fair ranking of scientists[J].Nature,2005,436(18).
[5] 彭愛東,于倩倩.h指數、g指數和累積影響因子在期刊評價中的相關性研究——以綜合性社科期刊為例[J].情報科學,2012,(30).
[6] 呂福新,顧姍姍.心理所有權與組織公民行為的相關性分析——基于本土企業的視角和浙江企業的實證[J].管理世界,2007,(5).
[7] 周志峰,韓靜嫻.h指數應用于區域科研評價的實證研究—以中國大陸31個省級區域為例[J].情報雜志,2012,(3).
[8] 吳雷,關卓軼,王曉紅.基于信息計量學的學術表現評價體系研究[J].經濟研究參考,2012,(41).
[責任編輯 杜 鵑]