


摘 要?本文為研究檔案學者的學術影響力,以CSSCI為數(shù)據(jù)源,運用p指數(shù),以檔案學領域高被引的43位學者為例,對比分析學者的總被引頻次(C)、發(fā)文數(shù)(N)、篇均被引頻次、h指數(shù)、p指數(shù),并進行相關分析,實證研究了p指數(shù)在檔案學者學術影響力評價中的應用。研究表明,p指數(shù)與總被引頻次、篇均被引頻次、h指數(shù)有很強的相關性,與發(fā)文數(shù)量沒有相關關系。p指數(shù)具有較好的區(qū)分度和敏感性。
關鍵詞 p指數(shù) 檔案學者 信息計量學
中圖分類號 G270 文獻標識碼 A 收稿日期 2020-02-08
★作者簡介:陳婧婧,上海申康醫(yī)院發(fā)展中心副研究館員,碩士研究生,研究方向為檔案管理。
Abstract In order to study the academic influence of archivists, the paper chooses the CSSCI as the data source and uses p-index to analyze comparatively 43 scholars who are highly cited in the field of archival science. Their total citations, number of published articles, citation frequency of each paper, h-index and p-index are compared and analyzed. The statistical analysis of application of p-index in the evaluation of academic influence of Chinese archivists is carried out. Results show that p-index is highly correlated with total citations, citation frequency of each paper and h-index, that it is not correlated with number of published articles, and that p-index has good discrimination degree and sensitivity.
Keyword p-index; archivists; informetrics
人才資源是創(chuàng)新活動中最為活躍、最為積極的因素。科研人才作為科學技術的載體,做好科研人才的績效評價,特別是對于學者個人研究表現(xiàn)的評價,對于調(diào)動人才的積極性和創(chuàng)造性具有重要作用。對科研人才的研究和評價一直是學界關注的焦點。筆者以“archivist assessment”“archivist evaluation”為關鍵詞檢索Emerald數(shù)據(jù)庫發(fā)現(xiàn),目前國外學者側(cè)重于對檔案館員的角色定義,如伊芙吉尼的《不僅僅是保護:檔案館員角色探討》等,尚未發(fā)現(xiàn)評價檔案學者影響力的研究。國內(nèi)對檔案學者進行評價運用的方法主要有主觀評價、社會網(wǎng)絡分析、文獻計量以及綜合評價的方法。如王云慶的《從作者分析看我國檔案學研究隊伍的狀況》,呂文婷的《中國檔案學學術群體共被引網(wǎng)絡探析》,郭瑤的《基于文獻計量學的中國檔案學者群體研究》等。
這些有效地研究了檔案學學者群體,但沒有從定量的角度考量學者個體的產(chǎn)出數(shù)量和質(zhì)量之間的關系,因此本文嘗試以國內(nèi)的檔案學科領域?qū)<覟樵u價對象,利用新型評價指標p指數(shù)對檔案學者學術影響力進行評價,可以考察檔案學者的個人成就,同時也為證明p指數(shù)用于人才科研績效評價的有效性提供實證資料。
一、p指數(shù)算法及其應用
2005年,美國學者Jorge.E.Hirsch提出將h指數(shù)作為對研究人員績效評價的指標。Hirsch將h指數(shù)定義為:一個科學家的h值,即是當且僅當在他發(fā)表的N篇論文中有h篇論文每篇得到的不少于h次的引文數(shù),而剩下的論文中每篇論文的引文數(shù)都小于h。h指數(shù)基于純粹的幾何結(jié)構(gòu),能同時反映產(chǎn)出率和產(chǎn)出質(zhì)量。因此,一經(jīng)提出便引起廣泛關注,但也存在缺乏靈敏度與區(qū)分度不足的問題,因此對評價產(chǎn)生很大的影響。
在h指數(shù)的研究基礎上,2010年,印度學者G.Prathap提出p指數(shù)。p指數(shù)可以被稱作是卓越指數(shù)(prominence factor)或者為威望指數(shù)(prestige factor)。P指數(shù)的表達式為(C2/N)1/3,其中,C為總引用頻次,N為發(fā)文數(shù)量。通過此表達式可以看出,p能同時反映質(zhì)量(C/N)和數(shù)量(C),可以表達論文的數(shù)量和質(zhì)量之間的關系。p指數(shù)與h指數(shù)具有相同的維度,并成功模擬了h指數(shù)對論文數(shù)量和質(zhì)量的總和考量。此外,p指數(shù)還能很好地預計相關性,可以作為新型綜合性學術評價指標。
Prathap認為p指數(shù)可以應用在很多方面,比如國家、機構(gòu)、期刊、學者學術影響力等宏觀和微觀層面的研究。在國內(nèi),目前p指數(shù)主要用于期刊評價,如張正慧、王圣潔、許新軍的研究等,用于學術影響力的評價有王志軍、趙蓉英等的研究。
二、研究對象和統(tǒng)計結(jié)果
1.統(tǒng)計對象的選擇與研究方法。本文借鑒呂文婷在《中國檔案學學術群體共被引網(wǎng)絡探析》一文中的統(tǒng)計結(jié)果,選取檔案學領域里被引次數(shù)最多的43名學者,統(tǒng)計其發(fā)文數(shù)量和被引總次數(shù)。國外學者對p指數(shù)的研究大多選擇基于Web的引文索引數(shù)據(jù)庫,鑒于該數(shù)據(jù)庫收錄我國檔案學領域的期刊類型較少,因此本文選擇《中文社會科學引文索引》(CSSCI)作為評價數(shù)據(jù)庫,檢索學者的相關數(shù)據(jù)。CSSCI數(shù)據(jù)庫的回溯期到1998年,因此本文統(tǒng)計這43位學者在1998年至2018年的總被引頻次。
2.數(shù)據(jù)統(tǒng)計結(jié)果。目前國內(nèi)的中文數(shù)據(jù)庫不能直接測得h指數(shù)和p指數(shù),筆者利用數(shù)據(jù)庫中的基本引用記錄,經(jīng)過人工偏差識別和修正加工后,計算得出檔案學者的h指數(shù)和p指數(shù)。數(shù)據(jù)統(tǒng)計結(jié)果如表1所示,按照各學者的p指數(shù)進行降序排列。需要指出的是,本文中的h指數(shù)、p指數(shù)限于統(tǒng)計時間區(qū)間、研究對象和數(shù)據(jù)庫的特定條件計算而來,任何一個條件變化均有可能引起h指數(shù)和p指數(shù)的變化。
從檔案學領域高被引作者的數(shù)據(jù)統(tǒng)計結(jié)果可以看出,中國人民大學馮惠玲教授的論文p指數(shù)最高,為12.6755,p指數(shù)大于6的有7位學者,占總?cè)藬?shù)的16%。按照h指數(shù)進行排序,排在前面的為馮惠玲、劉家真、何嘉蓀、胡鴻杰、何振、安小米、丁華東。學術論文是評價學者的重要指標,因此馮惠玲教授的排名是可以進行合理解釋的。馮惠玲的學術表現(xiàn)和影響也得到了檔案學界的承認,這從另一方面也佐證了p指數(shù)排名的合理性。
結(jié)合表1的數(shù)據(jù)統(tǒng)計結(jié)果以及在數(shù)據(jù)統(tǒng)計過程中的一些發(fā)現(xiàn)還可以得出:表1所示檔案領域高被引學者h指數(shù)最高值為11,p指數(shù)最高值未超過13。Hirsch是一個物理學家,他認為科學家在經(jīng)過20年的科研后h指數(shù)應當達到20。這是由于h指數(shù)最早在自然科學領域得到驗證,自然科學與社會科學兩個領域的學科有不同的引文模式和成果類型,所以兩個領域的門檻不盡相同。不過此數(shù)據(jù)也提示我們,檔案學作為一個年輕的學科,學者隊伍還需要不斷壯大,學者的影響力也需要不斷加強。
三、基于檔案學領域高被引作者的p指數(shù)實證研究
為了研究出p指數(shù)與總被引頻次、發(fā)文數(shù)量、篇均被引頻次和h指數(shù)之間的關系,進行了Pearson相關分析。首先對各變量進行描述統(tǒng)計,結(jié)果如表2所示。
由表2可以看出,變量總被引頻次的最小值與最大值分別為10和396,取值在合理范圍內(nèi),均值為81.33,標準差為71.707,偏度和峰度分別為2.602和8.827,可以看出該變量分布相對均勻,并服從于正態(tài)分布。變量發(fā)文數(shù)量的最小值與最大值分別為17和138,取值在合理范圍內(nèi),均值為70.65,標準差為30.913,偏度和峰度分別為0.011和-0.942,可以看出該變量分布相對均勻,并服從于正態(tài)分布。變量篇均被引頻次的最小值與最大值分別為0.096和5.143,取值在合理范圍內(nèi);均值為1.182,標準差為0.880,偏度和峰度分別為2.612和9.063,可以看出該變量分布相對均勻,并服從于正態(tài)分布。h指數(shù)的最小值與最大值分別為1和11,取值在合理范圍內(nèi),均值為3.98,標準差為1.766,偏度和峰度分別為1.696和4.934,可以看出該變量分布相對均勻,并服從于正態(tài)分布。變量p指數(shù)的最小值與最大值分別為0.987和12.676,取值在合理范圍內(nèi),均值為4.281,標準差為2.073,偏度和峰度分別為1.937和5.648,可以看出該變量分布相對均勻,并服從于正態(tài)分布。
筆者使用SPSS22.0繪制出總被引頻次、發(fā)文數(shù)量、篇均被引頻次和h指數(shù)與P指數(shù)的散點圖,發(fā)現(xiàn)總被引頻次、發(fā)文數(shù)量、篇均被引頻次和h指數(shù)與p指數(shù)近似呈現(xiàn)較強的線性關系,因此對各項統(tǒng)計指標進行Pearson相關分析。研究發(fā)現(xiàn),p指數(shù)與總被引頻次、篇均被引頻次、h指數(shù)具有較強的相關關系,與發(fā)文數(shù)量無相關關系。
1.p指數(shù)與總被引頻次的關系。在考察檔案學領域?qū)<覍W者的學術影響力時,總被引頻次這個指標比較有利于發(fā)文較多的作者,但由于引用活動本身的時滯特征,總被引頻次很難應用在較近的出版物上。筆者按照總被引頻次排序,發(fā)現(xiàn)11位學者在兩種指標下名次沒有變化,31位學者在兩種指標下名次變化很小,說明這些學者的論文總體被引比較穩(wěn)定,他們的學術影響力可以經(jīng)受這兩種不同評價指標的測評。
筆者利用SPSS22.0將p指數(shù)排名與總被引頻次排名進行了相關性分析,結(jié)果顯示:總被引頻次與p指數(shù)的Pearson相關系數(shù)為0.961,對應的p值為0.000,在5%的顯著水平上十分顯著,可以認為總被引頻次與p指數(shù)之間具有十分強的正相關關系。
2.p指數(shù)與發(fā)文數(shù)量的關系。論文的產(chǎn)出數(shù)量雖在一定程度上反映了學者的生產(chǎn)效率,但發(fā)文數(shù)量高的作者未必一定具有較高的影響力。在用p指數(shù)進行評價時,不僅要求發(fā)文量,還要求論文具有較高的篇均被引頻次,這樣才能得到較高的p指數(shù)。研究表明在檔案學領域,p指數(shù)與學者的發(fā)文數(shù)量之間不具有相關性,學者的發(fā)文量對p指數(shù)不構(gòu)成直接的影響。但發(fā)文數(shù)量指標依然很重要,它可以通過間接影響篇均被引頻次來影響p指數(shù)。
筆者利用SPSS22.0,將p指數(shù)排名與發(fā)文量排名進行了相關性分析,結(jié)果顯示:發(fā)文數(shù)量與p指數(shù)的Pearson相關系數(shù)為0.226,對應的p值為0.146,在5%的顯著水平上并不顯著,可以認為總發(fā)文數(shù)量與p指數(shù)之間不具有相關關系。
3.p指數(shù)與篇均被引頻次的關系。篇均被引頻次為總被引頻次與發(fā)文數(shù)量的比值,因此這個指標可以有效防止學者僅僅追求論文數(shù)量的不良傾向。篇均被引頻次容易受到那些總被引頻次很少的論文的影響,如那些還未來得及被引用的新近發(fā)表的前端研究成果,或者發(fā)表了若干年而未引起關注的文章,但是在檔案學領域,篇均被引頻次在現(xiàn)階段就表現(xiàn)出了對p指數(shù)的較大影響。43位高頻被引學者在過去20年間總被引頻次為3462次,篇均被引頻次達到80.5次,說明這些學者對檔案學的發(fā)展產(chǎn)生了很大的影響,他們在一定程度上更容易引導本領域的研究熱點,也更能引領檔案學的發(fā)展。
筆者利用SPSS22.0軟件,對p指數(shù)與篇均被引頻次進行了相關性分析,結(jié)果顯示:兩者的相關系數(shù)為0.936,對應的p值為0.000,可以認為篇均被引與p指數(shù)之間具有十分強的正相關關系。
4.p指數(shù)與h指數(shù)的關系。p指數(shù)延續(xù)了h指數(shù)的簡潔計算過程且便于計算的特征,但與h指數(shù)相比,p指數(shù)具有更好的區(qū)分度。以檔案學領域43位高被引學者為例,77%的學者h指數(shù)集中在3—5之間,h指數(shù)與作者存在“一對多”的情況,不能較好地區(qū)分學者的學術影響力,也就是說多位學者對應一個h值。反觀p指數(shù),每位作者對應一個唯一的p指數(shù),可以很好地區(qū)分評價對象,從而進行更合理的排名。
筆者利用SPSS22.0軟件,將p指數(shù)排名與h指數(shù)排名進行了相關性分析,結(jié)果顯示,兩者的Pearson相關系數(shù)為0.943,對應的P值為0.000,在5%的顯著水平上十分顯著,可以認為h指數(shù)與P指數(shù)之間具有十分強的正相關關系。
我國檔案學領域高被引作者評價結(jié)果的相關性分析顯示,p指數(shù)與傳統(tǒng)指標之間的相關性較強,與h指數(shù)的相關性也很強。p指數(shù)彌補了h指數(shù)的部分不足,屬于更為科學的評價指標。當然,本研究也存在以下不足:一是只考慮了學者在國內(nèi)的學術影響力評價。有些檔案領域的學者可能在國內(nèi)投入的精力較少,他們注重在國外期刊上發(fā)表學術論文,這些文獻在CSSCI中是檢索不到的,因此會影響到數(shù)據(jù)分析結(jié)果的精確性,從而影響到對學者學術影響力的評價。二是只考慮學者的論文情況,沒有將其著作考慮在內(nèi)。對檔案學領域而言,著作也非常重要,有些學者的經(jīng)典著作也能為其帶來長久的影響力。
參考文獻
[1]Evgenia Vassilakaki, Valentini Moniarou-Papaconstantinou, (2017) "Beyond preservation: investigating the roles of archivist", Li-brary Review, Vol. 66 Issue: 3, pp.110-126.
[2]王云慶,徐芳.從作者分析看我國檔案學研究隊伍的狀況[J].檔案學通訊,2011(4):19-23.
[3][11]呂文婷.中國檔案學學術群體共被引網(wǎng)絡探析[J].檔案學通訊,2018(2):38-43.
[4]郭瑤. 基于文獻計量學的中國檔案學者群體研究[D].天津:天津師范大學,2011.
[5] Hirsh JE.An index to quantify an individuals scientific research output. Proceedings of the national academy of sciences of the USA,2005,102(46):16569-16572.
[6]張正慧,鄭德俊.p指數(shù)用于中文社會科學學術期刊評價的適用性分析[J].圖書情報工作,2013,57(19):121-126.
[7]王圣潔,蔣旭,何曉慶.期刊p指數(shù)與其他評價指標相關性探討[J].中國科技期刊研究,2014,25(11):1404-1407.
[8]許新軍.p指數(shù)在期刊評價中的應用[J].情報學報,2015,34(12):1246-1251.
[9]王志軍,鄭德俊. p 指數(shù)運用于人才評價的有效性實證研究[J].圖書情報工作,2012,56(14):93-97.
[10]趙蓉英,魏明坤,楊慧云.p 指數(shù)應用于學者學術影響力評價的相關性研究[J].情報理論與實踐.2017,40(4):61-65.
[12]Ball P.Index aim for fair ranking of scientists[J].Nature ,2005,436(18):900.