p指數(shù)在中國檔案學者學術影響力評價中的應用

2020-11-06 05:36:46陳婧婧

蘭臺世界 2020年10期

摘要?本文為研究檔案學者的學術影響力，以CSSCI為數(shù)據(jù)源，運用p指數(shù)，以檔案學領域高被引的43位學者為例，對比分析學者的總被引頻次（C）、發(fā)文數(shù)（N）、篇均被引頻次、h指數(shù)、p指數(shù)，并進行相關分析，實證研究了p指數(shù)在檔案學者學術影響力評價中的應用。研究表明，p指數(shù)與總被引頻次、篇均被引頻次、h指數(shù)有很強的相關性，與發(fā)文數(shù)量沒有相關關系。p指數(shù)具有較好的區(qū)分度和敏感性。

關鍵詞 p指數(shù) 檔案學者信息計量學

中圖分類號 G270 文獻標識碼 A 收稿日期 2020-02-08

★作者簡介：陳婧婧，上海申康醫(yī)院發(fā)展中心副研究館員，碩士研究生，研究方向為檔案管理。

Abstract In order to study the academic influence of archivists， the paper chooses the CSSCI as the data source and uses p-index to analyze comparatively 43 scholars who are highly cited in the field of archival science. Their total citations， number of published articles， citation frequency of each paper， h-index and p-index are compared and analyzed. The statistical analysis of application of p-index in the evaluation of academic influence of Chinese archivists is carried out. Results show that p-index is highly correlated with total citations， citation frequency of each paper and h-index， that it is not correlated with number of published articles， and that p-index has good discrimination degree and sensitivity.

Keyword p-index; archivists; informetrics

人才資源是創(chuàng)新活動中最為活躍、最為積極的因素。科研人才作為科學技術的載體，做好科研人才的績效評價，特別是對于學者個人研究表現(xiàn)的評價，對于調(diào)動人才的積極性和創(chuàng)造性具有重要作用。對科研人才的研究和評價一直是學界關注的焦點。筆者以“archivist assessment”“archivist evaluation”為關鍵詞檢索Emerald數(shù)據(jù)庫發(fā)現(xiàn)，目前國外學者側(cè)重于對檔案館員的角色定義，如伊芙吉尼的《不僅僅是保護：檔案館員角色探討》等，尚未發(fā)現(xiàn)評價檔案學者影響力的研究。國內(nèi)對檔案學者進行評價運用的方法主要有主觀評價、社會網(wǎng)絡分析、文獻計量以及綜合評價的方法。如王云慶的《從作者分析看我國檔案學研究隊伍的狀況》，呂文婷的《中國檔案學學術群體共被引網(wǎng)絡探析》，郭瑤的《基于文獻計量學的中國檔案學者群體研究》等。

這些有效地研究了檔案學學者群體，但沒有從定量的角度考量學者個體的產(chǎn)出數(shù)量和質(zhì)量之間的關系，因此本文嘗試以國內(nèi)的檔案學科領域?qū)＜覟樵u價對象，利用新型評價指標p指數(shù)對檔案學者學術影響力進行評價，可以考察檔案學者的個人成就，同時也為證明p指數(shù)用于人才科研績效評價的有效性提供實證資料。

一、p指數(shù)算法及其應用

2005年，美國學者Jorge.E.Hirsch提出將h指數(shù)作為對研究人員績效評價的指標。Hirsch將h指數(shù)定義為：一個科學家的h值，即是當且僅當在他發(fā)表的N篇論文中有h篇論文每篇得到的不少于h次的引文數(shù)，而剩下的論文中每篇論文的引文數(shù)都小于h。h指數(shù)基于純粹的幾何結(jié)構(gòu)，能同時反映產(chǎn)出率和產(chǎn)出質(zhì)量。因此，一經(jīng)提出便引起廣泛關注，但也存在缺乏靈敏度與區(qū)分度不足的問題，因此對評價產(chǎn)生很大的影響。

在h指數(shù)的研究基礎上，2010年，印度學者G.Prathap提出p指數(shù)。p指數(shù)可以被稱作是卓越指數(shù)（prominence factor）或者為威望指數(shù)（prestige factor）。P指數(shù)的表達式為（C2/N）1/3，其中，C為總引用頻次，N為發(fā)文數(shù)量。通過此表達式可以看出，p能同時反映質(zhì)量（C/N）和數(shù)量（C），可以表達論文的數(shù)量和質(zhì)量之間的關系。p指數(shù)與h指數(shù)具有相同的維度，并成功模擬了h指數(shù)對論文數(shù)量和質(zhì)量的總和考量。此外，p指數(shù)還能很好地預計相關性，可以作為新型綜合性學術評價指標。

Prathap認為p指數(shù)可以應用在很多方面，比如國家、機構(gòu)、期刊、學者學術影響力等宏觀和微觀層面的研究。在國內(nèi)，目前p指數(shù)主要用于期刊評價，如張正慧、王圣潔、許新軍的研究等，用于學術影響力的評價有王志軍、趙蓉英等的研究。

二、研究對象和統(tǒng)計結(jié)果

1.統(tǒng)計對象的選擇與研究方法。本文借鑒呂文婷在《中國檔案學學術群體共被引網(wǎng)絡探析》一文中的統(tǒng)計結(jié)果，選取檔案學領域里被引次數(shù)最多的43名學者，統(tǒng)計其發(fā)文數(shù)量和被引總次數(shù)。國外學者對p指數(shù)的研究大多選擇基于Web的引文索引數(shù)據(jù)庫，鑒于該數(shù)據(jù)庫收錄我國檔案學領域的期刊類型較少，因此本文選擇《中文社會科學引文索引》（CSSCI）作為評價數(shù)據(jù)庫，檢索學者的相關數(shù)據(jù)。CSSCI數(shù)據(jù)庫的回溯期到1998年，因此本文統(tǒng)計這43位學者在1998年至2018年的總被引頻次。

2.數(shù)據(jù)統(tǒng)計結(jié)果。目前國內(nèi)的中文數(shù)據(jù)庫不能直接測得h指數(shù)和p指數(shù)，筆者利用數(shù)據(jù)庫中的基本引用記錄，經(jīng)過人工偏差識別和修正加工后，計算得出檔案學者的h指數(shù)和p指數(shù)。數(shù)據(jù)統(tǒng)計結(jié)果如表1所示，按照各學者的p指數(shù)進行降序排列。需要指出的是，本文中的h指數(shù)、p指數(shù)限于統(tǒng)計時間區(qū)間、研究對象和數(shù)據(jù)庫的特定條件計算而來，任何一個條件變化均有可能引起h指數(shù)和p指數(shù)的變化。

從檔案學領域高被引作者的數(shù)據(jù)統(tǒng)計結(jié)果可以看出，中國人民大學馮惠玲教授的論文p指數(shù)最高，為12.6755，p指數(shù)大于6的有7位學者，占總?cè)藬?shù)的16%。按照h指數(shù)進行排序，排在前面的為馮惠玲、劉家真、何嘉蓀、胡鴻杰、何振、安小米、丁華東。學術論文是評價學者的重要指標，因此馮惠玲教授的排名是可以進行合理解釋的。馮惠玲的學術表現(xiàn)和影響也得到了檔案學界的承認，這從另一方面也佐證了p指數(shù)排名的合理性。

結(jié)合表1的數(shù)據(jù)統(tǒng)計結(jié)果以及在數(shù)據(jù)統(tǒng)計過程中的一些發(fā)現(xiàn)還可以得出：表1所示檔案領域高被引學者h指數(shù)最高值為11，p指數(shù)最高值未超過13。Hirsch是一個物理學家，他認為科學家在經(jīng)過20年的科研后h指數(shù)應當達到20。這是由于h指數(shù)最早在自然科學領域得到驗證，自然科學與社會科學兩個領域的學科有不同的引文模式和成果類型，所以兩個領域的門檻不盡相同。不過此數(shù)據(jù)也提示我們，檔案學作為一個年輕的學科，學者隊伍還需要不斷壯大，學者的影響力也需要不斷加強。

三、基于檔案學領域高被引作者的p指數(shù)實證研究

為了研究出p指數(shù)與總被引頻次、發(fā)文數(shù)量、篇均被引頻次和h指數(shù)之間的關系，進行了Pearson相關分析。首先對各變量進行描述統(tǒng)計，結(jié)果如表2所示。

由表2可以看出，變量總被引頻次的最小值與最大值分別為10和396，取值在合理范圍內(nèi)，均值為81.33，標準差為71.707，偏度和峰度分別為2.602和8.827，可以看出該變量分布相對均勻，并服從于正態(tài)分布。變量發(fā)文數(shù)量的最小值與最大值分別為17和138，取值在合理范圍內(nèi)，均值為70.65，標準差為30.913，偏度和峰度分別為0.011和-0.942，可以看出該變量分布相對均勻，并服從于正態(tài)分布。變量篇均被引頻次的最小值與最大值分別為0.096和5.143，取值在合理范圍內(nèi);均值為1.182，標準差為0.880，偏度和峰度分別為2.612和9.063，可以看出該變量分布相對均勻，并服從于正態(tài)分布。h指數(shù)的最小值與最大值分別為1和11，取值在合理范圍內(nèi)，均值為3.98，標準差為1.766，偏度和峰度分別為1.696和4.934，可以看出該變量分布相對均勻，并服從于正態(tài)分布。變量p指數(shù)的最小值與最大值分別為0.987和12.676，取值在合理范圍內(nèi)，均值為4.281，標準差為2.073，偏度和峰度分別為1.937和5.648，可以看出該變量分布相對均勻，并服從于正態(tài)分布。

筆者使用SPSS22.0繪制出總被引頻次、發(fā)文數(shù)量、篇均被引頻次和h指數(shù)與P指數(shù)的散點圖，發(fā)現(xiàn)總被引頻次、發(fā)文數(shù)量、篇均被引頻次和h指數(shù)與p指數(shù)近似呈現(xiàn)較強的線性關系，因此對各項統(tǒng)計指標進行Pearson相關分析。研究發(fā)現(xiàn)，p指數(shù)與總被引頻次、篇均被引頻次、h指數(shù)具有較強的相關關系，與發(fā)文數(shù)量無相關關系。

1.p指數(shù)與總被引頻次的關系。在考察檔案學領域?qū)＜覍W者的學術影響力時，總被引頻次這個指標比較有利于發(fā)文較多的作者，但由于引用活動本身的時滯特征，總被引頻次很難應用在較近的出版物上。筆者按照總被引頻次排序，發(fā)現(xiàn)11位學者在兩種指標下名次沒有變化，31位學者在兩種指標下名次變化很小，說明這些學者的論文總體被引比較穩(wěn)定，他們的學術影響力可以經(jīng)受這兩種不同評價指標的測評。

筆者利用SPSS22.0將p指數(shù)排名與總被引頻次排名進行了相關性分析，結(jié)果顯示：總被引頻次與p指數(shù)的Pearson相關系數(shù)為0.961，對應的p值為0.000，在5%的顯著水平上十分顯著，可以認為總被引頻次與p指數(shù)之間具有十分強的正相關關系。

2.p指數(shù)與發(fā)文數(shù)量的關系。論文的產(chǎn)出數(shù)量雖在一定程度上反映了學者的生產(chǎn)效率，但發(fā)文數(shù)量高的作者未必一定具有較高的影響力。在用p指數(shù)進行評價時，不僅要求發(fā)文量，還要求論文具有較高的篇均被引頻次，這樣才能得到較高的p指數(shù)。研究表明在檔案學領域，p指數(shù)與學者的發(fā)文數(shù)量之間不具有相關性，學者的發(fā)文量對p指數(shù)不構(gòu)成直接的影響。但發(fā)文數(shù)量指標依然很重要，它可以通過間接影響篇均被引頻次來影響p指數(shù)。

筆者利用SPSS22.0，將p指數(shù)排名與發(fā)文量排名進行了相關性分析，結(jié)果顯示：發(fā)文數(shù)量與p指數(shù)的Pearson相關系數(shù)為0.226，對應的p值為0.146，在5%的顯著水平上并不顯著，可以認為總發(fā)文數(shù)量與p指數(shù)之間不具有相關關系。

3.p指數(shù)與篇均被引頻次的關系。篇均被引頻次為總被引頻次與發(fā)文數(shù)量的比值，因此這個指標可以有效防止學者僅僅追求論文數(shù)量的不良傾向。篇均被引頻次容易受到那些總被引頻次很少的論文的影響，如那些還未來得及被引用的新近發(fā)表的前端研究成果，或者發(fā)表了若干年而未引起關注的文章，但是在檔案學領域，篇均被引頻次在現(xiàn)階段就表現(xiàn)出了對p指數(shù)的較大影響。43位高頻被引學者在過去20年間總被引頻次為3462次，篇均被引頻次達到80.5次，說明這些學者對檔案學的發(fā)展產(chǎn)生了很大的影響，他們在一定程度上更容易引導本領域的研究熱點，也更能引領檔案學的發(fā)展。

筆者利用SPSS22.0軟件，對p指數(shù)與篇均被引頻次進行了相關性分析，結(jié)果顯示：兩者的相關系數(shù)為0.936，對應的p值為0.000，可以認為篇均被引與p指數(shù)之間具有十分強的正相關關系。

4.p指數(shù)與h指數(shù)的關系。p指數(shù)延續(xù)了h指數(shù)的簡潔計算過程且便于計算的特征，但與h指數(shù)相比，p指數(shù)具有更好的區(qū)分度。以檔案學領域43位高被引學者為例，77%的學者h指數(shù)集中在3—5之間，h指數(shù)與作者存在“一對多”的情況，不能較好地區(qū)分學者的學術影響力，也就是說多位學者對應一個h值。反觀p指數(shù)，每位作者對應一個唯一的p指數(shù)，可以很好地區(qū)分評價對象，從而進行更合理的排名。

筆者利用SPSS22.0軟件，將p指數(shù)排名與h指數(shù)排名進行了相關性分析，結(jié)果顯示，兩者的Pearson相關系數(shù)為0.943，對應的P值為0.000，在5%的顯著水平上十分顯著，可以認為h指數(shù)與P指數(shù)之間具有十分強的正相關關系。

我國檔案學領域高被引作者評價結(jié)果的相關性分析顯示，p指數(shù)與傳統(tǒng)指標之間的相關性較強，與h指數(shù)的相關性也很強。p指數(shù)彌補了h指數(shù)的部分不足，屬于更為科學的評價指標。當然，本研究也存在以下不足：一是只考慮了學者在國內(nèi)的學術影響力評價。有些檔案領域的學者可能在國內(nèi)投入的精力較少，他們注重在國外期刊上發(fā)表學術論文，這些文獻在CSSCI中是檢索不到的，因此會影響到數(shù)據(jù)分析結(jié)果的精確性，從而影響到對學者學術影響力的評價。二是只考慮學者的論文情況，沒有將其著作考慮在內(nèi)。對檔案學領域而言，著作也非常重要，有些學者的經(jīng)典著作也能為其帶來長久的影響力。

參考文獻

[1]Evgenia Vassilakaki， Valentini Moniarou-Papaconstantinou，（2017） "Beyond preservation： investigating the roles of archivist"， Li-brary Review， Vol. 66 Issue： 3， pp.110-126.

[2]王云慶，徐芳.從作者分析看我國檔案學研究隊伍的狀況[J].檔案學通訊，2011（4）：19-23.

[3][11]呂文婷.中國檔案學學術群體共被引網(wǎng)絡探析[J].檔案學通訊，2018（2）：38-43.

[4]郭瑤. 基于文獻計量學的中國檔案學者群體研究[D].天津：天津師范大學，2011.

[5] Hirsh JE.An index to quantify an individuals scientific research output. Proceedings of the national academy of sciences of the USA，2005，102（46）：16569-16572.

[6]張正慧，鄭德俊.p指數(shù)用于中文社會科學學術期刊評價的適用性分析[J].圖書情報工作，2013，57（19）：121-126.

[7]王圣潔，蔣旭，何曉慶.期刊p指數(shù)與其他評價指標相關性探討[J].中國科技期刊研究，2014，25（11）：1404-1407.

[8]許新軍.p指數(shù)在期刊評價中的應用[J].情報學報，2015，34（12）：1246-1251.

[9]王志軍，鄭德俊. p 指數(shù)運用于人才評價的有效性實證研究[J].圖書情報工作，2012，56（14）：93-97.

[10]趙蓉英，魏明坤，楊慧云.p 指數(shù)應用于學者學術影響力評價的相關性研究[J].情報理論與實踐.2017，40（4）：61-65.

[12]Ball P.Index aim for fair ranking of scientists[J].Nature ，2005，436（18）：900.

蘭臺世界2020年10期

蘭臺世界的其它文章: 陶行知研究的新史料：教育演講稿兩篇; 清至民國容縣不動產(chǎn)契約檔案探析; 古代上行文書“啟”之功用與體式研究; 抗日戰(zhàn)爭時期陜甘寧邊區(qū)的鹽業(yè)經(jīng)濟; 留日、留德軍事生概況及其對近代中國軍事發(fā)展影響; 評乾隆年間江津知縣曾受一