張文潔,張 軍
天津市疾病預防控制中心(天津市預防醫學科學院)預防醫學雜志社《職業與健康》編輯部 天津 300011
科技期刊是科研成果發布展示和交流傳播的重要媒介和平臺,期刊的學術質量則是決定期刊生存和發展的主要因素[1]。我國科技期刊種類繁多,期刊收錄的文章質量參差不齊,科學客觀地對期刊進行評價、了解期刊真實的學術質量及影響力已成為目前的研究熱點。文獻計量學這一術語最早由英國情報學家阿倫·普理查德(Alan Pritchard)于1969年提出;我國文獻計量學專家邱均平教授將其定義為“以文獻體系和文獻計量特征為研究對象,是采用數學、統計學等計量方法,研究文獻情報的數量關系、分布結構、定量管理和變化規律,并進而探討科學技術的某些結構、特征和規律的一門學科”[2]。近年來,文獻計量學發展迅速,不僅成為了各大圖書館和情報部門經常使用的一門學科,而且已成為期刊評價的一個重要工具,是衡量期刊學術地位、為期刊發展提供參考依據的重要研究手段。本文對我國文獻計量學的發展歷程、文獻計量學在期刊評價中的應用及存在的問題進行綜述,以期為期刊評價與管理、期刊質量提高和良性發展提供參考依據。
我國關于文獻計量學的研究起步較晚,20世紀70年代后期才逐步傳播和興起,《文獻計量學的研究對象和應用》與《新穎的〈科學引文索引〉》2篇文獻為當時的代表性成果[3]。之后隨著一些應用性與介紹性文章的出現,文獻計量學逐漸被應用到各個學科中,從此文獻計量學研究在我國蓬勃發展。40多年來,經過許多專家學者努力,我國文獻計量學研究取得了長足的進步,逐步從傳統文獻計量學范式走向由文獻計量學、信息計量學、網絡計量學、科學計量學、知識計量學融合而成的現代文獻計量學范式,實現了從學科的突破、拓展與超越走向學科的轉型、融合與升級[4-5]。
關于我國文獻計量學的發展歷程,我國情報學領域的專家學者有過大量探討。早在1987年,我國文獻計量學奠基人之一邱均平教授就總結了我國文獻計量學的研究現狀和特點,將我國文獻計量學的發展分為2個階段,即1979—1982年為起始階段、1983—1987年為初級發展階段,并指出發展具有階段性、不平衡性、偏重理論方法的研究、教育起步快的主要特點[6]。2003年,他又重新劃分了我國文獻計量學的發展階段,在前2個階段的基礎上,延續劃分出第3個階段,即全面發展階段(1988—2000年),此階段在科技管理與科學評價方面取得了許多標志性成果,實現了理論與應用并重,如建立了“中國科技論文與引文數據庫”、利用美國SCI排出了我國主要大學發表論文的名次、相繼出版了《文獻計量學》等專著或教材等[7]。2009年,范全青等[8]以6 653篇發表于1979—2008年間的我國有關文獻計量學的論文作為研究對象,將這30年來我國文獻計量學的發展劃分為介紹推廣(1979—1983年)、普及應用(1984—1989年)、全面發展(1990—2008年)3個階段。2020年,任全娥[4]通過匯總統計歷年數據,繪制出1979—2019年我國文獻計量學研究的發文量趨勢圖,并將這40年的文獻計量學研究劃分為產生與初步發展階段(1979—1989年)、繁榮與全面發展階段(1990—1999年)、拓展與應用發展階段(2000—2009年)、突破與轉型發展階段(2010—2019年),同時采用知識圖譜文獻計量分析軟件CiteSpace對這4個階段的作者群體變遷及學科演進脈絡進行了可視化分析,直觀地展示出40年來我國文獻計量學的發展軌跡和特點。
文獻計量學研究的主要內容和實際應用領域之一就是期刊評價。期刊評價始于20世紀30年代,1934年,英國文獻學家布拉德福(Bradford)分析了文獻在期刊中的集中與分散規律,提出了文獻聚散定律,這一定律的確立奠定了文獻計量學的理論基礎,也拉開了期刊評價研究的序幕。直至現在,該定律仍是核心期刊評價的理論基礎。文獻計量學通過對期刊文獻進行定量分析,揭示了期刊發展規律和增長趨勢、客觀評價期刊學術水平及影響力。目前常用的文獻計量學評價指標有影響因子、總被引頻次、基金論文比、H指數等。
影響因子這一概念最早由美國情報學家加菲爾德(Garfield)博士于1972年提出,是目前國內外應用最廣、認可度最高的期刊評價指標。盡管其一直廣受質疑,但影響因子在期刊評價中的地位仍無可替代[9]。目前國際上最常用的是兩年影響因子,指期刊前2年發表的論文在統計當年被引用的總次數與該刊前2年發表論文總數的比值,衡量的是“論文的平均被引率”[10]。一般認為,期刊的影響因子越高,期刊的學術影響力也就越高。但要注意,期刊影響因子的大小并不能完全等同于期刊質量的高低。
我國學者已開展過大量將影響因子應用于期刊評價的實踐研究。李啟正等[11]以《中國期刊引證報告(擴刊版)》2013年版收錄的紡織學科期刊作為研究對象,對期刊的影響因子與學術質量評價結果之間的契合程度進行了分析。邱殿明等[12]以13種地球科學綜合類中文期刊作為研究對象,采用灰色關聯分析法,探討了影響因子與其相關評價指標的關系,為科技期刊綜合評價方法中權重值的確定提供了參考。此外,學者們也沒有忽視影響因子在期刊評價中的不足,積極尋求改進方法。臧志棟等[13]結合PageRank算法,并融入載文量、被引質量、被引數量、自引修正數量等多種期刊影響力因素,構建了基于PageRank算法的期刊影響因子——WIF_PR因子,與傳統影響因子相比,新指標能夠區分不同期刊被引質量和科學地考慮期刊自引數量,從而更加合理、全面地評價期刊影響力。針對部分期刊通過人為降低載文量、提高自引率來操縱影響因子的情況,俞立平等[14]于2019年提出了自然影響因子這一概念,有效防止了期刊的過度自引;2022年,其又通過懲罰函數從修正人為降低的載文量、剔除過度自引2個方面對影響因子進行了修正,提出了合理影響因子這一新指標,有效降低了影響因子的人為操縱[15]。
總被引頻次是指某一期刊自創刊以來所發表的全部論文在統計當年被引用的總次數,可以反映期刊被認可和使用程度及其在學術交流中的影響力大小。總被引頻次具有一定的時間特性,是一個存量指標,一般而言,創刊早的期刊,因其發表論文較多,總被引頻次也較高,因此,用總被引頻次評價期刊近期的學術水平可能不夠準確[16]。俞立平[17]提出,可以用5年被引頻次來代替總被引頻次以提高期刊評價的時效性與公平性,且不會改變評價結果的統計特征,值得推廣應用。
此外,總被引頻次還與期刊載文量、所在學科性質等因素有關。王群英等[18]分析了資源學、生態學、地理學3個相近學科的8種期刊的載文量、總被引頻次和影響因子之間的關系,發現載文量與總被引頻次密切相關,但與各期刊影響因子的相關程度不一。郭春蘭[19]對被引頻次的局限性進行分析時提出,不同學科的研究方式、科研規模、合作程度各有特點,導致不同學科引文頻次總體水平存在差異,所以不同學科期刊的總被引頻次不具有可比性。
基金論文比是指期刊所發表的受各類基金資助的論文占全部論文的比例。受基金資助的論文通常反映了其所在學科領域的新發展動向和趨勢,具有比較高的學術價值。因此,基金論文比可以在一定程度上衡量期刊學術質量與辦刊水平。
不過,我國學者對于將基金論文比作為期刊評價指標還有一定爭議。李曉紅等[20]認為,“基金論文比”比“影響因子”更能代表科技期刊的學術質量。而劉睿遠等[21]認為,基金論文比作為期刊評價指標是科學合理的,但是其評價效能不如影響因子等傳統指標。嚴燕等[22]則認為,將“基金論文比”作為期刊評價指標,其整體思路是欠科學、欠合理的,并不能真正反映期刊質量。
此外,學者們還注意到了基金項目的人為操縱情況。目前,隨著各期刊評價體系對基金項目論文的重視,期刊對基金項目論文更加青睞。不少期刊都有基金論文優先錄用、快速發表、免收審稿費等舉措,這就導致一些作者為提高錄用率、盡快發表論文而不據實標注基金項目,繼而引發科研誠信問題[23-24]。白雪娜等[25]對9種期刊的國家自然科學基金項目論文標注情況的調查發現,存在發表內容與項目研究內容不符、憑空捏造基金項目、同一項目在多篇論文中隨意掛靠的現象。馬英[26]和孫濤[27]均強調,學術期刊應客觀看待基金論文比,避免一味地追求指標而使期刊發展偏離方向。
H指數是美國物理學家赫什(Hirsch)于2005年提出的一個用于評估科研人員個人研究績效的全新學術評價方法,后匈牙利學者布勞恩(Braun)等將其擴展應用到期刊學術影響力評價中。其定義為:如果某一期刊所發表的全部論文中有H篇文章分別被引用了至少H次,同時H又滿足最大自然數條件,那么該值為該期刊的H指數。一般而言,H指數越高,期刊的影響力就越大。
與傳統期刊評價指標相比,H指數兼顧了數量(發表論文數量)和質量(被引頻次)兩方面,克服了傳統指標單一評價的缺憾,是傳統文獻計量評價方法的有益補充,一經提出就獲得了廣泛關注和大量應用。
當然,H指數也存在不足之處,如受載文量影響較大、對高被引論文重視不足、不適用于跨學科期刊間的比較等。近年來,我國學者對H指數的研究主要集中在H指數改進方面。俞立平等[28]于2018年提出用H指數除以載文量的對數,然后再乘以高被引論文的比例得到Htop指數,以對H指數進行綜合修正;2020年,其又提出用H指數除以開平方后的載文量得到Hq2指數,解決了因載文量大而造成H指數偏高的問題[29]。熊回香等[30]提出應綜合考慮學者活躍度和學術影響力的Hμ指數,解決了H指數忽略高被引論文、未考慮合著者分配等問題。這些研究優化并豐富了H指數評價體系,在提高H指數評價的科學性、公平性、完整性方面具有重要意義。
我國目前發展較為成熟的主要期刊評價體系有:北京大學圖書館編制的《中文核心期刊要目總覽》、武漢大學中國科學評價研究中心編制的《中國學術期刊評價研究報告》(RCCSE)、中國科學技術信息研究所編制的《中國科技論文與引文數據庫》(CSTPCD)、中國科學院文獻情報中心編制的《中國科學引文數據庫》(CSCD)和南京大學中國社會科學研究評價中心編制的《中文社會科學引文索引》(CSSCI)。由于各評價體系均有自己的數據庫和評價指標,評價標準不統一,導致同一期刊在不同評價體系中的評價結果存在差異,會給管理者和使用者帶來困擾。
前文已經提到,無論是傳統的,還是新興的期刊評價指標,在擁有各自優點的同時,都或多或少存在一些弱點或缺陷;而且有些指標還存在人為操縱現象,可能會引發學術誠信或學術不端問題。此外,一本期刊的質量應包括4個方面,即政治質量、學術質量、編輯質量和出版質量,而文獻計量學方法主要對期刊的學術質量方面進行評價,無法科學、客觀地反映期刊的整體情況。
由于不同學科的學科性質、發展狀況不同,很多期刊又是跨多個學科的綜合性期刊,各期刊評價體系的學科分類也不統一,加之評價指標的局限性,導致期刊的跨學科評價也存在一定困難。雖然近些年出現了一批新興的跨學科評價指標,如期刊引證指數(JCI)、影響因子百分位、SNIP、PR8指數、學科標準化影響因子(cnIF)等[31-33],但這些指標尚處于初始階段,還沒有得到廣泛應用,其適用性仍有待進一步深入研究。
經過40多年的發展,我國文獻計量學研究取得了長足進步,現正處于突破與轉型階段,挑戰與機遇并存。文獻計量學在我國期刊評價中也得到了廣泛應用,是目前最常用的科技期刊學術質量與影響力評價方法。當然,任何方法都有其適用前提和范圍,都不可避免地存在局限性,期刊文獻計量學評價也不例外。不斷完善期刊評價指標和體系建設,構建一個真正權威規范、科學實用并符合我國國情的科技期刊評價體系仍是今后研究的重點。