韓曦英,侯力鐵,孫健*
(1.長春中醫藥大學醫藥信息學院,吉林 長春;2.長春中醫藥大學圖書館,吉林 長春)
學術期刊影響力是體現期刊學術價值的指標之一,它指的是期刊內刊載文獻在特定的時期內促進相關學術研究與應用發展的能力。期刊學術影響力首先受刊載文獻學術價值與應用價值的直接影響;其次與科研人員的主觀認知水平與信息素養有關;再次,期刊本身的傳播途徑、擴散能力等因素也會影響學術期刊的影響力;在特定時期內的社會因素、政策制度因素等,也是影響學術期刊影響力的因素。2013 年,中國科學文獻計量評價研究中心首次提出了一種綜合評價學術期刊影響力的方法,并應用于“中國最具國際影響力學術期刊”遴選。隨著“中國科技期刊國際影響力提升計劃”的實施,我國英文科技期刊的國際影響力有明顯提高,但影響因子、總被引頻次等計量指標在對該計劃實施的績效評價中飽受爭議[1]。
期刊的影響因子(Impact factor,IF),是現階段評價學術期刊影響力的主要指標,它是某刊在某年被全部源刊物引證該刊前兩年發表論文的次數與該刊前兩年所發表的全部源論文數之比。不同領域、不同學科的期刊影響因子也存在較大差異[2]。而且根據現行的計算方法,期刊的被引頻次與其對科研活動的真實學術貢獻程度相比,存在較大差異;時效性對期刊影響力的作用也沒有體現,因此胡健飛[3]等提出了基于學術貢獻值及被引分布均值的期刊影響力量化修正新解。
基于期刊影響力與影響因子關系的不確定性,筆者采用相關分析、主成分分析和分位數回歸的方法,利用文獻計量的相關指標,重塑了期刊影響力與影響因子之間的關系,為優化期刊影響力評價體系提供了基礎。
各種評價期刊影響力的不同指標之間的相關關系一直是學者們研究的熱點,并且隨著科學計量方法與情報學的結合越來越廣泛,文獻計量研究越來越全面、客觀。董敏紅[4]、安梅[5]、蘇楊[6]、周建[7]等分別利用統計學中主成分分析的方法分析了各種期刊的影響力指標間的關系及其與對期刊影響力的關系。俞立平[8]、薛慶根[9]等利用分位數回歸的方法對不同種類期刊的影響力指標進行了分析。但是期刊的各個影響力指標之間的相關關系不同,又存在著信息的交疊,不同影響因子期刊的IF 與影響力指標的關系也不盡相同,單用一種方法并不能全面的分析IF與影響力因子之間的關系。因此,筆者基于實證數據,采用多種多元統計分析的方法,利用不同的維度分析北大核心醫學類期刊影響因子與各種影響力指標之間的相關關系。

表2 北大核心醫學類期刊影響因子與影響力指標因子的相關系數及顯著性
2.1 數據來源
本文數據來自于2016 版《中國科技期刊引證報告》自然科學卷核心版,為了全面、準確、公正、客觀的評價期刊,《中國科技期刊引證報告》核心版結合中國期刊實際情況選用了期刊的幾種影響力指標:總被引頻次、即年指標、他引率、引用刊數、擴散因子、權威因子、被引半衰期等多種指標,根據不同的權重系數對期刊進行綜合評價。
由于醫學類期刊相對專業性較強、期刊數量較大、傳播較廣,且北大核心收錄的醫學類期刊學術水平較高,代表性強。因此,本文選取了北大核心收錄的216 種醫學類期刊作為研究對象,并對其中的影響因子和各種影響力指標進行分析。
2.2 研究方法
主成分分析是通過正交變換將一組可能存在相關性(信息有一定的重疊)的變量轉換為一組線性不相關的變量(主成分)。也就是用幾個較少的綜合標量盡可能多地反應原來變量的信息,是一種降維的方法。
單從定義看,期刊的各個影響力指標之間是有著相關關系的,即在刻畫期刊的影響力方面,影響力指標之間是有信息的重疊的。因此利用統計學的相關分析量化期刊影響力指標的相關關系,同時在明確相關關系存在的基礎上利用主成分分析(principal component analysis,PCA)對期刊的影響力指標進行整合,旨在盡可能保留原始變量信息的同時,將信息重疊的變量刪去。
分位數回歸(quantile regression)由Koenker 和Bassett 在1978 年提出,其通過取0~100%的任意分位數,調節回歸平面的位置和轉向,確定自變量與不同分位數的因變量之間的線性關系[10]。求解目標函數得到模型的參數估計為

其中ρτ(u)為檢查函數,,I(z)為示性函數。與普通的線性回歸相比,通過分位數的調節,分位數回歸既能在一定程度上代表所有數據的信息,也可以側重于特定區域的數據,且對數據沒有正態性的要求。因此利用分位數回歸分析影響力指標與期刊影響因子的關系可以全面明確各個層次的期刊的影響因子與影響力指標的關系。
本文數據采用R 程序R i386 3.4.2 進行分析。
本文選取的北大核心收錄的216 種醫學類期刊的影響因子和影響力指標的基本情況如表1。

表1 北核醫學類期刊影響因子及影響力指標統計描述
由于期刊的影響因子和影響力指標數據并不服從正態分布,因此采用spearman 系數描述各個指標之間的相關關系。
Spearman 相關分析表明,從平均程度上看期刊影響因子與影響力指標中的他引率、開放因子與期刊的影響因子之間關系并不顯著(P>0.05),與其他的影響力指標都有顯著的相關性(P<0.05)。而影響力指標之間,總被引頻次與即年指標、引用刊數、擴散因子、權威因子之間,即年指標與引用刊數、擴散因子、權威因子之間,他引率與引用刊數、開放因子、擴散因子、被引半衰期之間,引用刊數與開放因子、擴散因子、權威因子之間,開放因子與擴散因子之間,擴散因子與權威因子之間存在著顯著的相關性(P<0.05)。
鑒于期刊的部分影響力指標之間有著顯著的相關性,存在著信息的重疊,應用主成分分析的方法在保留原始信息的同時對期刊的影響力指標進行篩選。結合特征值>1 和累計貢獻率>85%即保留原始變量信息超過85%以上的原則,保留了四個影響力指標的主成分。

表3 期刊影響力指標的主成分

表4 分位數回歸結果

圖1 在各個百分位數與期刊影響因子有顯著相關關系的影響力指標
主成分的表達式為:
主成分1=0.970 總被引頻次+0.332 即年指標+0.089他引率+0.786 引用刊數+0.142 開放因子-0.664 擴散因子+0.971 權威因子-0.060 被引半衰期
主成分2=-0.057 總被引頻次-0.227 即年指標+0.800他引率+0.502 引用刊數+0.911 開放因子+0.604 擴散因子-0.053 權威因子+0.192 被引半衰期
主成分3=0.023 總被引頻次+0.219 即年指標+0.236他引率-0.169 引用刊數-0.183 開放因子+0.028 權威因子+0.939 被引半衰期
主成分4=-0.147 總被引頻次+0.887 即年指標+0.000他引率+0.006 引用刊數+0.187 開放因子+0.070 權威因子-0.150 權威因子-0.153 被引半衰期
主成分分析結果表明總被引頻次和權威因子構成第一主成分;他引率和開放因子構成第二主成分;被引半衰期構成第三主成分;即年指標構成第四主成分。北核醫學類期刊的八項影響力指標中的信息主要由其中的總被引頻次、即年指標、他引率、開放因子、權威因子、被引半衰期來表達,信息覆蓋達到90.260%。
北核醫學類期刊2015 年的影響因子的范圍為0.237~12.940,跨度較大。可以預見影響因子不同的雜志,其與影響力指標之間的關系也有不同,僅僅針對影響因子的平均數進行分析并不全面。選取不同的分位數進行期刊影響因子與主要的期刊影響力指標見的分位數回歸分析。分析結果見表4。
分位數回歸分析表明,期刊影響因子相對極低(百分位數=5%)和較低的(百分位數=25%)北核醫學類期刊,其期刊影響因子與即年指標之間有顯著(P0.05)或極顯著的(P<0.01)相關關系;期刊影響因子處于中位的( 百分位數=50%) 的北核醫學類期刊,其期刊影響因子與即年指標、開放因子有極顯著的相關關系(P<0.01),與被引半衰期有顯著的相關關系(P<0.05);期刊影響因子較高的(百分位數=75%)的北核醫學類期刊,其期刊影響因子與即年指標有極顯著的相關關系(P<0.01),與被引半衰期有顯著的相關關系(P<0.05);期刊影響因子相對極高的(百分位數=95%)的北核醫學類期刊,其期刊影響因子與即年指標之間有極顯著的相關關系(P<0.01)。可見不同百分位數影響因子的期刊,與其影響因子顯著相關的影響力指標并不全相同。
4.1 影響因子與影響力指標之間的相關分析有助于期刊評價指標的選取
北大核心醫學類期刊影響力指標中為總被引頻次、即年指標、他引率、開放因子、權威因子、被引半衰期為最主要的指標,在綜合刻畫期刊影響力時應給予較高的權重。不同分位數的影響因子的北核醫學類期刊,其有顯著相關關系的影響力指標也不盡相同,在綜合評價期刊影響力時應分層次研究分析。
4.2 多元統計分析的方法有助于從多角度、全面、定量地分析期刊評價指標
主成分分析在明確期刊影響因子、多種影響力指標之間有顯著的相關關系的前提下,能夠在保留絕大多數原始信息的同時,甄選出期刊影響力指標的主要成分。分位數回歸分析有利于詳細分析影響因子處于不同層次的期刊的影響因素的特點,較普通的以期刊影響因子均數為應變量的多元回歸分析更能全面分析與期刊影響因子有顯著相關關系的與影響力指標。因此在對期刊影響力做定量分析時,宜采用多種統計分析方法綜合分析。但是不同種類的期刊分析方法和結果不盡相同。
作者貢獻說明:韓曦英:設計并實施了研究的框架和方法,處理了數據,寫作了論文;侯力鐵:修正了論文的方向和框架;修改了論文。