摘要:文章首先簡要介紹了期刊評價的理論基礎和目的,通過對各種期刊評價方法的對比,分析了期刊評價中單指標的局限性和主觀因素的影響。文章采用中國科技期刊引證報告數據,利用主成分分析法對科技期刊進行綜合評價,并給出了相關的評價結果,最后指出主成分分析法應用中應注意的問題和內容。關鍵詞:科技期刊;綜合評價;主成分分析法中圖分類號:C03
文獻標志碼:A
文章編號:1008-5831(2010)01-0119-05
隨著科學技術的迅猛發展和科學事業的不斷進步,科技信息量急劇增加,這帶來了科技期刊在品種和質量上都有較大增長。科技期刊在傳播科技成就,交流學術思想,促進科技成果產業化等過程中發揮了越來越重要的作用。
科技期刊作為傳播科技信息和知識的載體,構成了科技事業的重要組成部分,大到一個國家,小到一所學校或個人,其學術水平的高低均可通過期刊的狀況
得到體現,因而,對學術期刊的評價也受到越來越多的關注。面對科技期刊數量的迅猛增長,如何識別科技期刊的良莠?如何選擇科技期刊,以及如何評價科技期刊的水平,以揭示科研整體水平和效率?這是科研管理部門、科研工作者、情報研究人員以及讀者等都十分關心的問題,于是便產生出科技期刊如何評價和遴選的問題。對學術期刊進行科學合理的綜合評價,其結果微觀上會影響辦刊思想以及科研人員的投稿取向,宏觀上會對科學文化技術的發展與交流產生重大影響。毫無疑問,對學術期刊進行綜合評價不僅具有現實意義,而且十分必要。
一、學術期刊評價的理論基礎
大部分科技期刊都屬于學術期刊范疇。而學術期刊評價體系主要由引文數據庫以及建立在此基礎上的期刊組成。其理論基礎是“文獻離散定律”和“引文集中與分散定律”,評價的主要依據是影響因子。英國文獻學家布拉福德于1934年提出“文獻離散定律”,他按照引文密度將專業期刊劃分為對該專業最有貢獻的核心區域(nucleus)和論文數量與之相等的幾個相繼區域,將密度最大的核心區域的期刊稱為“核心期刊”。
1971年,美國文獻計量學家加菲爾德提出“引文集中與分散定律”,即:大約75%的被引文獻較為集中地來自少數期刊,其余少數被引文獻則來自大量較為分散的期刊。他將被引文獻來源較為集中的期刊定名為“核心期刊”,從而開了“核心期刊”遴選之先河
。后來,眾多學者對以上經驗定律提出各種修正方案,從多方面發展了相關的文獻計量理論與模型,形成了諸多公認的定律和數學模型。
二、科技期刊評價的目的
文獻[1]認為,學術類科技期刊評價的目的有4個:(1)為制定科技政策提供咨詢;(2)為科技期刊的宏觀管理提供客觀依據;(3)有利于營造鼓勵科技創新的大環境;(4)為促進編輯學理論研究的發展和推動科技期刊工作的改革提供契機。
文獻[2]分別從公共價值學派、理論方法學派、實用主義學派二三個角度分析了科技期刊評價的目的。公共管理學派從公共管理的角度出發,以公共價值為目標研究科技期刊如何促進科學研究工作,如何通過科技期刊評價指標體系引導科技期刊提高學術質量,從而更好地為國家的科技自主創新體系服務;理論方法學派,則從科學計量學、圖書情報學理論方法人手,研究科技期刊的學科屬性,對公共價值學派提出的指標體系進行批評和提出改進意見,更多地考慮理論上的可行性;實用主義學派,多是從個別學科或某個期刊的角度出發研究如何利用期刊指標,提高自身的影響力或強調單個指標在評價體系中的重要性,研究適用于本學科本期刊的評價指標體系。

文獻[3]認為,期刊評價的目的從理論上看有4個方面:一是要把刊登高學術質量論文多的科技期刊評選出來;二是要把包含信息量大的科技期刊評選出來;三是把流通量大也就是看的人多的科技期刊評選出來;四是要把應用、引用、利用其中科技理論及方法多的科技期刊評選出來。
從以上觀點看,對科技期刊評價目的的理解都不盡相同,但總體說來,科技期刊的評價是想通過科學、客觀與合理的評價方法,評選出辦刊水平高,選登論文質量優秀的科技期刊。通過這種評價來促進科技期刊質量的提高,保障期刊的良性發展,同時為各級科技管理部門、廣大科研工作者、各類讀者和圖書館情報人員等期刊使用者提供具有重要參考價值的信息和參考工具。

三、中國科技期刊評價方法
實際上,科技期刊的評價是一個龐大且復雜的系統工程,需要很多定性和定量的指標。目前評價期刊的因素很多,常見的有引文率、影響因子、被引頻次、他引率、即年指標、基金論文比等。隨著科技期刊信息化和電子出版物的發展,電子期刊也逐漸增多,于是又出現了Web下載量、Web即年下載率為代表的期刊評價指標。
在眾多指標因素中,首先要確定哪些指標的組合最能合理地評價期刊,即怎樣將他們組合起來建立合理的指標體系?究竟其中哪些因素所起的作用比較大,哪些是主要影響因素?在許多評價方法中都沒有具體指明。
其次,各類指標權重的確定缺乏科學的方法,多帶有主觀性。指標的權重對期刊評價的影響很大,加權法中各因素權重的確定主要靠專家意見,專家咨詢法得到的權重因子具有不確定性和模糊性。層次分析法雖然采用了數學方法計算權重,但也是建立在專家的經驗基礎之上的。因此,有必要采用一種科學的客觀綜合評價法來對科技期刊進行評價。
中國科學技術信息研究所從1987年開始,就投大量人人、物力對科技期刊和論文的發表情況進行統計分析研究,并年度出版《中國科技期刊引證報告》。該報告是在基于學科分類的基礎之上,利用文獻計量學指標對不同學科范疇內的期刊進行評價,并依此通過統計計算出單個評價指標的具體數值,但很明顯,該報告對評價指標的數值未作進一步綜合分析。例如中國科技期刊引證報告2007年版中將同一學科類別期刊的總被引頻次、影響因子這兩個評價指標作散點分布圖進行對比,然而,這種比較僅能描述期刊在單項指標上的差異,并不能全面反映出評價指標間的特征,也不能揭示期刊之間的綜合質量和水平。在各領域的科學研究中,為了全面客觀地分析問題,往往要考慮從多方面觀察所研究的對象,要收集多個觀察指標數據,如果一個一個地分析這些指標,容易造成對研究對象片面的認識,也不容易得出綜合的、一致性很好的結論,而主成分分析法可以綜合考慮多方面的因素和各指標間的關系,因此,本文試圖利用主成分分析法,對科技期刊進行綜合評價。
四、綜合評價實例分析
(一)數據來源和說明
科技期刊評價的原始數據源自中國科學技術信息研究所發布的2007年版《中國科技期刊引證報告》,并以‘計算機科學技術類’期刊為實例,采用該報告中的9個期刊引用計量指標:總被引頻次、影響因子、擴散因子、學科擴散指標、學科影響指標、引用期刊數、即年指標、他引率和被引半衰期。該報告共給出25種計算機科學技術類期刊,如微型計算機應用、計算機工程、軟件學報等,如表1。
由于篇幅所限,表1僅列出五種期刊,顯然該評價體系給出的僅是單個指標得分值,無法得出期刊的總體評價分布信息。
(二)科技期刊主成分分析法應用
在實際研究和應用中,由于指標較多,再加上指標之間有一定的相關性,容易造成信息重疊,而一旦隨意減少變量又會損失很多信息,可能產生錯誤結論。而主成分分析法(Principal Component Analysis)可以將多個指標簡化成少數幾個不相關的綜合指標,達到降低數據空間維度、簡化系統結構的目的。表2為利用SPSS對表1中的9個原始評價指標、25個評價對象(期刊)數據計算出來的相關系數矩陣的特征值及其貢獻率。
表2中,Extraction Sums 0f Squared Loadings為因子提取結果,是未經旋轉的因子載荷的平方和。它給出了特征值大于1的前三個因子,可以看出前三個成分所解釋的方差占總方差的85.50%,具有較好的代表性,因此我們確定提取前三個主成分,這在一定程度上減少了原始數據的復雜性,而且其僅僅丟失14.5%的信息。
由旋轉后的因子得出的碎石圖可以看出,因子1與因子2,以及因子2與因子3之間的特征值之差值比較大,而因子4以后的特征值之間的差值都比較小,因此可以進一步得出:保留3個因子將能夠概括
從旋轉后的因子可以看出,因子F1主要與學科擴散指標、學科影響指標、總被引頻次和引用刊數相關,該因子主要反映期刊的學科對外擴散程度;因子F2主要與影響因子、即年指標和擴散因子相關,影響因子和即年指標反映的都是期刊的自身影響力,而擴散因子也是顯示總被引頻次擴散的范圍,所以因子F2主要反映期刊對其他期刊或學科的影響力;而因子F3主要與被引半衰期、他引率和影響因子相關,期刊被引半衰期主要反映期刊收錄的較新論文是在多長一段時間內發表的,期刊被引半衰期越高,該期刊被其他期刊引用的次數越多,從而與他引率關系越緊密,結合與影響因子關系,該因子反映的是期刊影響力的持久性。
圖2分別以因子(F2)為橫坐標,因子(F1)為縱坐標,給出了前兩個因子的坐標分布圖,可以看出,分布于右上角的期刊,如:17(軟件學報)在期刊的學科對外擴散和期刊的影響力方面都比較高;而分布于右下角的期刊,如:15(計算機與應用化學)的期刊影響力比較高,但其學科對外擴散程度比較低,這說明該期刊可能在化學這一學科的應用領域影響力比較大,但對別的學科影響則比較小;分布于左上角的期刊,如:7(計算機工程與應用)的期刊影響力比較小,但其跨學科的程度比較高。
為了對期刊進行綜合評價,我們利用表三中旋轉后的因子(主成分),將三個主成分分別表示成:
F1=0.210X1+0.065 X2-0.068 X3+0.172X4+0.239X5-0.103 X6+0.233 X7+0.239 X8-0.031 X9
F2=0.030X1+0.296 X2+0.430 X3-0.378 X4-0.083)(5-0.222 X6-0.099 X7-0.083 X8+0.050 x9
F3=0.040X1+0.397 X2+0.047 X3+0.400 X4-0.071)(5-0.016X6+0.010 X7-0.071 X8+0.735 X9
以三個主成分的方差貢獻率為系數可以構建期刊評價指數w如下,即:
W=A l×F1+A 2×F2+A 3×F3
分別將方差貢獻率代入上式,即:W=52.097%×F1+20.751%×F2+12.650%×F3
由于9個原始指標的量綱不同,為便于計算,消除不同指標所帶來的不同量綱之間的影響,我們利用均值法來計算最終評價得分。分別將原始值利用均值標準化后代入上式,就可以得出上述25個計算機科學技術類期刊的綜合評價得分值以及其排名,如表4。
為便于比較,我們對得分進行了標準化處理。可以看出“軟件學報”的綜合評價得分最高,遠遠高于其余計算機技術類期刊,這表明軟件學報的期刊質量和水平最好。相對而言“計算機學報”、“計算機工程與應用”緊接在后面兩位,應該說前三種期刊在計算機類期刊中具有較高的辦刊質量,應該算是優秀類期刊。而從得分來看,60分以上的期刊有六種,占25中期刊中的24%,基本符合2:8分布規律定律,這在一定程度上揭示了主成分方法的合理性。而絕大多數期刊的得分都分布在20~60分之間,而計算機輔助工程、微計算機應用的得分都是很低的,與優秀類期刊有較大差距。
五、結論
筆者提出的基于主成分分析法的期刊綜合評價方法,可以有效規避期刊評價指標權重設置中主觀因素的影響,同時可以通過主成因子的構成,分析不同指標之間的相關關聯性。從方法的運用和結果來看,利用主成分分析法可以比較準確地評價期刊質量和水平的高低,具有較好的實用性,但在主成分分析法的應用中必須注意如下幾個方面:(1)主成分分析法賦權的結果可能與客觀實際有些偏差,也有可能無法客觀地反映指標的實際重要程度;(2)主成分分析法中的樣本彼此間是獨立的,它們應該是一個簡單的隨機樣本,否則用主成分分析法得出的結論是不妥當的;(3)評價指標之間如果有多重相關性,那么主成分分析可能會歪曲真實的數據信息,一些主成分將會過分地夸大某些因素的作用,而無法客觀反映樣本的統計特征;(4)原始數據列中,某些數據是越大越好的正向分布,而有些數據是越小越好的逆向分布,對于逆向數據可以用取倒數的方法,將其變為正向分布,以利于原始數據的轉化處理。