司靜雯



摘 要:為了提高學術期刊評價能力,提出一種基于聚類分析的JCR收錄多屬性評價方法。根據所得分數的高低對各評價方法進行排序,與原始數據的分類排序結果一致。對比各評價方法的聚類分類結果和原始數據聚類結果,進行聚類一致度分析,發現應選擇倒數平均方法來完成評價過程。將各類評價方法所得的聚類結果和原始數據聚類結果相比所得期刊數一致性結果可以發現,繼續進行聚類所得的一致度結果表明聚類數量基本不會對評價方法的選擇造成影響。
關鍵詞: 聚類分析; 期刊評價; 聚類結果一致度; 評價方法
中圖分類號: G 302
文獻標志碼: A
Abstract: In order to improve the evaluation ability of academic journals, this paper proposes a JCR multi-attribute evaluation method based on cluster analysis. The evaluation methods are sorted based on the score, which is consistent with the sorting result of the original data. By comparing the clustering classification results of each evaluation method with the clustering results of the original data, the consistency degree of clustering is analyzed. It is found that the harmonic average method should be selected to complete the evaluation process. The consistency results of the journal number obtained by comparing the clustering results of various evaluation methods with the original data clustering results can be found that the consistency results obtained by continuing the clustering show that the number of clusters will not affect the selection of evaluation methods.
Key words: cluster analysis; journal evaluation; consistency of clustering results; evaluation methods
0 引言
對學術期刊進行評價屬于一個非常的復雜過程,無法通過單一性量化達到全面分析的效果,因此必須選擇多屬性評價方法[1-3]。許多國內學者引入了多屬性評價方法來評價學術期刊,并由此形成了眾多的科研成果[4-5]。目前,多屬性評價方法的種類也較多,并且有些方法還在后續應用中進一步得到了優化,由此形成了上百種不同的評價方法,大量學術文獻都報道了多屬性評價方法的應用過程。由于單一評價方法屬于不同方法實現組合評價的重要基礎,如果可以通過篩選去除不合適的評價方法,則能夠顯著降低組合評價的運算量,尤其是對于某些特定情況將無需采用組合評價而只需選擇合適的單一評價方法便可以達到理想的評價效果[6-9]。對于現階段多屬性評價方法與組合方式呈現多樣化發展但缺少有效篩選方法的條件下,需要重點研究單一評價方法的篩選過程,進一步強化此類研究領域,從而獲得更加豐富的多屬性評價理論,并且也能夠更加高效地篩選評價方法,由此實現減小評價成本并使評價方法達到更高的公信力[10-15]。信譽度與知名度是對期刊重要性與影響力進行評價的二個重要一級指標,其中,信譽度是利用特征因子類指標進行評價,知名度是通過期刊影響力指標得到體現。
本文采用聚類分析的方法,構建得到一種建立在聚類分析基礎上的,同時選擇JCR2015數學期刊作為評價對象,分別以加權線性匯總、Vikor評價、Tops評價、倒數平均、主成分分析對其實施評價,探討多屬性評價篩選方法的分析原理與篩選過程,為選擇合適的多屬性評價方法提供了一定的參考。
1 JCR收錄期刊評價方法篩選原理
對期刊評價前實施聚類是根據原始評價指標來完成的,此時未運用多屬性評價方法,聚類過程都是從最本源的層面出發,由此實現的聚類可以達到很高的可靠程度。開展多屬性評價的過程中,無論選擇何種評價方法,最重要的一點是要有效保持原始數據分類情況,也可以理解成對原始數據分類過程影響最小的多屬性評價方法是最優的評價方法。當某一期刊在原始數據中屬于優秀期刊,而經過評價后變為中等期刊,如果這類情況出現的次數較少則認為是正常的,例如一些在優秀期刊中處于較后面的期刊。不過上述情況的出現次數較多時,或由太多普通期刊變為優秀期刊時,則表明此時評價方法存在問題。
期刊數量對于聚類種類具有重要影響。如果實際評價期刊的數量較多時,例如總共包含了300種,則可將其分成3類;對于數量較少的評價期刊,例如期刊數量只有20種,則可將其分成兩類。
對聚類結果進行一致度篩選包括如下過程:
(1) 選擇評價對象,結合評價對象數量來完成聚類分類;
(2) 通過Eans聚類方法對對原始指標實施分類,確定聚類種類的數量,通常為2~3種,由此獲得各類期刊的分類屬性集;
(3) 利
用n種可行的多屬性評價方法來完成評價,獲得n種評價結果集;對得到的評價結果實施聚類,獲得包含n種聚類結果集Z;
(4) 計算出各聚類結果Z和原始聚類結果之間的一致度,得到具有最高一致度的多屬性評價方法。選擇達到最高一致度的聚類結果作為學術期刊評價結果。
2 評價方法與數據
為深入分析多屬性評價方法的實際應用過程,本文分別采用加權線性匯總、倒數平均、主成分分析、Vikor、Tops、共五類評價方法開展了評價,同時利用聚類分析來選擇合適的評價方法。
加權線性匯總是采用權重方法進行數理統計匯總的傳統方法;倒數平均是利用線性加權方法進行數理統計匯總的傳統方法;主成分分析是采用評價矩陣來多的評價指標數的方法。
Tops方法是根據評
價對象到正理想解x+j與負理想解x-j的相對距離來評價的方法,其評價結果C按照下式進行:
本文以JCR2015數學期刊作為研究對象,由于數學學科含有眾多的期刊,選擇此學科作為分析案例具備較高代表性。總共選定了10個評價指標。與國內的大部分引文數據庫相比可以發現,JCR引文數據庫可以產生更加廣泛的影響,同時各項評價指標也具有更加明顯的特征。表1給出了各個評價指標的原始數據摘要描述統計結果,如表1所示。
3 實證結果
3.1 期刊評價
分別以加權線性匯總、Vikor、Tops、倒數平均與主成分分析來評價期刊,同時還需注意,在本文算例中各項指標具有相等的權重,即不對加權線性匯總、倒數平均以及Top設定權重。之后對各評價方法得到的評價結果實施聚類,得到結果,如表2所示。
對原始數據進行分類后得到了34種優秀期刊、175種良好期刊、70種一般期刊,呈現中間多、兩邊少的變化趨勢,采用Vikor評價方法只得到了2種優秀期刊,45種良好期刊以及230種普通期刊,因此該方法明顯不合理。采用主成分分析得到的評價結果包含9種優秀期刊、73種良好期刊以及192種普通期刊,無法滿足分類要求。
根據所得分數的高低對各評價方法進行排序為1、2、3,與原始數據的分類排序結果一致。例如,對Tops評價結果進行排序所得的分類結果也為1、2、3,這跟原始指標分類排序結果相符,未發生錯位排序的現象,由此表明采用不同評價方法得到的結果和原始數據的分類評價結果形成了相互對應。
3.2 聚類一致度分析
對比各評價方法的聚類分類結果和原始數據聚類結果,判斷兩者是否一致,并由此計算得到一致度結果,如表3所示。
可以發現,采用倒數平均聚類分析結果得到和原始數據聚類分析結果相同的期刊總共為150種,之后是Tops評價方法,總共為71種,第三類是加權線性匯總方法,總共為69種,采用Vikor評價方法只存在63種與原始數據聚類分析結果相同的情況,采用主成分分析得到了64種一致的結果,根據以上測試結果,應選擇倒數平均方法來完成評價過程。
3.3 穩健性檢驗分析
為分析聚類種類是否會對評價方法的選擇過程產生影響,總共設定了3種聚類,再驗證聚類一致度結果。先進行聚類處理,分別對3種分類實施聚類,得到的分類結果,如表4所示。
原始數據被分成4類,其中第一類為18種,第二類為71種,第三類為176種,與刊評價的預期結果相符合。在上述分類結果中,Vikor評價得到的第一類期刊總共為106種,第二類共3種,與實際情況不太相符,因此被淘汰。
繼續進行聚類所得的一致度結果,如表5所示。
將各類評價方法所得的聚類結果和原始數據聚類結果相比所得期刊數一致性結果可以發現,倒數平均方法達到了最高的一致度,總共有150種,之后為Tops方法,總共有101種,第三是線性加權匯總方法,總共73種,第四為Vikor評價方法,總共63種,最少的是主成分分析方法,總共63種。應注意,進行3種分類處理得到的聚類結果一致性情況和3種分類方式相同,由此表明聚類數量基本不會對評價方法的選擇造成影響。
4 總結
1) 分別以加權線性匯總、Vikor、Tops、倒數平均與主成分分析來評價期刊,根據所得分數的高低對各評價方法進行排序,與原始數據的分類排序結果一致。表明采用不同評價方法得到的結果和原始數據的分類評價結果形成了相互對應。
2) 對比各評價方法的聚類分類結果和原始數據聚類結果,進行聚類一致度分析,發現應選擇倒數平均方法來完成評價過程。
3) 將各類評價方法所得的聚類結果和原始數據聚類結果相比所得期刊數一致性結果可以發現,繼續進行聚類所得的一致度結果表明聚類數量基本不會對評價方法的選擇造成影響。
參考文獻
[1] 許玉艷,張偉倩,李澤嫻,等. 國內水產科技期刊學術影響力動態評估[J].中國農學通報,2018(34):138-145.
[2] 張娟.中國農業科學院科技期刊學術影響力及發展趨勢分析[J].農業圖書情報學刊,2018(11):131-134.
[3] 楊萍.基于Entropy-TOPSIS法的核心期刊綜合評價研究[J].牡丹江大學學報,2018,27(11):119-121.
[4] 俞立平,王作功. z指數評價學術期刊的適用性及其改進研究[J].情報學報,2018,37(11):1132-1139.
[5] 王安安.西南大學期刊社編輯出版的兩種自科學報2018年度綜合評價結果[J].西南大學學報(自然科學版),2018,40(11):185.
[6] 周紅霞.期刊SNIP指標趨勢分析與預測研究——以圖書情報領域3種期刊為例[J].情報探索,2018(11):58-64.
[7] 黃筱瑾.基于APC付費政策淺析數據期刊的可持續發展[J/OL].農業圖書情報學刊,2018(07):133-136.
[8] 陳國劍.改良中國科技期刊生態的著力點——從中國科技期刊的萌生談起[J].河南大學學報(社會科學版),2018,58(6):150-156.
[9] 邱香華,韓云波.回歸論文本位和學者本位的期刊論文評價模型創新——模糊綜合評判法在SCI和CSSCI期刊論文評價中的應用[J].重慶大學學報(社會科學版),2018,24(6):93-103.
[10] 宋扉,馮景,蔣愷.影響因子分區誤導的消極影響及改進建議[J].編輯學報,2018,30(05):446-449.
[11] 朱雯,陳榮,劉穎.期刊下載頻次和被引頻次的相關性研究——復合H指數視角[J].數字圖書館論壇,2018(10):25-31.
[12] 張洋,方一然.基于CSSCI的國內期刊評價研究分析[J].農業圖書情報學刊,2018,30(10):30-37.
[13] 劉雪立,魏雅慧,孟君.影響因子百分位在學術期刊跨學科評價中的局限性[J].中國科技期刊研究,2018,29(10):1018-1021.
[14] 李明,賀偉,肖學斌.載文量參數修正方法在學術期刊評價指標中的應用研究[J].情報科學,2018,36(10):110-115.
[15] 趙廓,陳禾.國外科技期刊網絡傳播效果研究[J].科技與出版,2018(10):170-173.
(收稿日期: 2019.08.30)