金 飛, 謝 勰, 鄭 亮, 雎 悅, 王 浩
(1. 江蘇金智教育信息技術有限公司, 江蘇 南京 211100; 2. 西安郵電大學 通信與信息工程學院, 陜西 西安 710121)
基于物理關聯的學術期刊引用網絡影響力分析
金 飛1, 謝 勰2, 鄭 亮2, 雎 悅2, 王 浩2
(1. 江蘇金智教育信息技術有限公司, 江蘇 南京 211100; 2. 西安郵電大學 通信與信息工程學院, 陜西 西安 710121)
從網絡科學的視角分析學術期刊的影響力。針對傳統方案忽視網絡結構緊密度的缺陷,以物理關聯作為期刊選擇的依據。利用期刊之間的引用關系建立引用網絡,基于頂點強度進行統計分析以評估期刊的影響力情況。引入頂點權重因子改進影響力度量,并以地緣性比較緊密的若干高校學報為例進行測算評估。數據分析表明引用網絡方案可以較好地進行學術期刊影響力評估,特別是具備同一物理屬性的期刊群。
網絡科學;引用網絡;學術期刊;影響力分析
網絡科學[1-2]是目前的熱門研究領域,它發現并解決了很多問題,也因此變得越發重要和流行。學術研究的影響力評估是一個古老但一直困擾學界的難題,而網絡科學為其提供了一些非常好的解決方案[3]。
網絡科學應用于學術期刊的影響力分析其原因是現代學術合作越來越密切,而學術期刊正是聯系學者的重要媒介,由此形成的網絡結構研究非常豐富[3]。簡單來說,期刊中論文的被引用情況直接表明了該期刊的影響力水平,期刊被引用論文的次數越多,說明它的學術影響力越大,期刊質量越高。而期刊之間連接關系形成網絡結構,因此使用網絡科學評估研究對象的影響力分析是一個非常合適的方案。
基于網絡結構評價影響力的問題則是有些學術期刊的結構關系非常松散,單從形式上選取的一組期刊難以獲得較好的影響力評估。為此可引入期刊之間的物理關聯,基于此給出新的期刊選取策略,從而更好的進行學術期刊影響力評估。
可以將所有要評價的對象看作是在一個圖(或網絡)中的頂點,頂點之間用邊相連接。這些對象可以是若干學者,或若干論文。對象所組成的圖形稱為影響力圖,并通過函數來計算所有對象的影響力的值。在我們的模型中,頂點v的影響力值不再僅由其自身決定,而是與網絡中的其他頂點相互之間有影響,尤其是那些直接與v連接的頂點。首先,我們構建影響力網絡模型,然后,通過對象之間的關聯關系建立影響力網絡,并從中獲得影響力最大的個體。
對于一群相互關聯的對象,我們使用圖作為模型來評估其中每個對象的影響力。設圖G為(V,E),其中對象的集合構成頂點集V,而對象之間的關系構成邊集E。對于每一個v∈V,有自權重R(v),每一條邊e=(u,v)∈E,有邊權重W(u,v)。
為簡單起見,先定義初始頂點強度為

(1)
考慮到每個頂點有其自身的權重,可將頂點強度S(v)改進為

(2)
其中最具影響力頂點v*的獲得可通過公式
v*=argmaxQ(v)。
(3)
為了衡量各個期刊之間的影響力關系,可考察期刊中發表的論文。通過論文的引用關系來決定期刊之間的關系,根據引用度量值的累加計算期刊之間的權值,并最終獲得所有期刊的影響力圖GJ。
首先建立論文的引用關系網絡。需要明確論文與論文之間的引用關系,通過檢索相關期刊文獻數據庫,可以得到所有論文的引用情況。且由于論文之間可能存在相互引用關系,故該引用關系網絡圖為有向圖中的雙向圖。假定所有的論文構成了頂點集V,對于任意的論文u和v,若論文u引用了論文v,則它們之間存在一條有向邊(u, v),并定義邊的初始權重W(u, v) = 1,否則它們之間不存在邊。
考慮期刊的影響力圖。設有期刊{J1,J2,…,Jt},由此定義了V的一個劃分為{V1, V2, …, Vt},其中Vi中所有論文發自同一期刊Ji(1≤ i≤t),因此它們滿足
Vi∩Vj=? (1≤i,j≤t),

(4)
于是期刊{J1,J2, …,Jt}形成了GJ= (VJ,EJ),可將Jp與Jq之間的邊權重定義為

(5)
可以基于頂點強度[4-6]來計算期刊的影響力,對于期刊Jp(1≤p≤t),定義其影響力S為

(6)
于是即可得到所有期刊的影響力度量。
還可以對上述模型進行改進,檢索每個期刊的論文總數n,并用它的倒數作為期刊的自權重R(Jp)(1≤p≤t)的值,即R(Jp) = 1/n,再與相應期刊的邊權重進行運算,得到其影響力Q為

(7)
學術期刊的物理關聯性可以有多種選擇,傳統上研究人員通常選擇專業性較緊密的期刊形成網絡,但實際上地緣性等物理指標更為適合。例如某地區的高校學報是該地區高校學術交流的一種體現方式,由于物理關聯緊密,高校研究人員相互關聯較強,從而讓對應的高校學報的網絡結構更為緊密,因此可以此為準則選擇期刊并評估其影響力。
從某地區高校中選取15所具有代表性的理工類高校,并通過查閱中國期刊全文數據庫中對應高校學報J1到J15,分別將2011-2013年各學報引用其他學報的情況進行統計(表1),在統計過程中不考慮自引的情況。表1中橫向表示所選取的15所高校學報,縱向表示被引用的高校學報,矩陣數據表示三年內橫向高校學報引用縱向高校學報中論文的總次數。

表1 某地區理工類高校學報2011-2013年總引用情況
使用Pajek軟件[7]將表1中的數據繪成引用關系網絡圖(圖1),圖中的頂點代表所選的15所高校學報,頂點上的數據表明入度和出度之和,頂點越大表明數據值越大,相同的數據頂點大小相同,箭頭指向的是被引用的學報所在高校。由此也可以看出,J4所在頂點最大,即具有最高的影響力其次依次是J7,J5,J1等,說明這些高校學報具有較高的影響力,其論文具有較高的參考價值。

圖1 某地區理工類高校學報論文引用網絡
計算這些期刊的影響力S和Q,并對比傳統的復合影響因子[8],具體統計數據如表2所示。由于本方案更強調網絡結構的關聯性,因此比傳統的單純強調影響因子的評價更貼近實際。

表2 期刊影響力評分排名
根據物理關聯性合理選取了學術期刊,并對其進行影響力評估,相比于傳統的評估方案更為合理。具有較強物理關聯的期刊之間能形成較緊密的網絡結構,這有助于合理評估學術影響力。
未來需要對物理關聯性指標進一步量化,并納入較多的因素以改善模型的合理性。例如有些學報被一些特定學報引用次數相對較多,其主要原因是由于這些學校之間專業對口性稍強,這需要對模型進一步修正。
[1]LewisTG.NetworkScience:TheoryandApplications[M].NewJersey:Wiley, 2009: 1-22.
[2]EasleyDA,KleinbergJM.Networks,Crowds,andMarkets:ReasoningAboutaHighlyConnectedWorld[M].NewYork:CambridgeUniversityPress, 2010: 1-20.
[3]LiEY,LiaoCH,YenHR.Co-authorshipnetworksandresearchimpact:Asocialcapitalperspective[J].ResearchPolicy, 2013, 42(9): 1515-1530.
[4] 譚躍進, 吳俊, 鄧宏鐘.復雜網絡中節點重要度評估的節點收縮方法[J]. 系統工程理論與實踐, 2006, 26(11): 79-83.
[5] 周璇, 張鳳鳴, 李克武, 等.利用重要度評價矩陣確定復雜網絡關鍵節點[J]. 物理學報, 2012, 61(5): 1-7.
[6] 張琨, 李配配, 朱保平, 等.基于PageRank的有向加權復雜網絡節點重要性評估方法[J]. 南京航空航天大學學報, 2013, 45(3): 429-434.
[7]BatageljV,MrvarA.Pajek:ProgramforLargeNetworkAnalysis[CP/OL].(2014-03-04)[2014-03-15].http://pajek.imfm.si/doku.php?id=pajek.
[8] 中國知網.期刊復合影響因子[DB/OL].(2008-01-12)[2014-03-15].http://cpas.cnki.net/OldCore/.
[責任編輯:王輝]
Influence citation network analysis of academic journals based on physical relations
JIN Fei1, XIE Xie2, ZHENG Liang2, JU Yue2, WANG Hao2
(1. Jiangsu Wisedu Information Technology Co., Ltd, Nanjing 211100, China;2. School of Communication and Information Engineering, Xi’an University of Posts and Telecommunications, Xi’an 710121, China)
Influence of academic journals is analysed in the perspective of network science. Journals are chosen based on their physical relations to fix the problem of omitting network structure connection strength in traditional methods. The citation network of journals is established by the citation relationship between them, and the citation statics of the journals is obtained based on the vertexes strength, which is used to evaluate the influence of journals. The weight of vertexes is introduced to improve the measurement of influence, and university journals with closely geopolitical relation are taken as an example to measure influence. Data analyses show that the citation network method can evaluate the journal influence effectively, especially for the journal group with the same physical attribute.
network science, cictation network, academic journals, influence analysis
10.13682/j.issn.2095-6533.2014.05.022
2014-03-15
陜西省教育廳專項科研計劃基金資助項目(2013JK1131)
金飛(1979-),男,碩士研究生,工程師,從事大數據處理研究。E-mail:kimfly@163.com 謝勰(1981-),男,副教授,從事算法設計與分析研究。E-mail:xiexiexx@xupt.edu.cn
TP393
A
2095-6533(2014)05-0112-04