索 琪,郭進利
(1.上海理工大學管理學院,上海 200093;2.青島科技大學經濟與管理學院,山東 青島 266061)
?
評價長期科學影響的模型
索琪1,2,郭進利1
(1.上海理工大學管理學院,上海 200093;2.青島科技大學經濟與管理學院,山東 青島 266061)

摘要:提出了一個更合理的量化長期科學影響模型,并獲得模型的解析結果。論文在生命周期內的總引用次數代表了其長期的科學影響,結果顯示,該值只與其適應度有關。說明論文本身的內容、質量代表了其競爭力的大小,決定了其長期影響力。
關鍵詞:復雜網絡;引文網絡;長期影響
0引言
近年來,對引文網絡的研究備受關注,學者提出了一系列的演化機制來刻畫引文網絡。論文的被引用次數常被認為是評估論文的科學影響的重要指標[1]。Price[2]在1965年構建了引文網絡模型,論文被視為節點,論文之間的引用關系被視為有向邊。研究發現,只有極少量論文被引用了多次,而大多數論文僅獲得了較少的引用。Price認為論文被引用次數的增長是一個累積優勢過程,早期的研究者由于具有先行者優勢而導致其論文獲得較多的引用[3]。根據Price模型[3],引用次數越多的論文是該領域的經典文獻,被引用的概率會越大,這種擇優連接機制導致了引文網絡的“富者越富”現象。然而,實證研究發現許多真實的引文網絡不符合簡單的無標度現象。Price模型認為,節點進入系統的時間決定了它獲得連邊的能力,這種機制導致老節點的平均邊數必然高于新節點。事實上,即使是同一時間發表的兩篇論文,被引用次數也可能存在很大差別。因此,單一的擇優連接機制,而忽略了論文的內容本身,不能很好地刻畫引文網絡的增長。在引文網絡中,論文獲得引用的概率還與其研究內容密切相關,一些“年輕”的論文由于具有很好的學術價值,揭示了重要的科學發現,也可能在短時間內獲得大量的引用。如文獻[4]作為復雜網絡領域開創性的研究論文,在發表后很短時間內就獲得超過千次的引用,可稱之為“適應度”現象[5]。除時間因素外,對于競爭力的識別,也引發了網絡科學的新模型的研究。Bianconi等[6]指出,節點獲得連邊的能力不僅取決于年齡,而且取決于競爭獲得連邊的適應度,適應度越大的節點獲得連邊的能力越大。適應度模型中節點的進入時間和節點的競爭能力(適應度)共同決定了節點獲得連邊的能力,該模型不僅考慮到先行者優勢,也考慮到后來者趕超的因素。在引文網絡中,適應度參數[7-8]描述了論文的質量、貢獻,體現了論文個體本身的競爭力的大小。
此外,擇優連接的時間依賴性也成為引文網絡的研究熱點。Amaral等[9]認為,考慮到節點的年齡因素和獲得連邊的能力約束因素,有些網絡具有單標度或拉直指數分布特性。Zhu等[10]構建了一個漸進老化模型,并研究了年齡因素對聚類系數、網絡結構的影響。Hajra等[11-12]認為,引文網絡是一個老化網絡。Medo等[13]考慮到時間因素對引文網絡增長的影響,實證研究發現節點的吸引度隨年齡而衰減。Wang等[14]通過對3個引文數據庫的實證,分析論文的年齡對擇優連接的影響,發現論文的被引用率隨其年齡的增長而降低,即論文獲得連邊的能力隨時間呈指數衰減。事實上,由于科技論文的創新性特質要求,學者在文獻引用時,一方面會引用少量的本領域的經典文獻;另一方面,會引用大量的最近幾年的論文,由于這些“年輕”的論文反映了當前的研究熱點,必然在發表后的最初幾年獲得大量引用。因此,大部分論文的吸引力必然隨發表時間的延長而衰減。

1模型描述
類似于摩爾定律中描述的內存容量以指數級增長,科技論文每年發表的數量也呈指數形式增長[17],如式(1)所示。Barabási等[15]對The Physical Review(PR)數據庫分析發現,β=(17years)-1,即論文數量每17×ln(2)=11.8年翻一倍。
N(t)~exp(β t)
(1)
假設每篇新論文發表時,引用m篇老論文。在t時刻,文章i被引用的概率不僅依賴于節點的度(總引用次數)ci,而且依賴于它的適應度ηi和年齡Δti。即滿足:
(2)

2模型解析
Barabási等[15]對PR數據庫實證,發現引文模式呈跳躍式衰減。年齡衰減函數可以近似為一個對數正態分布函數
(3)
其中,t為時間,μ為平均壽命,σ為壽命波動。

(4)
(5)
設ci=m(f(ηi,Δti)-1),則有
(6)
由式(1),有
(7)
由式(6)和(7)及Δti=t-ti=β-1ln(N/i),有
(8)
記
(9)
將方程(9)帶入(8),得
(10)

(11)
因此,
(12)
A由下列積分方程確定
(13)
將式(3)帶入式(12),得
(14)
其中φ(x)是累積正態分布函數
(15)

(16)
由式(16)可知,論文在生命周期內的總引用次數獨立于μ和σ,只與論文的適應度ηi有關。
3結論

參考文獻:
[1]Garfield E. Citation analysis as a tool in journal evaluation [J]. Science, 1972, (178):471-479.
[2]Yu P, Van de Sompel H. Networks of scientific papers [J]. Science, 1965, 169: 510-515.
[3]Price D S. A general theory of bibliometric and other cumulative advantage processes [J]. Journal of the American Society for Information Science, 1976, 27(5): 292-306.
[4]Barabási A L, Albert R. Emergence of scaling in random networks [J]. Science, 1999, 286 (5439): 509-512.
[5]Redner S. How popular is your paper? An empirical study of the citation distribution [J]. The European Physical Journal B-Condensed Matter and Complex Systems, 1998, 4(2): 131-134.
[6]Bianconi G, Barabási A L. Competition and multiscaling in evolving networks [J]. Europhysics Letters, 2001, 54(4): 436.
[7]Caldarelli G, Capocci A, De Los Rios P, et al. Scale-free networks from varying vertex intrinsic fitness [J]. Physical Review Letters, 2002, 89(25): 258702.
[8]Servedio V D P, Caldarelli G, Butta P. Vertex intrinsic fitness: how to produce arbitrary scale-free networks[J]. Physical Review E, 2004, 70(5): 056126.
[9]Amaral L A N, Scala A, Barthelemy M, et al. Classes of small-world networks [J]. Proceedings of the National Academy of Sciences, 2000, 97(21): 11149-11152.
[10]Zhu H, Wang X, Zhu J Y. Effect of aging on network structure [J]. Physical Review E, 2003, 68(5): 056121.
[11] Hajra K B, Sen P. Aging in citation networks [J]. Physica A, 2005, 346(1): 44-48.
[12] Hajra K B, Sen P. Modelling aging characteristics in citation networks[J]. Physica A, 2006, 368(2): 575-582.
[13] Medo M, Cimini G, Gualdi S. Temporal effects in the growth of networks [J]. Physical Review Letters, 2011, 107(23): 238701.
[14] Wang M, Yu G, Yu D. Effect of the age of papers on the preferential attachment in citation networks[J]. Physica A, 2009, 388(19): 4273-4276.
[15] Wang D, Song C, Barabási A L. Quantifying long-term scientific impact [J]. Science, 2013, 342(6154): 127-132.
[16] Guo J L, Suo Q. Comment on “quantifying long-term scientific impact”[DB/OL].[2014-05-15].http://arXiv.org/abs/1405.1574v2, 2014.
[17] Blumm N, Ghoshal G, Forró Z, et al. Dynamics of ranking processes in complex systems[J]. Physical Review Letters, 2012, 109(12): 128701.
(責任編輯耿金花)
A Model to Quantify Long-term Scientific Impact
SUO Qi, GUO Jinli
(1.Business School, University of Shanghai for Science and Technology, Shanghai 200093, China;2.School of Eeconomics and Management,Qingdao University of Science and Technology,Qingdao 266061,China)
Abstract:We propose a model to quantify long-term scientific impact and obtain analytic results of the model. It is more reasonable than the model proposed by Barabási et al. The total citation count of a paper in its life cycle represents its long-term scientific impact. The results show that the value is only related to the paper’s fitness. It means that the content and the quality of the paper represents, the capability of its competitiveness, and determine its long-term impact.
Key words:complex network; citation network; long-term impact
文章編號:16723813(2016)01006404;
DOI:10.13306/j.1672-3813.2016.01.005
收稿日期:2015-05-07
基金項目:國家自然科學基金(71571119);國家統計科學研究項目(2015LZ497);山東省統計科研重點課題(KT15059)
作者簡介:索琪(1980-),女,黑龍江哈爾濱人,博士研究生,講師,主要研究方向為復雜網絡、超網絡。通訊作者:郭進利(1960-),男,陜西西安人,博士,教授,主要研究方向為復雜網絡、人類行為動力學。
中圖分類號:N94
文獻標識碼:A