張慧,葉鷹
(1.上海大學圖書情報檔案系,上海 200444;2.江蘇省數據工程與知識服務重點實驗室,南京大學信息管理學院,南京 210023)
作為優質論文的一類特殊引文現象,“黑-白天鵝”模型獨樹一幟[1],其實證探索已應用于以物理學、化學和生物醫學為代表的自然科學類諾貝爾獎優質論文中,并得到了較好的實證效果[2]。因此,本文試圖擴展探索“黑-白天鵝”模型的學科適用性,考查其是否同樣適用于諾貝爾經濟學獎的優質論文,但是結果卻很不理想。為探索可適用于更廣泛學科范圍的特殊引文模式,本文在“黑-白天鵝”模型的基礎上進一步發現了“天鵝群”模式,并應用在諾貝爾獎物理學和經濟學優質論文的分析中,其中“天鵝群”所占比例均在40%以上[3]。
同時,“睡美人”(Sleeping Beauty)[4]作為描述科學研究中的“延遲承認”現象,自2004年被提出以來,其是公認的優質論文具有的一種特殊引文模式,對其量化特征的研究包括對識別“睡美人”文獻方法的探討[5]、“王子文獻”的挖掘等方面[6],Ke等[7]提出了“睡美人指數”B,用于在大量文獻中識別“睡美人”文獻;Du等[8]進一步改進了“睡美人指數”B,提出了Bcp指標;Ye等[9]提出了“引文角”(citation angle),可同時用于識別“睡美人”現象和“曇花一現”現象,并可綜合B指數和Bcp指數等。此外,研究表明在天才的作品中可發現較多“睡美人”文獻[10]。
與“睡美人”僅從量化角度測量不同,“黑-白天鵝”模型和“天鵝群”模式是建立在質性判定基礎上的量化模型,研究者在探索過程中又進一步發現了“天鵝群”模式中存在“伴隨睡美人”現象[11],獲得“天鵝群”模式和“伴隨睡美人”的相互關聯,構成綜合論文質與量進行測評的特殊探討。現以物理學和經濟學為實證參照提供學界參考。
論文品質的判定一般通過同行評議來進行,屬于定性研究的范疇,本文中對優質論文的界定也同樣來源于同行判定的結果。由于公認的優質論文集稀缺,本文采用最具有公信力的諾貝爾獎作為判定,選擇諾貝爾獎獲獎者的論文作為研究起始。首先,涉及的概念是關鍵論文(key paper)和關鍵論文集(key publications),兩者的定義如下。
定義1:關鍵論文
關鍵論文,是諾貝爾獎獲獎者在被授予獎項時依據的相關論文,會以最重要貢獻對應的論文載入史冊。本文定義的關鍵論文是諾貝爾獎獲獎者被授予獎項時憑據的最重要論文,會在演講報告中被提及。關鍵論文的確定來自定性判斷。
定義2:關鍵論文集
諾貝爾獎獲獎者在獲獎之后會做演講報告(Nobel lecture),在報告中獲獎者會詳細闡述自身研究生涯及重大發現,并列出一系列參考文獻。本文定義關鍵論文集為諾貝爾獎獲獎者在演講報告的參考文獻中引用的自身文獻(即自引文獻)。關鍵論文的判斷依靠的是定性判斷,所以關鍵論文不一定被包含在關鍵論文集中。在關鍵論文集中,部分獲獎者會將在獲得諾貝爾獎之前整個研究生涯的所有研究文獻均列入演講報告的參考文獻中,一定程度上會影響到論文的品質,所以關鍵論文集的論文品質不及關鍵論文優質。
綜合關鍵論文和關鍵論文集的定義,本文研究的優質論文界定如下。
定義3:優質論文
關鍵論文和關鍵論文集構成優質論文。其中,前期研究中對“天鵝群”模式和“伴隨睡美人”模型的探索均基于優質論文中的關鍵論文[3,11],本文的研究擴展采用關鍵論文集,選擇關鍵論文集可在更大的范圍內探索“天鵝群”模式和“伴隨睡美人”模型。
本文前期研究以“黑-白天鵝”模型為基礎[1-2]。在“黑-白天鵝”模型中,“天鵝”論文有兩種類型,分別是“黑天鵝”論文和“白天鵝”論文,兩者定義如下。
定義4:“黑天鵝”論文
“黑天鵝”論文代表某一科學領域的突破性發現。本文的關鍵論文即“黑天鵝”論文。
定義5:“白天鵝”論文
“白天鵝”論文為“黑天鵝”論文發表前的高被引論文,且被“黑天鵝”論文所引用。
在“黑-白天鵝”模型中,“黑天鵝”論文一經發表,“黑天鵝”論文被引量與“白天鵝”論文被引量呈現出“此消彼長”的狀態,其描述的特點是“黑天鵝”論文具有科學突破性,“黑天鵝”論文的出現打破了“白天鵝”論文原有的引文形態。
為進一步探索可適用于不同性質學科的優質論文的特殊引文模式,“黑-白天鵝”模型被擴展為“天鵝群”模式[3],模式圖如圖1所示。
其中,橫軸T表示論文發表年份;縱軸C表示論文被引量;B代表“黑天鵝”論文;W1和W2代表兩篇“白天鵝”論文;TS為“黑天鵝”論文發表年份;TS+5為“黑天鵝”論文發表后的第五年。
由圖1可知,在“天鵝群”模式中,“黑天鵝”論文和“白天鵝”論文在“黑天鵝”論文發表后的五年時間引文曲線均呈現顯著增長的趨勢,兩種類型的論文呈現“共舞”狀態,發展形成一組“天鵝群”。“黑-白天鵝”模型和“天鵝群”模式中均選擇五年時間窗口,是基于van Raan[4]識別“睡美人”文獻的標準(van Raan法則)來考慮,即“睡美人”文獻需滿足兩個條件:一是文獻沉睡期至少為5年,且年均被引量小于等于2;二是文獻喚醒后4年內被引量大于20。因此,“黑-白天鵝”模型和“天鵝群”模式均選擇五年時間窗口來進行解析。“天鵝群”模式中選擇“黑天鵝”參考文獻中被引量最高的前兩篇作為“白天鵝”論文。

圖1 “天鵝群”模式示意圖
根據“黑天鵝”論文和“白天鵝”論文在“黑天鵝”論文發表后五年時間的被引量來定義“天鵝群”指數GS,進行量化研究,其公式為

其中,CB為“黑天鵝”論文在發表后五年時間窗口的被引量;CW1和CW2分別為兩篇“白天鵝”論文在同段時間窗口的被引量。基于公式(1),并結合“黑天鵝”論文和“白天鵝”論文被引量的相對大小,可將“天鵝群”模式劃分為以下三種類型:
類型1:CB>CW1且CB>CW2,即CB同時大于CW1和CW2;
類型2:CB≤CW1且CB≤CW2,即CB同時小于或等于CW1和CW2;
類 型3:CB>CW1且CB≤CW2,或CB≤CW1且CB>CW2,即CB介于CW1和CW2之間。
在“天鵝群”的三種類型中,類型1表示“黑天鵝”比任意一只“白天鵝”都強壯,類型2表示任意一只“白天鵝”比“黑天鵝”強壯,類型3則囊括了其他情況。其中,類型1的“天鵝群”最接近“黑-白天鵝”模型的思想,類型2和類型3則為“天鵝群”模式中存在的特殊類型。
由于研究發現“天鵝群”模式中存在“睡美人”現象,故需考慮“伴隨睡美人”模型,如圖2所示[11]。

圖2 “伴隨睡美人”模型示意圖
“伴隨睡美人”模型,是在“天鵝群”模式基礎上結合“睡美人”模型形成的,用于探索“天鵝群”模式的“白天鵝”論文中存在的“睡美人”現象。圖2中“白天鵝”論文W2即屬于“伴隨睡美人”文獻。“伴隨睡美人”文獻可定義如下。
定義6:“伴隨睡美人”文獻
“天鵝群”中存在的“睡美人”文獻即“伴隨睡美人”文獻。
通常情況下,“天鵝群”模式的兩篇“白天鵝”論文中僅存在一篇“伴隨睡美人”文獻(W1或W2),但也存在兩篇“白天鵝”論文均屬“伴隨睡美人”文獻的少數情況。與“黑-白天鵝”模型和“天鵝群”模式相同,“伴隨睡美人”模型也是同時綜合論文質與量測評的研究。區別于單純定量挖掘“睡美人”文獻的方法,“伴隨睡美人”模型從全新角度綜合論文的質性判斷和定量分析來探索“睡美人”現象。
本文選擇諾貝爾獎物理學和經濟學兩個學科的關鍵論文集,數據獲取時間窗口為2001—2010年,采集步驟如下:第一,在諾貝爾獎官網(https://www.nobelprize.org/)搜集各學科獲獎者的演講報告;第二,從這些報告參考文獻中可獲得每位獲獎者的關鍵論文集;第三,從WoS(Web of Science)數據庫中獲取諾貝爾獎獲獎者關鍵論文集的引文數據及其參考文獻的引文數據,作為“天鵝群”模式和“伴隨睡美人”模型探索的基礎數據,關鍵論文集中的論文為計量模式中“黑天鵝”論文,關鍵論文集中論文參考文獻被引量最高的兩篇論文為計量模式中“白天鵝”論文。
在“黑-白天鵝”模型中,本文基于前文提及識別“睡美人”文獻的van Raan法則[4],設立CW>50和CB>100,用于“黑-白天鵝”模型定量研究,即“白天鵝”論文與“黑天鵝”論文被引量五倍于“睡美人”文獻值設置,用于區分五年時間窗口不同類型的“天鵝”。本文對優質論文研究聚焦于諾貝爾獎物理學和經濟學兩個學科,考慮到不同學科領域論文引用情況不同,結合ESⅠ(Essential ScienceⅠndicators)2010—2019平 均學 科 引用 率記錄(2020年6月查詢),即物理學和經濟學的平均學科引用率分別為11.48和9.09,設定“天鵝群”模式和“伴隨睡美人”模型中CB和CWi在兩個學科分別大于等于50和25。下文實證研究將據此設定開展。
2001—2010年諾貝爾獎物理學和經濟學關鍵論文集數據匯總如表1所示,涉及各學科獲獎科學家人數、關鍵論文集中去除重復數據后的論文數目和“天鵝群”實例數目、“伴隨睡美人”實例數目以及各自所占關鍵論文集論文數目的比例。

表1 2001—2010年諾貝爾獎各學科關鍵論文集數據匯總
2001—2010年物理學和經濟學分別有27位和21位科學家被授予諾貝爾獎項,各學科關鍵論文集分別包含225篇和295篇論文。本文分別在物理學和經濟學關鍵論文集中發現了89個和85個“天鵝群”實例,占比分別為39.56%和28.81%。由此可見,不同于“黑-白天鵝”模型僅可適用于物理學、化學和生物醫學等自然科學類學科(在經濟學適用比例不足1%)[3],“天鵝群”可同時適用于物理學和經濟學兩個不同性質的學科。此外,物理學和經濟學中分別識別出10篇和24篇“伴隨睡美人”文獻,占比分別為4.00%和6.78%,遠高于Ye等[9]的一項研究(僅存在約0.1%的典型“睡美人”文獻)。
2001—2010年諾貝爾獎物理學和經濟學獲獎者中,分別有8位和2位獲獎者關鍵論文集中未發現有“天鵝群”實例。除此之外,分別有6位和7位獲獎者“天鵝群”實例占比在區間(0,30%],有8位和7位獲獎者“天鵝群”實例占比在區間(30%,70%],兩個學科均有3位獲獎者“天鵝群”實例占比大于70%。物理學和經濟學“天鵝群”實例根據“天鵝群”指數區分的類型分布如表2所示。

表2 2001—2010年諾貝爾獎各學科“天鵝群”實例類型分布
由表2可知,在物理學和經濟學關鍵論文集中均是“類型2”的“天鵝群”占據絕大多數,所占比例均在70%以上;其次為“類型3”的“天鵝群”;“類型1”的“天鵝群”占比最低,尤其在經濟學學科占比僅為1.18%。由此可見,“天鵝群”實例類型分布在物理學和經濟學兩個學科具有一致性。
本文分別在2001—2010年物理學和經濟學關鍵論文集中識別出10篇和24篇“伴隨睡美人”文獻。其中,物理學2004年獲獎者David J.Gross和2007年獲獎者Albert Fert均有4篇“伴隨睡美人”文獻,2008年獲獎者Makoto Kobayashi有2篇“伴隨睡美人”文獻且伴隨著同一篇“黑天鵝”論文;經濟學2001年獲獎者Joseph E.Stiglitz、2002年獲獎者Vernon L.Smith、2007年獲獎者Eric S.Maskin和2009年獲獎者Oliver E.Williamson分別有6篇、4篇、3篇和6篇“伴隨睡美人”文獻,其余2004年獲獎者Finn E.Kydland、2006年 獲獎 者Edmund S.Phelps、2007年獲獎者Roger B.Myerson、2008年獲獎者Paul Krugman和2009年獲獎者Elinor Ostrom各有1篇“伴隨睡美人”文獻。這里分別選擇物理學2004年獲獎者David J.Gross和經濟學2001年獲獎者Joseph E.Stiglitz的3篇“伴隨睡美人”文獻進行展示,如圖3所示。圖3中均以一個橫軸加雙縱坐標軸展示,橫軸表示論文發表年份,縱軸表示論文被引量。每幅圖中無標記曲線表示“黑天鵝”論文(B),“▲”標記和“-”標記分別表示兩篇“白天鵝”論文(W1和W2)。

圖3 諾貝爾獎物理學和經濟學“伴隨睡美人”文獻部分實例
在圖3中,物理學3篇“伴隨睡美人”文獻均為“白天鵝”論文W1,且這3篇文獻實為同一篇“睡美人”論文,但因伴隨不同“黑天鵝”論文被發現,所以計為3篇“伴隨睡美人”文獻。這3組“伴隨睡美人”實例文獻信息如下:
·2004Gross_1
“黑天鵝”:Gross D J,Wilczek F.Ultraviolet behavior of non-abelian gauge theories[J].Physical Review Letters,1973,30(26):1343-1346.
·2004Gross_2
“黑天鵝”:Gross D J,Neveu A.Dynamical symmetry breaking in asymptotically free field theories[J].Physical Review D,1974,10(10):3235-3253.
·2004Gross_4
“黑天鵝”:Gross D J,Wilczek F.Asymptotically free gauge theories.Ⅰ[J].Physical Review D,1973,8(10):3633-3652.
伴隨以上3篇“黑天鵝”論文而被識別出的“伴隨睡美人”文獻信息為:
Weinberg S.A model of leptons[J].Physical Review Letters,1967,19(21):1264-1266.
依據van Raan法則[4],此篇“伴隨睡美人”文獻“喚醒時間”為1971年,“睡眠時期”年均被引量為1.2,論文被“喚醒”之后四年被引量為622。
經濟學3篇“伴隨睡美人”文獻均為圖3中“白天鵝”W2。這3組“伴隨睡美人”實例文獻信息如下:
·2001Stiglitz_1
“黑天鵝”:Grossman S J,Stiglitz J E.On the impossibility of informationally efficient markets[J].The American Economic Review,1980,70(3):393-408.
“白天鵝”2:Hayek F A.The use of knowledge in society[J].The American Economic Review,1945,35(4):519-530.
·2001Stiglitz_2
“黑 天 鵝”:Stiglitz J E.Ⅰncentives and risk sharing in sharecropping[J].The Review of Economic Studies,1974,41(2):219-255.
“白天鵝”2:Arrow K J.The role of securities in the optimal allocation of risk-bearing[J].The Review of Economic Studies,1964,31(2):91-96.
·2001Stiglitz_3
“黑天鵝”:Stiglitz J E.Some lessons from the East Asian miracle[J].The World Bank Research Observer,1996,11(2):151-177.
“白天鵝”2:Kuznets S.Economic growth and income inequality[J].The American Economic Review,1955,45(1):1-28.
依據van Raan法則[4],以上3篇“伴隨睡美人”文獻“喚醒時間”分別為1973年、1969年和1972年,“睡眠時期”年均被引量分別為0.48、1.33和1.11,論文被“喚醒”之后四年被引量分別為25、36和27。
在多數情況下,“天鵝群”模式的2篇“白天鵝”論文中,僅有1篇可被識別為“伴隨睡美人”文獻,但在物理學2008年獲獎者Makoto Kobayashi、經濟學2002年獲獎者Vernon L.Smith和2007年獲獎者Eric S.Maskin的實例中均存在同1個“天鵝群”的2篇“白天鵝”論文都屬“伴隨睡美人”文獻的情形。
本文在諾貝爾獎物理學和經濟學分別發現10篇和24篇“伴隨睡美人”文獻,“伴隨睡美人”文獻本質實為“睡美人”文獻。由于存在文獻重復的情況,各學科“伴隨睡美人”文獻中“睡美人”論文數目要小于等于“伴隨睡美人”文獻數目。因此,物理學10篇“伴隨睡美人”文獻實為4篇“睡美人”論文,經濟學24篇“伴隨睡美人”文獻實為14篇“睡美人”論文。
本文基于諾貝爾物理學和經濟學獎對優質論文中的“天鵝群”模式和“伴隨睡美人”現象進行了探討,其中優質論文數據集選取了關鍵論文集。本文研究結論如下:
(1)優質論文中的“天鵝群”模式可同時適用于諾貝爾獎物理學和經濟學兩個不同性質的學科,在各學科關鍵論文集占比分別為39.56%和28.81%,比僅適用于以物理學、化學和生物醫學為代表的自然科學類學科的“黑-白天鵝”模型更具有普適性。此外,“天鵝群”類型在物理學和經濟學中的分布具有一致性,“類型2”的“天鵝群”占據絕大多數,“類型3”的“天鵝群”占比最低。
(2)優質論文的“天鵝群”中同時存在“伴隨睡美人”,在物理學和經濟學關鍵論文集中“伴隨睡美人”文獻占比分別為4.00%和6.78%,遠高于Ye等[9]的普通文獻集里僅存在約0.1%的典型“睡美人”文獻。
本文的局限性主要是優質論文集得之不易,論文要獲得國際公認優質很難;僅依據van Raan法則[4]識別“睡美人”文獻也有局限。這些局限有礙本文方法的推廣應用,其他擴展考慮[12-13]和王子文獻識別[14-15]可能有助于深化相關研究,而改進和優化策略及途徑則有待繼續進一步探索。