楊杰,鄧三鴻,王昊
(1. 南京大學信息管理學院,南京 210023;2. 江蘇省數據工程與知識服務重點實驗室,南京 210023)
科學并不是像一次函數一樣平滑地發展,開創性的科學研究才是推動社會進步的最大助力[1],開創性的研究通常具備高度的顛覆性(disruption)[2]。近年來,學者們通過《萊頓宣言》[3]和《舊金山宣言》[4]對傳統計量指標提出批判,并呼吁創新測度的相關指標。2020年,教育部、科技部等在《關于規范高等學校SCI論文相關指標使用 樹立正確評價導向的若干意見》[5]中指出,在科研評價中,要突出創新的質量和貢獻。對科學研究的創新性進行準確的測度是新時代下情報學和科學計量學的一項重要任務[6]。
科學和技術可以被描述為一種動態發展的復雜網絡[7],顛覆性創新的研究則體現為科學或技術網絡結構中對既有范式的破壞[8]。顛覆性指數(dis‐ruption index,DI)是Funk等[9]于2017年提出的新指標,基于專利技術的深層網絡結構計算其創新性,具體表現為專利的顛覆性影響分布,即該專利是否較大程度地影響了所在領域的技術范式。2019年,Wu等[10]將顛覆性指數拓展至文獻計量領域,并基于大樣本的實證研究證明了顛覆性指數的有效性和可靠性,如諾貝爾獎得主代表性成果的顛覆性指數具有較高的正值,而鞏固性研究的顛覆性指數往往為較低的正值甚至是負值。2023年,Park等[2]基于顛覆性指數的測度,發現當代科學似乎正在陷入“顛覆性停滯”的陷阱,即科學和技術的平均顛覆性正在逐漸下降。近年來,顛覆性指數在文獻計量學[11]、信息科學[12]和網絡科學[13]等多個領域得到了廣泛應用,而其局限性主要在于缺乏測度一致性和區分度[14-15]。Leydesdorff等[16]學者基于實證提出了DI*、DI5等一系列改進指標,以緩解DI測度不一致、分布不均勻等問題[14],但這些指標依然存在較大的改進空間。
本文在顛覆性指數最新研究的基礎上進行總結和改進,深入剖析了顛覆性指數測度不一致的表現及因素,并提出一種全新的計量指標——相對顛覆性指數(relative disruptive index,RDI),最后基于Web of Science(WoS)數據庫的引文數據進行實證檢驗,將顛覆性指數與相對顛覆性指數的結果進行對比分析。研究結果表明,顛覆性指數的局限性體現在對不同參考文獻數量的論文測度時出現異質性,原因體現在參數量級不一致,相對顛覆性指數在一定程度上解決了這些問題,能夠更好地測度科學研究的顛覆性創新程度。
科學進步的創新驅動因素一般是復雜且罕見的,因此,科學研究創新性的測度存在著較大的障礙[17]。現有的創新性測量方式一般是基于Koestler提出的“新穎的概念或方法結合”思路[18],Flem‐ing[19]、Boudreau等[20]以及Packalen等[21]分別基于這種思路研究了期刊、專利和論文的創新性,Uzzi等[22]提出了基于參考文獻的期刊組合罕見程度(atypical)的創新性計算方法,Boyack等[23]基于標準偏差(standard deviation,Std Dev)對該方法進行改進并驗證了其有效性;Wang等[24]利用類似的方法,但是僅選取期刊的首次組合作為創新性評判依據;Uddin等[25]基于關鍵詞的組合罕見程度來衡量研究的創新性;Fontana等[26]基于論文的參考文獻學科分類的新穎性組合或跨學科程度來測度其創新性;Azoulay等[27]基于出版物的MeSH(medical subject headings)主題詞重組比例來衡量其創新性;羅卓然等[28]將組合創新應用到學術詞匯文本,提出基于語義相似度的創新性指標。Shi等[29]將論文主題映射為多層嵌入網絡,并以此計算論文主題的不常見組合模式來表征其創新性。盡管創新性的研究在同行評議的過程中會面臨較大阻礙[20],但是其往往能夠取得更大的長期影響力[26]。
從理論基礎來看,現有的創新性測度指標主要是基于論文主題新穎的或者不常見的組合模式,屬于事前測度(ex ante)指標,雖然其不同于論文被引量[30]、擴散速度[31]、影響廣度[32]等事后測度(ex post)指標,但均屬于單一維度的評價指標。除創新性外,傳統的引文指標主要包括數量、合作、主題和影響,其測度維度也較為單一[33];而對于科學創新性這一復雜要素,則應當基于引文網絡中的多維度深層次關系進行測度[31]。
1.2.1 DI
顛覆性指數的理論基礎源自Popper的科學發展理論[34]和Kuhn的范式變革理論[35],即常規科學會在當前范式下解決未知的問題,而顛覆性科學不同于常規科學,顛覆性科學會在一定程度上突破既有范式的局限,產生新的范式、學科或領域。在引文網絡的視角下,可以將論文節點的前向引用節點視作其知識基礎,而將后向被引節點視作知識流動和影響[36],那么對于具備顛覆性創新特征的論文,其后繼節點會較小程度地依賴于該論文本身的知識基礎,而直接建立在該論文創立的“新范式”下,由此,顛覆性的概念可以定量地反映為引文網絡中論文被引模式的一種分布[13,37]。Funk等[9]基于專利引用網絡提出了顛覆性指數指標,用于衡量某一專利是發展還是顛覆了現有的技術趨勢。Wu等[10]進一步提出了引文網絡中的顛覆性指數,在引文網絡中,某一核心論文(focal paper,FP)的顛覆性指數定義為
其中,NB代表引用了FP,并且引用了FP參考文獻至少一次的論文數量;NF代表引用了FP,但沒有引用FP參考文獻的論文數量;NR代表沒有引用FP,但引用了FP參考文獻至少一次的論文數量。
Azoulay[38]對顛覆性指數有一直觀的解釋:對于某一核心文章FP而言,如果許多引用FP的論文也同時引用了FP的大部分參考文獻,那么FP可以被視為鞏固了其學科范式;反之,如果FP的未來引文并不承認FP的參考文獻,那么其可以視為顛覆了其學科領域的研究范式,甚至開創了新的領域。
1.2.2 DIn
Bornmann等[39]認為僅引用了FP的一篇參考文獻可能是一些特殊引用行為導致的,為了更準確地評估FP的引文文獻與被引文獻之間的緊密關系,給參數NB增加了引文數量的最低門檻n:
顯然,DI1完全等價于DI。在n值較大時,可以看作提高了NB的引文門檻,Bornmann等[39]認為這樣可以在一定程度上減少無目的性引用的影響,并通過實證檢驗出DI5具有較好的檢驗結果。
1.2.3 其他拓展及局限
Leydesdorff等[16]對顛覆性指數進行了改進,提出了兩個新指標DI*和DI#,并認為DI*可以更為直接地測度FP對原有學科范式的顛覆程度,而DI#則更偏向于測度FP在多大程度上繼承或發展了之前的研究,從而能以更細的粒度評價文章的創新性和鞏固性。Zhou等[40]將顛覆性指數和PageRank算法相結合,提出了DPRank模型,并基于美國物理學會(American Physical Society,APS)數據驗證了其測度有效性。Liu等[41]結合多維索引系統,對涵蓋多學科的多源數據進行了融合式顛覆性技術挖掘。Wang等[12]在顛覆性指數的基礎上,結合MeSH主題表提出了知識實體層次的創新性測度方法。Yang等[13]將顛覆性指數拓展為復雜網絡的重要節點測度指標,發現顛覆性指數識別出的關鍵節點與傳統指標的結果差異顯著。
顛覆性指數的主要局限性在于測度的缺乏有效性[15]、一致性[14]和區分度[16],現有研究主要是對顛覆性指數進行拓展,而顛覆性指數的測度不一致性和不均勻性問題一直沒有得到有效的解決,較大程度上限制了該指標的應用范圍。顛覆性指數局限性的一個體現是,衡量參考文獻數量不同的論文時缺乏一致性[14]。本文的創新之處在于,發現并深入分析了顛覆性指數的局限性,提出新的指標以有效測度科學研究的顛覆性創新。
顛覆性指數最早于2017年被Funk等[9]提出,2019年Wu等[10]的研究結果在Nature發布之后,引發了科學計量學界的廣泛討論。新的計量指標往往存在許多待完善之處,作為衡量論文顛覆性創新程度的計量指標,DI和DIn均存在較大的局限性:①可能受到不規范引用或無目的性引用的影響[42]。例如,FP的被引文獻A和B,A引用了FP參考文獻1篇,B引用了FP參考文獻10篇,A可能是無目的性引用,但A和B均被計算進了顛覆性指數的分子中。②DI和DIn在計算NB等指標時均使用引文的絕對數量,如在DI5的公式中,代表引用了論文FP,并且引用了FP參考文獻至少5次的論文數量;參考文獻較少的論文的DIn可能較大,而參考文獻較多的論文的DIn往往很小,不同的參考文獻數量在一定程度上會降低DIn結果的一致性[43]。同時,由于DI5采用自然數5作為閾值,在計算參考文獻數量少于5篇的文章時,DI5的參數無實際意義。③DI和DIn均存在參數量級不一致的問題(詳見3.3節)。
目前對顛覆性指數的改進中,均沒有涉及NR值,而NR本身會導致諸多問題:①在實際計算顛覆性指數的過程中,NR的值往往較大,甚至出現顛覆性指數參數量級不一致的問題(詳見3.3節),從而導致其分布非常密集(多數文章的顛覆性指數都非常接近0),不利于比較不同文章的創新性。②當一篇論文引用了多篇高被引文章時,其“參考文獻總被引”很大,由于NR的影響,其顛覆性指數會非常接近0(詳見3.3節)。③NR受FP參考文獻數量的影響較大,不同論文的參考文獻數量不一致,也會降低顛覆性指數計算結果的一致性。
為解決以上問題,借鑒Bornmann等[44]對參數NB的改進思路。與其不同的是,本文同時對NB和NR設定門檻,并且采用百分比值的方法設定門檻值,用于消除FP參考文獻數量對結果的影響。
在引文網絡中,論文節點存在著前向引用鏈接和后向被引鏈接,分別表示其知識基礎和知識流動。將引文網絡一篇核心節點論文FP的引用、被引用以及更深層的引用網絡關系描繪出來,如圖1所示。

圖1 DI和RDI的引文網絡結構關系
圖1a展示了顛覆性指數DI的引文網絡關系,中間節點代表該網絡中的核心論文FP,右側節點(a~h)代表FP的被引文獻,左側節點(i~l)代表FP的參考文獻;FP與其參考文獻的引用關系、FP與其被引文獻的引用關系均以有向實線表示,FP的參考文獻與FP的被引文獻之間的引用關系以有向虛線表示,將FP的被引文獻劃分為三大類別:NB、NF和NR,以此計算DI。當實際運用此指標時,NB中僅引用了FP的一篇參考文獻可能是一些特殊引用行為導致的,修正指數DIn通過設定一個引用量閾值來解決這個問題。與DIn方法類似,RDI也是設定了引用量閾值,不同之處在于RDI采用了相對值而非絕對值。鑒于不同文章的參考文獻數量差異可能較大,采用相對值可以有效地拓展測度范圍,并保持測度一致性。
圖1b展示了相對顛覆性指數RDI的引文網絡關系,假設某FP有20篇參考文獻,若設定閾值為10%,則只有引用了FP至少2篇參考文獻的論文才被算入相關參數。論文a和論文b均沒有引用論文FP,論文a引用了FP的2篇參考文獻i和j,論文b只引用了FP的1篇參考文獻i,則論文a被計算入而論文b不被計算入同理,在同樣閾值下,論文d被計算入而論文c和論文e不被計算入NF的計算與DI、DIn的計算方法完全相同。
對于引文網絡中某一核心節點論文FP,選擇Web of Science核心合集數據庫,通過標題或DOI(digital object unique identifier)進行檢索,基于以下操作可以獲取NF、NB、的值,根據式(1)~式(7)計算出DI、DI5、RDI等指標。
(1)以純文本文件格式導出論文FP的全記錄與引用的參考文獻,并記錄下該論文的DOI。
(2)進入論文FP的被引文獻頁面,選擇全部文獻并按照相同格式導出。
(3)進入論文FP的參考文獻頁面,對于每一篇參考文獻Cn均進入其被引文獻頁面,選擇全部文獻并按照相同格式導出。
(4)基于Python-3.9.2自定程序,計算出相應指標。
實證部分聚焦于Scientometrics期刊的被引量最高的101篇論文,魯棒性檢驗(3.5節)則對發表于Scientometrics期刊上的全部研究論文進行分析。此外,為了保證足夠的引文窗口,本文僅對發表于2010年(含)之前的研究論文進行分析。
相對顛覆性指數的一個重要參數是閾值,不同的閾值選擇下論文的相對顛覆性指數RDI分布如圖2a所示。其中,當閾值為1%時,相對顛覆性指數分布可以近似地看作顛覆性指數DI的分布(絕大部分論文的參考文獻數量少于100);當閾值大于5%時,不同類型論文的相對顛覆性指數分布出現明顯變化。本文選取13%為閾值,這是因為在該閾值下不同參考文獻數量的論文有著較為接近的分布,從而可以認為該閾值下顛覆性指數的分布受參考文獻數量的影響較小。

圖2 閾值與引文窗口(彩圖請見https://qbxb.istic.ac.cn)
引文窗口是科學計量指標的重要內容[30]。Born‐mann等[45]對顛覆性指數的引文窗口進行了初步探索,得出顛覆性指數需要5年以上的引文窗口。本文以高被引論文為視角,對DI、DI5、RDI的引文窗口做進一步探討,圖2b展示了數據中被引量最高的9篇論文在不同引文窗口下DI、DI5、RDI的值。其中,DI在5年的引文窗口后趨于穩定,這與現有研究結論保持一致[45],但是DI5和RDI可能需要8年以上的引文窗口才會趨于穩定,綜合考慮本文的樣本數據,選取10年為引文窗口,即在計算某論文FP的相關指標時,僅考慮FP發表10年之內(包含FP發表前)的論文。

表1 高被引論文顛覆性指數統計分布
值得注意的是,盡管本文選取了出現明顯差異的分界點作為閾值(13%)和引文窗口(10年),但是更高的閾值和更長的引文窗口并非不合適,不同的閾值和引文窗口導致相對顛覆性指數呈現的差異有待未來進一步探索。
DI、DI5與RDI的總體統計如表1所示,這3種指標的值域均是[-1,1]。已有研究表明[10],當一篇文章顛覆性指數為較高的正值時,通常代表這是一篇創新性的文章,顛覆性指數的值越接近1,說明它對原有學科范式的顛覆程度越高,如獲得諾貝爾獎研究的顛覆性指數位于所有樣本前2%的水平;反之,若一篇文章顛覆性指數接近0甚至為負值,說明它可能是一篇鞏固性研究或者綜述類文章。
從總體分布來看,大部分樣本論文的顛覆性指數平均值非常接近0,而相對顛覆性指數有著明顯更高的平均值(0.191)。相對顛覆性指數的標準差(0.221)比顛覆性指數的標準差(0.117)更大,對于值域相同的指標,較大的方差會為其帶來更好的區分度。因3個指標的偏度均是正值,故其分布相對于正態分布右偏,DI的偏度(4.779)和DI5的偏度(4.107)均較大,呈現明顯右偏;RDI的偏度(1.123)較小,偏移幅度不大。結合峰度指標和百分位數,樣本論文的DI集中在區間[-0.02,0.12],分布很不均勻且異常陡峭(峰度為28.062);DI5集中在區間[0,0.06],分布不均勻且陡峭(峰度為20.416);RDI集中在區間[-0.05,0.30],分布均勻且平緩(峰度為0.864)。
結合顛覆性指數和相對顛覆性指數的公式,表1反映出顛覆性指數的一個重要問題:參數量級的不一致性。NR(均值6192,標準差24376,范圍[7,218315])的量級遠遠大于NB(均值66,標準差86,范圍[1,530])和NF(均值55,標準差141,范圍[0,1277]),參數量級不一致性是導致顛覆性指數測度不一致和不均勻的主要原因之一。相對顛覆性指數中的則與公式中的其他參數處于同一量級,這在一定程度上證明了相對顛覆性指數解決了參數量級不一致性的問題。
DI、DI5與RDI的分布與相關關系如圖3所示,根據FP論文的參考文獻數量劃分出4個類型。從分布來看(位于對角線的3個子圖),DI和DI5的分布呈現明顯的異質性,無論是鞏固性最強的論文(顛覆性指數最低,位于分布圖最左側)還是顛覆性最高的論文(顛覆性指數最高,位于分布圖最右側),都僅包含了參考文獻數量小于20的論文,而其他類型的論文則集中分布在0附近,非常不利于其顛覆性的測度與比較,這很可能是源自公式本身的缺陷。在相對顛覆性指數RDI下,4種類型論文均呈現了接近正態的分布,因此,可以認為,相對顛覆性指數能夠從不同參考文獻數量的論文中測度出高鞏固性論文和高顛覆性論文。

圖3 論文的DI、DI5與RDI相關性及分布(彩圖請見https://qbxb.istic.ac.cn)
從3個指標的相關關系來看,DI、DI5與RDI之間的皮爾遜相關系數均非常顯著,因此,其都能有效衡量論文的顛覆性,但是不同于DI和DI5之間的高度線性相關關系(0.9233),RDI與DI之間的線性相關系數僅為0.5151,說明它是一個相對較為獨立的指標。
顛覆性指數及相對顛覆性指數分布的散點圖和箱線圖如圖4所示,分別統計不同參考文獻數量的4種論文集合的DI、DI5與RDI分布。

圖4 論文的DI、DI5、RDI與被引量及參考文獻數量分布
從散點圖(圖4a、圖4c和圖4e)可以看出,不同參考文獻數量論文集合的顛覆性指數的分布呈現明顯差異,而不同參考文獻數量論文集合的相對顛覆性指數分布更為均勻和一致。尤其是對于參考文獻數量較多的論文,DI和DI5分布非常集中且接近0,而RDI的分布仍然較為均勻。
從箱線圖(圖4b、圖4d和圖4f)可以看出,隨著FP參考文獻數量的增加,顛覆性指數的分布愈加集中且接近0,這是因為它在計算參數NB和NR時均以1為閾值,對參考文獻數量大于20的論文進行計算時,顛覆性指數的分布會過于集中,難以進行有區分度的測度,并且對于不同參考文獻數量的論文存在著測度不一致的問題。DI5通過設定固定閾值為5,在一定范圍內緩解了這個問題,參考文獻數量處于21~40區間論文的DI5取得了與0~20區間論文較為一致的分布。但是DI5依然存在一定的問題:一方面,DI5無法對文獻數量小于5的FP進行有實際意義的指標計算與測度;另一方面,在參考文獻數量大于40的時候,依然會出現指標值的分布過于集中、缺乏區分度、測度不一致等問題。
RDI在4個區間的參考文獻數量上均有著較為均勻和一致的分布,尤其對于參考文獻數量很大的論文(大于40)也能進行相應的指標計算與測度。從RDI散點圖可以看出,參考文獻數量處于41~60區間的論文中有2篇相對顛覆性指數大于0.4,參考文獻數量處于61及以上區間的論文中有2篇相對顛覆性指數大于0.2,因此,相對顛覆性指數能實現從參考文獻數量較大的論文集中識別出顛覆性高的論文,且其在不同參考文獻數量論文集合上的測度效應具備高度一致性。
綜上所示,相對顛覆性指數具有以下優勢:①受論文參考文獻數量的影響小,不同參考文獻數量的論文有較為一致的RDI值分布。②相對顛覆性指數的標準差更大,且偏度絕對值更小,分布更為均勻,能夠對不同論文的顛覆性進行有區分度的測度。③相對顛覆性指數可以從參考文獻數量較大的論文集中識別出顛覆性高的論文。④相對顛覆性指數與顛覆性指數的皮爾遜相關性非常顯著,可以有效地衡量文章的顛覆性。⑤相對顛覆性指數與顛覆性指數的線性相關系數不是很高,可以視作一個獨立的指標。
為探討相對顛覆性指數是否能夠對研究的顛覆性創新程度做出真實測度,需要做進一步的研究。指標的收斂有效性(convergent validity)屬于結構效度(construct validity)的一種,通常體現為指標在理論與實證的相關程度,而科學計量學相關指標的收斂有效性一般會基于人工檢視(manual inspec‐tion)進行[39]。為證明相對顛覆性指數能夠識別出高度顛覆性或高度鞏固性的論文,本文對相對顛覆性指數排在前10名、后10名的論文依次進行人工檢視。
由表2可知,相對顛覆性指數排名最高的10篇論文具有較高的創新性,有多篇論文是本領域的開創性研究論文,這些論文的作者均是科學計量學領域的泰斗級學者,其中多位榮膺“普賴斯獎”。具體如下:van Eck等[46]發明了科學計量學分析與可視化的重要工具VOSviewer,是科學計量學領域的一篇重要開創性論文;Larsen等[47]發現SCI(Sci‐ence Citation Index)和SSCI(Social Science Citation Index)的文獻在計算機科學和工程科學等前沿領域的覆蓋率非常低,并指出基于SCI和SSCI的評價指標問題,研究結論具備較高的創新價值和顛覆性;Narin等[48]是研究國際合作的一篇早期重要論文,對未來的國際合作研究產生了深遠影響;Moed等[49]創立了全新數據庫以整合荷蘭的全部論文,屬于地域性的創新性研究。Schubert等[50]首次以文獻計量學的視角深入研究了國際合作,是科學計量學領域早期的一篇開創性論文;Weingart[51]深入探討了文獻計量指標對科學系統的影響,為后續計量指標的作用機制研究奠定了重要基礎;Gl?nzel等[52]首次較大規模地研究了巴西的引文模式概況、發展趨勢以及國際合作情況,屬于地域性創新性研究。Gl?nzel等[53]創新性地提出了自然科學與社會科學之間的層次結構,是主題分類領域的一篇重要開創性論文;van Raan[54]分析了文獻計量學方法在評估科學研究和監測科學發展方面的潛力和局限性,是文獻計量學領域早期的一篇開創性論文;Katz等[55]創新性地提出了引文與科學合作中的一種非常重要的標定模型;van Raan[56]深入探討了科學計量與機構評價,創新性地提出了技術和方法問題及解決方案,是科學計量學領域的一篇重要創新性論文。

表2 相對顛覆性指數排名前10篇論文
總體而言,相對顛覆性指數最高的10篇論文均具備較高的顛覆性和開創性。然而,這種開創性可能局限于某一細分領域或地域(國家或地區),因此,未來需進一步分析、處理,才能篩選出最具開創性的論文。
除此以外,由表2可以發現,限制顛覆性指數DI測度有效性的一個重要因素——“參考文獻總被引”會顯著影響顛覆性指數DI。以相對顛覆性指數RDI排名第一和第二的論文為例,兩者的參考文獻總被引分別高達8912和10139,導致DI指標分母非常大,從而得出接近0的顛覆性指數DI;而對于參考文獻數量總被引少于100的論文,顛覆性指數DI與相對顛覆性指數RDI高度一致,這也從一個方面證明了相對顛覆性指數RDI的優勢。
樣本中相對顛覆性指數排名最低的10篇論文具備較低的創新性,通常表現為典型的鞏固性研究、發展性研究或非原創性研究(derivative research),如表3所示。相對顛覆性指數排名后10位的論文中有8篇是基于h-index的繼承研究:Egghe[57]的研究在h-index的基礎上提出了g-index,van Raan[58]的研究是基于h-index的實證,Batista等[59]的研究提出了互補指數h(t),Gl?nzel[60]的研究初步闡述了h-index的數學內涵,Egghe等[61]的研究是將h-index拓展為信息學的一般框架,Iglesias等[62]的研究是將不同領域學者的h-index納入同一個量表比較,Braun等[63]的研究是闡釋h-index在期刊評價領域的應用以及小規模實證,Sidiropoulos等[64]的研究指出了h-index的部分缺點并做了改進。這8篇論文是對h-index的進一步闡釋、改進和實證,屬于典型的鞏固性研究,相對顛覆性指數均為負值。而h-index論文本身的相對顛覆性指數為0.694,處于研究樣本前10%的水平,具有極高的開創性。

表3 相對顛覆性指數排名后10篇論文
在剩下的2篇研究中,Beaver[65]在Katz等[66]的研究基礎上,進一步總結了科研合作的發展、現狀和未來展望,屬于鞏固性較強的綜述研究;Meyer等[67]對Braun等[68]的研究進行了數據的拓展和改進,屬于非常典型的鞏固性研究。
值得注意的是,在鞏固性論文的測度中,顛覆性指數DI與相對顛覆性指數RDI呈現較高的一致性,表3中全部論文的顛覆性指數DI也位居樣本的后10%,說明相對顛覆性指數RDI的相對優勢并不能在測度鞏固性論文中得到體現。
基于收斂有效性分析,可以認為相對顛覆性指數能夠對論文的顛覆性創新水平進行有效的直接測度。一般而言,顛覆性創新水平較高的論文相對顛覆性指數為較大的正值,開創性論文的相對顛覆性指數接近1;創新性水平較低的論文相對顛覆性指數為接近0甚至為負值,鞏固性研究論文的相對顛覆性指數往往會很低。此外,還發現顛覆性指數DI無法有效地測度一些“參考文獻被引量”較高的開創性論文,相對顛覆性指數RDI在一定程度上解決了這個問題。
高被引論文僅占據了全部論文的小部分,為進一步分析相對顛覆性指數的測度有效性,對發表于Scientometrics期刊上的全部研究論文(文章類型為article,為保證足夠的引文窗口,論文發表時間設定為2010年之前,共檢索到2957篇)的DI、DI5與RDI進行計算。3種指標的核密度(kernel density)分布如圖5所示,對于參考文獻數量不同的論文,DI、DI5的分布呈現明顯的異質性(圖5a、圖5b),參考文獻數量處于1~20的論文與其他類別的分布完全不一致,而不同論文的RDI則都形成了較為一致的近似正態分布(圖5c)。魯棒性檢驗補充證明了上文的結論,即DI、DI5的測度不一致效應,以及RDI在測度不同類型論文的有效性。

圖5 Scientometrics期刊全部論文的DI、DI5與RDI核密度分布(彩圖請見https://qbxb.istic.ac.cn)
近年來,論文數量和被引量的大幅增長并未帶來核心領域的創新突破[69],具備高度顛覆性的開創研究才是科技發展的第一動力。本文梳理了科學研究創新性測度的顛覆性指數,深入剖析了其局限性,并提出了相對顛覆性指數。實證研究表明,相對顛覆性指數可以視為一種相對獨立的新指標,它比原始指標具備更好的區分度和一致性,能從參考文獻數量較大的論文集中識別出顛覆性論文。但是該指標依然存在著一定的不足之處:①因公式本身及數據庫的局限性,部分參考文獻數量較少的論文可能會計算出較高的“誤差值”。②基于相對顛覆性指數識別出來的高度顛覆性論文可能是局限于某細分領域或地域的開創性研究,需要做進一步分析才能篩選出開創性的研究。③相對顛覆性指數僅僅是對研究顛覆性創新水平的測度,并不能反映論文的影響力。
事實上,相對顛覆性指數不僅適用于論文的顛覆性創新測度,已有研究基于專利數據庫引用網絡、Github引用網絡數據等研究了技術和軟件的顛覆性[10]。相對顛覆性指數較高的研究往往具有較高的創新性,其中部分研究代表了領域的關鍵性突破和開創性成果;相對顛覆性指數較低的論文通常是對既有研究的鞏固性研究,但其影響力和價值也不可忽略。
本文受限于Scientometrics期刊所屬學科,且收斂有效性部分主觀性較強。未來的研究可以考慮更大樣本的實證,對比不同學科下相對顛覆性指數的差異,并將數據來源拓展至中文期刊數據庫、專利數據庫、社交媒體數據等。在指標的收斂有效性驗證部分,可與現有同行評議數據庫作比較,如醫學的F1000 Prime數據庫(現已更名為Faculty Opinions)。此外,鑒于相對顛覆性指數的局限性,有必要進一步探索如何處理參考文獻數量較少的論文,以及從創新性研究論文中識別出開創性論文的可行方法。
相對顛覆性指數為科學計量提供的潛在價值在于其能夠直觀地測度論文的創新性,可以與傳統指標相結合,以多維度的視角進行測度和評價,這也是未來的探索方向之一。此外,作為一種定量指標,相對顛覆性指數不應僅局限于論文層面的測度,后續研究可考慮將其拓展至對學者、機構、地區的顛覆性創新研究水平的測度。由于相對顛覆性指數較高的論文往往善于打破學科原有范式,也可探索相對顛覆性指數與引文睡美人現象[70]的關系。