遲培娟,丁潔蘭,冷伏海
(1. 中國科學院文獻情報中心,北京 100190;2. 中國科學院科技戰略咨詢研究院,北京 100190)
每一次重大科技革命或高技術產業形成都離不開突破性研究成果。突破性論文是一種常見的突破性研究成果,已有研究對突破性論文的界定較少,王海燕[1]認為,高影響力論文是指研究成果、思想、觀點和方法等會對本學科的發展以及科學共同體的交流產生重大影響的科技論文。其他學者大多是對突破性研究進行界定,例如,庫恩等從研究范式的角度分析了突破性研究可能顛覆或者創建新的研究范式[2-3]或引領新的科學范式[4-5]。部分學者從對本領域或其他領域科學研究有重大影響這一視角界定了突破性研究的內涵[6-8],還有學者認為突破性研究具有創新性或新穎性[9-10]。本研究認為,突破性論文是一類具有較高創新性,其理論、研究方法、結論等對本領域或其他領域產生了廣泛影響,對社會具有重要價值和影響的基礎研究成果。
突破性論文的識別對科技創新的前瞻性布局和科研管理都具有重要意義,當前主要依賴專家評議,廣受認可卻效率低下,必須采用其他方法加以輔助。基于文獻計量學的突破性論文識別研究多圍繞引用特征來進行分析,常見的是學術影響力特征,還有研究嘗試了從引文路徑、多代引用關系、引文網絡、引用文本特征等視角來遴選突破性論文,也有學者綜合多個指標嘗試突破性論文的早期識別,下文將對相關研究進行綜述。
學術影響力是學術質量類指標,常見的是以被引頻次代表學術影響力。突破性論文的高被引特點基本已經達成共識[1,11-14],但其引用閾值并不明確,有的研究將領域Top 1‰[1]、Top 1%[11]或Top 2%[13]論文作為潛在突破性論文,科睿唯安則將被引頻次超過2000 次的論文作為潛在諾貝爾獎成果[15]。為了實現高被引論文的快速識別,部分研究嘗試利用論文的短期引用(論文發表后1~5 年)來預測未來的高被引論文[16-25],但這些研究的準確率和召回率依然無法滿足實用需求。
Huang 等[26]通過分析引文級聯變化識別變革性研究,該方法主要是衡量新的論文在多大程度上破壞了代表既定范式論文引文級聯的增長;王海燕等[27]以引文網絡中的關鍵節點、研究前沿核心論文和ESI(Essential Science Indicators) 高被引論文作為突破性論文的代表,利用引用強度和技術生命周期來預測論文是否為突破性論文。上述兩項研究適合單篇種子文獻分析,操作較為復雜。
Wu 等[28-29]利用文獻及其前后向引用關系來計算文獻的“顛覆性”得分,顛覆性D的計算公式為D=(i類施引文獻數量-j類施引文獻數量)/所有施引文獻數量,其中i類施引文獻是指只引用目標論文的文獻,j類施引文獻引用目標論文的同時引用目標論文的參考文獻,D值越接近于1,越有可能是顛覆性文獻;該研究發現團隊大小(以文獻的作者人數來衡量)與論文的顛覆性負相關,提出小團隊更容易產生顛覆性創新的觀點,但并未確定有效的閾值來區分突破性論文和其他論文。
Schneider 等[13]將各個領域中Top 2%高被引論文遴選出來,并進一步區分了突破性論文和追隨者論文:如果候選論文B2 引用了候選論文B1,引用B2的論文有一定比例同時引用B1,那么B2 論文就是追隨者,B1 論文可能是突破性論文;驗證結果發現,11 篇突破性論文中可以識別出7 篇。
有學者采用拓撲網絡對領域“關鍵點”進行回顧性識別。陳超美團隊將科學網絡中具有高中介中心性的論文視為科學轉折點[30-31];Min 等[32]認為,3個引文網絡結構指標(平均聚類系數、網絡連通性和網絡密度)對早期發現突破性論文可能具有重要意義,但識別效果未經驗證。可視化技術也可以在突破性論文識別過程中發揮作用。Kleinberg[33]提出了突發監測算法,根據詞頻變化率找出某一時間段內的突現詞;陳超美開發的CiteSpace 中的Burst De‐tection 就是基于類似的算法來監測突現詞[31]。但這些研究針對的都是研究主題而非單篇論文。
Small 等[34]以生物醫學領域為例,提取了引用參考文獻的文本信息或上下文信息,發現被包含“discover”的語句引用20 次以上的論文中有8%獲得了諾貝爾獎。楊雪梅等[35]以年度十大科學突破的關鍵論文和諾貝爾獎關鍵論文作為突破性論文語料數據進行特征詞提取,通過特征詞識別F1000 數據庫某些重要文獻,其查全率能夠達到90%以上。
為了實現突破性論文的早期識別,Wolcott 等[36]利用隨機森林模型識別出6 個月的被引頻次、期刊影響因子、作者的高被引論文數量、合著者數量、合著網絡點度中心性、本領域的高水平論文數量等指標對識別突破性論文的貢獻度較大,采用這些指標預測論文屬于突破性論文還是屬于對比數據集,預測結果的準確性可達0.91,召回率可以達到77%;該方法的優點是及時性強,適合針對大量文獻的海選,但研究中采用的非突破性論文數量過少,僅有2500 篇,更換數據后的適用性尚有待驗證,并且預測結果的召回率偏低。
(1)目前突破性論文識別采用的大部分指標實用性不強。一是大部分指標僅能針對少量種子文獻進行分析,分析方法復雜,不適合大數據量分析,且分析結論存在普適性問題;二是突破性論文閾值不明確,沒有確切的閾值可以將突破性論文和其他論文區分開;三是識別效果還有待于進一步提升,召回率偏低;四是缺少有效的即時性指標,難以實現突破性論文的早期識別。
(2)突破性論文的學術影響力特征需要進一步明確。盡管許多研究認為突破性論文具有高學術影響力特征,但不同研究中采用的閾值有差異,沒有明確的閾值來協助遴選;此外,當前引用的觀察窗口基本在5 年以上,如果能夠進一步明確突破性論文的短時間(2~3 年)引用特征,將有助于實現突破性論文的早期識別。
(3)當前突破性論文的識別過于依賴文獻引用信息,缺少對其他特征的進一步研究。例如,有學者提出突破性論文應當具有創新性和新穎性,還有學者認為變革性研究往往具有延遲認可和科學-技術交叉(更容易被專利引用)等特征[4]。這些觀點缺乏實證研究的支持,因此需要進行更加深入的研究。
作為一類重要的基礎研究成果,突破性論文在“科學創造力”方面應該優于其他論文。為了評估基礎研究創新的程度和重要性,有學者將基礎研究的“科學創造力”分解成“新穎性”和“有用性”兩個方面[37-41],Piffer[42]強調,“新穎性”和“有用性”是所有層次創造力所共有的。
“新穎性”強調了創新本身的獨特性[43],是論文在發表背景下的自我特征,一經出現就已經固定。通常情況下,只有具備了“新穎性”的論文才能夠通過同行專家的評議并發表,不同論文的新穎性程度可能有差異。“有用性”等同于“影響力”,強調了創新結果在使用和傳播過程中是有價值的,研究成果必須能一定程度上對后續基礎研究、技術開發或者社會創新產生啟發和影響才能體現“有用性”。“有用性”必須經過實踐檢驗,領域專家可以根據自身的知識來預判“有用性”。在知識傳播的不同階段,基礎研究可以產生不同的“影響力”。一項基礎研究如果對后續基礎研究有用,通常會被本領域或其他領域的科學家引用,在基礎研究領域就會產生一定的“學術影響力”[44-46]。同時,基礎研究中的科學知識大多要擴散到學術界以外,通過創新鏈向下游傳播啟發技術創新[47],產生一定的“技術影響力”[48-49],并最終實現其社會價值(圖1)。

圖1 基礎研究成果創造力的特征分解
評價突破性論文實際上也是衡量科技論文“科學創造力”的過程。突破性論文的“科學創造力”較高,因此在“新穎性”和“有用性”方面可能表現突出,其中“有用性”至少體現在“學術影響力”和“技術影響力”兩個方面。基于以上分析,本研究提出了突破性論文的三元計量特征(以下簡稱三元特征)理論:①具有較高的新穎性,知識具有獨特性和異質性;②具有高學術影響力特征,獲得科研共同體的廣泛認可;③一般具有高技術影響力特征,通過對技術開發產生廣泛而深遠的影響造福人類社會(圖2)。

圖2 突破性論文的三元計量特征
目前已有的計量研究中,突破性論文的新穎性特征只有少量定性描述[8-10],沒有定量研究的支持;突破性論文具有高學術影響力特征已經廣受認可[1,11-14],但引用閾值和早期引用特征尚不明確;突破性論文的技術影響力僅有少量研究涉及,例如,杜建等[4]認為變革性研究往往具有科學-技術交叉(更容易被專利引用)特征。本研究將圍繞新穎性、學術影響力、技術影響力3 個方面來明確突破性論文的計量特征。
3.2.1 突破性論文的新穎性測度方法
當前新穎性指標算法主要基于知識組合創新理論,采用的知識單元包括參考文獻所在期刊和文本內容等,還有少量研究基于文本相似性進行計算[50-51],有必要從中遴選更適合的指標來測度突破性論文的特征。相比于期刊[38,44,52-55],基于文本內容組合的算法能夠更好地體現論文知識的創新,如作者關鍵詞組合[56-57]、主題詞組合[58-59]和MeSH 詞對[60-63]。其中,MeSH 詞表是由美國國立醫學圖書館發布的生物醫學領域權威詞表,經過領域專家設計和認可,相比于作者關鍵詞和主題詞更加客觀標準。但是當前基于MeSH 詞對的計算方法較為簡單,主要基于MeSH 詞對出現時間長短、出現頻次或者新MeSH 詞對占比,忽視了隨機組合概率的影響。
本研究參考Lee 等[38]基于參考文獻期刊對組合的算法,對基于MeSH 詞對的新穎性指標[63]進行了改進,考慮了MeSH 詞對隨機組合概率的影響,以區分詞對組合的難易程度,進而揭示組合的新穎程度。具體算法如下:
(1)構建目標論文數據集DOI-MeSH 詞對應關系表,統計單篇論文所有MeSH 詞對組合,將同一年出版論文所有MeSH 詞對匯總在一起,構成當年MeSH 詞對整體數據集N。
(2)比較某個MeSH 詞對在整體數據集實際出現的概率與其預期出現概率的比值,這個比值代表著該詞對的組合難易程度,即保守性Commonness:

其中,分子表示t1t2組合在整體數據集N中實際出現的概率;分母表示t1t2組合在整體數據集N中預期出現的概率。如果t1t2組合實際出現概率低于預期概率,即Commonness<1,說明該知識組合更困難、更新穎。
(3)列出單篇論文所有MeSH詞對的Commonness,由小到大排列,取10%處的值作為這篇論文的保守性Commonness,采用對數變換來獲得保守性的正態分布變量,新穎性與保守性相反,因此,

meshnov 值越大,表示知識組合比預期組合越少見,新穎性越高。
新穎性指標是本研究提出的三元計量特征的核心指標,而計量學指標在應用之前有必要驗證其能否有效反映其想要衡量的內容,以揭示其先進性和有效性。Harnad[64]認為,指標必須根據其意圖衡量和預測的內容進行驗證,驗證標準是同行專家評估。本研究將通過比較本研究改進的新穎性指標以及已有新穎性指標與專家評議結果的相關性,以驗證本研究改進的新穎性指標的優越性。
F1000 數據庫是生物醫學領域非常有特色的同行評議數據庫,該數據庫收錄的重要文獻應該是更具創新性的。因此,本研究將通過logistics 多項回歸模型分析新穎性,結合論文是否被F1000 推薦,來驗證本研究提出的新穎性指標與對比指標的收斂效度。對比指標refnov 選擇Lee 等[38]基于參考文獻期刊組合的新穎性算法,該算法常被采用且已有學者經過對比認為較優[65]。此外,為了避免期刊影響因子的影響,將5 年期刊影響因子加入了自變量;由于該數據庫對論文的收錄多在論文發表后數月內完成,因此未納入被引頻次。
在Stata 軟件中利用多項logistics 回歸模型進行分析,logistics 多項回歸公式為

其中,Y為因變量,即是否入選F1000 數據庫;X1、X2、X3分別為自變量meshnov、refnov 和JIF(jour‐nal impact factor,期刊影響因子);a、b、c分別表示3 個自變量與Y的相關系數。
為了直觀表示因變量和自變量的相關程度,進一步計算odds 值,該值表示在指定x條件下,事件為1 或0 的概率比:

本研究并不關注模型擬合的效果,只關注自變量的變化如何影響入選F1000 的概率。通過對比兩種新穎性指標與入選F1000 數據庫的關系來驗證哪種指標更符合專家意見,并選用更優的指標來進行新穎性測度。
實證研究結果表明,生物醫學領域論文的兩種新穎性與是否入選F1000 數據庫的相關性存在明顯差異。以2008 年為例,本研究改進的新穎性指標meshnov 與是否入選F1000 數據庫的相關系數為0.18,odds=e0.18=1.197,表明meshnov 每增加1 個單位,入選F1000 的概率上升19.7%;另一個對比指標refnov 與是否入選F1000 的相關系數為-0.08,odds=e-0.08=0.923,也就是說每當論文的refnov 增加1個單位,入選F1000 的概率下降7.7%。期刊影響因子與是否入選F1000 的相關系數為0.11,odds=e0.11=1.116,這表明期刊影響因子每增加1 個單位,入選F1000 的概率上升11.6%(表1)。

表1 新穎性與入選F1000數據庫的關系分析
分析結果表明,對比指標refnov 與論文是否入選F1000 負相關,這與專家的遴選標準是相反的,因此refnov 不能較好地體現專家認可的創新性。本研究改進的指標meshnov 與專家的預期是一致的,而且與是否入選F1000 數據庫的相關程度要優于期刊影響因子,說明meshnov 更能體現專家認可的創新性,因此新穎性指標meshnov 比refnov 更適合衡量論文的創新性。
3.2.2 突破性論文的學術影響力測度方法
論文的學術影響力分析較為常見,最常使用的指標是論文被引頻次。目前,替代計量學指標也越來越多地被使用,但由于這類指標存在覆蓋范圍小[66]、熱點偏離學術研究等問題[67],因此,本研究的分析將基于論文被引頻次進行。
突破性論文一般需要等待一段時間才能充分顯示其影響力。諾貝爾獎論文通常發表20 年以上才能獲得充分認可[68],因此,需要首先考察突破性論文的長期學術影響力特征。已有研究發現生物學領域論文發表5 年之后的被引排名就開始慢慢趨于穩定[69],因此8~10 年的觀察窗口可以顯示大部分論文的學術影響力特征。本研究統計了8~10 年前發表的生物醫學領域論文被引頻次,同時,為了消除不同學科領域引用差異和領域大小的影響,對同年發表的同領域論文依據被引頻次進行排名并計算排名百分比。如果論文屬于多個領域,選取排名百分比更小的領域作為分析依據。

表5 兩種早期識別突破性論文方法的比較
為了實現突破性論文的早期識別,有必要對其短期學術影響力特征進行分析。采用同樣的方法分別計算論文發表后1 年(論文發表當年)、2 年和3年時間窗內的被引頻次領域排名百分比,驗證突破性論文的短期學術影響力是否具有明顯特點。
3.2.3 突破性論文的技術影響力測度方法
技術影響力主要衡量基礎研究對技術開發的影響程度。專利對論文的引用是加快技術創新速度的重要驅動力[70]。多項研究表明,生物等領域的專利更傾向于引用期刊論文[71-72],通過測量文本相似性發現大多數專利引用都可以表明知識之間的聯系[73]。因此,基礎科學向某一特定技術領域的知識傳遞,可以用該領域內的專利對科學論文的引用頻次來定量描述[74-78]。研究發現,專利更傾向引用在自身和其他領域具有較大影響力的論文[79-80];隨著引用論文影響力的增加,施引專利的價值也在增加[81]。雖然學術影響力和技術影響力有一定的關聯性,但二者衡量了論文不同方面的特征,在科學界和技術界都被高度引用的論文較少重疊[82]。
目前論文的技術影響力分析主要集中在國家[83]、期刊[84-85]、機構[86-87]和單篇論文[4]層面。單篇論文層面,杜建等[4]采用論文是否被專利引用這一指標來尋找被延遲認可的突破性論文,但是被專利引用的論文比例較高,有的領域超過了10%,直接采用這一指標來衡量論文的技術影響力過于粗略。
如果論文被更多高價值專利引用,那么論文的技術影響力也相應更高。本研究參考機構層面的評價指標[86]提出了針對單篇論文的技術影響力指標計算方法,同時考慮了論文被專利引用的次數和施引專利的家族大小。施引專利家族大小體現了專利的價值,因為專利申請需要花費大量的時間和金錢,申請人會根據對專利價值的預判決定向多少個國家或地區進行專利申請。本研究構建的針對單篇論文的技術影響力指標為

其中,TI 表示技術影響力指數;Cp 表示論文被專利引用的次數(以專利家族為統計單位);F表示施引專利平均家族大小。
為了消除領域的影響,依據目標論文的技術影響力指數進行排名并計算論文的排名百分比,分析其中突破性論文的技術影響力特點。
生物醫學領域是全球重要的戰略方向之一,其基礎研究成果可以快速轉化為技術應用,成為驅動經濟發展的高新技術產業,各國紛紛將其納入優先發展領域。如果能實現該領域突破性論文的識別,可以更好地進行重大研究的前瞻布局和針對性的科研管理。本研究將以生物醫學領域為例,分析突破性論文的三元特征理論是否成立,進一步完善重要成果的科研評價方法。
4.1.1 標準數據遴選
要準確地揭示突破性論文的計量特征,標準數據的選擇至關重要。有研究以諾貝爾獎相關論文作為突破性論文的標準數據,但這類論文數量稀少,難以進行計量分析。近年來,Science雜志每年都會發布年度十大科學突破,其中生物醫學領域相關研究占據了很大一部分,這些研究獲得了廣泛的認可。本研究收集了2008—2010 年發表并被評選為年度十大科學突破的15 篇生物醫學領域論文作為標準數據。選擇這一時間段的原因是引用觀察時間窗在8 年以上,可以充分顯示突破性論文的影響力。同時還收集了2013 年被評為年度十大科學突破的11 篇相關論文作為驗證數據。
4.1.2 數據范圍
生物醫學領域論文數據總集:被PubMed 數據庫收錄并標注MeSH 詞(3 個及以上),同時被Web of Science 數據庫收錄,文獻類型為Article 的論文。
論文被論文引用統計:2008—2010 年論文被引頻次的統計時間是2019 年6 月,數據來自瑞典皇家理工學院基于Web of Science 裸數據的Bibmet 數據庫;2013 年論文被引頻次統計的截止時間是2021年3 月。被引頻次均采用他引,排除了目標論文所有作者發表論文的施引。
論文被專利引用統計:依據2021 年1 月在Lens數據庫檢索的結果。
4.1.3 學科領域劃分方法
為了避免學科差異的影響,本研究后續分析均在學科領域內進行。學科分類參考Web of Science數據庫的學科領域。本研究遴選出的突破性論文多來自Science、Nature等綜合性期刊,必須將綜合期刊發表的論文準確分配到相關學科領域才能保證分析結果的可靠性。本研究參考了瑞典皇家理工學院Bibmet 計量小組采用的基于目標論文的參考文獻所在領域來劃分的方法:統計論文的參考文獻所屬學科分類,依據學科包含的參考文獻數量降序排列,選取參考文獻數量最多的學科C1 作為替換的學科;如果排名第2 位的學科領域C2 的參考文獻數量N2大于等于C1 參考文獻數量N1 的0.625,則C2 也作為替換的新學科,否則學科重新分類終止;按照此規則繼續向下循環,直到學科分類終止或者新學科分類達到6 個。
4.2.1 突破性論文的新穎性特征驗證
為了明確突破性論文的新穎性特征,本研究分析了15 篇突破性論文中本研究改進的新穎性指標meshnov 和對比新穎性指標refnov 的特點。結果發現,突破性論文的meshnov 領域排名在2.66%~45.13%,全部都在Top 50%以內,其中有11 篇論文領域排名在20%以內,可見突破性論文的新穎性是較高的。突破性論文的refnov 領域排名百分比差異非常大,6.68%~87.01%不等,也就是說,突破性論文refnov 在各自領域中的排名并不突出,不符合我們對突破性論文具有較高創新性的認知,也可以從另一個側面反映meshnov 是比refnov 更優的新穎性指標。本研究還發現,突破性論文的meshnov 指標不僅在全領域排名Top 50%以內,在各領域Top 1%高被引論文中,突破性論文的新穎性排名依然可以穩定在Top 50%以內(圖3)。這說明突破性論文確實具有較高的新穎性,本研究改進的新穎性指標可以較好地測度突破性論文的創新特征。

圖3 突破性論文的兩種新穎性指標排名分析
4.2.2 突破性論文學術影響力特征驗證
本研究分析了生物醫學領域突破性論文的長期學術影響力和短期學術影響力特征。結果表明,在8~10 年的長期觀察窗口下,生物醫學領域突破性論文的領域排名百分比在0.011%~0.993%,均在Top 1%以內(表2),與此前部分研究采用的Top 1‰、Top 2%等閾值不同,本研究通過實證認為生物醫學領域突破性論文的長期學術影響力應該排名在領域Top 1%。本研究涉及的學科領域論文數量多在1 萬~6 萬篇,對于更小的領域來說(總論文數少于1 萬篇),這一閾值可能有變化。本研究僅涉及生物醫學領域的突破性論文,尚不清楚其他領域突破性論文的引用排名情況。

表2 生物醫學領域突破性論文的學術影響力和技術影響力分析
為了盡早識別出重要研究,本研究更加關注短時間觀察窗口下,突破性論文的學術影響力特征。實證研究發現,在論文發表后1 年,大部分突破性論文在發表當年的引用頻次排名超過了Top 1%的閾值;2 年的引用頻次排名基本都在Top 1%以內,只有1 篇論文在排在1.018%(表2),3 年的引用頻次排名全部都在Top 1%以內,與8~10 年窗口下的總引用排名較為接近,這與Adams[88]之前的研究結果較為吻合。
由此可見,生物醫學領域突破性論文的高學術影響力特征在論文發表后2~3 年時間就已經開始顯現,這可能和兩個原因有關:一是這些突破性論文中并不存在延遲認可的情況,二是生物醫學領域知識傳播速度較快,引用頻次可以快速地穩定下來。由于延遲認可的突破性論文較為少見,因此,可以利用這一特征實現生物醫學領域突破性論文的早期識別。
4.2.3 突破性論文技術影響力特征驗證
本研究分析了生物醫學領域論文的技術影響力特征,發現只有少部分論文具有技術影響力。以2008 年生物化學與分子生物學領域為例,僅有22.7%的論文被專利引用過,其中約一半僅被引用1 次(以專利家族為統計單位,如果一篇論文被同一個專利家族的多個專利引用,僅計數1 次)。高技術影響力的論文比較少見,僅有0.31%的論文其技術影響力超過500。論文的學術影響力(被引頻次)和技術影響力為低度相關(Pearson 相關性系數為0.354),說明二者衡量的是論文不同方面的特征。
15 篇突破性論文的技術影響力是所在領域平均水平的4~104倍,論文領域排名百分比通常在0.010%~0.73%,均在Top 1%以內,說明突破性論文具有高技術影響力特征(表2)。
突破性論文一般屬于Top 1%高被引論文,進一步分析發現突破性論文的學術影響力不一定高于Top 1%高被引論文平均水平,但其技術影響力均高于Top 1%高被引論文平均水平。這說明與其他Top 1%高被引論文相比,突破性論文的技術影響力更加突出,這體現了突破性論文對社會創新的重要貢獻(表3)。唯論文引用的評價模式忽視了基礎研究對技術開發的影響,在高被引論文中,突破性論文的技術影響力表現十分突出,這可以作為進一步區分追隨式高被引論文和突破性論文的重要依據。

表3 生物醫學領域突破性論文和高被引論文的技術影響力分析
4.2.4 突破性論文三元計量特征穩定性驗證
通過以上實證分析可以發現,突破性論文具有高新穎性、高學術影響力和高技術影響力的特征,本研究提出的突破性論文三元計量特征理論框架是成立的。本研究通過實證還進一步明確了突破性論文在3 個指標上均存在一個閾值。為了驗證上述計量特征是否穩定,本研究以新的突破性論文數據進行驗證,分析其新穎性、學術影響力和技術影響力三方面計量指標特征是否依然成立。
本研究選擇2013 年入選Science雜志年度十大科學突破的生物醫學領域論文進行驗證,共篩選到11 篇突破性論文。這些論文主要屬于生物化學與分子生物學、神經科學和免疫學3 個領域。結果顯示,這11 篇突破性論文的新穎性、長期/短期學術影響力、技術影響力領域排名均在Top 50%、Top 1%和Top 1%范圍內,說明生物醫學領域突破性論文的三元計量特征是穩定存在的。
鑒于突破性論文的三元計量特征是穩定存在的,可以嘗試利用3 個指標綜合遴選潛在的突破性論文。基于本文4.2.4 節的結論,本研究提出三元指標識別方法,將新穎性領域排名在Top 50%以內、長期學術影響力和技術影響力領域排名均在Top 1%以內的論文作為潛在突破性論文。以2013 年生物化學與分子生物學、神經科學和免疫學領域為例(數據說明見4.1 節),分別遴選出48 篇、13 篇和20 篇潛在突破性論文。
為了證明該遴選方法的有效性,將其與常規遴選方法進行對比。對比方法主要采用當前較為常用的被引頻次排名和期刊影響因子兩種指標來綜合遴選。Hicks 等[89]認為,細胞生物學排名較為突出的期刊的影響因子約為30,因此遴選被引頻次入選領域Top 1%,并且發表在期刊影響因子大于30 的論文作為潛在突破性論文。通過上述對比方法在生物化學與分子生物學、神經科學和免疫學3 個學科領域分別遴選到294 篇、67 篇和65 篇潛在突破性論文(表4)。

表4 兩種突破性論文的遴選方法比較
對比分析發現,本研究提出的三元指標方法和對比方法召回率均可以達到100%,即不遺漏突破性論文標準數據,這對提高方法的實用性至關重要,如果召回率偏低,還需要采用其他方法來補充,失去了提高初篩工作效率的意義。從精準率來看,三元指標方法明顯更優,精準率是對比方法的3~6 倍,可以將單個領域候選論文數量控制在50 篇以下,大大降低了專家人工判讀的工作量,提高了初步篩選的工作效率。
突破性論文的早期識別更具有價值和意義。本研究提出的新穎性指標具有即時性,一經發表就可以進行計算,短期學術影響力等待時間較短,結合新穎性和短期學術影響力特征有望實現突破性論文的早期識別。為了實現突破性論文的早期識別,本研究還將加入期刊影響因子這一指標,雖然有不少學者和科學家反對采用期刊影響因子作為單篇論文的評價指標,但是本研究認為,論文是經過同行評議發表的,不同期刊的評審標準本身就可以部分體現研究被認可的程度,諾貝爾獎獲得者在Nature、Cell和Science三大頂級期刊的發文數量遠遠超過其他期刊[90]。
基于三元計量特征理論,本研究提出了三元指標早期識別方法,將生物醫學領域新穎性領域排名Top 50%以內,論文兩年引用排名Top 1%以內,期刊影響因子在30 以上的論文作為潛在突破性論文,并以2013 年3 個學科領域為例進行分析。對比方法是將兩年引用排名Top 1%以內,期刊影響因子在30 以上的論文作為潛在突破性論文。
分析結果表明,兩種早期識別方法可以涵蓋所有突破性論文標準文獻,但是二者在精準率方面存在很大差異。如表5 所示,對比方法中,3 個領域入選的潛在突破性論文分別是333 篇、77 篇和69篇,而三元指標早期識別方法入選的論文數分別是155 篇、33 篇和41 篇,精準率是對比方法的2~3倍,入選的論文數量壓縮了一半左右。從識別效果來看,在5 萬篇論文以上的大學科領域中初篩的潛在突破性論文有155 篇,在評價工作中具有實用性,可以為后續專家評議奠定較好的基礎。
通過上述對比分析可以看出,利用本研究確定的突破性論文計量特征,不僅可以在較長時間窗口下實現突破性論文的精準識別,還可以在較短的時間窗(2 年)下實現突破性論文的早期識別。與已有其他突破性論文的早期識別研究相比,本研究提出的三元指標遴選方法精準率明顯高于對比方法,可以將單個領域潛在突破性論文數量控制在合理范圍內,具有良好的實用價值。
基于前期工作[91],本研究分析了突破性論文的三元計量特征,并形成了突破性論文遴選和早期識別方法,主要研究結論如下。
(1)突破性論文具有高新穎性、高學術影響力和高技術影響力三元特征。
本研究提出突破性論文的三元特征理論,即突破性論文具有高新穎性、高學術影響力和高技術影響力計量特征。本研究以生物醫學領域為例對三元計量特征進行驗證,結果發現突破性論文的新穎性領域內排名在Top 50%以內,學術影響力領域內排名在Top 1%以內,技術影響力領域內排名在Top 1%以內,三元計量特征理論是成立且穩定存在的。這一結論為突破性論文的高效遴選和早期識別奠定了基礎。
(2)突破性論文三元指標遴選方法和早期識別方法是有效的。
本研究基于新穎性、學術影響力和技術影響力三元計量理論構建了突破性論文的三元指標識別方法,還將其應用于突破性論文的早期識別。與已有方法相比,本研究提出的新方法具有更高的精準率,可以將潛在突破性論文數量控制在合理范圍內,有效減少后續專家評議的工作量;適合針對大量文獻的批量分析,大大提高了評議效率。
新穎性特征是本研究提出的突破性論文三元計量特征理論中的核心要素之一。本研究以MeSH 詞對作為知識組合代表,同時考慮了隨機組合概率的影響,提高了新穎性對創新衡量的準確性。由于新穎性具有即時性,明確突破性論文的高新穎性特征,為突破性論文的早期識別提供了一個很好的工具。本研究改進的指標適用于生物醫學領域,其他領域還缺少類似于MeSH 詞表的權威知識代表,后續可以考慮利用識別的主題等替代MeSH 詞表優化新穎性計算方法,進一步擴展研究結果的適用范圍。
本研究打破了以往只在學術范疇探討論文影響力的局限,從論文對技術開發推動作用視角剖析了論文的技術影響力,更加全面地測度了基礎研究成果的影響力。生物醫學領域的基礎研究可以快速轉化為技術應用,因此突破性論文同時具有高學術影響力和高技術影響力特征。突破性論文大多來自一般性基礎研究,一段時間后可以顯示實際應用價值,因此本研究提出的三元計量特征對于大多數突破性論文是適用的。但對于純理論研究和純應用研究領域,該方法還需要進一步調整才能使用。純理論研究很難轉化為實際應用,如考古和理論物理研究,其重大影響多限于人類認知,因此技術影響力較低。純應用研究對技術創新的影響較大,但學術影響力較低。因此,在純理論研究和純應用研究領域,需要考慮突破性論文識別方法的差異性,賦予三元指標不同的權重,例如,純理論研究論文的技術影響力指標權重應適當降低,學術影響力權重應該適當升高。
突破性論文的早期識別十分重要。本研究采用的新穎性是一個非常好的即時性指標,而學術影響力和技術影響力考察的是論文在實際應用中的價值,不經過時間檢驗難以預知,尤其是技術影響力需要更長的時間來檢驗。突破性論文的早期識別應遵循科技發展規律,盡量減少而非消除時間滯后性。未來提高突破性論文早期識別的精準性和效率,可以從三個方面入手。一是提高技術影響力指標的時效性:本研究采用8 年及以上觀察窗口,未來可以嘗試利用更短時間(3~5 年)內的專利引用、專利權人重要性等信息來計算技術影響力;二是挖掘其他即時性指標的特征:例如,自我評價語句文本特征和學科交叉特征等;三是提高突破性論文評價和識別效率:例如,在本研究的基礎上實現新穎性和技術影響力計算平臺化。