邊文越,李國鵬,周秋菊,冷伏海
(中國科學院科技戰略咨詢研究院,北京 100190)
自2014年起,中國科學院(2016年前為文獻情報中心,2016年至今為科技戰略咨詢研究院與文獻情報中心)與科睿唯安基于Essential Science Indica‐tors(ESI)數據庫研究前沿數據,聯合研制并發布了《研究前沿》年度報告,取得了良好的社會反響。原國家副主席李源潮在中國科協會議上引用了該報告結果[1],《人民日報》[2]、《光明日報》[3]、中央電視臺[4]、新華社[5]、《華爾街日報》等國內外新聞媒體以及美國物理聯合會、日本科學技術振興機構[6]等專業組織高度關注報告內容;中國農業科學院[7]、中國工程院[8]紛紛推出本領域的研究前沿報告,中國科學院科技戰略咨詢研究院也再接再厲,研制了《納米研究前沿分析報告》《全球城市基礎前沿研究監測指數》等產品[9-10];王小梅[11]、周秋菊[12]、邊文越[13]、白如江[14]、周群[15]、孫震[16]、張迪[17]等對ESI研究前沿進行了深入研究,在《情報學報》《中國科學院院刊》等期刊發表了一系列文章,ESI研究前沿已經成為情報學界研究熱點。
作為報告研制團隊成員,本課題組在為《研究前沿》取得的成績興奮之余,也意識到有必要就ESI研究前沿的一些基本問題進行討論,以進一步加固其發展基礎。本文首先討論了ESI研究前沿的一些基本問題,然后基于這些討論,設計了基于ESI研究前沿的研發水平比較方法,并進行了案例驗證。
中文“研究前沿”在英文中實際對應的是兩個含義有所區別的詞組:research frontier和research front。前者多用于自然科學界,后者多見于情報學界[18],而ESI研究前沿使用的是后者。ESI研究前沿基于引用關系,每個前沿由一組高被引論文和引用這些論文的相關論文組成,這些高被引論文的共被引相似度強度位于設定的閾值之上[19]。ESI研究前沿每兩個月更新一期,每期約1萬個研究前沿。要搞清楚ESI研究前沿的內涵,關鍵是搞清楚re‐search front的準確含義以及其與research frontier的區別。
(1)詞義辨析。根據《韋氏詞典》的解釋,frontier由“地理上的邊界”引申出“認知的極限”(the farthermost limits of knowledge or achievement in a particular subject),從而具有“前沿”的含義。美國科技政策學家Bush在其著作《科學:無止境的前沿》(Science:The Endless Frontier)中使用了frontier一詞。front是指“活躍或感興趣的領域”(an area of activity or interest)。雖 然 Price[20]、Small[21]、Garfield[22]等對research front的定義不同,但都是基于高被引論文。一組被同行大量引用的論文所指向的領域自然是活躍的領域。因此,從詞義上看,情報學界使用的research front與自然科學界使用的research frontier是有區別的,前者更多地是指向研究熱點。
(2)學界觀點。在國內,無論是情報學界還是自然科學界,都已經注意到了前者所說的research front并不是后者所通常理解的“研究前沿”。鄭彥寧等[23]指出,基于引文方法識別出的research front更趨于熱點而不是前沿[23]。某位長期從事科技情報研究的科研人員認為,research front翻譯為“研究焦點”也許比“研究前沿”更合適一點。在中文語境中提到前沿,大家通常想到的是少數尖端研究領域,比如,物質結構、宇宙起源、生物演化等,對應的英文是frontier[24]。2015年10月,在《研究前沿2015》發布會上,應邀出席的某院士當場指出,報告中的“前沿”實際上是指研究熱點。
(3)案例研究。2005年,《科學》(Science)雜志為慶祝創刊125周年,提出了125個科學問題,這些問題是科技界公認的研究前沿[25]。本文按照《研究前沿》報告的領域劃分,分別從《科學》雜志這125個科學問題和2014—2020年《研究前沿》報告中選取了一些例子并進行對比。如表1所示,自然科學界和情報學界各自認為的研究前沿在方向上是一致的,但情報學界的research front更多地表現為實現自然科學界research frontier的具體方法和途徑。這符合科學邏輯。因為研究前沿是科研人員共同的奮斗方向,在致力于解決research frontier的過程中,形成了一些可行性高、參與程度高的途徑或方法即熱點。這些途徑或方法在引用關系上體現為一組內容關聯、頻繁被共同引用的論文及其施引論文,這就是research front。

表1 《科學》和《研究前沿》中“前沿”對比
綜上所述,本文認為ESIresearch front反映的是研究熱點。鑒于我國情報學界已經習慣將其翻譯成ESI研究前沿,本文仍沿用這一翻譯,但其含義是研究熱點。
采用聚類方法求解出的研究前沿必須具有科學含義,才具有價值。通過連續7年分析解讀ESI研究前沿,本文認為確實有相當多的ESI研究前沿準確反映了科技界的研究熱點,具有很強的分析和研究價值。但仍有一部分ESI研究前沿值得商榷,主要有以下三個方面的原因。
(1)聚類規模。理論上,一個ESI研究前沿由一組共被引論文及其施引論文組成。但在實際分析解讀中,因為施引論文數量眾多且主題發散,所以主要關注作為基礎的共被引論文。根據聚類參數設計,每個ESI研究前沿對應一個由2~50篇論文組成的共被引論文簇。以2018年3月前沿數據為例(表2),在全部10143個前沿中,只包含2或3篇論文的簇多達6632個,占比65.4%。而依據多年研究形成的經驗,至少需要4篇論文才能準確識別出其共同指向的研究主題,即至少約2/3的ESI研究前沿基本判斷不出主題。組成簇的論文太少不行,而太多也不代表就能識別出研究主題,這與引用動機有關。根據研究經驗,由20~40篇論文組成的簇通常能夠較好地反映研究主題。

表2 ESI研究前沿統計分析(2018年3月數據)
(2)引用動機。ESI在對高被引論文進行聚類時,默認引用都是合理的科學行為,是對已發表成果的繼承和發展,但實際情況要復雜得多。一方面,存在不合理的引用,突出體現為自引哄抬。少數ESI研究前沿的共被引論文簇絕大多數甚至全部由自引論文組成,類型包括自我引用、師生互引、同門互引、夫妻互引、固定合作伙伴互引等。當然,不排除其中確實有優秀的研究團體,其研究內容也具有較高的科學價值,但更多的是互相哄抬。另一方面,合理的引用動機也千差萬別。同樣引用一篇文獻,有人采用前言宏觀介紹,有人借鑒實驗方法,有人關注結果討論。這就使得在同一個共被引論文簇,特別是規模較大的簇中,可能存在兩個甚至多個內容關聯性不強的研究主題。
(3)科學價值。即使研究主題聚焦明確、引用動機科學合理,一個ESI研究前沿也不一定合格,因為它還必須具有較高的科學價值。缺乏科學價值主要表現為共被引論文大都來自科技不發達國家和發表在低水平期刊。對于具有全球普適性的自然科學熱點,科技強國不參與基本不可能;即使是一些區域性熱點,通常也至少有1~2個科技強國參與研究。而論文是否發表在本領域權威期刊,則反映了同行專家對研究成果是否認可。
綜上所述,本文認為一個ESI研究前沿的共被引論文簇符合研究主題聚焦明確、引用動機科學合理、科技強國參與、權威期刊認可這四個標準,該前沿就可被認定為是一個合格的研究前沿。
分析利用ESI研究前沿實質上就是分析利用組成前沿的共被引論文簇和施引論文,前者是重點。本文認為,明確共被引論文簇的內容屬性是正確使用ESI研究前沿的前提。
ESI數據庫將組成前沿的共被引論文簇稱為“core papers”。根據《韋氏詞典》的解釋,core的含義為“a central and often foundational part usually distinct from the enveloping part by a difference in na‐ture”,不僅有“中心”的含義,同時蘊含“基礎”的意思。相比于施引論文,共被引論文簇居于引用網絡的中心,并且構成引用網絡的基礎。因此,Persson[26]認為共被引論文簇是引用網絡的“智力基礎”(intellectual base)。Zhao[27]持相似觀點,稱其為“知識基礎”(knowledge base)。《研究前沿》主要研制者冷伏海研究員也認為是知識基礎。國內有學者將core papers翻譯為“核心論文”。根據《現代漢語詞典》(第七版)的解釋,“核心”是指“主要部分(就事物之間的關系而言)”,如領導核心、核心小組等。相比于core papers的英文原意,“核心論文”突出了共被引論文簇對引用網絡,即ESI研究前沿的重要性。本文認為,將core papers翻譯為“基礎論文”更好,不僅更貼合其原意,而且更準確地反映了共被引論文簇的內容屬性,具體理由闡述如下。
(1)基礎性不等于重要性。施引論文以共被引論文簇作為其研究基礎,因此,基礎性是共被引論文簇的第一性。共被引論文簇頻繁被引用,即頻繁被當作研究基礎,反映了其重要性。但對于某個具體ESI研究前沿,兩者并不一定等價。例如,某鈉電池研究前沿,其共被引論文簇含有研究鋰電池的論文。鋰與鈉是同族化學元素,化學性質相似,其研究有借鑒意義。因此,鋰電池研究可以是鈉電池研究的基礎,但不能算作后者領域的重要成果。類似的例子在ESI研究前沿中還有很多。
(2)共被引論文簇的重要性不完備。第一,共被引論文簇有時間限制,要求是之前六年發表的論文。因此,會遺漏發表在六年前的本領域奠基性工作。第二,進入共被引論文簇的前提是成為高被引論文,而ESI數據庫的高被引標準是按出版年分別計算,即發表越早的論文要求被引次數越高,發表越近的論文則要求相對較低。以2018年3月數據為例(表3),47296篇共被引論文發表時間從2012年到2017年12月,被引次數統計截至2017年12月,最高被引5063次、最低4次。相對而言,長時間積累了較高引用次數的論文說明其經過了時間檢驗,其重要性可能性更高;而發表時間較近、被引次數相對較低的高被引論文,其后續發展情況未知,其重要性也打上了問號。第三,ESI數據庫的高被引標準對綜述和普通論文一視同仁,使得綜述更容易進入共被引論文簇。但綜述只是對前人研究成果的總結歸納,其對領域發展的重要性通常不及原創性論文。第四,共被引論文簇要求高被引論文“共同”被引用強度達到一定閾值,因此,可能遺漏閾值之下的重要工作。科睿唯安公司報告指出,受聚類方法限制,共被引論文簇一度只利用了43%的高被引論文(目前是99%)[28]。第五,ESI研究前沿存在碎片化特點,可能將一個研究熱點分裂成若干個。例如,在2018年3月數據中,鈣鈦礦太陽能電池這一研究熱點被分成20多個前沿,雖然反映了其不同的研究細節,但也使任一前沿的共被引論文簇都無法反映其全貌。

表3 ESI研究前沿共被引論文被引用情況(2018年3月數據)
明確了共被引論文簇的內容屬性,其使用問題迎刃而解。作為ESI研究前沿的基礎,共被引論文簇可以用于揭示研究熱點,但由于其重要性不完備,通常不適合直接用于分析比較各國研究水平。本文采用“基礎論文”一詞指代ESI研究前沿的共被引論文簇。
構建高質量的論文分析集合是準確比較各國基礎研究水平的前提。Web of Science數據庫雖然論文收錄較全,但論文質量參差不齊。ESI數據庫選取了其中top 1%高被引論文。雖然高被引不一定代表高質量,但兩者確實有較大相關性,因此,高被引論文具有更高的分析價值。然而ESI數據庫只有22個學科分類,若要分析某個具體前沿領域,則需要費時費力地構建檢索式。ESI數據庫通過共被引聚類,每期形成約1萬個研究前沿,相當于把高被引論文按照研究主題做了較為細致的劃分,為前沿數據集構建與分析提供了很大方便。然而,如上文所述,在形成ESI研究前沿的過程中,受方法所限存在一些誤差,導致ESI研究前沿并不適合直接用于分析比較各國研究水平。本文認為,應該充分利用已形成的分析便利條件即ESI研究前沿,有針對性地予以彌補,設計合理的基于ESI研究前沿的研究水平比較方法。重點解決因研究前沿碎片化導致的“只見樹木不見森林”問題和因發表時間限制、共被引強度要求而導致的重要成果丟失問題。對于高被引標準問題,只要不搞國家、機構、作者發文量的排名,則影響不大。事實上,對于ESI研究前沿這種小樣本數據,也不應該簡單地根據發文量排名,分析比較各國研究水平。
如圖1所示,本文的設計思路是:首先,在ESI研究前沿中找出所有與分析主題相關的前沿并將其基礎論文合并,即解決研究前沿碎片化問題;其次,以合并后的基礎論文為基礎,補充前沿發展歷程中的重要成果,構建基本完備的重要成果集合,即解決基礎論文重要性不完備問題;最后,以構建的重要成果集為基礎進行研究水平比較分析。

圖1 基于ESI研究前沿的研究水平比較方法
針對上述思路,本文擬采用以下方法實現:①根據分析主題,設計構造檢索式,在ESI研究前沿“research front name”字段檢索相關前沿。每個前沿的research front name由若干個關鍵詞組成,這些關鍵詞可以反映前沿的內容和范圍。對于檢索到前沿,閱讀其基礎論文,剔除不相關和不合格的前沿,對剩下的前沿命名并將其基礎論文合并。②以合并后的基礎論文為基礎,根據引用關系和語義關系補充前沿發展過程中的重要成果。論文通常在引言部分綜述前人的重要成果時會使用一些信號詞,比如,first代表首次提出,to date、current往往緊跟最新進展,record、remarkable、形容詞最高級(如highest、longest)提示重要性高。包含這些詞的句子所引用的參考文獻一般都是值得關注的重要成果。此外,通過搜索引擎檢索與分析主題相關的新聞媒體報道,防止遺漏重要進展,并補充最新進展彌補引文的滯后性。③采用知識元分析方法,比較各國研究水平[29]。根據分析主題特點,設計知識元組成結構,然后從論文和新聞媒體報道中提取前沿知識元,并根據語義把知識元鏈接形成知識網絡,進而對前沿發展趨勢和各國研究水平進行深入分析和對比。
本文以鈣鈦礦太陽能電池為案例,對分析框架進行驗證。使用2018年3月ESI研究前沿數據,分析時間截至2017年年底。
鈣鈦礦太陽能電池是以鈣鈦礦材料作為吸光層的太陽能電池,光電轉換效率從2009年首次報道時的3.8%,到2018年已經突破了23%。2013年,鈣鈦礦太陽能電池被《科學》雜志評為年度十大突破之一。2016年,鈣鈦礦太陽能電池被“世界經濟論壇”評為當年十大新興技術之一[30]。
首先,以perovskite為關鍵詞在ESI研究前沿re‐search front name字段中檢索,找到118個前沿。接著,閱讀每個前沿的基礎論文,剔除不屬于鈣鈦礦太陽能電池領域和不合格的前沿,還剩下20個,對其命名,分為電池設計和基礎研究兩類(表4)。為比較電池設計水平,本文選取電池設計類的7個前沿,將其基礎論文合并。由表4可以看出,雖然理論上ESI研究前沿使用的是之前六年的論文,但具體到某一個前沿其基礎論文可能并沒有覆蓋那么長的時間范圍。而且,即使將電池設計類的7個前沿合并,其56篇基礎論文的發表時間范圍為2012年8月至2017年1月,距離當期收錄截止時間2017年12月也還有一段距離。這些都提示了必須補充前沿進展和最新成果。

表4 鈣鈦礦太陽能電池研究前沿
本文采取由近及遠的策略,先補充最新成果,再補充前沿發展歷程中的重要成果。首先,搜索權威新聞媒體對鈣鈦礦太陽能電池的報道,補充了2017年的兩篇重要論文和三項重要成果。然后,將這2篇論文和56篇基礎論文合并,通過逐篇閱讀其引言部分,找到first、recent、to date、record、re‐markable、highest等提示關鍵成果的詞,并下載對應的參考文獻,去除重復文獻,最后合計得到23篇論文。然而,通過閱讀這23篇論文發現,其引言部分包括了一些前述58篇論文未提到的重要研究成果,即仍需繼續上述過程。為此,本文為這一過程設置了終點:①回到起點,即first所提示的本領域第一篇成果;或者②沒有新的發現,即與已有論文重復;或者③引用的成果的重要性明顯不足。又經過兩輪補充,本文結束這一過程,構建了由102篇論文和3項媒體報道成果組成的重要成果集。
本文根據鈣鈦礦太陽能電池的特點,設計了由名稱、電池組成、性能、來源四個基本要素組成的知識元。其中,“名稱”表示鈣鈦礦太陽能電池的具體研究方向。由于經過補充的重要成果集的內容范圍已經超出了電池設計類的七個前沿,本文對研究方向重新進行了分類和命名,分為正型結構、反型結構、半透明電池、串聯電池、無機鈣鈦礦電池、無鉛鈣鈦礦電池、大面積、小模塊、大模塊和其他等。“電池組成”表示鈣鈦礦太陽能電池正反電極、電子傳輸層、吸光層、空穴傳輸層等部分的組成材料,對于串聯電池還包括第二種電池的信息和串聯方式。“性能”表示用于測試的電池活性面積,以及在該面積下測得的光電轉換效率、開路電壓、短路電流、填充因子等信息。“來源”表示該條知識元的出處,以Web of Science入藏號或新聞報道出處表示,并關聯作者、機構、出版時間等信息。本文通過人工閱讀的方式,從102篇論文和3項媒體報道成果中,挖掘出112條知識元(圖2)。

圖2 鈣鈦礦太陽能電池知識元(部分)
這些知識元雖然來自不同論文或媒體報道,但是彼此之間存在著豐富的語義關系,可以根據分析需要有針對性地組織起來形成知識網絡。本文選取最能反映各國研發水平的小面積(約0.1 cm2)太陽能電池研究結果,繪制電池效率提升曲線。如圖3所示,由知識元串聯形成的曲線清晰地呈現了電池效率從2009年5月首次報道時的3.8%到2017年6月22.1%的快速提升過程,在這一過程中做出重要貢獻的機構及機構間的合作與競爭情況。由圖3可知,雖然日本在該領域做出奠基性成果,但截至分析時間鈣鈦礦太陽能電池研究水平領先的國家是韓國和瑞士。圖3的分析結果受到領域專家認可。

圖3 鈣鈦礦太陽能電池效率提升曲線
結合案例驗證,對本文提出的基于ESI研究前沿的研究水平比較方法作以下討論。
(1)補充重要成果的必要性。如圖3所示,在10項里程碑成果中,有6項不在當期ESI研究前沿使用的47296篇基礎論文范圍內。其中,用圓形實心點表示的2項成果是由于發表時間(2012年前)在當期基礎論文收錄時間范圍外而未被收錄,而用三角形實心點表示的4項成果的發表時間全部在收錄時間范圍內,并且被引頻次達到甚至遠遠超過高被引標準(表5),但仍未被收錄。無論哪種原因,都說明使用ESI研究前沿基礎論文作研究水平分析時,必須補充重要成果,而不能直接將其用于分析。

表5 補充的四項論文與同期基礎論文對比
(2)補充重要成果的方法。用于比較研究水平的成果,重質不重量,如何衡量論文的質量成為重要問題。如上文所述,單純依靠引用次數多少判斷研究水平高低并不可靠。本文采取基于引用關系和語義關系的遴選方法,實質上是借助專家智慧判斷引用成果的質量。當作者使用first、to date、cur‐rent、record、remarkable、形容詞最高級等詞語修飾引用的研究成果時,說明該成果值得重視,有必要被補充進來。這種遴選方法既可以降低自引哄抬的影響,又可以通過直接引用關系避免“共同”被引用所導致的遺漏,還可以突破ESI數據庫對基礎論文“之前六年”的時間限制。
(3)關于知識元挖掘方法。本文采取人工方法挖掘知識元,而未采用機器挖掘方法。其原因主要在于每條知識元由多項數據組成,這些數據不僅分布位置多樣(有的在正文,有的在附件;有的在段落,有的在圖表),而且每一項數據可能存在需要分辨的多條記錄,給機器挖掘造成一定困難。本文認為解決這一問題既需要探索智能的機器挖掘方法,更需要發展高質量的本國期刊。因為本文所列的知識元數據都是作者在向期刊投稿時需要明確提供的,哪個國家掌握了期刊及其背后的數據庫,哪個國家就掌握了這些經過語義標引的高質量數據,節省了挖掘成本。因此,在數據驅動科研時代下,我國必須積極發展自己的科技期刊,通過吸引國內外優秀論文投稿,積累優質數據,為本國科研服務。
(4)科研評價話語權。近年來,諸如ESI高被引科學家、ESI“核心論文”等基于引用次數的評價指標頻頻被用于科研評價。不可否認,通過高被引方法確實能發現很多優秀的科學家和研究成果。然而,目前的情況多是把數據商提供的分析結果拿來就用,缺少深究分析方法和分析結果是否合理。這相當于把我國科研評價話語權直接交給了外國商業公司,不利于我國科技事業的健康發展。本文提出的研究水平比較方法,既充分利用ESI研究前沿,又有針對性地完善,可以更好地用于科研評價,有利于把評價話語權牢牢掌握在自己手中。
本文從ESI研究前沿出發,首先討論了前沿內涵、合格標準、使用方法等基本問題,認為ESI研究前沿實際反映的是當今科技界的研究熱點,一個合格的ESI研究前沿需要其基礎論文符合研究主題聚焦明確、引用動機科學合理、科技強國參與、權威期刊認可等四個標準,基礎論文可以用于揭示研究熱點但不適合直接用于分析比較各國的研究水平。其次,基于上述結論,本文設計了基于ESI研究前沿的研究水平比較方法,其核心是構建基本完備的重要成果集合并采用知識元方法分析成果集合、比較各國研究水平。最后,本文使用鈣鈦礦太陽能電池這一研究熱點對該方法成功進行了驗證,并結合驗證結果對補充重要成果的必要性和補充方法、知識元挖掘方法和科研評價話語權問題進行了討論。
按照《孫子兵法》“上兵伐謀”思想,分析比較各國在某一前沿領域的研究水平,應該從戰略規劃開始,沿著“戰略規劃—項目部署—基礎研究—成果轉化”鏈條進行全方位比較。因此,本課題組正在構建基于戰略規劃、項目部署、基礎研究、成果轉化等多種數據的研究水平分析比較方法,ESI研究前沿在其中將發揮識別研究熱點和以其為基礎構建基礎研究成果集等重要作用。同時,考慮到各領域科學研究的不同特點(純理論、應用導向等),在方法設計和ESI研究前沿使用方面將更加具有針對性和符合學科特點。