倪四秀 亓永康
(江蘇師范大學圖書館,江蘇 徐州221116)
學術論文作為科學研究正式交流最主要的介質,在科學研究與科學交流中扮演著不可替代的角色。高水平論文是指具有重要學術價值,一定程度上反映某一研究領域的前沿與熱點的學術論文。本研究中高水平論文包括ESI數據庫中近十年內各學科每年論文被引次數居前1%的高被引論文,以及近兩年內以每兩個月為單位被引次數居前0.1%的熱點論文[1]。
目前,有關學術論文特征及其影響力的研究受到各界學者的廣泛關注。Garfield[2]在1955年提出通過論文的被引頻次衡量論文的影響力,Kos?mulski[3]對論文被引頻次與引用文獻做對比分析,將論文被引頻次大于其參考文獻數的論文定義為成功論文;Bornmann L.等[4]通過對科學家引證行為的研究表達了對被引頻次的質疑,發現論文引證行為受多方面因素的影響。Xiaojun Wan等[5]研究證實了參考文獻的重要性,提出了引用強度概念以衡量學術論文參考文獻的影響力。Shao,W[6]指出學術論文影響力的評價是科研管理的重要內容,建立綜合的學術論文影響力評價體系,才能客觀、直接地實現影響力評價社會性和動態性。
在國內,主要針對SCIENCE、NATURE等最頂級期刊刊載論文,采用文獻計量方法,從期刊[7]、研究領域[8]、研究機構[9]等維度對頂級期刊論文刊載和引用的特征進行深入分析。梁帥等[10]以我國F5000論文為對象,從關鍵詞維度,綜合分析了優秀論文在創新、內容等方面的特征;周曉英等[11]針對我國圖書館學和情報學最高被引的100篇論文的內部與外部特征進行對比分析;劉武英等[12]以編輯出版類核心期刊為對象,揭示了零被引論文與期刊的H指數、影響因子之間的密切相關性。
生命科學已經發展成為21世紀最活躍的學科之一,成為自然科學的前沿學科[13]。SCIENCE評選的十大突破中過半數與生命科學研究直接相關[14],被譽為“科學界奧斯卡”的“科學突破獎”將生命科學設為三大突破獎之一。李克強總理對“2018世界生命科學大會”作出重要批示,強調“要深入交流、凝聚共識、加強協作,推動生命科學研究和技術創新取得更多突破”[15]。當前在頂級期刊中也刊載有多篇關于生命科學研究方法的突破[16]與生命科學領域研究最新進展[17]的成果,有學者從文獻計量學視角研究了生命科學領域論文特征,發現了該研究領域的論文開放獲取比率最高[18],也有學者以生命科學為樣本基于B-SFA對基金資助做分析[19]。
筆者以生命科學為例,從發文特征、引文特征、合作特征等多維視角,分析高水平論文的傳統影響力產生與分布特征,以便為進一步增強該領域研究成果影響力提供依據。
筆者以ESI數據庫的高水平論文為數據源,在ESI數據庫中檢索限定學科為生命科學領域所包含的4個學科:生物與生化、環境/生態學、微生物學、分子生物與遺傳學,得到2008年1月1日至2018年8月31日的生命科學領域Top Papers(高水平論文)共計19125篇,篩選去除沒有DOI信息的文獻數據,得到有效數據19080條;以19080條文獻DOI號分別在Web of Science核心合集中匹配到相應的文獻,檢索匹配得到其中19057條文獻的標題、作者、來源期刊、DOI、文獻類型、語種、出版日期、被引次數、最近180天使用次數、2013年至今使用次數、頁數、引用文獻數、研究方向、WOS類別并導出。此即為本課題研究的基礎數據,在此基礎上基于發文信息、被引頻次、合作網絡3個視域展開對生命科學領域高水平論文特征的綜合評價分析。
圖1顯示了本課題研究樣本論文(19057篇)的發表時間和學科大類,發現2008年至2018年生命科學領域的高水平論文中關于生物與生化的研究論文數量最多,其次是環境與生態。為了驗證研究時段內論文數量的變化趨勢,對歷年論文數量做趨勢線擬合分析,趨勢線公式為:y=1311.6e0.0503x,R2=0.9834,擬合度極高,表明生命科學領域高水平論文在2008-2018年的時段內論文數量分布呈明顯的指數型增長態勢??梢灶A見,在學術界與社會日益關注下,在理論基礎不斷完善與研究技術不斷革新的背景下,關于生命科學領域的研究會進一步升溫,論文數量會保持高速增長,高水平論文的數量與質量也會不斷提高。

圖1 生命科學領域高水平論文數量分布
選取19057篇生命科學領域高水平論文的來源(國家)地區信息,默認第一作者的第一歸屬單位所在的地區為其來源地區,發現除38篇論文的國家信息空缺外,其余19019篇論文歸屬于113個國家(地區),其中25個國家(地區)僅有1篇論文,23個國家(地區)的論文數量超過100篇,且此23個國家(地區)所擁有的高水平論文占據了全球的93.22%。
從論文數量看,美國以5748篇論文占據了全球生命科學領域高水平論文的30%以上,居第1位,領先優勢較大;中國1675篇論文居第3位,與美國尚存在不小差距,但是在國際上已占有重要地位。從論文篇均被引頻次看,23個國家(地區)中最高的是日本,達到了498.33;發文量最高的美國篇均被引次數為336.79,也處于較高水平;中國的論文篇均被引次數為168.84,在23個國家中最低,與發達國家還有較大差距,中國近年來在生命科學領域的研究中取得了巨大進步,高被引論文數量顯著提升,已經與發達國家處于同樣的位置,但是在論文質量層面還是存在較大的差距,在量變的同時還需致力于質的提升。
選取論文的來源機構指標,并統計論文的第一作者所屬的第一單位,除38篇論文信息缺失外共得到19019條機構信息,統計得到3523個機構,超過發文量均值(不少于6篇)的機構有522個。
表1中列出了生命科學領域高水平論文發文量150篇以上的12個機構發文情況。從整體看,論文的分布較為集中,前100位的機構論文量占據總數超過一半,前22位的機構中有13個來自美國,美國的科研機構在生命科學領域的研究中有極高的影響力。中國科學院以277篇論文位居第4位,國內論文數量較多的機構還有清華大學(39篇)、北京師范大學(37篇)、復旦大學(37篇)等高等學校。
從機構性質看,各個國家的國家研究院都具有較高的影響力;而美國的機構中私立大學和公共組織在生命科學領域的研究中起到了主導作用,特別是私立研究型大學,依托美國開放的學術環境與雄厚的科研和資金實力,與世界各國的高校、組織開展了廣泛的合作,取得了豐碩成果;中國科學院作為中國最高層次的研究機構,代表了中國在生命科學領域最權威的影響力,眾多高校還需充分發揮各自學科資源優勢,實現優勢互補、合作共贏。

表1 生命科學領域高水平論文機構分布
筆者提取19057篇論文的文獻類型信息,發現生命科學領域高水平論文主要為3種文獻形式:研究型論文、綜述類論文、會議論文,3種類型的論文在2008年-2018年間的數量分布以及論文篇均被引頻次如表2所示。
在我國,臨床中有越來越多的腦梗死患者接受治療,血管性帕金森疾病的發病率也在上升,臨床中主要采取的是美多巴與多巴胺受體激動劑治療,但是治療的結果不佳。血管性帕金森綜合征患者沒有出現脫色神經元以及路易小體[2-3],癥狀和帕金森疾病相似。在一些其他的研究中,血管性帕金森患者有比較多的患者基底核區梗死對其影響比較大,梗死讓多巴胺突出以及突觸后結構被破壞,影響了多巴胺系統功能,臨床中引起了各類癥狀表現。
從論文數量上看,2008年至2018年生命科學領域高水平論文的主要形式為研究型論文,達到了13156篇,占總數的超過69%,會議論文僅124篇,綜述類論文為5777篇,與研究型論文構成了高水平的主體;研究型論文的年份分布與論文總體分布保持一致,論文數量隨發表時間的變遷而增長。
從論文被引頻次看,總體上研究型論文和綜述類論文的篇均被引頻次接近,且均與論文發表時間成正比;綜述類論文在發表的最近兩年被引頻次要高于研究型論文,綜述類論文大都以簡潔概括性的語言對某一問題做系統闡述,在論文發表的最初階段受到了廣泛關注,但是綜述類論文的被引存在明顯的時效性特征;2016年之前發表的研究型論文在總體上被引頻次高于綜述類論文,且領先幅度與論文發表時間成正比,研究型論文的被引更具有厚積薄發的持續性。
互聯網的發展與普及催生了傳統學術資源傳播方式的變革,開放獲取論文以其免費獲取、質量高、無限制使用的特點成為學術知識傳承創新和交流發布的主體和新趨勢[20],開放獲取擴展了論文的獲取渠道,無疑會增加論文被閱讀與利用的機會,開放獲取對論文的被引次數乃至論文的傳統學術影響力是否有影響還需進一步驗證。
提取19057篇生命科學領域高水平論文的開放獲取信息,得到如表3所示的開放獲取與論文被引頻次,表中統計了2008—2018年歷年的開放獲取與非開放獲取論文數量、最大被引頻次、篇均被引頻次和開放獲取論文比重。從橫向看,高水平論文中共有11817篇論文為開放獲取論文,超過總數的62%,非開放獲取論文為7240篇,生命科學領域的高水平研究成果更多地被開放獲取期刊所收錄;歷年開放獲取論文的篇均被引頻次均高于非開放獲取論文,開放獲取論文不論在被引數量還是被引質量上都高于非開放獲取論文,開放獲取對論文的被引用具有積極作用。
從縱向看,除2018年外,歷年論文開放獲取比重均超過50%,2018年開放獲取比重受論文數據只采集到前8個月的影響較低(37.36%),但是在近3年論文開放獲取比重明顯呈下降趨勢,非開放獲取論文的數量也有明顯增加,或因開放獲取期刊通常會收取高額的費用且為了利益盲目擴張論文發表數量,導致期刊質量下降,眾多有價值的實驗研究轉投了傳統非開放獲取高質量期刊,對開放獲取期刊形成了不小的沖擊。
科學基金是最基本的科研資助方式[21],隨著研發經費支出的迅速增長,科學基金在論文產出過程中的地位日益突出[22]。為了驗證基金資助對生命科學領域高水平論文的被引頻次是否有影響,提取了19057篇高水平論文的基金資助信息,發現有16653篇論文至少有1條基金資助信息,超過總數的87%,生命科學領域高水平論文大部分取得了高質量的基金資助。統計論文的基金資助數量并計算對應基金資助數量下論文的篇均被引頻次,制得基金資助與論文被引頻次關系圖(如圖2所示)。

表2 不同文獻類型論文被引頻次分布

表3 開放獲取對論文被引頻次影響

圖2 基金資助對論文被引頻次影響
圖2 中縱軸表示論文的基金資助數量,0-13逐條排列,13以上區間排列,橫軸表示對應基金資助條數的高水平論文數量和篇均被引頻次??梢园l現,有2404篇論文沒有基金資助信息,默認為這2404篇論文沒有取得基金資助,但是這些論文也取得了篇均被引342.01次的高被引水平;取得一項基金資助的論文數量最高,達到3430篇,論文數量隨論文取得的基金資助數量的減少而增加,半數論文得到了不多于3項基金資助。
筆者提取19057篇高水平論文的作者和所屬國家(地區)信息,統計每篇論文對應的作者數和國家數,得到了如表4所示的生命科學領域高水平論文作者合作與國家(地區)合作情況分布表,默認單篇論文的作者數大于1為合作論文,單篇論文所屬國家(地區)數大于1為國際合作論文。

表4 生命科學領域高水平論文合作分布
從論文的作者合作看,19057篇論文中除去4篇沒有明確的作者信息,共有18251篇論文的作者數量大于1,即合作論文占總數的95%以上,可見在生命科學領域的研究中多學者、多團隊的協同合作是攻破科研難題取得高影響力的重要條件;802篇由單一作者完成的論文能夠入圍高水平論文行列突出了作者高水平的研究能力,其中有368篇論文歸屬于美國;作者數為兩人或3人的論文數量最高,占合作論文總數的27%,作者數量大于10人的論文有5180篇。
從論文的國家(地區)合作看,除去沒有明確國家信息的38篇論文,有10397篇論文由單一國家(地區)所獨有,占總數的約54%,國際合作在生命科學領域的研究中沒有凸顯;在國際合作論文中,有4560篇論文由兩個國家共同完成,可見少數國家間形成的穩定的合作模式在生命科學領域的研究中比較普遍;在中國的1675篇高水平論文中有948篇為國際合作論文,國際合作比例達到56%,中國學者在生命科學領域的研究會更樂于尋求與國際上其他國家的合作,其中中國與美國學者合作完成的論文686篇,在所有國家中是最高的;而美國的國際合作論文僅11篇,而國內多作者合作論文高達5369篇,占總數的93.4%,美國學者在生命科學的研究中更傾向于尋求本國其他機構學者的合作,這與美國眾多私立研究型大學、民間科研組織所擁有的強大科研實力是密不可分的。
統計論文的來源國家(地區)信息,以生命科學領域的4個研究學科為劃分依據,分別構建了4個學科的國家(地區)合作矩陣,并利用VOSviewer軟件繪制如圖3所示的合作網絡圖譜。
圖3中的4個合作網絡圖譜展示了生命科學領域4個學科各國家(地區)合作發表論文的情況,每一個節點代表一個國家(地區),節點之間的連線代表各國家(地區)之間合作的強度,合作越為緊密則連線越粗??梢园l現,4個合作網絡圖譜之間存在較大差別。分子生物與遺傳學和環境/生態學兩個學科的合作網絡密度明顯較高,各節點之間的連線更多,體現了各國家(地區)在這兩個學科的科學研究中存在更為廣泛的緊密合作,也催生了更多的國際合作的科研論文。4個合作網絡中美國都是最大的一個節點,與世界各國的聯系也最為密切,在分子生物與遺傳學中美國、英格蘭、德國、中國、加拿大構成了合作核心,環境/生態學中美國、澳大利亞、英格蘭、德國、中國、法國構成了合作核心,生物與生化中美國、德國、英格蘭、法國、中國、瑞士構成了合作核心,微生物學中美國、英格蘭、德國、法國、荷蘭構成了合作核心。
中國在4個學科的合作網絡中處于緊密合作的核心位置,與美國的合作最為密切。為了更清晰地展現中國在生命科學領域高水平論文合作網絡中的位置,抽取全部論文的國家(地區)信息,構建生命科學領域全網絡合作矩陣,并得到全網絡合作圖譜,截取如圖4所示的中國在生命科學領域中的合作網絡圖譜。

圖3 生命科學領域四學科高水平論文合作網絡圖譜(閾值=10)

圖4 生命科學領域高水平論文合作網絡圖譜(中國)
由合作網絡圖譜可以發現,紫色的最大節點代表中國,同為紫色節點的國家(地區)構成同一個聚類,這一聚類包括了中國、韓國、沙特阿拉伯、日本、新加坡、馬來西亞、巴基斯坦以及中國香港地區和臺灣地區,均分布于亞洲,可見在生命科學領域的論文合作中地緣因素與科研合作有較大關聯,同處一個區域的國家(地區)更容易產生合作的可能。在知識圖譜中與中國所代表節點連線最粗的是美國,同時也是整個網絡中的最大節點,英格蘭、德國、法國、荷蘭、澳大利亞、加拿大、瑞典、西班牙是最主要的合作對象,也與這些國家(地區)共同構成了生命科學領域高水平論文合作網絡中的核心。
筆者以生命科學為案例,從發文信息、被引頻次、合作網絡3個視域對高水平論文發文特征、引用特征、合作特征進行分析發現:
(1)發文特征方面,高水平論文數量呈明顯的指數型增長態勢,關于生命科學的研究持續升溫,高水平論文的數量與質量不斷提高;美國在生命科學領域的研究占有先導地位,領先優勢巨大,中國論文數量位居前列,但是論文被引頻次與主要國家相比還有不小差距;美國各種性質的研究機構憑綜合學術環境、資金支持與科研實力優勢取得了豐碩成果,無論是論文數量還是質量均具有高水平;生物醫藥等與人類健康密切相關的學科研究越來越受到科學界的關注,取得了極高的影響力。
(2)引用特征方面,生命科學領域的高水平論文被引處于極高水平,綜述類論文因對研究熱點前沿的追蹤與概述,在論文發表的最初階段受到了廣泛關注,取得了極高的學術影響力;開放獲取論文不論在被引數量還是被引質量上都高于非開放獲取論文,開放獲取對論文的被引用具有積極作用;基金資助論文的數量明顯高于非基金資助論文,絕大多數的高水平論文都取得了足夠的基金項目的資金支持。
(3)合作特征方面,在生命科學領域的研究中多學者、多團隊的協同合作是攻破科研難題取得高影響力的重要條件,美國擁有的強大學術影響力是各國開展國際合作的首選對象;生命科學領域4個學科的高水平論文合作網絡中美國都是最重要的合作對象,各合作網絡均產生了多個國家(地區)構成的緊密合作核心團體,中國在合作網絡中占有重要地位,影響力逐步提升。
(4)筆者通過揭示生命科學領域高水平論文的特征,明確當前我國生命科學領域研究與發展的方向,并通過中國與世界主要國家的對比,為中國生命科學領域研究找尋新的突破路徑。