劉佳雨
(南京郵電大學 圖書館,江蘇 南京 210023)
論文的首次被引通常被認為是它生命周期的開端,也是實現零被引的一個突破[1]。首次被引速度的快慢可以衡量文獻的科學價值,一般來說被引速度越快,越能表示這篇文獻觀點新穎有價值[2]。但是也存在“睡美人”這類特殊的文獻,常常“沉睡”很久才被人們發現[3],目前對“睡美人”文獻的研究大多仍是針對其中高被引論文的延遲響應展開,而對其他占比為大多數的延遲響應的所謂“低被引”論文卻缺少研究。高低被引的界線兩邊本就存在模糊地帶[4],一些所謂的“低被引”文獻的被引次數可能并不少,所以除高被引外的論文同樣具有科學價值。不同于以往以高低被引的標準進行分類,本文提出以首次響應時間為界線將論文進行分類,將高低被引論文一起進行比較。
首次被引與開放獲取之間的研究較少。對于OA(開放獲取)與nOA(非開放獲取)論文在首次被引階段的表現,有學者將混合出版期刊的OA與nOA論文發表后前3年的響應程度進行對比,結果顯示OA具有響應快速的起步優勢[5]。該研究僅針對單一領域的某本期刊,結果或許不具備推廣性,但是這一方向的研究對OA論文的引文機制、引文生命周期以及優勢探索有明顯的積極意義,需要更多關注。
綜上,目前的研究對除高被引外文獻的延遲響應研究較少,也較少有論文探索OA論文與首次響應的關系。本文提出以OA和nOA論文的首次響應時間為研究對象,將所有論文按快速、普通和緩慢響應進行分類,展現OA與nOA在首次響應速度上的不同特點。本文對緩慢響應做出定量的界定,展示OA緩慢響應現象的特性與獨特的引文生命周期,有助于從引文周期角度更細化地展現出OA優勢具體作用于引文周期的某一階段,有利于科研工作者更清晰地認識OA與nOA優勢。
本文選擇Hindawi公司旗下的期刊論文為研究樣本。Hindawi是世界上最大的完全開放獲取(Fully Open Access)期刊出版商之一。Hindawi公司收錄了從1874年開始的OA論文[6],收錄較早期的論文,給予OA論文充分的被引用時間,方便進行OA引文的研究。
本研究選擇發表時間為2000—2001年收錄在Hindawi網站上的所有開放獲取論文,共搜索到3 418篇,除去未被引用的論文,共得到2 466篇OA論文及其被引相關數據。之后,再根據OA論文中的關鍵詞,在SCI中隨機檢索出相似領域的2 466篇已獲得引用的nOA論文,記錄文獻的基本信息。
匈牙利學者Schubert等[7]在研究中首次提出論文發表到首次被引之間的“響應時間”。本文延用“響應時間”這一概念。考慮開放獲取因素的加入使得論文的首次被引時間較分散,僅分為快慢兩類論文會使分類不夠準確,所以本文根據所有論文的響應時間將論文分為快速響應論文、普通響應論文和緩慢響應論文。依據Sun等[8]在論文中將2年內設為立即響應(Immediately)以及將5年后設為輕微沉寂(Light Disappearance)論文的區分標準,本研究將發表后2年內完成首次被引的論文定義為快速響應論文;第3~5年內完成首次被引的論文則為普通響應論文;第6年開始才被第1次引用的論文稱為緩慢響應論文。
2 466篇OA和2 466篇nOA論文發表后獲得首次被引時間的分布情況,如圖1所示。圖1橫坐標表示每篇論文首次被引時間,橫坐標“1”表示在發文當年即發文第1年被引用,“-1”表示OA論文因為提前出版在正式發表前1年就獲得了首次被引;縱坐標表示在某個時間點獲得首次引用的論文篇數。整體來看,nOA與OA論文的趨勢大致相同,在論文發表后的前兩年獲得首次被引的論文數呈上升趨勢,且nOA論文獲得首次被引的論文數量多于OA論文。第一年,有385篇nOA和157篇OA論文獲得了首次引用;發表后的第2年完成首次被引的論文數達到頂峰,nOA與OA論文分別有897篇和508篇獲得首次引用;第3年,nOA與OA論文均有453篇論文獲得首次被引。隨后每年完成首次被引的論文數量大致呈現逐年減少的趨勢,但是每年獲得首次被引的OA論文開始多于nOA論文,在論文發表后的第11年至第22年,共343篇OA論文、116篇nOA論文被首次引用。在統計的結果中最后5年才被首次引用的OA論文有89篇,nOA論文有16篇。OA論文完成首次被引的情況整體滯后于nOA論文,峰值的論文數也與nOA論文數有較大差距,整體被引速度較為平緩,出現“長尾”現象。

圖1 OA與nOA論文首次被引所用時間分布
根據論文的響應時間,將論文分為快速響應論文、普通響應論文和緩慢響應論文3類,分類結果如圖2所示。

圖2 OA與nOA論文首次響應分類情況
2.2.1 快速響應論文
快速響應論文是指發表后2年之內獲得首次引用的論文,nOA論文中有52%是快速響應論文,然而OA論文中快速響應論文占比僅為28%。nOA論文在響應速度方面表現得積極且快速,超一半的論文在兩年內完成首次被引,而OA論文的響應速度略顯遲緩,同時快速響應論文在OA論文中整體占比最少。可能是因為在OA運動的早期,OA論文在質量與科研學者的認知中有一些缺陷和不足,導致在快速響應階段獲得引用的論文數量較少。
2.2.2 普通響應論文
普通響應論文是在發表后的第3~5年內完成首次被引的論文。普通響應論文在nOA中占比32%,在OA論文中占比38%,兩者相差較小。OA論文在發表后3~5年內有較多論文開始被關注和引用。可以看出普通響應論文在OA與nOA論文中的占比約為1/3,這一部分論文在以往只區分快慢被引時經常會被歸到其中某一類,其實并不合適。首先,它們數量較大,占總體的三成多,被歸到其他類會引起那一類占比虛高;其次,從響應時間角度來看,發表后3~5年內被引并不能達到快速也不構成慢速的條件。所以本文將這一部分單獨分類,結果較合理,也可以滿足科研評價的需要。
2.2.3 緩慢響應論文
緩慢響應論文是論文在發表后第6年逐漸開始被人引用的論文。一般來說,6年已經超過部分學科的半衰期,所以6年后才被引用在響應速度上較為緩慢。nOA論文中16%是緩慢響應論文,有386篇;OA論文中34%是緩慢響應論文,有843篇,占比較大,遠遠高于在nOA論文中的占比。結果表明,有超1/3的OA論文在發表6年之后才會慢慢獲得引用,對比nOA論文,響應較緩慢。由此,下文將對OA論文的緩慢響應現象展開更深入的研究。
843篇緩慢響應的OA論文首次響應時間和論文累計被引次數的氣泡圖,如圖3所示,橫坐標為首次響應間隔時間,縱坐標為論文編號,氣泡大小表示該論文累計被引次數的多少。結果顯示,累計被引次數較高的論文完成首次被引的時間大致集中在論文發表后的第6~10年,占緩慢響應OA論文的59.3%,但是有160篇論文在發表15年后才獲得首次被引,且有部分論文被引次數超過10次,即在發表15年后這部分論文依然完成了知識的首次傳播與有效輸出,這與常規的文獻老化規律并不一致。

圖3 OA緩慢響應論文首次被引與累計被引次數氣泡圖
緩慢響應現象在OA論文中有3個主要特點:占比大、分布散以及沉寂久,如圖3所示。
(1)占比大。緩慢響應論文在OA論文中的占比較大,達34.18%,且緩慢響應論文的被引次數占OA論文總被引次數的10.63%,這一部分緩慢響應論文數量并不可以被忽視。
(2)分布散。從發表后第6年至第22年緩慢響應論文都有分布,每一年都有論文被引用;且有高被引論文也有僅被引1次、2次的論文,緩慢響應的OA論文從時間和被引次數上的分布都較為分散,但是響應早些的論文數量比響應晚些的論文數量多。
(3)沉寂久。在緩慢響應論文中有許多論文沉寂15年、20年后才被引用的,15年后響應的論文有160篇,其中還有46篇在發表20年后才獲得首次被引。這種情況在nOA中較少見,其中原因可能是論文開放獲取,使得文章能在被需要的時候還能及時被找到和下載。
本文選取3篇典型的OA緩慢響應論文進行詳細分析,如圖4所示。論文1為Khuri在2001年發表的“A laplace decomposition algorithm applied to a class of nonlinear differential equations(《應用拉普拉斯分解算法求解一類非線性微分方程》)”,是屬于數學科學領域的一篇論文,該論文提出了使用拉普拉斯分解法有效求解一類非線性微分方程。2006年,論文“Numerical solution of duffing equation by the laplace decomposition algorithm”在研究使用拉普拉斯法求解Duffing方程時引用了論文1,是論文1的首次被引。論文1在發表后的第6年才獲得第1次被引,雖然第1次被引用的速度相對較緩慢,但是截至目前已獲得147次引用,是1篇高被引文章。論文1發表于2001年,在2006年獲得第1次引用,從2010年起,此后兩年的被引數量大幅上升,并且2012—2016年保持每年至少10次的被引次數,在2020年達到引文頂峰,當年被引23次。從整體趨勢來看,該篇論文的被引數量依然有上漲趨勢。雖然緩慢響應的OA論文在發表之后沒有立即獲得引用,但是也可能后勁十足。

圖4 3篇典型OA緩慢響應論文被引情況
Wood在2001年發表的“Adenomyosis: difficult to diagnose, and difficult to treat(《子宮腺肌癥:難以診斷,也難以治療》)”標記為論文2。論文2提出了對于嚴重的子宮腺肌癥的治療方法有子宮內膜子宮肌術消融、腹腔鏡子宮肌術電凝或切除,子宮動脈栓塞是子宮切除術前可嘗試的一種新技術。論文2發表于2001年,在發表后的第10年獲得了首次被引,目前累計被引34次。論文2在開始受到學者注意的前兩年均只被引用1次,2012年首次達到被引頂峰5次,隨后每年均有引用,在2019年、2020年、2021年各被引用3次、2次、1次。該論文在發表之初經歷完全無人問津的10年之后,逐漸開始引起關注,并不斷被學者引用。雖然總計被引次數并不是高被引,但是每年均有引用,在發表20年后依然能為學術界傳播它所承載的知識。可以說開放獲取為這件事提供了可能,否則可能20年后,學者想用這篇文章時,已經無法快速尋找并且免費下載了。
Pescar等發表的“Univalence of certain integral operators(《某類積分算子的單價性》)”標記為論文3,這篇文章總計被引11次,該論文研究了某些積分算子單價性的條件。論文3發表于2000年,在2019年才完成它的首次被引,在許多研究中“沉寂”20年已經足夠使它被當成老化文獻去對待,然而它在首次被引當年共被引用5次,在之后的兩年,每年分別被引用3次,總被引11次,這篇緩慢響應的開放獲取論文已不符合常規的文獻老化趨勢,OA賦予了它不同的生命。紙質本身會老化,但是上面所承載的知識不會老化,而開放獲取給這些知識提供了存儲與供人檢索、免費使用的方式,使得文獻在發表多年之后也有機會能獲得引用,雖然響應速度比較緩慢,但是也提升了部分文獻的利用率,使得其上承載的知識可以打破以往紙質期刊載體的枷鎖,被更多學者看到和傳遞出去。開放獲取或許已經在改變目前期刊的老化規律,值得之后深入研究。
論文的首次響應是它被學者們關注的起點,標志著它所承載的知識開始傳播。本文根據首次響應時間,將論文分為快速響應論文、普通響應論文和緩慢響應論文。結果顯示OA在緩慢響應論文中的占比較大且響應時間分散。對開放獲取的首次響應時間進行細化研究,為開放獲取的引文周期特征與OA優勢的產生原因提供了更具體的分析。
本研究將OA與nOA論文的首次響應時間進行對比。結果發現,nOA論文的響應速度整體較快,nOA論文在發表第5年時已有80%的論文完成首次引用,而OA論文需要在第9年才能達到這一水平。雖然響應速度較緩慢,但是借助OA的優勢使得沉寂多年的論文可以獲得首次被引。首次響應較緩慢的OA論文中存在高被引論文、多次被引論文、沉寂多年被喚醒的論文等多種情況,凸顯了這一現象占比大、分布散和沉寂久的特點,對于OA論文和首次響應的研究具有一定的價值。由于低被引領域以及首次響應與OA的關系這部分還沒有系統地研究,本文僅進行了初步的探索,后續還可以進一步探究。