999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于全文計量的COVID-19論文撤稿后持續被引現象研究

2023-12-10 15:54:41任檐雨楊思洛
知識管理論壇 2023年5期
關鍵詞:分析研究

任檐雨 楊思洛

基金項目:本文系國家社會科學基金后期資助項目“基于全文計量分析的知識交流體系研究”(項目編號:22FTQB003)研究成果之一。

作者簡介:任檐雨,本科生;楊思洛,教授,博士生導師,通信作者,E-mail:58605025@qq.com。

收稿日期:2023-04-04? ? ? ? 發表日期:2023-10-20? ? ? ? 本文責任編輯:劉遠穎

摘要:[目的/意義]新冠(COVID-19)疫情期間,有較多相關主題的論文被撤稿,但通過各權威數據庫或網站檢索發現,這些論文在撤稿后仍被持續引用。本研究旨在從引文內容層面分析其撤稿后的傳播和影響,并就重大公共事件中引證和撤稿機制的優化提出建議,以促進學術交流的良性發展。[方法/過程]首先從WoS、Scopus和PubMed數據庫中獲取COVID-19撤稿論文及其施引文獻全文,并對施引文獻中的引文上下文進行人工抽取;然后通過撤稿標記情況、引用對象、引用位置和引用情感4個維度構成的全文引文分析框架進行人工標注和內容分析。[結果/結論]COVID-19撤稿論文被識別的概率和速度遠超生物醫學領域的其他論文,撤稿機制起到一定的學術凈化作用;但其內容仍在擴散,其中的不可靠和錯誤信息大量傳播。此現象須引起研究者、期刊及數據庫等各方足夠的重視,重大公共事件中的引證和撤稿機制亟待優化。

關鍵詞:COVID-19;撤稿論文;全文引文分析;學術凈化;學術影響

分類號:G251

引用格式:任檐雨, 楊思洛. 基于全文計量的COVID-19論文撤稿后持續被引現象研究[J/OL]. 知識管理論壇, 2023, 8(5): 399-413[引用日期]. http://www.kmf.ac.cn/p/360/.

自新冠(COVID-19)疫情暴發以來,人類社會各方面受到了巨大影響。為了應對突如其來的重大公共衛生事件,加快對該病毒的了解,實現更有效的防控,學術界快速響應。相關研究成果產出速度加快,簡短的報告、觀點和意見等數據類型明顯增多[1];期刊論文出版的周期也大大縮短,據統計,2020年的前6個月,COVID-19主題的論文平均被錄用時間僅為19.3天[2],中位數僅為6天[3]。匆忙的撰寫和發表、不夠充分的同行評審、少數作者“蹭熱點”的主觀傾向,甚至是惡意造假、抄襲、違背科研倫理等學術不端行為導致COVID-19主題的論文在呈指數級增長的同時,撤稿率也居高不下[4] 。然而,從世界各權威數據庫或出版商網站都可以觀察到,這些論文在撤稿后仍然獲得了一定的引用量,部分甚至達到了數百次。

由于生物醫學領域的撤稿論文對人類造成的危害往往更直接、更嚴重,了解其內容的擴散情況也就顯得更為重要和緊迫。而當前對于COVID-19撤稿論文的引文分析極少。本文旨在從全文引文分析的視角,探析COVID-19撤稿論文為研究者所感知的情況,揭示COVID-19撤稿論文在施引文獻中的作用,分析其造成的學術影響及凈化效果,并就重大公共事件中引證和撤稿機制的優化提出建議,以促進學術交流的良性發展。

1? 研究現狀綜述

1.1? COVID-19撤稿論文研究

新冠疫情暴發以來,相關研究成果在快速增長的同時,也出現了驚人的撤稿率,這一現象引起了學者們的關注。當前,相關研究主要包括:①關于頻繁撤稿現象的研究,主要從科研誠信、出版倫理、制度倫理等方面剖析撤稿事件并提出思考和建議[5]。A. J. London等[6]、E. Barroga等[7]將新冠疫情期間大規模的知識生產命名為“研究例外現象”(research exceptionalism),批判大量的研究只使用了較小的樣本量、未經驗證的方法和并不充分的證據,只經過粗略的或根本沒有經過同行評審;P. Soltani、A. Dagliati等[8-10]均基于頻繁撤稿的現狀探討了COVID-19撤稿論文造成的危害以及缺乏質量控制流程的學術亂象,提出了優化同行評審、遵循報告指南、關注數據共享和治理、克服社交媒體上的“信息疫情”等系列建議。②從文獻計量學的角度入手,以 Web of Science(WoS) [11]、Scopus[12]、PubMed[4]、Retraction Watch等數據庫為數據來源,討論COVID-19撤稿論文的特征和撤稿率高的原因。如李國琪[4]基于191篇撤稿論文詳細分析了撤稿原因、主體、時滯、文獻類型及地區分布;L. Schonhaut等[13]將COVID-19論文的撤稿率與疫情中的其他相關主題進行對比,指出其撤稿率超過了4/10 000的基礎水平;N. S. L. Yeo-teh等[14]調查發現COVID-19稿件的接受速度比其他主題快11.5倍,認為這可能是造成撤稿率高的原因之一。也有學者 [15-16]利用Almetrics計量指標分析了COVID-19撤稿論文。

1.2? ?撤稿論文引文分析

早在1990年,M. P. Pfeifer等 [17]就指出,人們對于撤稿文獻的最終科學命運知之甚少,并表明撤稿僅可將引用減少約35%。后續對于撤稿論文的引文分析逐漸豐富起來,引文網絡可視化、引用的影響因素是其中的重要話題。J. Schneider等 [18]通過雙層引文網絡的可視化分析揭示了錯誤信息在引文網絡上繼續傳播的可能性;S. Y. Kim等[19]基于韓國醫學引文索引調查發現,引用在撤稿后1—3年的時間范圍內很常見,并不受撤稿標記可見性的影響;C. R. Madlock-Brown等 [20]探討了自引和期刊影響因子對被引頻次的影響、不同撤稿原因及撤稿主體論文被引趨勢的差異。這些研究主要基于傳統“量”的層面,并沒有考慮到引文的差異性。深入引文內容層面的研究關注最多的是引用情感方面,如姚長青等[5]、楊珠[21]、J. Bar-Ilan等 [22]對一定學科和時間范圍的撤稿論文進行了引文情感判別,袁子晗等 [23]分析了不同引用情感的時序變化特征和軌跡;也有一些關注引文是否提及撤稿,P. E. Van Der Vet等[24] 、D. G. Hamilton等[25]做出了一定的探索。然而,這些分析框架較簡單,分析內容較為局部和片面,有待深入和優化。

1.3? 全文引文分析研究

全文引文分析以施引文獻的全文文本為研究對象,當前研究主要包括:①全文引文分析框架體系的構建,目前已提出引用強度、引用位置、引用情感、引用功能、引用動機及引用對象等多個分析維度。前三個維度的劃分標準大體相似,其他維度的定義則見仁見智。引用功能與引用動機的相關研究較多,石澤順等[26]、崔紅[27]、S. Teufel等[28]都提出了各自的觀點;引用對象的相關研究則較少,通常將其嵌入到引用功能和引用動機之中,如M. A. Garzone[29]在“使用”這一引用動機中提出了5種對象類型;而陸偉等[30]認為這樣的嵌套使標注體系變得龐雜,將引用對象分離出來成為一個單獨的分析維度。②應用全文引文的計量研究。張藝蔓等[31]、劉運梅等[32]、楊思洛等[33]分別研究了知識流動、三角引用和論文影響力評價等問題。張春博等[34]、X. Liu等[35]則將其引入了撤稿論文的引文分析。前者選取自然科學和社會科學領域的造假論文各一篇,構建了包括引用位置、引用情感和引用對象在內的引文分析框架;后者則重點關注心理學領域研究者對于撤稿的感知,重點分析了正確提及論文撤稿的引文片段分布特征,并指出首次提及撤稿后施引文獻的增長速度明顯放緩。

綜上,在全球新冠疫情感染人數已超過6億的背景之下,對于COVID-19撤稿論文的研究眾多,但對其撤稿后持續被引現象的關注卻很少;同時,當前全文引文分析方法的應用并不廣泛,對于撤稿論文引文這一特殊的引文類型沒有揭示出其深層次的語義內涵。本文試圖構建更全面的引文文本分析框架,從內容層面更細粒度地揭示COVID-19論文撤稿后的被引情況。

2? 數據來源和研究方法

對于概念“撤稿后引用”(post-retraction citation),當前學術界有諸多不同的看法:M. P. Pfeifer等[17]將撤稿一年后的施引文獻視為“撤稿后引用”,因為一篇論文從提交到最終出版通常需要12個月及以上;D. G. Hamilton等[25]認為任何提交日期在撤稿日期之后的施引文獻均可視為“撤稿后引用”,而X. Liu等[35]認為,論文發表之后引用與被引用的關系即正式建立,直接根據“出版日期”來定義“撤稿后”更加準確。結合新冠疫情期間的快速出版模式,本文將“撤稿后引用”定義為任何出版日期在撤稿聲明出版日期之后的引用行為。在當今的數字化環境下,數據庫是檢索和獲取期刊論文的主要途徑[36],論文一經在線發布即開始傳播,故在出版日期方面優先選擇“在線出版日期”。

2.1? 數據來源與篩選處理

2.1.1? 撤稿論文檢索及篩選

在WoS、PubMed和Scopus三大數據庫中以“COVID-19”“Novel Coronavirus”“Corona Virus Disease 2019”“SARS-COV-2” “Severe Acute Respiratory Syndrome Coronavirus 2”為檢索詞進行檢索,并在檢索結果中選擇文獻類型為“撤稿出版物”或“撤稿通知”(Retracted Publication或Item Withdrawal或Withdrawn Publication或Retraction或Retraction of Publication),分別得到檢索結果169條、245條和18條(檢索時間:2022年9月17日)。去除三個數據庫的重復文獻和重復撤稿通知后,實際得到撤稿論文209篇。再根據在線發表日期確定論文的出版和撤稿時間,如果日期只精確到“月”,則統一記為該月的1號。

之后,按照以下標準進行人工篩選:? ? ? ? ①以COVID-19為主題且屬于生物醫學領域;②是實證研究或基于實證研究的系統評價或元分析;③存在撤稿后被引用的現象(排除自引);? ? ④在檢索時間之前沒有得到更正或更正后的版本再次被撤回。最終得到符合條件的撤稿論文52篇。按文獻類型來分,有研究性論文48篇、系統評價和元分析4篇;按撤稿原因來分,有數據問題型6篇、錯誤/爭議型21篇、倫理問題型18篇、抄襲型5篇、其他原因型2篇。撤稿原因的具體內涵如表1所示[37]:

2.1.2? 施引文獻獲取及篩選

分別在WoS、Scopus和PubMed數據庫中檢索上述論文撤稿后的施引文獻。除研究性論文和綜述外,系統評價和元分析通過整合大量的臨床研究增加了樣本量、增強了全面性,是生物醫學領域重要的文獻類型。因此,本研究選擇研究性論文、綜述、系統評價和元分析這4類施引文獻作為主要的研究對象。將每篇施引文獻的出版日期與撤稿聲明的發表日期一一比對,剔除撤稿前引用的、無法獲取全文的、注而未引的、三個數據庫中重復的以及其他不符合要求的施引文獻,最終獲取施引文獻全文1 317篇。基于許多施引文獻既是系統評價又是元分析的事實,同時為便于后續分析的需要,本文將敘述性綜述歸為一類,系統評價和元分析歸為一類。經過人工抽取,共得到包含被引文獻的語句1476條,其中898條源自研究性論文,458條源自綜述,120條源自系統評價和元分析。

2.2? 研究方法

2.2.1? 撤稿標記情況

X. Liu等[35]將“撤稿狀態感知”定義為是否在文中提及了撤稿或是否在參考文獻列表中標注了特定論文已撤稿。但是筆者發現,同一篇施引文獻在參考文獻列表處的標注存在隨數據庫的變化而有所不同的現象,代表這一標記可能來自數據庫平臺而并不一定來自施引者本人。故本研究主要關注引文中是否直接指出被引文獻已撤稿或是否有類似含義的表達,以了解施引者對于撤稿的感知情況。具體標準如表2所示:

2.2.2? 引用對象

引用對象指的是撤稿論文被引的具體內容,直接關系到施引文獻對撤稿論文的問題識別情況。綜合陸偉等[30]、張春博等[34]的觀點,結合文本標注實際,構建如下的引用對象分類體系(見表3):

2.2.3? 引用位置

根據一般學術論文的結構劃分[33],標注引文片段在施引文獻中的位置,詳見表4。值得注意的是,由于綜述在章節上的安排比較特殊,故僅對研究性論文、系統評價和元分析中的引文進行位置標注和分析。部分研究性論文如病例報告,可能出于時間緊迫等原因,論文結構不甚嚴謹,將其引用位置標注為“Others”。

2.2.4? 引用情感

情感分析是全文本分析的關鍵內容,改善了傳統引文指標片面單一的缺陷,實現了更加深入準確的論文測度[33]。在撤稿論文的引文內容分析中,引用情感更是可以直觀地反映出作者對于撤稿論文的態度,其分類體系見表5。

基于以上4個維度,筆者構建了完整的全文引文分析框架,根據該框架對前文得到的1 317篇施引文獻中的1 476條引文進行人工標注。標注示例見表6。

3? 結果與分析

3.1? 撤稿標記情況分析

撤稿標記情況在不同施引文獻類型中的分布見表7。在1 317篇施引文獻的1 476次引用中,共有457次標記了被引文獻已撤稿,約占總引用次數的30.96%;其中研究性論文、綜述、系統評價和元分析三類施引文獻中標記被引文獻已撤稿的比例分別為30.62%、31.22%和32.50%,系統評價和元分析最高但總體相差不大。

撤稿論文的撤稿原因不同,其引文中的撤稿標記率則產生了明顯差異,如表8所示。在數據問題型撤稿論文的1 100次被引中,有427次都標記了被引文獻已撤稿,標記率達到了約38.82%的較高水平;而在錯誤/爭議型論文的193次被引中,只有28次標記了撤稿,比例還不到數據問題型的一半;在后三類撤稿論文的引文中,這一比例則更低,倫理問題型約為1.9%,抄襲型和其他原因型均為0。總體來看,撤稿標記率雖然達到了30.96%,但在不同類型的撤稿論文間分布極不均衡。

3.2? 引用對象分析

在457次標記被引文獻已撤稿的引用中,往往沒有特定的引用對象,即使有也大多是為了撤稿事件敘述的完整性;而未標記撤稿的引文則很有可能在不知情的情況下引用撤稿論文的問題部分。故筆者對1 019次未標記撤稿的引文引用對象進行了詳細的統計分析。

如表9所示,由于有2次來自研究性論文和4次來自綜述的引用中包含了兩個引用對象,故1 019次未標記撤稿的引用中共包含了1 025個引用對象。不難發現,撤稿論文的結果結論被引次數最多,在1 025次引用中占到了711次,其中又以核心結果被引最多,達到了632次。研究性論文和綜述中對實驗數據的引用比例均在5%—7%左右,而在系統評價和元分析中這一比例卻高達59.04%,這是因為這類文章需要將大量的研究數據合并計算,撤稿論文實際上在其中充當“數據”角色。對“其他”的引用僅次于結果結論,在總體中的占比約為17.56%;對概念術語和方法工具的引用則比較少,分別只有10次和14次。

結合撤稿原因來看。如圖2所示,對核心結果的引用均占據了最大比例,對中間結果、實驗數據和“其他”的引用數量也十分可觀。數據問題型、錯誤/爭議型、倫理問題型、抄襲型和其他原因型五類撤稿論文的結果分別被引用了500次、99次、58次、15次和39次,實驗數據分別被引用了73次、17次、12次、6次和2次,“其他”分別被引用了101次、43次、27次、3次和6次;對方法工具的引用主要來自其他原因型、錯誤/爭議型和倫理問題型撤稿論文。

3.3? 引用位置和引用情感分析

論文的章節結構在確定引文的功能和重要性程度方面起著關鍵作用。由于綜述沒有統一明確的結構,故僅對研究論文、系統評價和元分析的1 017次引用進行位置分析。由表10可見,引文在施引文獻中主要分布在Introduction和Discussion & Conclusion部分,在1 017次引用中分別占到了452次和385次,其中未標記撤稿的分別為 308次和288次;Results和Data & Methods部分的引用分別有111次和25次,其中未標記撤稿的分別為74次和17次;在所有的引用位置中,只有Others部分已標記撤稿的引文多于未標記的引文。

引用情感分布結果如表11所示,457次已標記撤稿的引用幾乎全部為負面引用,只有極少數施引文獻(6次)即使知道被引文獻已撤稿,仍持中性態度,認為其存在一定的價值和意義;兩次正面引用的對象都是“其他語句”,剩余的449次均持否定和批判態度。1 019次未標記撤稿的引用中,最多的引用情感為中性(787次),這符合我們對學術論文的一般認知,即措辭相對客觀謹慎,較少出現極性情感;其次為正面引用,有210次;負面引用則很少,只有22次。

鑒于不知情狀態下的非負面引用危害最大,對這997次引用的位置和對象進行詳細分析:在787次未標記撤稿的中性引用中,有45次引用了撤稿論文的實驗數據,有559次引用了結果結論,引用位置的分布特征和總體特征相似。在210次未標記撤稿的正面引用中,位于Discussion & Conclusion部分的最多(106次),施引者大多將撤稿論文的結果結論(98次)和實驗數據(7次)與自身研究進行對比以增強論證效果。Results部分次之,共計58次,其中43次來自系統評價和元分析,用于確定將撤稿論文的實驗數據納入合并計算;在這43次中,有33次都引自數據問題型和錯誤/爭議型撤稿論文,1篇施引文獻還同時納入了2篇撤稿論文,分別為錯誤/爭議型和抄襲型。分布在Data & Methods部分的次數較少,但對施引文獻產生的影響較大,有11篇研究性論文將撤稿論文的實驗數據和結果結論作為方法設計的重要支撐,有1篇系統評價和元分析論文于此位置同時納入了兩篇撤稿論文;Introduction部分的次數也較少,共計17次,大多對撤稿論文的核心結果進行肯定并作為引入自身研究話題的理論背景。

3.4? 引文的時間分布

引用行為發生在COVID-19論文撤稿后多久反映出研究者對撤稿的關注度、敏感度和反應的及時性,也可以看出論文撤稿后在引用鏈中存活的時間及其變化趨勢。由于施引文獻的具體引用時間無從知曉,本研究以出版時間代表引用時間,對施引文獻出版日期和撤稿聲明出版日期之間的差值,即撤稿后的引用時間窗口進行了統計,結果如圖3所示:

由圖3可見,已標記撤稿的引用在撤稿初期的前4個月內顯示出較快的增長,至第四個月時已積累了127次。這其中間隔時間最短的來自于一篇綜述,該文詳細報道了Hydroxychloroquine and Covid-19: a cellular and molecular biology based update一文的撤稿原因和經過,此時距這篇論文撤稿僅過去了5天。但是隨著時間的推移,這類引用并沒有繼續增長,而是呈現出了下降趨勢。

未標記撤稿的引用大多發生在COVID-19論文撤稿后的兩個月內,第一個月和第二個月內分別有114次和98次。鑒于COVID-19論文的出版周期平均在兩個月左右[38],可以判斷其中有部分是在撤稿前對其進行了引用而在撤稿后才得以發表。總體而言,未標記撤稿的引用次數隨著時間的推移而逐漸減少;但很顯然,截至本研究開展之際,對撤稿論文的正常引用從未停止。有一篇文章在“數據問題型”撤稿論文Cardiovascular disease, drug therapy, and mortality in Covid-19撤稿后26個月仍對其結果進行了正面引用,指出“Our results are consistent with other studies......”;撤稿后第27個月的一次引用也是對“數據問題型”論文實驗結果的中性引用,并沒有表達任何懷疑或否定。并且,從已標記撤稿與未標記撤稿的引文數量對比來看,前者一直明顯低于后者,只有個別月份稍微持平或略有超過。

4? 討論

從撤稿標記情況來看,在1 476次引用中,共計457次標記了被引文獻已撤稿,比例為30.96%,即有約三成的論文明確顯示了對撤稿的意識;而其他生物醫學領域的撤稿論文研究得到的撤稿標記率一般在5%左右[18,39],可見在全球疫情大流行的背景下,COVID-19論文備受關注,其撤稿事件被知曉和報道的概率也相對較高。當然,也不能忽視剩余近70%的引用均未標記撤稿和標記率在不同類型撤稿論文間分布極不均衡的事實,錯誤/爭議型這類有明顯重大缺陷的撤稿論文標記率不到2%,倫理問題型、抄襲型和其他原因型的撤稿論文更是幾乎無人標記;綜述、系統評價和元分析作為基于已有研究的二次研究,標記率也只是略高于研究性論文,大多數研究仍對參考文獻的最新狀態并不敏感。

已標記撤稿的引文通常不引用明確的對象,即使引用也是為了撤稿事件敘述的完整性,未標記的則不然。由表9可見,后者最主要的引用對象為結果結論,尤其是核心結果。在1 019次未標記撤稿的引用中,對核心結果的引用就達到了632次。這與張春博等[34]認為只有極少數文獻表達對撤稿論文核心結果的支持不同,也讓撤稿論文造成的危害加劇。其可能的原因是,施引者為了追求研究速度,并未閱讀撤稿論文全文而是直接引用了其結論。結合撤稿原因來看,對撤稿論文數據、結果和方法工具的835次引用中有693次都引自數據問題型和錯誤/爭議型論文,其中誤導性信息的傳播范圍之廣可見一斑。此外,對“其他”的引用也有180次。該引用對象在本研究的定義中包含“對文章內容的粗略引用”,如僅籠統地敘述“previous publications have reported retinal findings in COVID19 patients”。這類引用通常與施引文獻本身的研究沒有直接關系,但反映出作者仍將撤稿論文視為正常論文,并有可能推動撤稿論文的進一步擴散。

不同位置的引文在施引文獻中起著不同的作用:Introduction部分的引文用于為新研究奠定基礎;Data & Methods部分的引文用于支持方法設計;Results、Discussion& Conclusion部分的引文則用于對比結果結論、增強論證效果或突出自身研究的獨特價值[40]。一般來說,后三者與施引文獻內容的相關性更大,重要性程度也更高[41]。通過與其他非撤稿論文的對比發現,COVID-19撤稿論文在施引文獻中的位置分布特征同他們基本一致[42,43],代表撤稿論文大多是出于與正常論文相似的目的而被引用[44]。盡管Introduction部分的引文略多(452次),但Discussion & Conclusion、Results和Data & Methods部分也分別達到了385次、111次和22次,這些引文超七成都沒有標記撤稿,可以推測在施引文獻中承擔了較為重要的角色。

從引用情感來看,雖然總的負面引用次數達到了471次,但其中449次來自于已標記撤稿的引文;在1 019次未標記的引用中,對其表示懷疑或指出其存在爭議的負面引用僅有22次,可見在不知情的情況下,大家對于撤稿論文的態度仍以承認甚至肯定為主。997次未標記撤稿的非負面引用基本都引用了撤稿論文的實驗數據和結果結論,且大部分引自數據問題型和錯誤/爭議型論文。其中210次未標記的正面引用有半數以上都位于Discussion & Conclusion 部分,Results和Data & Methods 部分也達到了70次,后者對施引文獻的影響尤甚。

從引文的時間分布來看。一方面,已標記撤稿的引用在撤稿初期就出現了較快增長,有近20次發生在撤稿后僅一個月內,最早的一次出現于撤稿后5天,這一速度遠超其他論文[35];未標記撤稿的引用次數總體上也隨時間呈現出明顯的下降趨勢,可見撤稿機制確實起到了一定的學術凈化作用。但另一方面,對COVID-19撤稿論文的正常引用從未停止。截至本文統計時間點,最長的一篇已經在撤稿后被持續引用了27個月之久,盡管這是一篇臭名昭著的從《柳葉刀》上撤稿的論文;雖然撤稿標記率有緩慢的波動上升,但大部分時候都處于較低水平;部分來源于撤稿前的引用對施引者而言也許是情有可原的,但其造成的危害卻是客觀的,尤其當這類引用以正面情感居多時。

5? 研究結論與建議

5.1? 研究結論

通過撤稿標記情況、引用對象、引用位置和引用情感4個維度以及引文的時間分布,本研究從引文內容層面對COVID-19論文撤稿后的傳播和影響進行了全面的分析,總結出以下三點結論:

(1)COVID-19撤稿論文被識別的概率和速度明顯高于生物醫學領域的其他論文,撤稿機制確實起到了一定的學術凈化效果。在全球疫情背景下,COVID-19成為了當仁不讓的研究熱點,相關知識流動的速度加快,受到的關注度更高,其撤稿被發現的概率和速度也更高;且隨著撤稿后時間的推移,引文數量出現了明顯的下降,可見撤稿作為學術界的自我糾錯機制確實對阻斷傳播產生了一定的影響。

(2)COVID-19撤稿論文內容持續擴散造成了一定的危害,不可靠和錯誤信息正大量傳播。本研究納入的52篇論文在撤稿后共被引用1 476次,篇均被引28.38次,而近70%的引文沒有標記撤稿,其中近九成引自數據問題型和錯誤/爭議型撤稿論文;引用對象呈現出以核心結果為主的特征,作者不僅很少對撤稿論文提出質疑,還大多賦予其重要的地位和角色。這些結果意味著撤稿論文仍以正常論文的方式大量傳播,誤導著科研人員、衛生決策和社會認知。

(3)COVID-19撤稿論文影響深遠,撤稿為研究者普遍知曉需要經過漫長的時間。盡管COVID-19撤稿論文的凈化效果已經優于其他撤稿論文,但這只是暴露出了科學自我糾錯機制一直以來的窘境,并不代表其凈化效果絕對的良好。在未標記撤稿的引文中,有約半數發生在撤稿半年至一年內,有約四分之一發生在撤稿一年后;截至研究開展之際,撤稿論文被引的最長周期已經達到了兩年零三個月且還未終止,而自疫情暴發至今也僅有三年。也就是說,可能在整個疫情期間都無法消除某些撤稿論文的負面影響,盡管這在公共衛生事件中非常重要。

由此觀之,COVID-19論文撤稿后持續被引現象須引起學術界的重視。

5.2? 思考與建議

新冠疫情暴發以來,學術界的快速出版模式為抗擊疫情做出了應有的貢獻,也留下了不可避免的“后遺癥”。筆者就該事件及此類重大公共事件中的引證和撤稿機制提出以下建議,以期促進學術交流的良性發展:

(1)科研人員是引用和傳播撤稿論文的主體,阻斷撤稿論文的內容擴散首先要從科研人員這一源頭抓起。①科研人員應該認識到,COVID-19及其他“熱點”論文的快速出版和大量發表是以犧牲其他主題的論文為代價的,要樹立起高度的社會責任感,摒棄“蹭熱點”的錯誤心態,為自己的研究成果及引用的參考文獻負責。②在新冠疫情這樣的重大公共衛生事件中,論文的撤稿率遠高于平常[14],尤其是在事件暴發的初期,信息往往瞬息萬變,極不穩定,科研人員應該時刻保持警惕,及時跟進最新的調查結果,謹慎使用存在爭議的尤其是發布了“expression of concern”(關注聲明)的文章。③科研人員應該規范引用行為,避免不閱讀原文而直接轉引、使用本地文件而不檢索其最新狀態等不良習慣,善于使用CrossMark、Retraction Watch等輔助工具了解論文的“前世今生”;如果認為某些對撤稿論文的引用無法避免且確有必要,應在文中注明已撤稿或在附錄中注明引用原因。④科研人員應恪守學術道德,在撰寫和提交論文之前反復檢查參考文獻尤其是與自身研究高度相關的文獻;如果發現與自身研究有直接關系的論文撤稿,應主動聯系期刊編輯進行修改,減輕其回溯篩查的負擔。

(2)作為學術質量的把關者和過濾器[45],期刊應在出版速度和科學嚴謹性之間努力尋找一個最佳平衡點。首先,發生撤稿的期刊應盡力提高讀者對于撤稿的知情率。一方面,應在全平臺發布撤稿通知,確保所有出版文獻的地方都加注了“retracted”(撤稿);另一方面,鼓勵設置“更正”“論文撤銷”專欄[46],對存在問題的論文進行披露和公示。有關研究表明,有1/3的COVID-19撤稿論文是由同一組作者撰寫的[12]。在本研究的34篇撤稿論文中,有4篇分別來自于兩位相同的作者,還有2篇來源于同一機構、同一團隊,然而施引者對于同根同源的撤稿論文反應卻可能大不相同,故期刊應對連環撤稿事件做出特別標記,如在撤稿聲明之間建立交互鏈接或將一系列撤稿論文放在同一篇聲明之中。其次,期刊應仔細檢查論文的參考文獻,做好出版前的最后一輪把關。如果某篇施引文獻正處于審稿或預出版階段,需要求作者明確地解釋引用的目的和動機,如無引用必要應將其徹底刪除[47];對于建立在撤稿論文基礎上或對其表達強烈認同和支持的研究,應高度重視并核實其真實性、有效性;某些負面引用可以接受,但須明確標記“已撤稿”,并鼓勵引用撤稿聲明作為直接引用撤稿論文的替代方法[47]。同時,應制定具體的引用規范,要求作者在提交稿件時證明他們已經檢查過了參考文獻[48]。最后,對于已經發表的施引文獻,期刊應進行全面徹底的回溯和調查。在本研究納入的52篇COVID-19撤稿論文的所有施引文獻中,只有一篇文章[49]因為引用了撤稿論文而被撤稿,其他施引文獻均沒有受到任何的處理。對此,期刊編輯應第一時間聯系施引文獻作者,要求其盡快更正或撤回,盡量將撤稿論文的不良影響控制在最小范圍內[21]。

(3)文獻數據庫是當今數字化環境下檢索和獲取論文的主要途徑,對撤稿論文的后續傳播有很大影響。例如撤稿論文Effectiveness of surgical and cotton masks in blocking SARS-CoV-2: a controlled comparison in 4 patients于2020年4月6日發表在影響因子51.598的期刊Annals of Internal Medicine上,不到兩個月后因存在錯誤而被撤稿,但截至本研究開展之際,WoS數據庫仍未收錄其撤稿聲明并將其類型更改為“retracted publication”,收錄的PDF也沒有“retracted”水印,該文僅在WoS中就被引用了103次。對此,管理和運營團隊應該認識到自己的責任,了解撤稿論文對科學可靠性的危害,與期刊及出版商通力合作,及時更新論文撤稿狀態、收錄論文撤稿聲明并建立醒目的鏈接和標記,以最快的速度將撤稿信息提供給研究者。

當然,以上提到的部分措施需要耗費巨大的時間和精力——某些撤稿論文的被引次數達上百次之多,一些投稿論文的參考文獻數量也十分龐大,如果要求期刊編輯逐篇核查將是一個驚人的工程。在重大公共事件要求的快速出版模式之下,這樣精細的篩查更是困難重重,因此,最好的解決方案還是盡快開發出能夠自動檢測引文的工具和能夠自動追蹤撤稿論文擴散路徑的系統。

本文的貢獻主要在于:有利于警示學術界重視起COVID-19撤稿論文的后續處理,為該事件及此類重大公共事件中引證和撤稿機制的優化提供一定的建議;構建了較為全面的適用于撤稿論文的全文引文分析框架。局限性主要在于:僅綜合了三個數據庫中的COVID-19撤稿論文及其施引文獻而沒有關注其他的數據庫和預印本平臺;沒有對撤稿前發表的100余篇施引文獻進行統計分析等。

參考文獻:

[1] GIANOLA S, JESUS T S, BARGERI S, et al. Characteristics of academic publications, preprints, and registered clinical trials on the COVID-19 pandemic[J]. PloS one, 2020, 15(10): e0240123

[2] AVIV-REUVEN S, ROSENFELD A. Publication patterns changes due to the COVID-19 pandemic: a longitudinal and short-term scientometric analysis[J]. Scientometrics, 2021, 126(8): 6761-6784.

[3] PALAYEW A, NORGAARD O, SAFREED-HARMON K, et al. Pandemic publishing poses a new COVID-19 challenge[J]. Nature human behaviour, 2020, 4(7): 666-669.

[4] 李國琪. 基于COVID-19論文撤稿特征探析期刊應對突發公共衛生事件的策略[J]. 天津科技, 2022, 49(5): 90-95. (LI G Q. Analysis of reporting strategies of journals during public health emergencies based on characteristics of retracted COVID-19 papers[J]. Tianjin science & technology, 2022, 49(5): 90-95.)

[5] 姚長青, 田瑞強, 楊冬雨, 等. 撤銷論文及其學術影響研究[J]. 中國科技期刊研究, 2014, 25(5): 595-604. (YAO C Q, TIAN R Q, YANG D Y, et al. Research of retracted paper and its academic impact[J]. Chinese journal of scientific and technical periodicals, 2014, 25(5): 595-604.)

[6] LONDON A J, KIMMELMAN J. Against pandemic research exceptionalism[J]. Science, 2020, 368(6490): 476-477.

[7] BARROGA E, MATANGUIHAN G J. Fundamental shifts in research, ethics and peer review in the era of the COVID-19 pandemic[J]. Journal of Korean medical science, 2020, 35(45): e395

[8] SOLTANI P, PATINI R. Retracted COVID-19 articles: a side-effect of the hot race to publication[J]. Scientometrics, 2020, 125(1): 819-822.

[9] DAGLIATI A, MALOVINI A, TIBOLLO V, et al. Health informatics and EHR to support clinical research in the COVID-19 pandemic: an overview[J]. Briefings in bioinformatics, 2021, 22(2): 812-822.

[10] MHEIDLY N, FARES J. Leveraging media and health communication strategies to overcome the COVID-19 infodemic[J]. Journal of public health policy, 2020, 41(4): 410-420.

[11] TEIXEIRA DA SILVA J A, TSIGARIS P, ERFANMANESH M. Publishing volumes in major databases related to Covid-19[J]. Scientometrics, 2021, 126(1): 831-842.

[12] FRAMPTON G, WOODS L, SCOTT D A. Inconsistent and incomplete retraction of published research: a cross-sectional study on Covid-19 retractions and recommendations to mitigate risks for research, policy and practice[J]. PloS one, 2021, 16(10): e0258935.

[13] SCHONHANT L, COSTA-ROLDAN I, OPPENHEIMER I, et al. Scientific publication speed and retractions of COVID-19 pandemic original articles[J]. Pan American journal of public health , 2022, 46: e25.

[14] YEO-TEH N S L, TANG B L. An alarming retraction rate for scientific publications on Coronavirus Disease 2019 (COVID-19)[J]. Accountability in research, 2021, 28(1): 47-53.

[15] SHAMSI A, LUND B D, SEYYEDHOSSEINI S. Sharing of retracted COVID-19 articles: an altmetric study[J]. Journal of the Medical Library Association, 2022, 110(1): 97.

[16] HAUNSCHILD R, BORNMANN L. Can tweets be used to detect problems early with scientific papers? A case study of three retracted COVID-19/SARS-CoV-2 papers[J]. Scientometrics, 2021, 126(6): 5181-5199

[17] PFEIFER M P, SNODGRASS G L. The continued use of retracted, invalid scientific literature[J]. Jama, 1990, 263(10): 1420-1423.

[18] SCHNEIDER J, YE D, HILL A M, et al. Continued post-retraction citation of a fraudulent clinical trial report, 11 years after it was retracted for falsifying data[J]. Scientometrics, 2020, 125(3): 2877-2913.

[19] KIM S Y, YI H J, CHO H M, et al. How many retracted articles indexed in KoreaMed were cited 1 year after retraction notification[J]. Science editing, 2019, 6(2): 122-127.

[20] MADLOCK-BROWN C R, EICHMANN D. The (lack of) impact of retraction on citation networks[J]. Science and engineering ethics, 2015, 21(1): 127-137.

[21] 楊珠. 造假論文被引分析——以國家自然科學基金委員會查處的造假論文為例[J]. 編輯學報, 2022, 34(3): 291-294. (YANG Z. Citation analysis of Chinese falsified papers from the perspective of citation content analysis: taking the falsified paper investigated by the National Natural Science Foundation of China as an example[J]. Acta editologica, 2022, 34(3): 291-294.)

[22] BAR-ILAN J, HALEVI G. Post retraction citations in context: a case study[J]. Scientometrics, 2017, 113(1): 547-565.

[23] 袁子晗, 張紅偉. 學術不端撤銷論文施引文獻引用態度分析——以哈佛大學心臟干細胞撤稿事件為例[J]. 中國科技期刊研究, 2021, 32(4): 465-473. (YUAN Z H, ZHANG H W. Citation attitudes of articles to papers retracted due to academic misconducts: taking the retracted papers of cardiac stem cell from Harvard University as an example[J]. Chinese journal of scientific and technical periodicals, 2021, 32(4): 465-473.)

[24] VAN DER VET P E, NIJVEEN H. Propagation of errors in citation networks: a study involving the entire citation network of a widely cited paper published in, and later retracted from, the journal Nature[J]. Research integrity and peer review, 2016, 1(1): 1-10.

[25] HAMILTON D G. Continued citation of retracted radiation oncology literature—Do we have a problem?[J]. International journal of radiation oncology biology physics, 2019, 103(5): 1036-1042.

[26] 石澤順, 肖明. 基于本體和關聯數據的全文引文分析方法研究[J]. 圖書館雜志, 2021, 40(4): 100-108. (SHI Z S, XIAO M. Research on full-text citation analysis method based on ontology and linked data[J]. Library journal, 2021, 40(4): 100-108.)

[27] 崔紅. 我國科技人員引文動機聚類分析[J]. 情報雜志, 1998(2): 68-70. (CUI H. Clustering analysis of citation motivation of Chinese science and technology personnel[J]. Journal of information, 1998(2): 68-70.)

[28] TEUFEL S, SIDDHARTHAN A, TIDHAR D. Automatic classification of citation function[C]//Proceedings of the 2006 conference on empirical methods in natural language processing. Sydney: Association for Computational Linguistics, 2006: 103-110.

[29] GARZONE M A. Automated classification of citations using linguistic semantic grammars[D]. Canada: The University of Western Ontario, 1997.

[30] 陸偉, 孟睿, 劉興幫. 面向引用關系的引文內容標注框架研究[J]. 中國圖書館學報, 2014, 40(6): 93-104. (LU W, MENG R, LIU X B. A deep scientific literature mining-oriented framework for citation content annotation[J]. Journal of library science in China, 2014, 40(6): 93-104.)

[31] 張藝蔓, 馬秀峰, 程結晶. 融合引文內容和全文本引文分析的知識流動研究[J]. 情報雜志, 2015, 34(11): 50-54, 49. (ZHANG Y M, MA X F, CHENG J J. Research of knowledge flows based on citation content analysis[J]. Journal of intelligence, 2015, 34(11): 50-54, 49.)

[32] 劉運梅, 馬費成.面向全文本內容分析的文獻三角引用現象研究[J]. 中國圖書館學報, 2021, 47(3): 84-99. (LIU Y M, MA F C. Research on the phenomenon of literature triangular citation facing full text content analysis[J]. Journal of library science in China, 2021, 47(3): 84-99.)

[33] 楊思洛, 聶穎. 結合全文本分析的論文影響力評價模型研究[J]. 現代情報, 2022, 42(3): 133-146. (YANG S L, NIE Y. Research on evaluation model of papers influence combined with full-text analysis[J]. Journal of modern information, 2022, 42(3): 133-146.)

[34] 張春博, 丁堃, 王賢文, 等. 全文引文分析視角下的造假論文學術影響研究[J]. 科學學研究, 2021, 39(4): 577-586. (ZHANG C B, DING K, WANG X W, et, al. Research on the impact of fraudulent paper to the academia from the view of citation analysis in full-text--case study of two highly cited retracted publications [J]. Studies in science of science, 2021, 39(4): 577-586.)

[35] LIU X, WANG C, CHEN D Z, et al. Exploring perception of retraction based on mentioned status in post-retraction citations[J]. Journal of informetrics, 2022, 16(3): 101304.

[36] 曾建勛.我國學術期刊數據庫的轉型發展路徑思考[J]. 編輯學報, 2022, 34(3): 262-266. (ZENG J X. Thoughts on transformation and development path of Chinas academic journal database[J]. Acta editologica, 2022, 34(2): 262-266)

[37] 吳任力, 鄧支青, 吳淑倩.多維視域下開放獲取期刊撤稿原因分析——基于Retraction Watch Database數據[J]. 中國科技期刊研究, 2020, 31(3): 346-355. (WU R L, DENG Z Q, WU S Q. Analysis of the reasons for retraction of open access journals from multi-dimensional view: based on the data from Retraction Watch Database[J]. Chinese journal of scientific and technical periodicals, 2020, 31(3): 346-355.)

[38] HORBACH S P J M. Pandemic publishing: medical journals strongly speed up their publication process for COVID-19[J]. Quantitative science studies, 2020, 1(3): 1056-1067.

[39] BUDD J M, COBLE Z, ABRITIS A. An investigation of retracted articles in the biomedical literature[J]. Proceedings of the Association for Information Science and Technology, 2016, 53(1): 1-9.

[40] 尹莉, 鄧紅梅.自引的新評價——引用極性、引用位置和引用密度的視角[J]. 情報雜志, 2019, 38(9): 180-184, 179. (YIN L, DENG H M. New evaluation of self-citation: from the perspectives of reference polarity,reference position and reference density[J]. Journal of intelligence, 2019, 38(9): 180-184, 179.)

[41] SOMBATSOMPOP N, KOSITCHAIYONG A, MARKPIN T, et al. Scientific evaluations of citation quality of international research articles in the SCI database: Thailand case study[J]. Scientometrics, 2006, 66(3): 521-535.

[42] 吳寧, 王傳清, 黃國彬. 基于被引位置的數據論文價值分析——以數據期刊Scientific Data為例[J]. 圖書情報研究, 2022, 15(2): 41-49. (WU N, WANG C Q, HUANG G B. Value analysis of data papers based on cited location: taking scientific data as an example[J]. Library and information studies, 2022, 15(2): 41-49.)

[43] HU Z, CHEN C, LIU Z. Where are citations located in the body of scientific articles? a study of the distributions of citation locations[J]. Journal of informetrics, 2013, 7(4): 887-896.

[44] HSIAO T K, SCHNEIDER J. Continued use of retracted papers: temporal trends in citations and (lack of) awareness of retractions shown in citation contexts in biomedicine[J]. Quantitative science studies, 2022, 2(4): 1144-1169.

[45] 劉晶晶. 國外開放獲取期刊的同行評議方式研究[J]. 編輯學報, 2017, 29(2): 200-203. (LIU J J. Study of peer review modes of abroad open access journals[J]. Acta editologica, 2017, 29(2): 200-203.)

[46] 朱大明. 關于科技學術期刊論文更正和撤銷的討論[J]. 編輯學報, 2013, 25(5): 484-485. (ZHU D M. Erratum and revocation of papers in sci-tech academic journals[J]. Acta editologica, 2013, 25(5): 484-485.)

[47] 王麗麗. 撤銷論文被引用的原因探析及防范措施[J]. 出版發行研究, 2018(8): 74-76, 64. (WANG L L. Analysis on the reasons for citations of retracted papers and preventive measures [J]. Publishing research, 2018(8): 74-76, 64.)

[48] 劉燊, 徐飛. NSC雜志撤稿論文引用異常增加現象辨析與治理建議[J]. 中國科技期刊研究, 2022, 33(5): 545-553. (LIU S, XU F. Analysis of the abnormal increase in cited frequency of retracted papers in NSC and suggestions for governance[J]. Chinese journal of scientific and technical periodicals, 2022, 33(5): 545-553.)

[49] HILL A, GARRATT A, LEVI J, et al. Retracted: meta-analysis of randomized trials of ivermectin to treat SARS-CoV-2 infection[J]. Open forum infectious diseases, 2021, 8(11): ofab358.

作者貢獻說明:

任檐雨:進行研究選題與設計,收集與分析數據,撰寫論文;

楊思洛:提出研究方向,指導與修訂論文。

Research on Post-retraction Citations of COVID-19? Articles Based on Full-text Citation

Ren Yanyu1? ?Yang Siluo1,2

1School of Information Management, Wuhan University, Wuhan 430072

2China Research Center for Science Evaluation, Wuhan University, Wuhan 430072

Abstract: [Purpose/Significance] During the COVID-19 pandemic, many papers on this topic were withdrawn. But it was found through authoritative databases or websites that these papers have been cited even after the retraction. This study aims to analyze the dissemination and impact of retraction at the level of citation content, and to put forward suggestions on the optimization of citation and retraction mechanisms in major public events, in order to promote the healthy development of academic exchanges. [Method/Process] Firstly, the full text of COVID-19 retraction papers and citation references were obtained from WOS, Scopus, and PubMed databases, and the citation context in the citation references was manually extracted. Then, manual annotation and content analysis were carried out through the full-text citation analysis framework consisting of four dimensions: retraction mark situation, citation object, citation position, and citation emotion. [Result/Conclusion] The probability and speed of recognition of COVID-19 retracted papers are much higher than other papers in the biomedical field, and the retracted mechanism plays a certain role in academic purification. But its content continues to spread, with unreliability and misinformation spreading widely. This phenomenon should be paid enough attention by researchers, journals and databases, and the mechanism of citation and retraction in important public events should be optimized urgently.

Keywords: COVID-19? ? retracted papers? ? full-text citation analysis? ? academic purification? ? academic impact

猜你喜歡
分析研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
新版C-NCAP側面碰撞假人損傷研究
電力系統及其自動化發展趨勢分析
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 99精品国产自在现线观看| 亚洲AⅤ波多系列中文字幕| 一区二区影院| 国产性猛交XXXX免费看| 免费毛片视频| 成人福利免费在线观看| 国产午夜无码片在线观看网站| 国产毛片网站| 丁香五月婷婷激情基地| 久久久久青草大香线综合精品| 国产在线精彩视频二区| 国产在线欧美| 久久精品视频一| 五月婷婷导航| 久草中文网| 欧美在线一二区| 亚洲va视频| 亚洲精品第一页不卡| 色精品视频| 99er精品视频| 秋霞午夜国产精品成人片| 女人18毛片一级毛片在线| 国产欧美成人不卡视频| 中文字幕资源站| 久久精品aⅴ无码中文字幕 | 精品福利网| 中文字幕久久亚洲一区| 国产高清精品在线91| 欧美激情视频二区| 亚洲中文字幕无码爆乳| 国产成人AV综合久久| 亚洲成年人片| 久久精品这里只有国产中文精品 | 色婷婷啪啪| 国产91熟女高潮一区二区| 久久6免费视频| 美女一级毛片无遮挡内谢| 992tv国产人成在线观看| 91福利在线看| 亚洲男人在线天堂| 亚洲va欧美ⅴa国产va影院| 手机在线国产精品| 一级黄色网站在线免费看| 麻豆国产在线不卡一区二区| 野花国产精品入口| 国产精品99r8在线观看| 国产在线视频福利资源站| 99热亚洲精品6码| 乱人伦中文视频在线观看免费| 九色91在线视频| 日韩精品毛片| 91精品亚洲| 国产一级视频在线观看网站| 手机成人午夜在线视频| 久久夜色撩人精品国产| 国产日本欧美在线观看| 成人免费午间影院在线观看| 中文字幕无线码一区| 国产女主播一区| 精品无码专区亚洲| 国产一区二区精品高清在线观看| 高潮爽到爆的喷水女主播视频 | 亚洲综合色区在线播放2019 | 午夜在线不卡| 亚洲精品欧美日本中文字幕| 91精品国产综合久久香蕉922| 亚洲人成网站日本片| 美女被躁出白浆视频播放| 日韩欧美国产中文| 国产成人久视频免费| 午夜视频www| 色婷婷色丁香| 又黄又湿又爽的视频| 国产久操视频| 欧美一级高清片欧美国产欧美| 国产欧美日韩在线在线不卡视频| 国产色偷丝袜婷婷无码麻豆制服| 久久久久久久蜜桃| 欧美在线视频不卡第一页| 亚洲国产精品一区二区第一页免| 亚洲欧美自拍视频| 欧美成人午夜视频|