999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中國撤回論文的分布、原因與影響(2012-2018)

2021-12-09 08:47:38張約翰
圖書館論壇 2021年11期
關鍵詞:數據庫研究

張約翰

1 背景

撤稿通常在學術不端或錯誤損害研究的有效性、可靠性或完整性時發生,被撤回文章的數據、結論或方法不應繼續被其他學者引用[1]。撤稿可幫助研究者識別存在問題的論文,節省科研試錯成本。每年被撤回文章的數量呈增加趨勢,對出版商和研究者提出了巨大挑戰,引起學術界的極大關注[2-3]。2013-2015年在Retraction Watch數據庫中記錄的撤回文章源自15個國家,包括科研強國美、德、英、法。但僅考慮撤稿總量不夠,還應考慮各個國家出版文章的總量[4]。若根據Scimago提供的2013-2015年各國文章總量對撤稿量進行加權,大多數科研強國并不是撤稿的主要貢獻源[5]。

撤稿的原因包括錯誤、欺詐、政治或道德問題、違反出版道德規范等[5-6]。大部分撤稿是由于包括抄襲和重復在內的學術不端行為[4,7]。有關中國學術不端行為和撤稿問題的輿論事件表明我們社會比以往更加關注這一領域。由中國學者撰寫的學術出版物數量有所增加,被撤回的出版物數量也有所增加[7-13]。從2011-2017年3月15日發表的文獻看,中國學術不端行為比率(撤稿量與發表文章總量之比)排名第一[10]。盡管Scimago上記錄的中國文獻總量很龐大,從2011年395,431篇增加到2017年534,879篇,這仍然是一個可怕的結論。中國作者大量撤稿引起全球關注,來自中國的研究成果開始被很多人質疑[14-15]。

國內學者對中國作者撤稿的研究有相當一部分聚焦于醫學領域。卜今根據PubMed數據庫收錄的中國作者撤稿聲明,描述了中國作者在生物醫學領域科技文獻的失敗情況以及出版不倫理行為[16];付曉霞等、郝秀原等、彭妍捷等從原因和對策兩方面對2015年3月BioMedical Central大規模撤稿在內的多次撤稿事件進行反思[17-19];包靖玲等基于Scopus數據庫調查2015-2017年醫學領域國際期刊的撤稿聲明,發現撤稿文章數量最多的為中國[20]。對中文學術期刊撤稿的研究也有一定成果。張晴等基于CNKI數據庫回溯92篇撤銷論文,指出學術不端引起的撤稿占67.4%,主要分布于醫藥衛生、工業技術和自然科學領域[21];丁媛媛根據中文科技期刊數據庫、中國知網、中國數字圖書館、萬方數據、中國醫藥數字化期刊群和中華醫學會數字化期刊數據庫等分析國內學術期刊刊登撤稿聲明,董敏則依據萬方和中國知網數據庫對2013-2018年的中文科技論文進行統計描述,周志新基于中國知網數據庫對中文科技期刊被撤銷論文進行特征分析[22-24]。朱大明、張新慶、游蘇寧、胡金富、葉方寅等通過定性經驗對重大撤稿事件和撤稿現象發表討論[25-29];范姝婕等對中國作者科學引文索引擴展版(SCI-E)收錄論文的撤稿情況進行文獻計量學分析[30]。綜上所述,國內學者采用文獻計量學方法對撤稿的研究相對聚焦于醫學領域,關于中文學術期刊撤稿的研究較多;相當部分與撤稿有關的論文并非基于計量數據而是基于定性經驗的;存在一些采用文獻計量學方法對英文期刊撤稿情況的研究,但聚焦于中國作者在英文期刊撤稿的研究較少,缺乏系統的概述。因此,本文基于Retraction Watch網站數據庫(http://retractiondatabase.org/RetractionSearch.aspx),采用文獻計量法對2012-2018年間與中國有關聯的撤回論文進行分析。

Retraction Watch(RW)成立于2010年8月,是一個跟蹤撤稿事件、旨在幫助公眾關注科學不端行為及其糾正過程的在線數據庫,包含1.8萬多篇可以追溯到1970年代的撤銷論文或摘要[31-33]。RW涵蓋面廣、規模大,可以看作是記錄英文撤稿的最流行和最有用的來源之一。雖然撤稿是防范學術不端的重要方法,我國還沒有專業的反學術不端網站,構建已發表論文跟蹤系統、發揮讀者監督作用十分必要[34]。本文采用Retraction Watch數據庫作為數據源,一方面可以基于其規模和涵蓋面保證數據選取科學性,對中國作者在國際期刊上的撤稿情況做準確系統的揭示,一方面也期待更多基于RW這類專業撤稿記錄平臺的研究可以提高國內學界對專業反學術不端網站的重視,鼓勵構建專業的網站或平臺,打破國內外撤稿記錄的信息差,促進形成健康的學術生態。

2 數據和方法

本文將RW中記錄的2012-2018年撤回文章作為原始數據。2017年Retraction Watch管理員宣布:“我們的個人電子郵件提示有14,000個訂閱者,日常電子郵件有1,000個訂閱者。”(http://retractionw atch.com/2017/08/03/happy-birthday-retraction-watch-7-update-database/)該網站是“世界上最大的撤回文章數據庫”(https://retractionwatch.com/2019/12/31/a-look-back-at-retraction-w atch-in-2019-and-forward-to-our-10th-anniversary/#more-118665)。數據集的篩選標準包括:必須是完整的撤稿;必須是源自中國的撤稿;必須是科學文獻,嚴格地說是研究論文;所撤回文章的原發表日期應在01/01/2012和12/31/2018之間。

RW還包含大量“表示擔憂”等其他記錄,篩選標準可以將數據集微調到撤回的研究論文上。RW檢索界面只會返回最新600條記錄,提示“您的搜索返回了大量結果,僅顯示600條,縮小搜索范圍以查看所有結果”。因此,文章根據發布年份縮小時間間隔,通過多次檢索獲取并下載RW提供的HTML頁面,作為計量的原始數據。一旦撤稿記錄滿足篩選標準,就可以通過Python標準庫、csv庫、re庫和bs4庫解析HTML頁面來提取元數據信息作進一步分析,具體包括:撤回文章的標題、撤回文章的主題、出版商、出版雜志、撤稿的機構、撤稿的原因、撤回文章的作者、原始文章的DOI、是否有付費墻、文章類型、國家。

3 結果和討論

3.1 撤稿基本情況

(1)年度趨勢。2012-2018年RW數據集中,應用篩選標準之前有關中國撤稿信息的條目數為2,044,剔除“更正”等類別后共得到1,881條有關“撤回”的記錄,在此基礎上進一步篩選出1,553篇撤稿文章。其中,每年撤稿量的平均值是222次,與2018年的發現一致[35],即中國是撤稿數最多的國家之一。在1,881條“撤回”記錄中,2012年次數最少,小于170次;2015年最多,超過350次;2014年和2015年共有約700次撤回,占37%,年度撤稿數量形成凸曲線。每年的撤回次數在變化,很難通過波動找到明確的趨勢,詳見圖1。但如果將早期預探索中發現的年度撤稿量計算在內(2009年在800次以上,2010年在4,000次以上,2011年在2,000次以上,2012年為167次),則可以看到下降趨勢非常明顯。急劇下降的原因尚未可知,需要進一步探索。

圖1 中國研究人員撰寫或合著文章被撤回及其有關信息的數量(2012-2018)

(2)“付費墻”文章的撤稿頻率。付費墻是對在線內容實行付費閱讀的模式,在學術出版領域,研究論文的閱讀、下載普遍需要付費,研究者一般通過機構圖書館付費統一訂閱來獲取論文,若沒有統一訂閱則需要為單篇文章付費才能獲取原文。隨著開放獲取期刊越來越多,無需付費、向所有人開放的無付費墻文章數量不斷增加。除付費墻字段N/A(不可用)的記錄以外,付費墻文章數為25篇,而非付費墻文章為691篇(占96.1%)。早期探索中的付費墻文章數量為698篇,文章總數為9,083篇,所占比例同樣很小。如果撤回意味著原文章不具發表價值,開放獲取論文的質量可能需要被審視。在科研共同體與Elsevier和Springer等大型出版商競爭中,這并不是好消息,只有質量不再受質疑,開放獲取運動才能邁向更高的層次。

3.2 作者和來源

(1)國際合作與分布。與中國撤回文章作者合作的國家和地區分布相當廣泛。合作文章數美國位居第一(140次撤回),其次是日本、巴基斯坦、英國,再次是澳大利亞(13次)、加拿大(12次)、意大利(11次)和德國(10次)。美國占比最高不足為奇,根據Scimago排名數據,美國是科研實力最強的國家,有超過68萬篇文獻,H指數超過2,200。但是,國際合作分布很不均衡,排名前十的國家或地區占比高達96%。Sci2 Tool的NAT(網絡分析工具包)提供的原始網絡摘要顯示:42個節點,11個孤立節點;65條邊,無自環或平行邊;平均權重1.415;13個弱連通子圖(11個為孤立點),最大的連通子圖由23個節點組成。具體細節可以從Pajek圖表中看出:荷蘭、奧地利、加納、阿魯巴、愛爾蘭、新西蘭、巴西、開曼群島、泰國、亞美尼亞和沙特阿拉伯是孤立的;一些國家組成一些小社區,如由馬來西亞、巴基斯坦、埃及、西班牙和伊朗組成的社區。原網絡并不是弱連通的,為了使可視化簡潔且易于理解,可通過Sci2工具提取最大連通子圖。

圖2展示各個國家或地區的協作分布。圖中的節點代表國家或地區,每個節點的面積與國家或地區出現頻率相對應,連接線的粗細代表共現的頻率(國際協作),每個節點的顏色表示Louvain算法劃分的社區。社區內部的國家或地區具有更多的相似性和更強的協作意愿,而不同社區中的國家或地區之間存在更多的差異和較弱的關系。圖2顯示了在RW撤回數據集中與中國合作的國家或地區之間的關系,同一社區中的國家或地區聯系更緊密。這種聯系表現出的地理特征是:與中國合作的國家或地區傾向于與地理距離較近的國家或地區合作,如瑞士、德國和意大利在一個社區內;挪威和瑞典在同一社區;英國和法國,約旦、南非和土耳其在同一社區。此外,澳大利亞與法國也在同一社區,表明經濟和歷史因素也可能影響了社區分布。

圖2 中國科學論文撤稿的國際合作網絡

(2)期刊來源。撤回文章來自717種期刊,其中大量期刊(495種)僅發布1份撤回通知。Tumor Biology(Tumour Biology)-Official Journal of the International Society of Oncology and Bio-Markers(ISOBM)有88篇撤回文獻,占5.7%,其次是PLoSOne、Multimedia Tools and Applications和Biochemical and Biophysical Research。在撤稿最多的期刊中,沒有一種是中國出版的,這與Chen等的結論一致[8]。至少撤回9篇文章的期刊有23種,發布的撤回通知約占總數30%。排名第一的期刊Tumour Biology由Springer出版。通常頂級期刊每年都會發表很多文章,包括傳播和生物學方面的文章,這可能會影響它們在撤稿名單上的排名。

(3)出版商。表1列出中國作者撤稿的主要出版商,排名前三的是Elsevier、Springer和Wiley。Elsevier和Springer撤回文章量占撤稿總量的40%以上,側面顯示出其在科學出版領域的重要地位。從科學研究平等權利的角度來看,這是負面的,但在處理撤回文章方面,大型出版商可能會發揮更重要作用,其數據庫足夠大,也可以影響大多數存儲庫。

表1 撤回中國作者文章較多的出版商

(4)作者。單個作者最高撤回次數為15次,僅有兩位作者的撤稿達到15次,撤稿次數大于等于10次的僅有7人,大于等于9次的僅有15人。撤稿與文章的可靠性有關,撤稿最多的作者被揭露時可能會感到不適,其科研質量也受到質疑。不過,如果不同時比較撤稿原因,這個數字也不能說明太多信息,有待進一步探討。

(5)機構。表2列出中國作者撤回論文較多的機構,有73個機構有1篇以上的撤稿。大多數機構(1,716個)只有1份撤回通知。沒有某個機構撤回的文章很多,撤回的數量很大程度上取決于中國發表文章的總量。

圖3 各領域的撤回總數分布

表2 撤稿較多的機構

3.3 領域

RW數據集可以識別來自不同科學領域的撤稿。生物-細胞、生物-癌癥、遺傳學、生物化學、生物-分子、醫學-腫瘤學、化學、社會/協會期刊、材料科學、計算機科學、技術、醫學-胃腸病學,這12個領域的撤稿數約占撤回總數60%(見圖3)。考慮到Scimago記錄的發表文章總數,這部分歸因于這些領域的出版物總量很大。

3.4 原因

本文將RW標記的撤稿原因作為原因類別劃分依據,每篇撤回文章至少擁有1個原因標記。與其他相關研究中含原因的撤稿記錄比例相比,如Aspura等的27%[36],情況尚令人滿意。最常見的原因是文章重復和圖像重復(也稱為“自我抄襲”),這并不奇怪,社交媒體上有關撤稿的新聞往往是關于中國文章的重復現象。中國是發展中國家,仍在追趕美國等先進國家。但是,當下數量導向的科學評估體系和尋求快速成功的社會氛圍不能被忽略。

“有關數據的擔憂或問題”“不當行為-官方調查”“作者不當行為”三者的比例相同。當對合法的作者權利主張存在疑問、爭議或爭議時,使用“關于數據的擔憂或問題”;在公司法人或政府機構調查后發現不當行為時,使用“不當行為-官方調查”;當期刊、出版商、公司、機構、政府機構或作者本人聲明研究犯有不當行為時,則使用“作者不當行為”。由于對數據或不當行為的擔憂而撤回的文章超過四分之一,因此應重視偽造或剽竊等問題。

關于剽竊,Chaddah提出另一種觀點,他稱為“結果剽竊”[37]。他認為,研究人員重復已經發表的實驗并獲得有效數據是科學研究的共同特征。這似乎很合理:現代科學的主要特點之一是具有實證主義背景。重復實驗不僅是可接受的,而且應當期待重復實驗的出現以驗證先前結果,這有利于科學發展。

圖4 中國撤回文章的各種原因

檢測軟件不僅可以避免剽竊,也易于檢測重復度。此外,隨著機器學習的快速發展,檢測圖像的重復變得更準確、方便和快速。人工智能可以提高軟件性能,并增加欺詐難度。由于不當行為而導致的撤稿影響廣泛,社會已經注意到有必要重建科學規范。這呼喚更多的研究來揭示這些問題在科研共同體中的重要性,而本研究是回應之一,詳見圖4。

從占比較高、統計意義更顯著的“(基礎生命科學)生物化學”“(基礎生命科學)生物-癌癥”“(基礎生命科學)生物-細胞”“(物理學)化學”4個領域看,出現比例最高的撤稿原因是“文章重復”,其在生物-癌癥領域占比最高(44%)。“委婉表達剽竊”在生物化學領域和化學領域占比較高,分別為18%和15%,明顯高于在生物-癌癥、生物-細胞領域的占比(分別為3%、8%)。生物-癌癥領域占比第二高的撤稿原因是“圖像重復”,占27%,而“圖像重復”在其他3個領域的占比僅為16%左右。“有關數據的擔憂或問題”在生物化學、生物-細胞和化學領域均在15%上下浮動,但在生物-癌癥領域的占比格外低,僅為7%。“有關圖像的擔憂或問題”與“方法錯誤”兩原因在4個領域撤稿中的占比差距不大。在文章所分析的4個領域中,撤稿原因具有一定的相似性,內部卻有較為明顯的差異,相較而言生物-癌癥領域的“圖像重復”撤稿原因十分突出。

3.5 撤回文章的影響

撤回文章通常由于其撤稿而價值不高,使用引文分析法對其進行評估可能局限性比較明顯,為此本文嘗試使用一種基于公眾關注的方法作進一步研究。Altmetrics是與傳統基于引用的度量互補的計量方法和定性數據。來自網絡的Altmetrics數據源可以顯示全世界討論和使用學術成果的頻率。它是一種對注意力的記錄,也是評估影響的指標(https://www.altmetric.com/about- altmetrics/whatare-altmetrics/)。Altmetrics詳細信息頁面為用戶提供了注意力分數,以表示該文檔被提及的頻率。本文使用Altmetric Details Page API來獲取基于DOI的撤回文章注意力得分,以評估撤回文章的影響力。

大部分撤稿的注意力得分是不可用的(770篇),小部分文章(77篇)的注意力得分超過10。如表3所示,3篇最具影響力的文章是《世界范圍內宗教與兒童利他主義之間的消極關聯》《大氣中O2和CO2組成變化對海洋熱量吸收的量化》《完全鎖定狀態下基于腦機接口的通信》,注意力得分超過2,000。高注意力得分的撤回文章會帶來惡劣影響:《柳葉刀》刊登Andrew Wakefield撰寫的有關自閉癥和MMR(麻疹、流行性腮腺炎和風疹)疫苗的文章(https://www.thelancet.com/journals/lancet/article/PIIS0140 673697110960/fulltext),注意力得分超過4,000,損害了公眾對該疫苗的信心。文章發表后,MMR疫苗的接種率顯著下降,文章撤回后接種率也沒有反彈。基于數據實證的Altmetrics能夠解決傳統計量方法時間滯后的問題,可以用來檢測具有重大影響力的撤回文章,使研究人員和政府官員可以有針對性地進行處理。本研究中高注意力得分的文章數量不多,未來研究中也需要使用更多定性方法。宗教與兒童、氣候變化、腦機通信和基因編輯等主題受到公眾更多關注,這些領域撤回文章的負面影響更大。科學文獻在學術共同體內具有學術影響力,但社會影響力也不可忽視。2020年11月發表在Nature Communications上的The association between early career informal mentorship in academic collaborations and junior author performance分析導師和男性學生一起工作比和女生學生一起工作獲益更多(https://www.nature.com/articles/s41467-020-19723-8),引發廣泛討論,許多女性科學家表示強烈反對,該文章最終在12月被撤回。為跟蹤熱點領域文章的社會影響力,研究機構可以大規模監測注意力得分變化曲線,在文章撤回或引發廣泛討論時做出針對性的釋疑或處理,盡可能及時有效地消減其負面影響。

表3 Altmetrics注意力得分最高的文章(超過100)

4 結語

本文研究學術出版界與撤稿相關的幾種現象。從Retraction Watch檢索的數據集來看,2012-2018年的中國的撤稿數量變化不大,呈現先增后減趨勢,2015年達到356篇峰值。與中國研究人員數量和每年大量的出版物相比,撤稿量看起來較少,但當涉及“撤稿”這不應發生的情況,這些數字值得注意。同時,在可用的統計樣本中大多數的撤稿都是沒有付費墻的文章,對開放獲取來說此現象令人擔憂,是未來重要的研究課題。

機構和作者方面的撤稿分布相對均勻,而國家、期刊和出版商方面則相反。撤稿協作網絡顯示出一定的地理特征。隨著撤稿引起國內外廣泛關注,科研共同體應予以重視,尤其是撤稿所占比例較大的生物、化學和醫學領域。此外,科研評估體系需要改革。就目前的度量標準而言,存在“出版或滅亡”事實,只有注重質量的評估系統才能解決過量撤稿之類的問題,而步調適中也可以方便研究人員尋求長期成果和更深入的研究。

根據Altmetrics數據,盡管大部分撤回文章的注意力得分較低,但注意力得分很高的文章警告:研究文章不僅意味著“報告一個結果”或“個人文章總量加一”,在快速溝通的時代,撤回一篇不值得出版的文章會造成很多麻煩。

本研究存在一定局限性:一是時間粒度較粗,僅提取年份參數,未提取月份日期信息;二是沒有分析從文章發表到撤稿所跨的時長,僅收集原始論文的發表年份;三是數據源的覆蓋范圍有限,僅使用RetractionWatch數據庫,Grieneisen和Zhang的研究涵蓋JSTOR、Pubmed、Google Scholar和RW等42個數據庫[38];四是在作者分析過程中,使用名稱作為識別符,存在潛在的重名問題。名稱重復項應給予消歧以確保關鍵字可以代表確切實體,進一步的研究可以嘗試使用ORCID和基于深度學習的方法來解決該問題。此外,還應該通過添加年齡和性別信息等來豐富對作者的分析,更詳實地描繪作者畫像。

猜你喜歡
數據庫研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 88av在线播放| 亚洲欧美一区二区三区麻豆| 亚洲成AV人手机在线观看网站| 国产亚洲精品va在线| 久久这里只有精品免费| 在线看片中文字幕| 欧美天天干| 99无码中文字幕视频| 久久一色本道亚洲| 国产精品成人免费综合| 久青草免费视频| 九月婷婷亚洲综合在线| 国产成人综合亚洲欧美在| 国产成人精品一区二区不卡| 久久中文字幕2021精品| 国产精品视频猛进猛出| 亚洲午夜福利精品无码不卡 | 精品五夜婷香蕉国产线看观看| 性欧美在线| 成人va亚洲va欧美天堂| 亚洲国产中文在线二区三区免| 凹凸精品免费精品视频| 国产高清在线观看| 男女精品视频| 久久青草精品一区二区三区| 亚洲欧洲天堂色AV| 搞黄网站免费观看| 国内精品久久久久鸭| 天天躁夜夜躁狠狠躁躁88| AV在线天堂进入| 亚洲av无码久久无遮挡| 亚洲二区视频| 精品视频一区二区观看| 全部免费特黄特色大片视频| 亚洲精选无码久久久| 久久精品丝袜| 国产免费久久精品99re不卡| 欧美一级黄片一区2区| 亚洲经典在线中文字幕| 在线日韩一区二区| 久久婷婷人人澡人人爱91| 国产91丝袜在线播放动漫| 大学生久久香蕉国产线观看| 香蕉国产精品视频| 亚洲综合精品第一页| 色九九视频| 国产精品蜜臀| 精品福利视频导航| 亚洲成年人网| 日韩123欧美字幕| 日本高清有码人妻| 免费毛片视频| 狠狠色丁香婷婷综合| 日本国产在线| 国产a网站| 国产免费人成视频网| 99在线小视频| 中文字幕在线播放不卡| 伊人国产无码高清视频| 香蕉在线视频网站| 亚洲av综合网| 国产色网站| 国产又粗又猛又爽视频| 欧美亚洲欧美区| 欧美成人午夜在线全部免费| 2020精品极品国产色在线观看| swag国产精品| 久久综合色播五月男人的天堂| 国产综合精品日本亚洲777| 欧美成人免费一区在线播放| 国产欧美日韩综合在线第一| 一区二区三区在线不卡免费| 国产一级妓女av网站| 精品久久蜜桃| 色欲色欲久久综合网| 欧美亚洲第一页| 国内精品九九久久久精品| 最新国产你懂的在线网址| 欧美亚洲国产日韩电影在线| 国产日韩欧美精品区性色| 国产成年女人特黄特色毛片免| 婷婷亚洲视频|