摘 要:隨著生成式AI和人工智能生成內容(Artificial Intelligence Generated Content,AIGC)的迅速發展,學術不端出現了新形式,學術不端治理面臨新的挑戰。本文分析了直接生成更加逼真的包含文字和圖片的論文、生成論文的輔助材料和生成審稿意見三種學術不端新形式,并提出及時總結論文造假規律、開發更加智能的檢測工具、推廣專家分層審稿模式和加強科研道德建設這四條治理措施,以期為促進學術期刊高質量發展提供參考。
關鍵詞:學術不端;AIGC;治理措施;科研誠信;學術期刊高質量發展
DOI: 10.3969/j.issn.2097-1869.2024.02.014 文獻識別碼:A
著錄格式:李新新.AIGC時代學術不端的新形式及其治理[J].數字出版研究,2024,3(2):113-118.
2019年5月,國家新聞出版署發布了行業標準《學術出版規范 期刊學術不端行為界定(CY/T174-2019)》,對學術不端行為進行了明確的界定。近年來,各界對學術不端現象有著越來越深刻的認知,對期刊學術不端現象更加重視。隨著互聯網、生成式AI等技術的迅速發展,各種新形式的學術不端隨之出現,從而給學術不端的治理帶來新的挑戰。
1 學術不端治理文獻綜述
學術不端歷來是學術界關注的問題,研究者們已經對此開展了若干細致的工作,對于學術不端的表現、成因和治理措施的研究都有了若干成果。生成式AI和人工智能生成內容(Artificial Intelligence Generated Content,AIGC)時代的到來,也使部分學術期刊和學者制定新規定、開展新研究來作為回應。
1.1 學術不端的表現、成因和治理
在學術不端的表現方面,劉金波等[1]將學術不端現象總結為抄襲剽竊、一稿多投、多稿并投、重復發表、拆分發表、數據造假、不當署名、無端撤稿、買賣代寫和學術泄密十種類型。馮婷等[2]針對公眾對16種學術不規范行為的認知進行了問卷調查,這些學術不端行為涉及論文寫作、投稿、論文發表、署名、基金標引和參考文獻六個方面。劉普[3]列舉了學術不端的六種形式:學術抄襲、學術剽竊、學術造假、侵占他人學術成果、偽造學術身份和履歷及貪污科研經費。從已有的研究工作可知,學術不端集中表現為論文抄襲、代寫、實驗數據造假等形式。
在學術不端的成因方面,劉金波等[1]從權力碰撞、機制不全、學術腐敗、懲戒不力、職業倦怠和個人主義六個方面探討了學術不端的根源。許蔚萍[4]指出,高校學術不端形成的原因是內在動機從“探究學問”異化為“追逐利益”,外部評價由“價值追求”異化為“量化評價”。朱冬梅[5]在分析期刊論文學術不端原因時指出,作者是產生期刊論文學術不端的源頭,專家審稿造成的學術不端不容小覷。馮婷等[2]通過問卷調查,從個人因素、制度因素和環境因素三個角度分析造成學術不端的原因,個人因素包括科研成果產出、職稱晉升和獲取學位等方面造成的壓力,制度因素中相關規范對學術不端界定不清晰、監管制度不完善和懲戒措施不力是前三位因素,環境因素中學術研究功利主義和浮躁現象排在首位。劉普[3]指出,學術不端有六個原因:受社會大環境影響、學術不端具有一定隱蔽性、對學術不端行為容忍度高、少數管理部門和責任人把關不嚴、缺乏完善的追究懲戒機制和考核評價機制不夠科學合理。從文獻可知,科研考核壓力、制度不完善和把關不嚴是造成學術不端的主要原因。
在學術不端的治理方面,朱冬梅[5]提出,期刊編輯可以借助融媒體來防范學術不端,具體舉措包括完善采編系統信息采集以加強前端控制、加強期刊編輯的初審工作及完善同行評議送審機制和送審方法。劉金波等[1]提出從以下兩個方面來防范學術不端:從平臺、主體、制度、技術、環境層面構建“五位一體”的學術出版倫理防范機制;從網絡出版、供需錯配、融合出版、規范建設等方面構建“四位一體”的學術不端立體防范網絡。許蔚萍[4]提出,高校治理學術不端的對策包括確立以學術共同體為核心的治理理念、建立誠信自律與法治約束相結合的制度及推進數字化與智能化相融合的治理方式。劉普[3]建議,通過教育引導增強對于學術不端的免疫力、真正落實對學術不端“零容忍”的查處力度、完善預防與處理學術不端的相關機制、發揮媒體和學術打假專業人士的作用、加強防范和發現學術不端的技術手段建設及完善學術與人才考核評價機制六個方面治理學術不端。綜上可知,加強論文發表前的學術不端檢測是一項重要措施,使用技術手段輔助檢測是一個重要方向。
1.2 AIGC對科研誠信的影響
AIGC時代下的學術不端是指在該技術廣泛應用的背景下,學術界中出現違反學術道德和規范的行為,這些行為獲取不當的學術利益,損害學術研究的公正性、準確性和可信度。例如,中華醫學會雜志社在對醫學科技論文寫作和評審過程中使用生成式AI(GenAI)相關事宜的規定中指出:“GenAI不能用于整篇論文或論文重要部分的撰寫(如研究方法、結果和對結果的解釋分析等)。所有屬于科學貢獻或智力勞動范疇的內容均應由作者完成。如論文主要內容使用GenAI完成,編輯部將按照學術不端行為進行處理……編輯部經研判認為作者在論文寫作中存在違反GenAI使用規定的情形,將直接退稿或撤稿;情節嚴重者,將列入作者學術失信名單,兩年內禁止作者向中華醫學會系列雜志投稿;如作者是期刊審稿人,同時禁止其參與審稿工作。”[6]
使用計算機生成論文并非近年才開始出現的現象。2005年,美國3名計算機專業的研究生開發了論文生成軟件SCIgen,該軟件能夠生成帶有圖片、表格和參考文獻的論文。十幾年來,不斷有研究人員使用該軟件和其他論文生成器生成論文后向會議和期刊投稿并被錄用,其中不乏國際知名學術期刊[7]。當這些論文被曝光為計算機生成后,論文接收方的聲譽會受到影響。Nature在2021年報道,在計算機科學領域,100萬篇文章中約有75篇論文是由計算機程序SCIgen自動生成的[8]。
AIGC時代來臨后,學術不端出現了新的形式,這給傳統的學術不端治理帶來了挑戰。在AIGC時代,人工智能能夠以令人驚訝的準確度生成文字、圖片、視頻和代碼等內容[9]。學者們研究了以ChatGPT為代表的AIGC工具可能對學術不端造成的影響。羅云梅等[10]指出,ChatGPT可能導致真實性、侵權及偏見問題,產出的內容并不受我國著作權法的保護,還會引起署名方面的問題。王少[11]指出,ChatGPT對學術不端的內涵和外延都造成了沖擊,而應對ChatGPT的策略包括三個方面,即構建主客體合作網絡、更新治理程序與標準和構建流動式治理框架。
2 AIGC時代學術不端的新形式
2.1 直接生成更加逼真的包含文字和圖片的論文
2023年12月,谷歌發布了人工智能大模型“雙子座”,該模型在大多數指標上超過了GPT-4,能夠生成文字和圖片混合的文章。論文工廠在該模型及未來功能更強大的大模型的基礎上,基于大量已發表的學術論文進行訓練,有可能生成包含更逼真圖片的學術論文,將更容易通過審稿專家的評審和編輯的把關并最終發表。
2024年2月,《中國科學報》報道,我國科研人員在開放獲取期刊Frontiers in Cell and Developmental Biology上發表的一篇論文,由于使用人工智能繪圖工具Midjourney生成的插圖,在上線發表3天后被期刊緊急撤稿[12]。這篇論文的插圖畫風和科研論文明顯不符,因此在發表后引發熱議并引起期刊編輯部的重視。Midjourney并不是一個專門用來生成科研論文插圖的人工智能繪圖工具,其生成的圖片比較容易被識別。當前大模型普遍采用“預訓練+微調”的方式進行訓練,論文工廠如果在圖片生成通用大模型基礎上使用已有科研論文中的圖片進行微調,很可能生成足以以假亂真的圖片,給論文審理帶來巨大困擾。
2.2 生成論文的輔助材料
按慣例,編輯對論文進行把關的一個方法是要求作者提供輔助材料,包括文字、圖片、源代碼和視頻等,其能夠證明論文的作者確實進行了實驗和調查并得到了論文中的結果,原本其中最強有力的是視頻。2024年2月,OpenAI發布了文生視頻大模型Sora,其能夠根據用戶的指令來生成視頻。雖然目前該模型生成的一些視頻還有若干問題,但是相信OpenAI未來正式向公眾推出該模型時會修復大部分問題。國內一些高校和相關企業也在大力開發具有自主知識產權的文生視頻大模型,相信在不遠的將來,市面上會有若干針對不同場景的文生視頻大模型。如果論文工廠使用文生視頻大模型來生成視頻作為論文的輔助材料,很有可能通過審稿專家和編輯的評審。傳統上,計算機科學領域的論文可以通過要求論文作者提供程序源代碼來避免弄虛作假,一些研究人員也會在個人主頁上公開論文中實驗使用的源代碼。但是重復論文中的實驗往往涉及比較復雜的運行環境的搭建,有的計算機實驗如大模型實驗的重復需要較高的成本,因此在論文評審過程中,評審專家往往不會通過運行作者提供的源代碼來判斷實驗結果是否存在學術不端,這就使得大模型生成的源代碼很有可能通過審稿專家的評審。這種情況下,傳統上通過文字、圖片、源代碼和視頻等輔助材料來幫助評審方確定論文學術水平的方法很可能面臨失效。
2.3 生成審稿意見
王蘊嘉等[13]在探討ChatGPT在學術期刊編輯領域的應用時指出,可以使用ChatGPT來判斷稿件的價值,如直接生成供編輯參考的判斷結果。中國知網提供了AI輔助研讀工具、單篇問答和文章伴讀功能,單篇問答功能能夠提煉出文章的大綱、觀點和研究方法等,而文章伴讀功能能夠挖掘文章的價值并指出存在的問題。這兩個功能的合理使用無疑能夠在一定程度上提高審稿速度。
合理、適度地使用大語言模型可以提高審稿效率,但是也存在過度使用的風險。隨著投稿數量的激增,審稿專家面臨著越來越大的挑戰。有些審稿專家科研和教學任務繁重,有時會把稿件交給他人代審,如部分高校教師會把稿件交給自己的研究生去審閱,然而研究生學術水平參差不齊,有些學術審稿經驗不豐富,難以檢查出稿件中存在的學術不端問題。在AIGC時代,審稿專家如果使用大語言模型來自動生成審稿意見,可能無法發掘出稿件中的亮點,尤其是可能無法發現稿件中隱含的學術不端問題,從而使這類稿件“錯誤”地通過評審。
3 AIGC時代學術不端的治理措施
針對AIGC時代出現的學術不端新形式,可以從總結規律、提升技術水平、優化審稿機制及加強科研道德等方面進行治理。
3.1 及時總結論文造假規律
使用人工智能大語言模型生成論文的現象引起了學術界的關注,有研究對人工智能大語言模型生成的論文的特點進行了分析。人工智能大語言模型生成論文對不同學科的滲透程度不同,應用于社科和醫學學科較為容易[14],需要對這兩個學科的論文進行更嚴格的把關。人工智能大語言模型生成的論文能夠體現出一定的創新性,但是在不同學科領域的創新程度不同。大語言模型能夠表現出一定的推理性,但其生成的論文大多屬于組合創新和應用創新范疇,而在最重要的原始創新上則能力不足。期刊編輯可以據此對來稿分別處理:擴大原始創新論文的接收比例,這是大語言模型所不擅長的;對組合創新的論文加大審查力度,因為這類論文也在大語言模型生成的能力范圍內;對應用創新的論文嚴加審查,因為這類論文有很明顯的模式,正是大語言模型所擅長的。分類處理措施使編輯作為把關人能夠在很大程度上避免大語言模型生成論文的接收。加強大語言模型的推理能力是當前人工智能技術發展發力的重點,未來生成論文的甄別難度將會越來越高,期刊編輯需要密切關注這些科技新動態。
3.2 開發更加智能的檢測工具
大模型的訓練需要高水平的技術人員、較多的硬件資源和大量的訓練數據,這些都需要大量的資金。在當前的科研考核中,論文級別和論文數量仍是非常重要的考核指標,一些科研人員有可能花費大量的資金購買由AIGC生成的論文,以完成科研考核、職稱晉升和申報課題等目標。大量資金流向論文工廠,論文工廠就會持續優化大模型,生成更加難以被識別的論文。
論文工廠能夠在大模型的基礎上進行微調來生成論文,論文檢測方也可以在大模型的基礎上進行微調來開發檢測深度偽造論文的工具。實際上,自從深度偽造出現以來,就一直有研究者在研究如何對其進行檢測。
在論文學術不端檢測這個細分領域,如果使用大量學術論文對現有大模型進行微調,有可能訓練出檢測準確率足夠高的學術不端檢測大模型。可以針對論文中的文字和圖片及輔助材料中的文字、圖片、程序源代碼和視頻分別進行檢測,最后匯總多種媒介形式的檢測結果。
3.3 推廣專家分層審稿模式
大模型的一個固有問題是“幻覺”。“幻覺”是指“模型在處理輸入任務、維持輸出語境連貫性以及與現實世界事實保持一致性時存在偏差或錯誤”[15]。李國杰[16]指出,科研大模型必須找到解決“幻覺”的辦法。更有效的“幻覺”檢測方法和“幻覺”的生成機制仍是當前人工智能界致力于探究的問題[17]。盡管大模型生成的論文能夠通過很多審稿專家的評審,但是資深審稿專家還是能夠憑借多年的經驗和深刻的學術洞察力看出論文中存在的“幻覺”問題,這成為發現AIGC內容的有效抓手。
不過資深審稿專家是稀缺資源,無法滿足海量的審稿需求。期刊可以根據學科特點和既往經驗,建立與機器檢測配套的內部評價體系。在使用檢測工具對稿件進行評分后,可以將人類撰寫置信度較高的稿件交由一般審稿專家來評閱,將人類撰寫置信度居中的稿件交由資深審稿專家來評閱,而對人類撰寫置信度較低的稿件建議按拒稿處理。該措施能夠減輕資深審稿專家的審稿壓力,審稿專家一方面不至于將自己無暇審閱的稿件交由他人代審,另一方面也能夠充分發揮自身的作用,對稿件進行更精準的評判。此外,也可以考慮采用預發表模式,將通過專家評審和編輯把關的論文先在預印本平臺推出,進行開放評價,這或許能成為一種有效預防“漏網之魚”的方法。
3.4 加強科研道德建設
首先,增強科研人員的道德意識,堅守出版屬性,加強規范化管理[18]。通過入職時及定期的道德教育和培訓活動,使科研人員明確自身的職責、義務,增強自律意識。其次,建立健全監管機制,包括有效的舉報預處理機制,鼓勵科研人員積極參與道德監督,對于違反科研道德規范的行為進行嚴肅處理。再則,完善科研評價體系。一套科學、公正的評價體系會明確科研活動的目標和導向,激發科研人員的積極性和創新精神,同時也能夠規范其行為,促使其自覺遵守科研道德規范,從而形成良好的學術風氣。具體到論文評價和科研考核,要做到“重質量、輕數量”。歐美高校往往對發表論文的數量沒有硬性要求,評判個人成就主要依據成果質量,高校會邀請同行對成果質量開展匿名、公平的評審,從學術影響力、成果質量等多個維度來評判。
4 結語
學術不端是阻礙學術期刊高質量發展的問題之一,打擊“學術水貨”勢在必行。基于大模型的AIGC能夠以較高的準確度生成文字、圖片、代碼、音頻和視頻,其快速發展催生了學術不端的新形式,學術期刊要根據自身實際情況,及時歸納總結論文造假規律,采取積極的防范和處理措施,堅定明確的辦刊宗旨和方向,堅持實事求是的科學精神和科學態度,保持本職工作的專業性,杜絕學術不端,確保學術期刊高質量發展。
作者簡介
李新新,女,《北京印刷學院學報》副主編,編輯。研究方向:編輯出版。
參考文獻
[1]劉金波,韓文革.學術期刊編輯實務中的出版倫理:如何防范學術不端[J].武漢理工大學學報(社會科學版),2023(5):146-152.
[2]馮婷,葛文,毛鴻艷.作者和編輯對學術出版中作者學術不端行為的認知差異及防治措施[J].甘肅科學學報,2023(4):142-152.
[3]劉普.我國學術不端問題的現狀與治理路徑:基于媒體報道的64起學術不端典型案例的分析[J].中國科學基金,2018(6):637-644.
[4]許蔚萍.高校學術不端治理研究:文獻分析的視角[J].黑龍江高教研究,2023(3):44-48.
[5]朱冬梅.融媒體環境下編輯對期刊論文學術不端的防范措施探究[J].新聞研究導刊, 2023(15):224-227.
[6]《中華醫學雜志》社有限責任公司.中華醫學會雜志社關于在論文寫作和評審過程中使用生成式人工智能技術的有關規定[EB/OL].(2024-01-08)[2024-04-22].https://mp.weixin.qq.com/s/_IRUqAtyEM_2n53GrRlQgA.
[7]張萍,張小強.機器參與論文寫作的出版倫理風險與防范對策[J].中國科技期刊研究,2022(4):439-449.
[8]VAN NOORDEN R. Hundreds of gibberish papers still lurk in the scientific literature[J].Nature,2021,594:160-161.
[9]翟尤,郭曉靜,曾宣瑋.AIGC未來已來:邁向通用人工智能時代[M]. 北京:人民郵電出版社,2023:5.
[10]羅云梅,劉雪梅.ChatGPT對學術出版倫理的影響[J].醫學與哲學,2023,44(12):25-28.
[11]王少.ChatGPT與學術不端治理:挑戰與應對[J].科技進步與對策,2023(23):103-110.
[12]BIK E.The rat with the big balls and the enormous penis – how Frontiers published a paper with botched AI-generated images[EB/OL].(2024-02-15)[2024-02-18].https://scienceintegritydigest.com/2024/02/15/the-rat-with-the-big-balls-and-enormous-penis-how-frontiers-published-a-paper-with-botched-ai-generated-images.
[13]王蘊嘉,張琪.ChatGPT在學術期刊編輯領域的應用與展望[J].編輯學報,2023,35(S1):127-131.
[14]張明慧,玉璐,楊軍.禁用還是擁抱:生成式人工智能與中國社科期刊原創把關[J].出版發行研究,2023(8):49-55.
[15]趙月,何錦雯,朱申辰,等.大語言模型安全現狀與挑戰[J].計算機科學,2024(1):68-71.
[16]李國杰.大數據與計算模型[J].大數據,2024(1):9-16.
[17]羅文,王厚峰.大語言模型評測綜述[J].中文信息學報,2024(1): 1-23.
[18]宋吉述,王惠.中國出版業的人工智能應對策略分析[J].中國數字出版,2024,2(1):68-74.
New Forms and Governance Measures of Academic Misconduct in AIGC Era
LI Xinxin
Editorial Department of Journal of Beijing Institute of Graphic Communication, 102600, Beijing, China
Abstract: With the rapid development of generative AI and artificial intelligence generated content (AIGC), new forms of academic misconduct have emerged, bringing new challenges to the governance of academic misconduct. Three new forms were analyzed: directly generating more realistic papers containing text and images, generating supporting materials for papers, and generating review comments. In response to these new forms, this paper proposed four governance measures: summarizing paper falsification patterns in time, developing smarter detection tools, promoting expert layered review, and strengthening the construction of scientific research ethics, with a view to providing references to promote the high-quality development of academic journals.
Keywords: Academic misconduct; AIGC; Governance measures; Research integrity; High-quality development of academic journals