中圖分類號:TP18;G301 文獻標志碼:A 文章編號:1004-342(2025)04-12-6
近年來,以ChatGPTDeepSeek為代表的大語言模型引發全球關注。基于生成式訓練模型的人工智能生成內容(ArtificialIntelligenceGenerativeContent,AIGC)被視為人類知識生產革命的重要推動者,被廣泛運用在教育、醫療、科研和傳媒等知識生產與信息傳播領域。有學者認為,人工智能作為知識生產主體的地位應獲得承認,①也有學者認為AIGC不能算作是一種真正的知識,只是一種信息的生成。②那么,AIGC屬于何種知識范疇?和學術知識生產有何異同?作為一種新的技術變量,對于學術知識生產又會產生何種影響?關于這些疑問,我們有必要回到知識本身,理清人工智能生成內容的邏輯,并對AIGC誘發的科研失信問題及學術生態面臨的風險加以探討和反思
一、AIGC與知識生產的關聯
知識是人類在長期實踐與生活中,通過積累、思考、實驗等形成對認知對象的認識,是人類在自己的歷史活動中對實踐經驗的總結和升華,并以具有思想內涵、時代內涵和文明內涵的各種概念體系構成人類文明進步的階梯和支撐點。①沿著知識社會學的路徑,除了經由研究或思考并得到系統化表達的知識之外,②那些指導日常生活實踐的常識也可算作知識。AIGC是指由人工智能生成而非人類創作的內容,具有知識密度高、生成速度快、生成成本低,甚至具有一定的創造性特點,它的確可以成為知識生產的一種方式。
有學者總結了AI生產的“知識”與人類生產的知識的本質差異。人類知識是在意向性的基礎上以一階知識和二階知識的面目呈現,而AI生成的“知識”缺乏反思性和意向性,通過對既有知識的聯結和組合,以三階知識的面貌呈現。所謂一階知識就是人類憑借感知直接對“對象世界”的無中生有,二階知識即在一階知識基礎之上進一步發揮聯想、推理重新加工和改造后的知識,三階知識是在一階知識和二階知識基礎上的新的知識形態,是一種“類知識”。也有學者將其稱為“混亂知識”③或“暗知識”,用以指代在“算法黑箱”的邏輯下人類尚未把握、理解的知識范疇。以往對知識生產的理解始終圍繞著人這一主體及其實踐而展開,當生成式人工智能以非人類實體介人到知識產生的過程中,知識生產的意涵進一步得到了延展。
那么兩者有何關聯?首先,人類知識構成人工智能的基礎。沒有人類預存的知識,就談不上機器所表現出的智能,正如有些學人所笑談,人工智能有多“人工”就有多“智能”。其次,AIGC所產生的“類知識”,本質上是人類已有的知識。AIGC實際上是從海量文本中分析人類語言實踐的概率,并根據最可能的搭配內容作為答案高效地提供給人類提問者。@最后,人工智能產生的“暗知識”是人類知識發展過程中的重要外延,最終可被收編為人類知識的組成部分。
二、AIGC介入下的學術知識生產
2020年初,麻省理工學院讓人工智能參與到抗生素研發過程,人工智能在61000個分子中篩查到1個分子符合制藥標準,研究人員將其命名為Hlicin(海利霉素)。①在醫學領域,學者指出ChatGPT有潛力徹底改變研究人員在醫學領域進行科學寫作和數據分析的方式。②麻省理工學院最新對1018名科學家的一項實驗表明:使用人工智能輔助的研究人員發現材料數量增加了 44% ,專利申請數量提高了 39% 。③聚焦于科研工作流程中,AI在文獻檢索、文獻閱讀、文獻分析、文獻管理、筆記管理、論文寫作等方面均有不同程度的賦能作用,其中主要的賦能集中在協助文獻研究、設計科學實驗方案、幫助進行數據分析、提高論文寫作速度、加快學術出版等方面。③AI在加速科學發現、提高效率等方面已經發揮出巨大的潛力。AIGC表現出的強大“類人性表達”,勢必會進一步加速傳統知識生產的變革。
有學者從知識演進的層次“數據一信息一知識一智慧”,以及知識搜索和知識評估維度總結了AI介人下的三種知識生產模式:AI主導型、AI合作型和AI輔助型。AI主導型是指作者向生成式AI輸入撰寫一篇論文的全部或部分內容的指令(譬如論文摘要、提綱、標題、論證行文等內容),不經過驗證和調試地直接使用;AI合作型是指作者在知識搜索階段通過人機協作,不斷輸人指令與生成式AI交互,直至獲得達到甚至超出自身期待的回答;AI輔助型是指知識搜索階段由AI獨立完成或者人類和AI交互完成,同時人類會對AIGC的科學價值進行判斷和改進,使得AI在生產最終呈現出的知識產品中只起到一種輔助性作用。有學者從知識獲取途徑與思維運作過程總結了AI對于傳統科研活動的沖擊,即檢索式的知識獲取轉變為生成式,綜合式的思維運作轉變為選擇式。②盡管目前AI在信息檢索、摘要總結、文本分析、生成策略和對話回顧等方面較為成熟,但其仍無法承擔學術知識生產的主要重擔,人類的主體性地位尚不能動搖,
首先,從知識演進的層次看,AIGC目前正處于從數據到信息的階段,無法獨立生成知識。數據本身只是一種未經加工的、不具有任何特定意義的符號化記錄,信息是一種被處理和解釋過的、對接收者具有特定的意義。數據轉化為信息后需要借助人類的理性和經驗實現到知識的進階,而生成式AI自身無法將數據有效轉化為知識。①其次,基于生成式的知識獲取,存在無法回避的缺陷:知識獲取的碎片性、模糊性,甚至是虛假性。AIGC在已有文獻庫中截取部分關鍵要點,容易忽視原著的上下文的整體語境。當原著中的詞語被重新組合后就會對語境信息造成巨大損耗。AI所依賴的深度學習模型是基于海量數據庫的二次學習,數據源的有限性、真實性會導致AI生成低質量信息,而AIGC再次進入互聯網又造成虛假數據的惡性迭代。這本身有悖于知識的增長與傳播有助于推動提升人類認知準確性的基本邏輯。最后,人工智能生成內容沒有真正的創造性。從本質上而言,人工智能是被人類創造的,它是“人類的創造物”而不是“創造者”。AIGC缺乏體現
創造力的關鍵元素:自主性、意向性、意識、價值觀、情感,以及超越“已知”建立“未知”的能力。②AI無法像人類學者一樣能產生瞬間的靈感或頓悟。盡管AI已經表現出一定的“創造”能力,但這種“創造”能力本質上還是基于人類已有語料庫的概率性綜合,它所能做的只是基于海量的既有語料執行操作——搜索、重組和替換。③
三、AIGC誘發的科研失信危機
著名語言學家喬姆斯基曾在《紐約時報》發表評論,直言不諱地指出ChatGPT本質上是高科技剽竊,展出了一些平庸的邪惡:抄襲、冷漠和回避。
年1月,國內媒體報道的一學生使用AI學術造假被麻省理工學院退學的新聞引發熱議。事實上,關于AIGC所引發的科研失信問題屢見不鮮
《自然》雜志(Nature)曾報道:大量由人工智能生成、偽造的期刊文章通過同行評審并得以發表,一些出版物表示他們將撤下這些論文,這可能導致超過200篇論文被撤稿。有國外學者指出,ChatGPT在科研寫作中被濫用的案例包括:抄襲、結果的錯誤表述、過度依賴自動化、不了解技術術語、數據誤解、缺乏原創性、缺乏問責機制、缺乏透明度、偏見和不準確,以及作者身份的濫用。①此外,學術界已出現濫用大語言模型生成文本的署名爭議,ChatGPT在論文工廠中的濫用問題更亟待重視。②國內學者對于AIGC與科研失信問題主要集中在誘發潛在虛假舞弊現象,如ChatGPT應答中存在錯誤、偏見或誤導性的信息會在集中式的應答機制中,被用戶與機器信息傳遞過程的感受性要素所掩蓋。③
此外,生成式AI在科研場景中會引發輸出低質量信息;會對研究誠實性和可靠性造成破壞,導致剽竊、抄襲、偽造、篡改等科研誠信問題。還有學者指出,生成式AI應用于研究生科研寫作會產生技術依賴,導致學生的思維惰性和思考萎靡,且難以確定研究成果的真偽,這違背科研工作原創性原則,并進一步影響學術成果評估的公正。@
目前,學術界已經陸續對人工智能在學術研究中的使用作出回應。《科學》雜志(Science)《自然》雜志等海內外學術期刊已陸續推出AI使用規范。《科學》雜志明確表明既不接受ChatGPT生成的論文,也不允許ChatGPT作為論文作者。中國歷史研究院《歷史研究》雜志在國內率先發布《關于規范使用生成式人工智能工具使用的啟示》。
年3月28日,《當代青年研究》編輯部發布規范:不接受運用AI工具生成文章的主體架構、核心觀點和主要內容,改寫既有研究成果;虛構工具信息或隱瞞使用情況;偽造或捏造文獻、內容與數據等;作者應對論文使用AI工具的情況負責,并承擔相應法律與道德責任。一經查實存在上述所列問題,刊物將有權采取退稿、撤稿、通報、禁止在刊物發表文章等措施。③
四、結語
知識生產是人類不斷發明、創造新的信息、概念、思想、理論的創新活動。①學術研究的任務是提出問題和解決問題,是不斷形成新的學術知識的創造活動。②在傳統學術知識生產過程中,生產模式始終以人類為主導,其中凝結著人類的思辨力、洞察力、想象力、創造力。誠然,AI有助于節省人類從事學術知識生產的時間,提高知識生產的效率。然而,普通人在面對AIGC的黑箱時可能無法有效洞見知識生產的過程,缺乏對知識性質的判斷。這可能會導致人類“主體性”(Agency)的喪失,而建立在“主體性”缺失基礎上的AIGC可能會裹足不前。果真如此,人類的知識生產會陷入內卷式的停滯,這當然不是大家希望看到的未來
(責任編輯:劉曉琴)
Lacking of Originality: the Academic Knowledge Production of AIGC
LIU Yu LI Xiaoyi (School ofJournalism, Yunnan University, Yunnan,Kunming, 650500)
Abstract: In recent years,the development of artificial intelligence has presented new challenges and opportunities for human knowledge production and information dissemination. By reviewing the existing academic research on AIGC,it has been found that AI has enriched the wayof human knowledge production,particularly in promotingthe production ofthird-order knowledge.However,anunavoidable issue for AIGC is the lack oforiginality and insight in itsknowledge content,which prevents it fromexpanding the overallboundariesof human cognition. Although the use of AIGC in academia can improve the effciency of scientific research,it further exacerbates the existing severe issues of research integrity in our country.
Key words: knowledge production; research integrity; artificial intelligence; originality