[基金項目]江蘇高校哲學社會科學研究一般項目“智能出版背景下學術出版的創新發展路徑研究”(項目編號:2023SJYB1273);2023年中國高校科技期刊研究會“善鋒軟件基金”資助項目(項目編號:CUJS2023-SF034)。
[作者簡介]譚曉荷(1988—),女,山西臨汾人,常州大學學報(自然科學版)科長,編輯。
[摘要]隨著人工智能技術不斷發展,ChatGPT的應用前景也越來越廣泛。文章依據ChatGPT的運行邏輯,在分析ChatGPT和學術出版全產業鏈的基礎上,提出將ChatGPT應用于學術出版行業,形成“ChatGPT+學術出版”融合模式。文章從正面效應和負面效應分析該融合模式對傳統學術出版的影響,最后,從政策監督、產業布局、數據安全三方面給出應對策略。
[關鍵詞]ChatGPT;人工智能;學術出版;融合發展;全產業鏈
當下,ChatGPT無疑是全世界最熱的話題之一,其風靡全球各大媒體平臺。自2022年12月開放注冊以來,ChatGPT用戶注冊數量迅速破億,日峰值也達到數億級別。如此大火的ChatGPT是“何方神圣”?會對學術出版帶來何種影響?學術出版人應該如何應對此種影響?
ChatGPT由美國人工智能實驗室OpenAI開發,是一款人工智能聊天機器人程序。ChatGPT不僅具有聊天功能,而且具有以人類自然語言的方式生成文本、編寫程序、繪制圖片、合成視頻、分類數據等功能。ChatGPT的強大功能主要依托于大型語言模型(Large Language Model,簡稱LLM),而LLM被視為通往通用人工智能(Artificial General Intelligence,簡稱AGI)的必經之路。可預知,未來的AGI擁有超大型LLM,此種超大型LLM與任務無關,其可以從海量數據中學習、歸納各種知識、經驗,以解決實際生產生活中出現的各種各樣問題。第一,LLM的規模必須足夠大,數據收集必須足夠多,要考慮用戶千變萬化的需求及多種多樣的任務。第二,LLM必須具備強大的自主學習能力,形成良性“人類表達—結果反饋”的循環。ChatGPT屬于文本類AI智能技術應用,是人工智能內容生成技術的最新成果。它基于深度學習算法,可以根據前后文理解實現與使用者的持續互動,是一種強化的人工智能深度學習模型[1]。筆者將此種模型的運行邏輯簡易歸納為三個環節(輸入處理環節、文本分析環節、輸出呈現環節)、兩大模塊(文本預處理模塊、深度學習模塊)。值得注意的是,由于ChatGPT是基于預測模型生成文本的,因此在輸出呈現環節中,使用者需要對生成的內容進行一定的正誤取舍、質量評價和后期處理等,以確保輸出的文本符合自身的需求和預期。
自ChatGPT發布以來,學界研究主要集中在人工智能技術現狀、產業應用前景及對人類未來的影響等方面。在學術出版領域中,以國際權威期刊為代表的出版界以及以科研工作者或倫理研究者為代表的學術界,主要關注ChatGPT對學術誠信、科學研究范式、倫理道德等帶來的影響。目前的相關研究主要集中在:第一,諸多期刊已對使用ChatGPT生成的作品作出明確限制。例如,2023年1月,Science雜志明確表明ChatGPT不可以列入作者,強調不能在作品中使用由任何人工智能工具(如ChatGPT)生成的數字、文本、圖形等[2];2023年2月,Nature雜志提出“人工智能改變了科學研究范式”,指出當前ChatGPT研究的“五大優先”事項[1];同月,《暨南學報(哲學社會科學版)》公布關于使用人工智能工具寫作的說明,指出不接受與ChatGPT聯合署名的作品。第二,大型語言模型對科學研究帶來的機遇與挑戰。例如,吳思遠等探討了ChatGPT對電池研究領域開展信息整合與獲取的機遇與挑戰[3];王樹義等指出ChatGPT給科研工作者帶來提高閱讀、寫作、編程效率等機遇,也帶來了數據真實性、安全性、隱私性等挑戰[4]。第三,ChatGPT自主生產內容引發的版權、倫理問題。例如,令小雄等試圖考證ChatGPT是否具有道德倫理偏差及其引起的科技及學術倫理問題[5]。目前,從學術出版全產業鏈出發,全面探討ChatGPT與學術出版結合的可能性,及其帶來的正面及負面效應的研究尚未多見。新技術是一把“雙刃劍”,ChatGPT既能給學術出版帶來機遇,又給學術出版帶來諸多風險與挑戰。因此,筆者認為有必要就“ChatGPT+學術出版”融合模式帶來的正面效應和負面效應進行分析,并提出一些應對策略。
一、ChatGPT、學術出版與“ChatGPT+學術出版”融合模式全產業鏈分析
全產業鏈分析指對一個產品或服務從原材料采購到最終用戶消費的全過程進行綜合分析,旨在揭示產品或服務的生命周期,以及其中各個環節存在的利潤分配、風險控制、資源利用和環境影響等方面的問題,以便為企業或政府部門進行規劃和決策提供依據。筆者將全產業鏈按上游、中游、下游環節分類[6]:第一,上游環節,通常是整個產業鏈的最初環節,包括原材料、加工、運輸等,這些環節對產品或服務的品質和成本有著重要的影響;第二,中游環節,通常是產品或服務的核心環節,包括研發、設計、加工、生產等,這些環節對產品或服務的品牌形象、市場份額和利潤有著重要的影響;第三,下游環節,通常是產品或服務的最終環節,包括銷售、服務等,這些環節對產品或服務的用戶滿意度和口碑評價有著重要的影響。筆者從全產業鏈維度綜合分析了ChatGPT和學術出版的全產業鏈,并在此基礎上提出了“ChatGPT+學術出版”融合模式,分析了該模式下ChatGPT對學術出版的正面效應與負面效應。
(一)ChatGPT全產業鏈分析
從全產業鏈維度看,ChatGPT的上游環節主要包括數據和組件。數據即幫助ChatGPT訓練模型、優化算法和提供服務的大量文本數據和語料庫,主要來源有互聯網數據、出版物(圖書、期刊、報紙)數據、社交媒體數據等。因此,數據的處理和管理在上游環節至關重要。組件主要包括高性能的計算機硬件、軟件等支持,自然語言處理、神經網絡等算法及機器學習模型的協同作用。該環節主要參與者有數據供應商、計算機軟硬件供應商。中游環節主要指與ChatGPT相關的業務范疇,是ChatGPT產品或服務的核心環節,主要是核心技術的設計和研發,即構建語言模型算法及技術的開發與研究,主要參與者有語言模型開發商、算法技術研究機構或個人。下游環節主要指ChatGPT相關的應用范疇,是ChatGPT產品或服務的最終環節,主要參與者有應用服務提供商、終端用戶。現階段,ChatGPT高度擬人化的對話回答模式給用戶帶來了較好的互動體驗,各行各業正在嘗試應用其助力研究或生產,并取得了一定的正面反饋。朱光輝等指出,ChatGPT很有可能重塑各行各業生態,改變人類思考或處理問題的方法,替代人類進行解答、創作、翻譯、咨詢等[7]。也就是說,ChatGPT有可能成為繼互聯網、智能手機后,人人都無法離開的工具。
(二)學術出版全產業鏈分析
學術出版指學術專著、論文、報告等出版物的生產、傳播、發行和銷售過程。學術出版上游環節主要指學術研究及作品創作的過程,是學術出版的核心環節,主要包括策劃選題、設計實驗、采集數據、分析結果、文本撰寫等,主要參與者有研究機構、研究團隊、研究個人等。此環節具有較強的自主創新性,一方面體現了作者的創造性,另一方面體現了作品的原創性。中游環節主要指學術作品的出版過程,主要包括作品的審閱、編輯加工、校對、排版、印刷、數字化等,主要參與者包括出版社、期刊編輯部、印刷企業、數字化服務商等。此環節具有較強的專業性、標準性、市場化等特征,屬于知識服務范疇。一是審稿專家的專業性,保證作品的學術質量;二是出版方的標準性,把握學術規范標準、把關學術誠信門檻;三是印刷企業或數字化服務商的市場化,將學術作品按照用戶市場需求進行紙質印刷或數字化呈現。下游環節主要指學術作品的傳播與應用過程,是學術出版的終端環節,主要包括學術作品的精準化推廣,用戶的便利性獲取,學術成果的轉化應用等,主要參與者包括圖書館、學術會議、數字服務商、用戶等,其中用戶是學術出版產業鏈的終端。此環節具有較強的服務特質,一是為學術作品提供精準化、普適化的推廣渠道;二是為用戶提供便利化、無障礙化的獲取和閱讀學術作品的渠道。
(三)“ChatGPT+學術出版”融合模式全產業鏈分析
筆者將“ChatGPT+學術出版”融合模式定義為將ChatGPT技術應用于學術出版全產業鏈的各個環節,實現研究設計、數據采集、作品創作、審閱、編輯、傳播、推廣應用等環節的智能化、高效化的運營體系。在上游環節,ChatGPT可以輔助作者進行文獻檢索、資料整理、初步分析等工作,提高研究效率,包括為作者提供創意靈感,協助作者撰寫論文、報告等。此外,ChatGPT還可以促進學術界進行跨學科、跨領域的交流與合作,該環節主要參與者包括研究機構、研究團隊、研究個人等。在中游環節,ChatGPT可以輔助審稿專家進行文獻評估、查重、語言潤色等工作,提高審稿質量和效率。此外,ChatGPT還可以協助編輯進行文章排版、校對等工作,提高編輯效率。ChatGPT通過與審稿專家和編輯的協同作業,有望提高學術作品的質量,該環節主要參與者包括出版社、期刊編輯部等。在下游環節,ChatGPT可以為出版社、編輯部等提供智能推薦服務,實現學術作品的精準推廣。ChatGPT可以為用戶提供個性化的閱讀體驗,如智能問答、知識圖譜等,提高用戶的閱讀興趣。此外,ChatGPT還可以助力學術成果的轉化應用,促進學術研究與實踐結合,該環節主要參與者包括數字服務商、用戶等。
綜上所述,“ChatGPT+學術出版”融合模式將人工智能技術與學術出版產業鏈相結合,實現學術研究、創作、審閱、編輯、傳播、推廣等環節的智能化、高效化。這一模式有望為學術界提供更加便捷、高質量的服務,推動學術出版的發展和創新。然而,這一模式也可能帶來一定的負面效應,如對學術創新的影響、對學術誠信的挑戰等。
二、“ChatGPT+學術出版”融合模式對學術出版的影響
從上文全產業鏈的角度來看,ChatGPT與學術出版存在著廣泛的聯系。其作為一種自然語言處理技術,在學術出版的各個環節中都能夠發揮重要作用。筆者嘗試將ChatGPT與學術出版結合,提出“ChatGPT+學術出版”融合模式,并對“ChatGPT+學術出版”融合模式對學術出版可能產生的正面效應及負面效應分別進行分析,旨在幫助學術出版從業人員了解ChatGPT服務的全貌和影響,推動國家制定合理的政策,促進學術出版的可持續發展。
(一)正面效應:促進學術出版數字化向智能化發展,賦能傳統產業轉型升級
1.“ChatGPT+學術出版”模式對學術出版上游環節的影響
第一,優化ChatGPT數據來源。該模式將學術出版的核心產物—學術作品作為ChatGPT的訓練數據主要來源,能夠提高ChatGPT生成內容的質量,使ChatGPT逐漸適應學術作品的創作思維、創作方式,這是ChatGPT應用于學術出版的基礎。第二,提高學術研究生產效率。ChatGPT通過對大量學術作品的分析,可以發掘其中的關鍵詞、研究熱點、研究主題等信息,幫助創作者進行資料查找、數據分析整合、策劃選題、構建規劃等,從而提高研究效率。第三,提升作品質量。ChatGPT可以為創作者提供自然語言處理相關的技術支持,用來輔助寫作、語法校對、圖片繪制、翻譯等。此外,ChatGPT還可以提供可信賴的參考文獻,從而提高創作者的寫作質量。
2.“ChatGPT+學術出版”模式對中游環節的影響
第一,輔助稿件篩選,優化審稿流程,提高審稿效率。ChatGPT通過分析已出版圖書或期刊的研究主題、研究方式、用戶,幫助出版社或期刊編輯部自動整理、篩選、分類大量來稿,輔助給出初審意見、匹配審稿專家等,從而提高審稿效率。第二,優化傳統編輯、校對、排版流程,提高作品質量及可讀性。ChatGPT通過對已有學術作品的學習和分析,可以輔助編輯進行稿件審閱,并提出修改意見;通過學習語法、用詞、標點等的標準用法,可以為校對人員提供技術支持,提高校對準確度;根據圖書或期刊格式要求,可以進行自動化排版,最大限度減少人為排版導致的錯誤。第三,基于用戶行為分析,制訂出版計劃,提高服務水平。ChatGPT可以通過對圖書或期刊的用戶進行行為分析,反向助推圖書或期刊的選題策劃,實現有針對性的出版,進一步提高出版社或期刊編輯部的服務水平。
3.“ChatGPT+學術出版”模式對下游環節的影響
第一,自動整合,推廣精品化。ChatGPT可以自動整合學術作品內容,對相關數據進行收集整理、構建模型與訓練、自動化挖掘和分析,從而推廣更準確、更有價值的學術資源。第二,自動檢索,智能化服務。ChatGPT可以根據用戶的閱讀習慣,為用戶提供更智能化的學術作品檢索、內容分析、知識推薦等服務,從而提高用戶的閱讀體驗和效率。此外,ChatGPT還可以為用戶提供相關的信息和建議,以幫助他們更好地理解和應用學術內容。
綜合以上分析,“ChatGPT+學術出版”融合模式下,出版社或期刊編輯部可以把ChatGPT當作更高效、更便捷的信息處理工具,從而更好地管理和推廣學術成果。ChatGPT賦能學術出版,可以加強作者、用戶、評審者之間的聯系,提高生產效率,創新學術交流方式,賦能傳統產業轉型升級。
(二)負面效應:引發新的學術倫理擔憂與挑戰,造成新技術應用與學術倫理間的失衡
基于前文分析,在“ChatGPT+學術出版”融合模式下,易引起以下幾個方面的負面效應。第一,數據的準確性、隱私性、安全性值得深思。ChatGPT的可靠性依賴于數據模型提供的當量知識及常識,其不了解數據庫認知范圍以外的一切事物,因此,ChatGPT在特定問題上有可能會提供錯誤信息、誤導內容或者不道德決策等。另外,ChatGPT具有人為參與的增強型學習能力,每位用戶均為ChatGPT的免費測試員,用戶每輸入一次信息就會對ChatGPT模型造成影響。用戶本次輸入的內容可能會作為其他用戶提出的問題的答案,對用戶個體來說,其數據安全性可能會受到潛在威脅。第二,學術誠信及版權爭議威脅,陷入抄襲與剽竊的怪圈。ChatGPT的語料庫訓練數據主要來源于學術出版物中的學術資源,其邏輯模型和數據模型也基于語料庫而建構,但其語料庫驅動存在一定缺陷。研究發現ChatGPT不具備因果關系的數理運算能力,其只能基于相似或相近數據進行概率匹配。雖然ChatGPT能夠生成復雜且極具說服力的文本,但是ChatGPT無法標示觀點、方法、結論等的具體出處或依據,用戶如果不假思索直接使用ChatGPT給出的內容,會不自覺地陷入抄襲與剽竊的怪圈。另外,如果ChatGPT給出的內容涉及版權問題,還有可能使用戶陷入版權糾紛。第三,新技術的盲目崇拜,學術研究創新性受阻。目前看來,ChatGPT在相對表層的常規文本或非專業領域能夠為有需求的用戶提供便捷幫助,但在需要較強創新性的專業領域,用戶不應陷入對新技術的盲目崇拜。研究者直接使用ChatGPT生成的材料,不但影響學術研究特有的原創特性,還會固化其思維,導致創新能力的缺失。
三、應對策略分析
(一)確保意識形態安全,加快檢測工具開發,健全監督體系
從真實性與科學性維度看,ChatGPT所生成的內容質量參差不齊,可能會干擾用戶獲取信息及觀點認知。從政治維度看,ChatGPT由美國OpenAI公司開發,如果不加管控,ChatGPT語料庫一旦受到“違意識形態投毒”,可能會帶來非常嚴重的意識形態安全問題。因此,現階段有關部門要做的不單是優化算法,更重要的是未雨綢繆,在國家層面、行業層面制定相應的法律法規、行業規范,有效規制、防范智能科技應用可能引發的意識形態安全隱患。學術界在應對潛在學術抄襲或剽竊等問題時,把握學術倫理的考量及其理性規約,加快有效檢測工具的研發。在有效檢測工具問世之前,學術界一要采取正向引導措施,鼓勵研究者公開自己在學術研究過程中是否使用ChatGPT,二要強化學術倫理培養,加強學術審核的力度,健全學術不端、學術誠信問題的問責機制,進一步完善相關規章制度。
(二)引導學術出版融入ChatGPT產業布局,賦能傳統學術出版協同轉型
《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》強調,實施“上云用數賦智”行動,推動數據賦能全產業鏈協同轉型。ChatGPT作為新一代人工智能技術的代表,應賦能學術出版轉型升級,推動傳統學術出版由數字化向智能化轉型。
“ChatGPT+學術出版”呈現的信息能夠滿足研究者的使用需求,提高工作效率、激發創新活力,加大引導學術出版商融入ChatGPT產業布局力度,形成“ChatGPT+學術出版”融合模式,更好地發揮ChatGPT在學術出版行業中的作用,以促進學術出版由數字化向智能化轉型,推動學術出版創新發展。第一,加大技術支持,鼓勵新型平臺研發。有關部門應鼓勵大型學術出版商與ChatGPT相關的技術公司合作,建立專業的技術團隊,開發更加智能化、高效的學術出版工具或平臺,為學術出版更好地提供技術支持。第二,打破產業壁壘,整合學術資源。目前,學術出版產業鏈上的各個環節仍然存在數據資源分散、信息孤島等問題,因此其要想更好地應用ChatGPT等技術,需要各個環節之間的協同配合,整合學術資源以實現數據的共享和資源的互通,從而更好地為研究者服務。第三,學術界應增強國際合作和信息共享,建立國際學術交流和合作平臺,促進學術出版的全球化和多元化發展。
(三)重視ChatGPT引起的數據安全隱患
筆者針對ChatGPT引入學術出版帶來的數據安全隱患問題,提出以下建議。第一,要強化版權保護。有關部門要將ChatGPT使用的源數據進行版權強化,例如對有版權的源數據利用區塊鏈技術設置數字簽名[8],當ChatGPT使用有版權的數據時,生成的內容上自動添加標識,從而提高用戶的版權意識。第二,要保護用戶隱私。為了防止用戶隱私泄露,ChatGPT需要經過用戶授權才能使用用戶個人數據,有關部門應開發個人隱私數據加密或隔離技術,確保用戶隱私信息安全儲存。第三,要加大系統審核與監督管理。有關部門要強化對ChatGPT生成內容的審核與監督管理,確保ChatGPT生成的內容導向正確,避免ChatGPT生成誤導信息,產生不良影響。
四、結語
ChatGPT作為高度發達的自然語言處理工具,對傳統學術出版的轉型升級發揮積極作用。同時伴隨技術的進步,有關部門也必須考慮以ChatGPT為代表的新一代人工智能技術帶來的包括學術倫理在內的對社會各方面的影響,如何將其更好地與傳統行業結合,如何更好地為人類社會服務,如何構建未來智能圖景,是值得深思的問題。
[參考文獻]
[1]VAN DIS E A M,BOLLEN J,ZUIDEMA W,et al.ChatGPT:five priorities for research[J]. Nature,2023(7947):224-226.
[2]THORP H H.ChatGPT is fun,but not an author[J].Science,2023(6630):313.
[3]吳思遠,王雪龍,肖睿娟,等.基于大型語言模型的工具對電池研究的機遇與挑戰[J].儲能科學與技術,2023(03):992-997.
[4]王樹義,張慶薇.ChatGPT給科研工作者帶來的機遇與挑戰[J].圖書館論壇,2023(03):109-118.
[5]令小雄,王鼎民,袁健.ChatGPT爆火后關于科技倫理及學術倫理的冷思考[J].新疆大學學報(哲學社會科學版),2023(04):123-136.
[6]張園,張叢,陶晴,等.基于全產業鏈視角的科技期刊出版產業優化探析[J].中國科技期刊研究,2022(03):289-295.
[7]朱光輝,王喜文.ChatGPT的運行模式、關鍵技術及未來圖景[J].新疆師范大學學報(哲學社會科學版),2023(04):113-122.
[8]譚曉荷, 沈秀.區塊鏈驅動科技期刊數字出版創新發展研究[J].出版與印刷,2023(01): 68-76.