
學術圖書出版在知識傳播、學術發展和社會進步中扮演著至關重要的角色,是連接知識生產者與知識消費者的重要橋梁。當今,人工智能(AI)已經在多個領域取得了顯著的進展,極大地改變了人們的生活方式和工作方式。人工智能技術在圖書出版行業的應用也引起了廣泛關注。2022年OpenAI公司的ChatGPT問世,成為生成式人工智能(AIGC)領域的突破性進展,很多專家學者認為當前人類已進入了“大模型時代”。在大模型時代,學術圖書出版面臨著新的機遇和挑戰,編輯的角色和工作方式正在發生變化。
01生成式人工智能創作的特點
ChatGPT基于GPT-3架構,具有極高的自然語言生成和理解能力,能夠生成連貫、流暢且符合上下文的文本,同時優異的多輪對話能力也體現了大模型強大的泛化性、交互性能力。2023年3月14日,OpenAI發布GPT-4。其不僅可以對文本進行處理和分析,還可以處理圖像、音頻和視頻等多種模態的數據,且在對話交互和情感分析方面有了進一步提升。
創造性和多樣性
AIGC(如GPT系列),通過學習大量的文本數據,能夠模仿人類的創作風格和思維過程,從而產生原創性的、連貫的、有邏輯的文本內容,這些內容在風格、主題和結構上可以呈現出多樣性。它不限于復制現有文本,而是能夠根據給定的上下文或條件生成多種風格和主題的文本。這種多樣性不僅體現在語言風格上,還包括對不同文化、歷史背景和情境的了解。
風格模仿與遷移
AIGC在模仿特定風格方面的能力非常強大,這主要得益于其深度學習和機器學習的技術基礎。AIGC可以學習并模仿特定的寫作風格,無論是正式的學術論文、輕松的博客文章還是具有特定作者特色的文學作品,AIGC都能夠生成風格相似的文本。AIGC還可以應用風格遷移技術,將一種風格的特征應用到另一種內容上。例如,可以將梵高的畫風應用到普通照片上,或者將古典音樂的風格遷移到現代流行歌曲中。
個性化生成
AIGC在個性化生成方面展現出了強大的能力。可以根據用戶的需求和偏好生成個性化的文本,例如,為特定讀者群體定制內容,或者根據讀者的歷史行為和興趣生成推薦。除了文本,AIGC還能夠處理圖像、音頻和視頻等多模態數據,生成具有特定風格和情感的多媒體內容。例如,OpenAI推出的Sora模型可以根據文本提示生成視頻,這在個性化內容創作方面開辟了新的可能性。
實時互動
在聊天機器人和虛擬助手等應用中,AIGC能夠實時生成回應,與用戶進行流暢的對話交流。如ChatGPT能夠進行個性化的對話,根據用戶的輸入調整其回應的風格、語氣和內容,使得交流更加自然和個性化。這種能力使得AI能夠更好地模擬人類對話,提供更加人性化的服務。一些大模型被設計得具有情感和記憶功能,能夠在對話中模擬情感反應,并在一定程度上記住之前的交流內容,從而提供更加連貫和個性化的交互體驗。
可控性
AIGC模型通常包含大量的可調參數,這些參數可以影響模型的學習過程和生成結果。例如,在自然語言處理中,可以通過調整模型的“溫度”參數來控制生成文本的創造性和多樣性。較低的溫度值會產生更可預測、更一致的文本,而較高的溫度值則會增加文本的隨機性和創新性。在ChatGPT中,上下文信息對于生成內容的可控性至關重要。模型可以根據輸入的上下文信息(如前文、后文、任務樣例等)進行學習和預測,從而生成與上下文相關且符合預期的內容。此外,通過人類反饋,可以對AIGC模型進行微調,使其更好地理解人類意圖并生成更符合人類偏好的內容。
局限性與風險
盡管AIGC在內容生成方面取得了顯著進展,但仍存在一些局限性和潛在風險:AI生成的內容可能涉及知識產權和版權問題,如何界定AI生成作品的版權歸屬和使用權是一個復雜的問題。由于其數據依賴性、算法透明度和可解釋性不足,以及技術濫用等原因,使其生成的內容可能存在信息不透明及虛假信息泛濫、偏見和錯誤的價值觀等倫理和道德風險。為了應對這些局限性和風險,需要在發展技術的同時,加強倫理指導、完善法律法規、提高公眾意識,并在教育和培訓中強調AI技術的負責任使用。
02生成式人工智能對學術圖書出版的助力與挑戰
學術圖書的策劃、編輯與出版是一項專業性很強的工作。學術圖書編輯需要具備良好的策劃能力,能夠根據市場需求和學術發展趨勢,策劃有價值、有影響力的學術圖書項目,涉及選題的確定、作者的邀請、內容的組織和結構的安排等。學術圖書編輯通常需要具備深厚的專業知識背景,以便更好地理解和處理學術內容;需要對相關學科領域有深入的了解,能夠準確把握學術研究的前沿動態和學術規范。學術圖書的編輯工作要求高度的嚴謹性,編輯需要對文本進行細致的校對和審核,確保內容的準確性、邏輯性和科學性。
AIGC在學術作品創作中的應用是一個新興領域,它涉及利用AI技術自動生成文本、圖像、音頻、視頻等多種類型的內容。這一技術的發展給學術生產和出版領域帶來了深遠的影響,同時也給知識產權、學術誠信、內容質量等方面帶來了風險和挑戰。
人工智能技術對學術圖書出版全流程的助力
助力選題策劃
AI技術通過對大量學術作品的分析,可以發掘其中的關鍵詞、研究熱點、研究主題等信息,幫助創作者進行資料查找、數據分析整合、策劃選題、構建規劃等,從而提高研究效率。通過分析市場趨勢、讀者偏好和行為數據,可以預測未來可能流行的主題和趨勢,幫助出版機構提前布局,抓住市場先機。AIGC可以輔助編輯生成初步的內容草稿,為編輯提供創意支持,激發創作靈感。通過讀者畫像,輔助編輯更精準地定位目標讀者,策劃符合其需求的內容。還可以輔助進行風險評估,構建風險預警系統,及時調整選題策略。
助力出版過程
智能編校就是利用AI技術,特別是自然語言處理(NLP)和機器學習算法,來輔助或自動化編輯和校對工作的工具。這些自動化校對工具可以自動檢測和校正稿件中的拼寫錯誤、語法錯誤和標點符號問題等;自然語言處理軟件可以在實時編輯過程中識別錯誤;通過設置關鍵詞過濾和敏感內容識別,智能校對系統可以自動標記出可能的問題內容,供編輯進一步審核,使審校工作更加高效。此外,還包括智能排版、融合出版和按需印刷等全流程數字化。
助力市場營銷和版權保護
AI技術可優化和自動化處理圖書的營銷和發行過程,以提高效率、增強用戶體驗和提升銷售業績。這種模式結合了大數據、機器學習、自然語言處理(NLP)、計算機視覺等先進技術,旨在實現更加精準的市場定位、個性化的內容創作、自動化的廣告投放和實時的效果監測。在內容傳播方面,可以加強與生產、消費的實時互動;在內容消費方面,可以創新高度匹配、個性化消費模式。AI技術可以幫助出版社管理和追蹤圖書的版權信息,確保版權的合法使用,防止侵權行為。
人工智能技術給學術圖書出版帶來的挑戰和潛在風險
難以審核作品的原創性
AIGC可以輔助學者進行文獻綜述、數據分析、實驗設計等研究工作,甚至在某些情況下能夠生成具有一定深度和廣度的學術論文,這可能導致作者將AI生成的內容誤認為是自己的原創內容,違反了學術誠信的原則。例如,OpenAI的GPT系列模型能夠根據給定的主題和結構生成連貫、邏輯性強的文本。有研究顯示,ChatGPT撰寫的50篇文章中,有40篇表現出優秀的原創水平。傳統的抄襲檢測工具可能無法有效識別AI生成的內容,這給學術圖書的審稿和編輯工作提出了新的挑戰。
難以界定作品的知識產權
AIGC生成作品的版權歸屬、署名權以及是否構成作品抄襲等問題,是學術界和法律界正在探討的問題。一些學者認為,AI生成的內容應當享有知識產權保護,而另一些學者則認為AI生成的內容不應被視為作品。截止到2023年10月,全球最大的圖書商城亞馬遜上統計ChatGPT作為作者的圖書就已經高達1024本。然而與此同時,在學術出版領域中,許多大型出版機構對此紛紛更新了收稿要求,禁止或限制使用ChatGPT生成作品。如2023年1月,Saence雜志明確表明不可以將ChatGPT列為作者,規定不能在作品中使用由AI工具(如ChatGPT)生成的數字、文本、圖像等,國內的某些期刊,包括《天津師范大學學報(基礎教育版)》《暨南學報(哲學社會科學版)》等,也明確提出不接受與ChatGPT聯合署名的作品。理由是ChatGPT不能對出版物承擔有意義的責任,不能為其工作主張知識產權。
存在不易辨識的科學性錯誤
AIGC無法自主判斷信息的真實性,它只是根據訓練數據生成內容。如果訓練數據中包含錯誤或過時的信息,AI可能會生成不準確或誤導性的內容。AIGC的算法通常被認為是“黑箱”,由其生成的內容可能缺乏對原文獻的引用,使用者難以追蹤和糾正這些錯誤,可能導致信息不透明及虛假信息泛濫。如果作者未對創作過程中使用了AI輔助的作品進行嚴格審核的話,作品將在科學性方面存在較大隱患,為編輯的審稿工作帶來較大困難。
隱含意識形態風險
由于設計者和使用者的價值偏差、技術和算法蘊含的政治偏差以及應用場景的多元性,AIGC極易誘發意識形態風險。如ChatGPT其內容生成模式高度依賴于數據庫構建與人工邏輯訓練。這意味著AI生成的內容往往反映了訓練數據的偏向和訓練者、使用者的價值觀。如果AI系統在特定文化或價值觀下訓練,它可能會在輸出內容時傾向于傳播這些特定的文化和價值觀;AI系統可能會在生成內容時表現出算法偏見,這可能源于訓練數據中的偏見或開發者的主觀意圖。這種偏見可能導致生成的內容在性別、種族、宗教等方面存在歧視。南京大學社會學院的馬文、陳云松的最新研究顯示:無論是ChatGPT還是“文心一言”,都更偏向美國文化背景和其推崇的主流價值觀,并沒有充分展現基于中國文化主體性的價值觀;這些價值判斷并沒有社會事實依據,而是直接復制已存在于互聯網海量語料中的根深蒂固的態度傾向,說明目前版本的AIGC尚未產生近似于人類的邏輯思考能力。研究還發現,即便是主要建立在中文語料之上的“文心一言”,但由于中文互聯網“時空折疊”的特征,也會產生一定程度的文化偏向。這種隱含的偏見和錯誤的價值觀,極易造成圖書意識形態風險,為編輯的審稿工作帶來了新的挑戰。
03大模型時代編輯素養提升建議
2023年10月18日在北京召開的“出版、發行與大模型應用高端論壇”上,與會專家學者指出:從出版業的發展歷程看,每次出版業大的變革,都離不開技術的創新。當AIGC這樣顛覆性的技術出現時,出版人既要積極擁抱新技術,也要密切關注其發展,解決新問題,把它利用好。作為學術圖書編輯,建議從以下幾方面提升自身的基本素養、新技術應用能力和創新思維,以適應大模型時代的新要求。
提升政治理論素養
在大模型時代,編輯的政治理論素養尤為重要,這不僅關系到出版物的質量和導向,也是維護社會穩定和文化安全的關鍵。第一,政治立場堅定,堅持深入學習習近平新時代中國特色社會主義思想,確保出版物內容符合國家法律法規和社會主義核心價值觀。第二,具備高度的意識形態敏感性,能夠識別和抵制錯誤思想和不良信息,確保出版物內容的正面導向。第三,打開國際視野、提升文化自信,積極傳承和弘揚中華優秀傳統文化,同時吸收借鑒人類文明的優秀成果,推動文化創新,能夠在國際交流中準確傳達中國聲音,展現中國形象。
加強倫理和法律意識
編輯應加強法律意識,確保所有使用的內容(包括文本、圖片、音頻、視頻等)都已獲得合法授權,防止學術不端行為,如抄襲、偽造數據等。編輯應遵循職業道德,抵制不道德的內容,如色情、暴力、歧視等,確保出版物內容符合社會倫理標準。在使用AI工具輔助圖書宣傳時,要對生成的內容進行核實,確保內容觀點的公正性和客觀性,避免傳播偏見和錯誤信息。
拓展學術能力和跨學科知識
學術編輯需要具備深入學習和研究的能力,以便理解最新的學術研究成果和理論發展,確保出版物的學術質量和前沿性。能夠準確判斷稿件的學術價值和創新性。同時.需要不斷更新知識,跟蹤學術前沿,以便更好地了解和評估稿件內容。在大模型時代,編輯需要具備跨學科知識,以便更好地掌握和利用AI技術,以及處理和整合來自不同領域的信息。
具備適應新技術的終身學習能力
隨著AI技術的應用,編輯需要熟悉相關的技術工具,如學習和掌握AIGC工具的使用,了解其工作原理和應用場景,以便更好地利用這些工具優化選題策劃、進行自動化校對,提高工作效率和內容質量;編輯應更加關注用戶需求,能夠利用AI技術進行個性化推薦和定制化內容,提升讀者體驗,增強用戶黏性和滿意度;能夠結合AI技術創造新的出版形式和內容,如互動式故事、多媒體融合出版物等,以吸引和保持讀者的興趣。建議參加相關的技術培訓和研討會,了解最新的AI技術和行業動態,保持對新技術的敏感性和適應性。總之,要具備終身學習的能力,保持對新技術、新趨勢的持續關注和學習,以便不斷適應出版業的快速變化。
在大模型時代,學術圖書編輯不僅需要傳統的編輯技能,還需要適應新技術,不斷提升自身的綜合素質。展望未來,應繼續深化對AI技術的學習,探索其在學術出版領域的更多應用,同時加強對AI生成內容的審核和質量控制。還應與技術開發者、法律專家和倫理學者緊密合作,共同制定行業標準和規范,以確保學術出版的質量和公信力,推動學術出版業的健康發展。
作者簡介:
徐珊,女,漢,山東省泰安市人,編輯,碩士研究生,研究方向:醫學圖書編輯出版。