溫亞旭 白立華 郭雪吟
摘 要 2023年可以被稱為AIGC與我國出版行業全面融合的發展元年,AIGC技術將為出版融合帶來更大的發展空間。文章基于國家新聞出版署融合出版智能服務與標準重點實驗室在AIGC上的探索與實踐,闡述了AIGC在出版全流程,包括選題策劃、內容創作、編輯加工與審校、發行營銷以及讀者服務中起到的關鍵作用。同時,分析了當前AIGC技術應用于出版行業存在的問題與風險。隨著AIGC技術的進一步完善,出版業應該積極擁抱變化、謀求創新,在AIGC的引領下駛向智慧融合發展的新紀元,煥發出新的活力與生機,全面實現轉型升級。
關鍵詞 AIGC;出版融合;出版流程;實踐應用
2022年末,ChatGPT猶如一顆璀璨的流星劃破科技長空,其引領的人工智能生成內容技術(Artificial Intelligence Generated Content,AIGC)應用風暴瞬間席卷全球,宣告生成式人工智能新時代的到來。AIGC不僅代表著AI技術從單純的感知、理解世界躍升至能夠自主生成、創造世界的全新境界,更是一次劃時代的人工智能算法突破。這一革命性的飛躍,意味著人類對人工智能的運用已徹底擺脫了單一功能的束縛,真正步入了全面通用的新紀元。在這一年多的時間里,我們目睹了AIGC技術為各行各業帶來前所未有的賦能與變革。不僅各行各業紛紛投身于AIGC應用場景的探索之中,更在嘗試利用這一技術推動數字化與智能化的飛速發展。而在這股潮流中,出版行業也并未置身事外,同樣在積極尋求AIGC技術的融合與創新,以期在新的時代背景下實現更大的突破與發展。
目前,關于AIGC的概念尚無統一規范的定義。國內產學研各界對于AIGC的理解是繼專業生成內容和用戶生成內容之后,利用人工智能技術生成內容的新興生產方式。在國際上的對應術語是“人工智能合成媒體”(AI-Generated Media or Synthetic Media),即“通過人工智能算法對數據或媒體進行生產、修改及操控的合并”[1]。中國信通院與京東探索研究院聯合發布的《人工智能生成內容(AIGC)白皮書》將AIGC表述為兩個不同方面的概念,從內容生產者角度而言,可以認為是采用人工智能模型生成的內容;從技術角度而言,指向根據人類的指令自動生成內容的一類技術集合[2]。
出版業作為文化傳承、知識傳播的關鍵通道,與AIGC的創新結合,不但標志著技術的革新,更預示著出版行業的深刻變革與全新機遇。AIGC,將促進出版業從選題策劃、內容創作、編輯加工與審校到發行營銷、讀者服務等各個關鍵節點發生顯著變化,將有力地助推出版融合的轉型發展。同時,AIGC在出版領域的應用也面臨諸多挑戰,亟須探討和尋找解決方案。本文將以國家新聞出版署融合出版智能服務技術與標準重點實驗室(以下簡稱“實驗室”)在出版融合領域的AIGC實踐為基礎,探析AIGC技術在出版融合發展中的作用與功能以及存在的相關風險與挑戰。
1 AIGC在出版流程中的應用創新
出版分為“編、印、發”這幾個關鍵節點。當前,AIGC已經可以深度參與每一環節的工作。AIGC深度賦能出版業的發展,能夠顯著增強出版內容的品質和水準,優化迭代出版業傳統人力工作,重塑出版流程,帶動出版整體效率的提升,同時能為讀者提供更加精準、高效、開放、智能的圖書服務,從而為出版融合的持續發展提供強有力的支撐與推動。對此,實驗室于2023年底研發了出版行業首個AIGC大模型BOOKSGPT并以此為底層架構推出了AI編輯工作室,其中包含了龐大且功能齊全的AIGC助理,他們將深入參與到出版的這幾個關鍵環節,讓出版流程及編輯工作更加高效、智能。
1.1 選題策劃環節
選題策劃作為編輯工作的重要環節,是編輯人員基于全面考量與深入洞察,結合主觀智慧與客觀條件,所開展的一場極具創意的活動。選題策劃是圖書出版工作開展的最初階段,不僅是整個圖書出版工作的基礎,也是整個圖書出版工作的靈魂。根據《全國新書首發中心2023年度新書市場報告》顯示,2023年全國上市新書18.36萬種,出版選題總量與圖書出版單位責任編輯的人數之間存在顯著的不平衡。這種懸殊的對比,凸顯了在沒有聚合型、智慧化數據系統或平臺作為支撐的情況下,責任編輯想要進行全面的、多層次的、深入且廣泛的選題調研,以及高效地完成選題策劃工作,所需付出的時間與精力之巨大[3]。因為,選題策劃基本依賴編輯的個人經驗和直覺,加上廣泛地收集各種熱點和信息,通過組織論證分析進行的。恰恰缺少最重要的一環:沒有聽到讀者的聲音。究其原因,是因為多年來出版一直處于“生產到發行”的單向投送,未形成“生產到發行到再生產”的閉環。這樣的選題策劃缺乏有效大數據的支撐和分析。因此,在選題策劃階段,AIGC技術不僅可以幫助編輯與出版單位完成對產品標簽、關鍵賣點標簽、銷售數據標簽、讀者用戶標簽的數據整合,還能夠參與需求調研、競品分析、作譯者挖掘、選題材料撰寫等工作。在AIGC技術的賦能下,通過“專業經驗+客觀數據”指導而誕生的圖書,將更加符合市場,并且投向精準,兼具“引領性以及滿足讀者需求”。例如,在實驗室研發的AI編輯工作室中,針對出版單位在選題策劃中的痛點、難點,打造了數智化資訊助理、選題策劃助理。一方面,讓AIGC代替了以往人工的數據查找、收集和分析,幫助編輯和出版單位收集讀者需求偏好,瀏覽最新資訊、了解行業動態、解讀圖書榜單,為圖書選題做好相關信息儲備;另一方面,讓AIGC幫助編輯做自動化的市場研究、競品分析,替代編輯撰寫翔實、完整的選題報告。測試結果顯示,整個環節提效達到70%~80%,大幅節省了編輯的時間,釋放了人力資源成本。
1.2 內容創作環節
出版的精髓在于內容,無論媒介如何更迭,印刷技術如何演進,出版形式如何轉變,內容始終是決定勝負的核心要素。在傳統的內容創作過程中,作者主要依賴自己豐富的生活經驗與深厚的知識積淀,再結合廣泛查閱所有的相關資料,以自身獨特的語言風格來創作出作品。在AIGC的強大賦能之下,內容創作將迎來前所未有的便捷與高效。AIGC不僅能在提綱撰寫、素材準備、內容創作、文字潤色、邏輯優化等多個關鍵環節為作者提供深度助力,更能憑借其對海量信息的深度分析與挖掘,為作者提供豐富且關聯性強的案例,從而協助作者拓寬視野、深化思考,使內容創作達到前所未有的高度與深度。不光是對于作者,內容創作對于編輯來說,也是一項非常繁重的工作。編輯需要花費大量的時間和作者一起構思圖書的大綱、思考故事應該如何推進、為圖書文稿做潤色加工,還需要為圖書生產插圖、封面圖等各種類型的圖片,甚至還需要為圖書撰寫適配各渠道的書評。對此,實驗室也開發了幾位數字創作者,以匹配圖書創作和細分領域的創作需求。首先是AI作者,它可以幫助編輯和作者撰寫提綱、創作內容、準備素材、加工潤色、優化稿件結構。有別于通用大模型的寫作能力,其大模型對標的是名家名著、優秀作品集,是用這些素材進行的底層訓練,所以在保證作品原創性的同時,還能保證產出物的品質,顯著減少了編輯的二次工作量。測試下來,AI作者可以節省人類作者73%的寫作時間,非常高產。其次是AI美編,AI美編具備迅速、低成本地創作和圖書相關的各種類型圖片的能力,出圖效果媲美有5~8年經驗的美編,速度快、質量高、成本低,可以輔助設計師高效地設計出美觀、易讀、符合規范的封面、插圖,輔助進行版式設計和排版,提高設計效率和品質,還可以通過對大量設計案例的學習和分析,使用自然語言處理和機器學習技術,在設計圖書封面和插圖之前,了解書籍的主題、內容和目標受眾,根據用戶提供的需求和設計要求,自動生成符合設計規范和主題的設計方案。再次是AI譯者,外版書出版有兩個痛點,翻譯周期長和翻譯質量良莠不齊,這嚴重制約了外版書的出版效益。目前,實驗室的AI譯者僅需2分鐘即可翻譯完成3 000字外文內容,有別于谷歌、有道一類的翻譯軟件,AI譯者能很好地保留原文稿的語言風格和思想內核,媲美人工翻譯,還能保持原文檔的格式輸出,便于比對,也減少重新排版的時間??梢哉f,AIGC工具不僅大幅提升了翻譯的效率,也極大提升了譯稿質量,縮短了整個出版周期。當然,人工智能在內容創作領域的飛速進展,固然令人矚目,但這絕不意味著AIGC能夠全面取代人類的作者與編輯。人類所擁有的高階思維能力,諸如豐富的想象力和獨到的審美,都是目前僅依賴代碼與程序創作的AI所無法企及的。然而,AIGC的應用確實在很大程度上釋放了生產力,它促使作者和編輯的角色轉型,使他們能夠更專注于挖掘深層次的創意與策劃,從而引領內容創作進入全新的時代[4]。
1.3 編輯加工及審校環節
近年來,隨著出版單位面臨的編輯審校工作壓力日益攀升,編輯被迫在繁重的任務中掙扎,難以抽出更多時間和精力投入選題策劃與推廣之中。這種現狀不僅阻礙了編輯的個人成長,也限制了出版業務的長遠發展。因此,如何深度挖掘和有效利用AIGC技術的潛能,將其巧妙地融入編輯加工及審校環節中,成為當前關注的焦點。出版業迫切需要借助AIGC技術的力量,進一步解放編輯的生產力,推動出版業從依賴人力資源的傳統模式,邁向智能化、高效化的新時代。傳統的校對軟件功能局限且淺顯,只能糾正錯別字和標點錯誤,對編輯和校對人員而言,不過是杯水車薪,無法從根本上為他們卸下重負。然而,隨著AIGC技術的突飛猛進,編校工作將迎來革命性變革。人工智能不僅可以勝任查重等基礎任務,更能深入文本內核,精準捕捉不當搭配、邏輯瑕疵,甚至能夠敏銳地發現圖表中的數據錯誤。更值得一提的是,它們還能智能指導排版,讓版面煥然一新。有了它的加持,編校人員將徹底擺脫瑣碎工作的束縛,得以全身心投入選題策劃、內容創新等更具挑戰性和價值的工作中[5]。對此,實驗室充分響應出版單位“提升審核效率”“改進響應時間”“壓縮審校成本”的訴求,研發出了適合出版行業的、趕超市面上自動校對軟件的AI審校工具。這套工具已創建了上萬個獨立知識體,整合了100 T的專業語料數據,構建了專業的出版審校知識體系。它能做到針對文本內容,進行多重維度的識別和計算,發揮大模型的優勢,像人一樣地去理解全文。根據測試,審校工具萬字審校時間小于10分鐘,誤報率小于500%,可檢查出15種知識差錯,18種內容風險,而普通校對軟件僅能檢測出不到10種。一般10萬字的書稿,人工審校一次大約需要2~3天左右,但AI審校無需人工參與,不占用編輯時間,AI處理完成后編輯僅需選擇是否采納即可,這顯著提升了編輯的審校效率。
1.4 發行營銷環節
通過審校后,圖書下印上市。在傳統營銷中,出版社需要手動撰寫適配多個平臺的文案,需耗費數小時,且平臺規則又不是很清楚,耗費大量時間。但是在AIGC技術的加持下,后端營銷工作可以變得更為科學,圍繞數據和營銷效果做更加科學的決策。例如,當前實驗室已訓練出非常成熟的發行營銷AI助理,不僅能幫助出版單位在各個新媒體渠道進行營銷推廣,實現即時營銷文案撰寫、短視頻和直播內容自動生成、平臺運營政策快問快查,更能通過算力對大數據進行分析計算,精準描繪用戶畫像,以達到讀者進行個性化推送的最終效果。
1.5 讀者服務環節
經過以上環節的圖書到達讀者手中了,如何給讀者提供后續的圖書服務?AIGC技術同樣大有可為。AIGC文本生成技術能實現內容的視覺化呈現,以更加生動有趣、簡潔易懂的方式展示和解讀知識,突破出版單一單向傳播的桎梏,增加與讀者的互動交流,幫助讀者深度理解。未來,尤其是與VR、AR等技術的結合應用,極大地豐富了閱讀形態和內容呈現方式,讓讀者全方位立體式感受圖書內容,提高了讀者主動閱讀的興趣。例如,過去幾年,實驗室的核心產品RAYS平臺一直在通過智能二維碼匹配圖文、音視頻等內容,把傳統圖書改造為“現代紙書”。但2023年年初,實驗室對其中做了一項重大調整,推出了服務讀者的輔助閱讀產品“書小二數字人”。匹配在每本圖書上的數字人,可以就本書內容隨時和讀者答疑解惑,交流互動,即時問答,高效閱讀,特別在教育類圖書和學術類圖書上,解析、速讀等功能深受讀者的歡迎。它充分突破了傳統多媒體資源的桎梏,讓讀者與圖書產生更深一步的聯動。
2 AIGC在推動出版融合發展中存在的風險與挑戰
AIGC技術為出版融合發展提供了強有力的技術支撐,然而其在應用的過程中仍然面臨諸如內容質量、版權保護、道德風險等方面的相關風險與挑戰。
2.1 內容質量問題
AIGC過度參與編輯工作可能導致內容虛假、同質化等問題,在內容虛假上,一方面AIGC的算法并不是永遠正確,例如,在谷歌的發布會上,人工智能聊天機器人Bard在萬眾矚目中上演了一出尷尬的失誤。它自信滿滿地宣稱太陽系外行星的首張照片出自JWST之手,然而這一說法瞬間被戳破。事實上,這一里程碑式的照片早在2004年便由歐洲南方天文臺的Very Large Telescope(VLT)捕捉。這一錯誤猶如一枚重磅炸彈,在資本市場掀起軒然大波,直接導致谷歌股價暴跌,揭示了人工智能在信息處理與核實方面的脆弱性[6];另一方面,人工智能在文本理解方面仍停留在表層,未能深入把握深層次的語義與語境,這種局限性制約了其生成內容的創意與靈活性,使得其輸出往往顯得機械與刻板[7]。因此,對于內容嚴謹規范的出版業來說,合理利用AIGC,反復核實AIGC生成內容的正確性是非常必要的。在內容同質化的問題上,AIGC所面臨的挑戰也日益凸顯。由于其在處理相同或相似話題時傾向于輸出相似的結果,這導致文章、書籍在內容層面變得愈發雷同,缺乏獨特性和創新性,嚴重制約了出版業的多樣性和發展活力。因此,出版業更需要通過人類的主導與把關,來克服算法的薄弱環節,確保AIGC生成的內容質量。
2.2 版權保護問題
基于AIGC對于出版行業的重大影響,關于AIGC的版權保護問題也成了業界關注的焦點。但是,對于AIGC是否有必要在版權上予以保護、保護的條件以及保護的路徑等問題,當前仍然存在許多爭議。一方面,人工智能并不具備我國著作權法規范中“作者”的主體資格;另一方面,著作權法的核心是“內容是否為獨創性和智力成果”,而人工智能生成的內容到底是由機器人自動生成還是人主導生成,目前還未準確界定。因此,AIGC生成內容作者身份的定義,版權歸屬等問題還需要進一步規范。無論是基于財產論、勞動價值論,還是知識產權激勵論,我們都堅定認可人工智能生成內容的可保護性。這些內容的誕生,背后匯聚了人工智能編程設計者、使用者、所有者等眾多主體的智慧與辛勞。唯有賦予其版權保護,方能確保相關主體的投入成本得到合理回報,進而實現這些內容的經濟價值與文化價值的最大化。此舉不僅能激發各方主體進一步開發、應用人工智能的積極性,更能推動人工智能技術的持續創新與發展,催生更多、更優質的內容問世。倘若縱容隨意使用、抄襲、傳播的行為泛濫,這必將沉重打擊相關主體的積極性,對新作品的創作和人工智能產業的蓬勃發展構成嚴重威脅。這種不負責任的行為不僅玷污了原創者的勞動成果,更可能扼殺掉整個行業的創新活力與前進動力。
2.3 道德風險問題
AIGC的運行離不開龐大的數據支撐,以進行深度的訓練與學習。然而,在海量的數據中,有可能隱藏著一些敏感的個人信息或隱私內容,甚至可能包含未經明確授權便使用的參考數據[8]。這些問題使得AIGC在追求技術革新的同時,也不得不面對數據隱私保護所帶來的重大挑戰。如何在推進技術進步的同時,確保數據隱私的安全與合規,成為AIGC發展中亟待解決的重要課題。同時,AIGC生成的內容還可能存在種族歧視、性別歧視等道德問題。舉例來說,研究人員在實驗中要求多個大型模型為不同性別、性取向和文化背景的人群創作故事,然而,他們發現這些模型在角色分配上卻展現出了令人震驚的性別偏見。這些模型幾乎無一例外地將那些具有多樣性且社會地位崇高的工作角色賦予了男性,而女性則往往被限定在傳統上被低估或帶有負面標簽的角色中。這一發現不僅凸顯了大型模型在性別和文化背景處理上的重大缺陷,更引發了關于如何徹底改革和優化這些模型,以使其能夠更真實、更全面地反映社會多元化的廣泛討論和深刻反思。
3 結語
當前,AIGC并不能完全替代編輯工作,但可以成為他們的好幫手,助力整個出版流程的降本、提質、增效。未來,AIGC的應用場景將會進一步多元化,涉及領域會更加全面,將進一步朝著實現獨立完成內容創作的方向邁進,存在的風險與挑戰也將隨著技術的進步以及相關法律法規制度的完善而得到解決。出版業,作為科學、文化、教育傳播的核心陣地,其重要性不言而喻。在AIGC技術的浪潮中,出版業將扮演關鍵角色,成為這一先進技術的主要應用領域之一。同時,出版業還承載著內容質量把控、版權保護捍衛以及道德風險界定的歷史使命,必將成為重要探索者和引領者,為技術的持續發展和創新注入強大動力?!昂媳е?,生于毫末;九層之臺,起于累土”,只要出版業能夠充分擁抱變化、謀求創新,AIGC將讓出版業煥發新的活力與
生機。
(責任編輯:翟艷榮)
參考文獻
[1] KRIZHEVSKY A,SUTSKEVER I,HINTON G.ImageNet Classification with Deep Convolutional Neural Networks[J].Advances in Neural Information Processing Systems,2012.
[2] 中國信息通信研究院,京東探索研究院.人工智能生成內容(AIGC)白皮書[R/OL].(2022-09-02)[2024-04-03].http://www.caict.ac.cn/english/research/whitepapers/202211/P020221111501862950279.pdf.
[3] 顏小虎,紀蕾.人工智能賦能出版知識服務的創新路徑[J].出版廣角,2023(23):38-43.
[4] 孫興麗.人工智能賦能數字出版的探索[J].采寫編,2024(1):122-124.
[5] 黃月蛟.我國出版業在人工智能時代的創新與探索[J].文化產業,2024(1):57-59.
[6] 彭家雨,徐鵬.AIGC對數字出版的機遇與挑戰[EB/OL].[2024-04-03].https://www.iii.tsinghua.edu.cn/info/1131/3323.htm?eqid=e128de32000b9cd500000005647409dd.
[7] 段永杰,李彤.數字出版中AIGC生成物的應用場景及其倫理規則[J].出版科學,2023,31(6):84-93.
[8] 黃曉潔.AIGC在出版行業中的實際應用[J].出版廣角,2024(2):80-82.
Analysis on the Application of Artificial Intelligence Generation Content Technology (AIGC) in the Development of Publishing Integration
Yaxu Wen1,2Lihua Bai1,3Xueyin Guo1,3
1.Key Laboratory of Integrated Publishing Intelligent Service Technology and Standards of National Press and Publication Administration,Wuhan 430070,China;2.Zhejiang University Press,Hangzhou 310063,China;3.Wuhan University of Technology,Wuhan 430070,China
Abstract AIGC technology will bring greater development space for the integration of publishing.Based on the exploration and practice of AIGC in the Key Laboratory of Integrated Publishing Intelligent Services and Standards of the National Press and Publication Administration,this article expounds the key role of AIGC in the whole process of publishing, including topic planning,content creation,editing,processing and proofreading,distribution and marketing,and reader service.At the same time,the problems and risks of the current AIGC technology applied in the publishing industry are analyzed.With the further improvement of AIGC technology,the publishing industry should actively embrace changes and seek innovation,and sail to a new era of wisdom development under the guidance of AIGC integration,radiate new vitality and vitality,and fully realize transformation and upgrading.
Keywords AIGC;Publishing integration;Publishing process;Practical application