范波 賈廣勝 范林海 裴恒利 張一媚 湯興恒
摘 要:快速發展的人工智能技術正推動傳統出版業進入新時代。文章從人工智能技術在傳統出版業的應用分析出發,對人工智能與傳統出版業相融合的應用現狀、應用探索等做出具體分析。面對人工智能對傳統出版業帶來的機遇與挑戰,應積極探索人工智能與傳統出版業融合發展新平臺——出版產業大腦的建設,以實現出版產業的創新產出和轉型發展,推動出版業向更高質量發展。
關鍵詞:人工智能 出版產業大腦 傳統出版 融合出版
人工智能(Artificial Intelligence,AI)技術的發展為傳統出版產業帶來了轉型機遇。[1]2022年11月,ChatGPT問世,其在內容生成方面所表現出的卓越性能,不僅給智能內容生成(Artificial Intelligence Generated Content,AIGC)、個性化定制出版等帶來了希望,同時,也將會革新既有的出版理念和出版方式[2],對包括傳統出版業在內的眾多行業產生巨大影響。《出版業“十四五”發展規劃》強調要推動出版深度融合發展,突出科技創新在數字化轉型升級中的作用,中宣部等部門也提出要促進文化和科技的深度融合,打造新型出版傳播體系。由此可見,利用人工智能等新一代信息技術賦能傳統出版產業高質量發展,推動文化和科技的深度融合已成為國家發展戰略導向,出版業應抓住新機遇,挖掘人工智能與傳統出版產業的契合點,最終打造“出版+人工智能”的新模式和新形態。
一、人工智能在出版產業的應用現狀
我國的出版融合轉型工作已推進多年,在新媒體平臺構建、在線教育、知識服務、數字閱讀等方向,各出版單位均做出了有益的探索。[3]然而,由于技術、模式、體制機制等問題,導致在出版產業的融合轉型過程中,出現了數字要素基礎薄弱、技術應用支撐能力不足、數據底座不堅實、業態融合程度不深、產業結構優化升級效果不明顯、供給與需求結構不適應等問題,制約了傳統出版產業的融合轉型發展進程。近年來,隨著《出版業“十四五”發展規劃》等方針政策的提出,人工智能與傳統出版業發展的結合已成為人工智能技術應用的一大熱點領域,人工智能技術通過數據的匯聚、工具的應用與場景的結合,能夠不斷賦能傳統出版產業提升應用價值,實現技術與應用場景的螺旋上升。基于人工智能等新一代信息技術,推動傳統出版的數字化融合發展,已成為出版業發展的主要趨勢。經過深入研究,目前,國內外人工智能技術在出版相關領域的應用已經取得了一些重要進展,其應用領域主要集中在以下三個方面。
1.知識組織和知識服務
利用詞表、分類到本體、知識圖譜等知識組織技術構建專業數據庫,結合機器學習、機器翻譯、智能檢索等技術對文獻進行自動分類、跨語言檢索,實現內容多元化、產品化和標準化的知識服務。[4]如人民法院出版社的“中國法律應用數字網絡服務平臺”,通過搭建法信大綱知識地圖,突出法律知識數據聚集與分析作用;知識產權出版社的“InteCovery專利分析”,為用戶提供了深度標引加工服務;威利的“Cochrane Library”提供醫學主題詞表(MESH)的組織功能;再如科學出版社的“SciEngine平臺”、施普林格的“Springer Material”、百度的“百度學術”、萬方的“萬方數據知識服務平臺”等都是知識服務領域中較為成功的應用案例。
2.自動化出版業務流程
將人工智能技術與出版實際業務場景相結合,能夠輔助優化內容生產、編輯、校對、發行等環節的效率,提升出版品質和讀者體驗。①利用深度學習技術,實現文稿推薦和文稿生成,輔助選題流程優化。[5]例如,WordAi作為一款基于深度學習技術的智能寫作工具,可根據主題和關鍵詞生成高質量原創文字,助力用戶高效地完成選題和內容創作。②通過語法分析、語義解析、詞匯識別等手段,自動檢測文稿和圖片中的錯誤,輔助編輯進行圖像編輯和分類,提高編輯效率。[6]例如,基于自然語言處理、人工智能和內容結構化技術,黑馬智能輔助審校平臺可實現文稿的檢查、推薦和優化,有利于提高編輯工作效率和質量。③通過預測分析和機器學習,優化印刷流程,降低成本,提高效率。[7]例如,Heidelberg Prinect Press Center系統利用機器學習和數據分析技術,實時監測、分析和優化印刷生產過程。該系統收集并處理大量生產數據,可預測潛在問題并自動調整設備參數,以提高印刷效率和質量。④基于人工智能技術,能夠通過分析讀者購買行為、閱讀習慣等數據,預測讀者需求,優化發行策略,還可以通過個性化推薦、智能客服等方式,提升讀者體驗,增加讀者黏性。[8]例如,Amazon Kindle 是一款采用人工智能技術的電子閱讀服務平臺。通過分析用戶的閱讀歷史、喜好和購買行為等多維度數據,該平臺可向用戶推薦更符合其興趣的圖書和內容。這種個性化的推薦系統使用戶能夠更輕松地發現新書、擴展閱讀領域,并提高閱讀的滿足感與體驗。
3.智能化出版物版權管理
利用人工智能技術可以為出版物版權管理提供高效、準確的輔助服務,協助版權保護機構快速發現和處理侵權行為,保護版權人的合法權益。通過深度學習、自然語言處理等技術,能夠識別侵權圖片和侵權文字[9],結合海量數據智能分析,實現對侵權行為的監測和預防,降低侵權風險并保障版權方的權益。[10]國內外多家知名廠商正在積極布局基于人工智能技術的版權監測管理平臺:YouTube平臺的ContentID版權管理功能,通過人工智能技術對用戶上傳內容進行識別和比對,實現音頻、視頻、圖像等多種類型內容的侵權監測;國內如騰訊版權資產服務平臺,通過建立人工智能和大數據技術的侵權監測系統,對互聯網上的圖片、視頻、文字等內容進行監測和比對,快速發現和解決版權侵權問題,幫助作者維護自己的版權權益。
二、人工智能在出版產業的問題探索
從現有研究可以發現,當前人工智能技術在出版產業的應用主要存在以下幾點問題。
1.從出版產業角度進行中觀、宏觀分析的應用較為缺失
單個企業的聚合構成了產業,產業反映了行業多個企業的特征。出版社或更為大型的出版集團,對現有的人工智能應用多集中于微觀領域,大多應用是從產業技術入手,在編排、印刷、產品推薦等局部傳統領域,應用相關人工智能進行技術改進。[11]但人工智能技術所提供的豐富數據源、分析手段并沒有直接應用于出版產業的中觀、宏觀層次的管理與分析,而相較于產業技術細節,產業鏈條、產業布局、產業規劃等信息將更加直接決策產業、企業的發展走向與興衰。
2.行業傳統數據與產業大數據的融合程度不足
出版產業的產業鏈也有大小之分,從傳統出版行業的角度來看,出版產業可以分為編(編輯)、印(印刷)、發(發行)、供(物料供應),而當前科技創新與傳統產業的融合,使得傳統產業的鏈條本身發生了大的變化。產業鏈與創新鏈的融合更為密切,因此政府、產業、研究院所、高校等與企業主體的合作與交流日益加強。但在這種情況之下,我們仍然發現,人工智能技術所依賴的分析數據,其維度較為單一,數據的孤立性依然存在,在小鏈條中,不同企業間的數據仍然沒有打通,而對于大鏈條的數據,又缺乏必要的收集渠道和手段。數據是人工智能分析的重要基礎,因此從現有出版產業的發展來看,小鏈條與大鏈條的數據孤立現象仍然存在。
3.先進技術背景下的應用場景服務模式尚不清晰
從行業的管理、發展來看,不同層次,其需要也是不同的。在微觀層面,面對大數據和人工智能技術的沖擊,要在多元化數據、多源頭數據、多緣數據以及先進技術的支撐下,擴展業務思維,對于編、印、發、供等細粒度信息進行再組織、再分析,以人工智能手段支持其應用。在中觀層面,面向企業決策和管理,需要在多樣化數據支持下,進行企業管理與決策,人工智能與大數據的應用將賦能企業管理、業務拓展和轉型。在宏觀層面,一個產業的治理,必須將多源大數據作為基礎,以分析工具和方法作為手段,以可視化為前端展開多樣化服務,為管理決策提供直觀高效的支撐。
三、人工智能在出版產業的應用探索
為解決出版產業融合轉型發展中存在的數字要素基礎薄弱、技術應用支撐能力不足、業態融合程度不深、產業結構優化升級效果不明顯、供給與需求結構不匹配等問題,構建“出版產業大腦”,為產業未來發展謀劃、產業發展策略制定、產業轉型治理提供數據化的智能輔助決策支撐。
產業大腦以數據資源為驅動,以人工智能技術為基礎,以大數據分析為手段,將政策鏈、產業鏈、創新鏈、人才鏈、資金鏈等資源要素數據匯聚起來,通過關鍵技術研發、數據科學處理與分析,掌握行業態勢和自身定位,面向產業戰略、管理、執行三個維度,提供多源數據、智慧輔助決策、業務流程智能化、多場景交互可視化四項服務,構建產業指數體系,既為產業轉型升級提供數字化服務,也為產業治理提供數字化工具。
1.戰略層面,為宏觀產業決策層提供綜合知識圖譜,構建產業融合轉型“參謀室”
面對出版產業宏觀決策管理中存在的決策經驗化、產業鏈治理效能低等問題,出版產業大腦在宏觀決策層面,面向出版產業政府決策機構,從政策鏈、產業鏈、創新鏈視角進行出版產業宏觀態勢的觀察與透析。利用智能可視分析技術,結合政策、標準、主體、產業、人才等創新要素數據,通過時空結構分析、系統建模與仿真分析等方式構建出版產業知識圖譜,打造“一屏觀全域”的動態監測平臺,對產業宏觀層面進行直觀刻畫,輔助產業規劃的最高決策層及相關主體,給予其俯視產業鏈全局的機遇,為我國出版產業管理部門和機構提供覆蓋面廣、時效性強的多維決策支撐,為出版產業進行全方位、全流程的決策賦能,從而達到精準決策的目的。
(1)政策圖譜是政府制定產業政策的參考標桿。構建政策圖譜,利用數據挖掘和文本分析技術,智能提取政策主題、措施和目標,把握政策熱點、脈絡和趨勢,并結合關聯分析、語義識別,分析不同政策間的關聯性、實施效果、社會反響,輔助開展科學的政策規劃和研判,促進政策研究者對產業狀況的深度理解,也能輔助政策決策者科學制定相關政策,并為未來政府建設政策智能咨詢服務體系、打造政策智能管理系統奠定基礎。
(2)產業圖譜是政府優化產業布局的重要依據。產業圖譜建立模型打造產業指標評價體系,優化產業布局,實現政策效果的量化評估和分析預測,推動產業結構良性發展。幫助政府決策者掌握出版產業的宏觀格局演化情況,開展出版產業鏈結構分析,建立產業發展評價體系、分析研判產業發展前景、預測企業需求和發展趨勢、構建資源精準匹配模型,對產業政策的效果進行量化評估和分析預測,幫助政府把握產業瓶頸與發展機遇,提升政府治理能力,輔助政府有針對性地制定產業發展戰略和調控政策,對出版產業發展方向和區域布局進行動態化指導,促進產業鏈上下游資源綜合利用,推動產業結構良性發展,提升出版產業的創新能力、發展規模和經濟效益。
(3)創新圖譜是政府促進產業升級的有力支撐。構建創新圖譜,基于文本挖掘和語義分析技術,識別前沿技術熱點,結合科學計量、社會網絡分析等技術,剖析產業創新態勢,將技術與作者、機構、資源投入等數據進行關聯,為出版機構提供合作推薦、優化創新投入結構,輔助決策者開展資金支持、政策引導和服務保障。
2.管理層面,出版產業大腦可以服務于中觀企業管理層,提供智能態勢監測,打造企業科學管理“駕駛艙”
針對出版企業轉型升級的需求,“出版產業大腦”以數據智能為核心,提供資源治理服務,基于智能分析引擎研發,服務企業開展競合態勢分析、國際出版動態監測和對標分析,研究如何進一步通過技術研發、內容創新、渠道融合、市場融合走好高質量發展之路,探索出版融合發展新路徑,提高出版企業規模、內容價值和創新水平,提升企業的競爭力和影響力。
一是開展智能態勢監測與分析服務。基于智能分析引擎,服務出版企業開展競合態勢分析、市場競爭力分析、人才動員力分析、科技創新力分析等,探索企業融合發展新路徑,提高出版企業內容價值和創新水平。
二是提供全方位的企業發展態勢智能分析。構建面向出版企業管理的智能分析工具,包括企業態勢智能評估、企業競爭關系分析、企業人才脈絡梳理等,輔助管理者自主開展多維態勢分析。
三是構建海外出版動態監測和國內外競合分析服務。面向國內外主要出版商產品,利用機器翻譯、實體識別等技術獲取海外主要出版物信息并,實現對海外出版物內容、市場動態、書評和社會影響的評估,支撐圖書版權引進和出海的分析和決策判斷。
3.執行層面,出版產業大腦還服務微觀業務層面,提供智能業務輔助工具,搭建業務流程管理“操作臺”
基于人工智能技術,為出版產業從業者提供智能工具集,利用出版流程數據,結合知識圖譜、機器翻譯、自然語言處理等技術,構建智能選題、智能發行、智能審校等應用場景服務,提升編輯、發行、審校等業務流程效率,對現有企業出版流程與模式進行升級。
(1)智能選題。基于文本識別、聚類分析等技術,識別市場熱點話題,為選題提供方向參考,并結合同類圖書市場化分析,有針對性地開展市場需求分析和預測,結合自然語言處理技術自動生成選題報告,為圖書選題策劃提供參考依據。
(2)智能發行。根據讀者用戶的購買記錄和會員信息,為讀者進行畫像,并結合協同過濾技術,為用戶推薦可能感興趣的書籍,實現精準營銷;另外,通過比較同類圖書的市場表現和銷售情況,輔助生成同類圖書的優缺點分析報告,以便更好地制訂圖書發行策略。
(3)智能寫作。基于大模型,自主研發智能內容生成平臺,能夠根據提示詞一鍵生成文章段落和圖片,輔助開展組稿、文案撰寫等工作。
(4)智能審校。基于自然語言處理和深度遷移學習技術,根據分詞結果及當前詞條的上下文語義關系,識別知識點并創建索引,利用預訓練模型,實現創作、編輯、審核、發布等環節文本的自動化審核和校對,提升校對質量及審稿效率。
四、結語
人工智能時代,傳統出版業將受到前所未有的沖擊與挑戰,需辯證看待人工智能技術與傳統出版業之間的關系,保持理性認識。人工智能技術為傳統出版業的轉型升級帶來諸多發展機遇,一方面,應繼續推進行業內外多源數據匯聚進程,構建多源關聯、時效權威、高數據質量的產業大數據知識庫,以保證人工智能技術數據底座的準確性與及時性;另一方面,持續聚焦人工智能產業應用研究,分別在數據、算法、算力三要素層面,在知識服務、流程優化、版權管理等細分領域,全面、深入、透徹地研究人工智能技術原理,聚焦人工智能技術與出版產業的深度融合,持續探索人工智能技術在出版產業中的廣泛應用,實現人工智能對傳統出版產業的深度賦能,推動產業效率和價值的全面提升。
(作者單位系山東出版數字融合產業研究院,范林海系本文通訊作者)