
【摘 要】 出版業數字化轉型經歷了“互聯網+”產品和服務創新轉型階段,現在正進入以大數據、人工智能驅動的數智化時代。從產業維度看,這標志著數字化轉型從“互聯網+”進入“智能+”時代。這個階段是出版業基于智能技術與其他產業深度融合的過程,通過創新技術,提升全要素生產率,實現供給側結構性改革。一是工具革命,從傳統工具到智能工具;二是智能技術賦能產品服務創新,從單一圖書出版到多元化復合出版,從圖書出版向知識服務平臺創新,從文本向視頻化、有聲閱讀、AR/VR等多產品形態發展;三是數據賦能,實現智能出版向智慧出版轉型。
【關 ?鍵 ?詞】出版;數智化;智能技術;數據賦能
【作者單位】劉長明,北京北大方正電子有限公司。
【中圖分類號】G230.7 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2022.06.006
2022年是“十四五”規劃的第二年。“十四五”時期,經濟發展的主題是高質量發展,由規模擴張模式全面轉向更加注重質量、效率、效益的發展模式。實現經濟高質量發展,要把重點放在推動產業轉型升級上,而實現產業轉型升級,則需要培育新動能。從培育新動能維度看,科技創新是重要突破點,以信息技術為基礎的科技創新正成為驅動產業發展和變革的新興力量;從全球產業環境看,伴隨著移動互聯、大數據、云計算、人工智能、區塊鏈、5G等智能技術的發展,尤其是這些技術的疊加與融合,我們正迎來新一輪科技革命;從新一輪科技革命看,數字化、網絡化、智能化是突出特征,也是新一代信息技術的核心。
新一輪科技革命給產業融合發展帶來了新的契機,信息技術與經濟社會的深度融合,是未來十年的發展主線,也是數字經濟發展的基礎。以移動互聯、大數據、云計算、人工智能、區塊鏈、5G為代表的新一輪信息技術正推動全球產業進入數智化時代,各領域企業均開始布局數智化轉型升級。
一、企業的數智化轉型
企業數智化轉型大多從信息化、數字化逐漸演進到數智化。信息化階段,主要是計算機在企業的應用、IT基礎設施建設以及圍繞ERP、CRM等信息化應用;數字化階段,互聯網、大數據、云計算技術滲透各行各業,其核心特征是數據驅動;數智化階段,智能技術產業化,實現“AI+數據智能化應用”“AI+服務創新”。數智化的主要特征有兩個方面:一是在大數據、云計算等數字技術的基礎上,開始應用機器學習、深度學習、知識圖譜、RPA等AI智能技術,實現多技術融合發展;二是數智化更注重數據的應用,數字化的重點是用數據來體現業務,而數智化的重點是讓數據反饋業務,賦能業務和管理。
企業數智化轉型升級就是企業利用等智能技術進行業務流程的優化與重塑,通過深化智能技術在生產、運營、管理和營銷等環節的應用,實現企業數字化、網絡化、智能化發展。
二、數智化轉型是出版融合的發展趨勢
2010年1月,新聞出版總署印發《關于進一步推動新聞出版產業發展的指導意見》,其中明確指出:“積極發展數字出版、網絡出版、手機出版等以數字化內容、數字化生產和數字化傳輸為主要特征的戰略性新興新聞出版業態。” 2014年4月,國家新聞出版廣電總局與財政部聯合發布《關于推動新聞出版業數字化轉型升級的指導意見》,極大地推動了新聞出版業數字化轉型升級的步伐。經過多年的探索和發展,出版業在業務流程優化、產品和服務創新等方面取得了許多重要成果,也建立了一些數字化內容生產、傳播、服務的標準體系和規范。2020年,以5G、云計算、大數據、人工智能、物聯網和區塊鏈為代表的新一輪技術,帶動全球進入產業數智化時代,中國出版業數字化轉型也開始從數字化進入數智化新階段。《出版業“十四五”時期發展規劃》強調,要突出科技創新在推動出版業數字轉型升級、實現深度融合發展中的重要作用,大力推動5G、大數據、云計算、人工智能、區塊鏈、物聯網、虛擬現實和增強現實等技術在出版領域的應用,推動國家出版發行信息公共服務平臺的應用。可見,出版業融合發展已融入新的技術發展和產業變革中。
在新一代信息技術與產業深度融合中,出版業融合發展將進入新階段。一是內容生產數字化,將數據作為生產要素;二是產品形態持續創新,除傳統紙質圖書外,電子書、有聲書、視頻、AR/VR、數字閱讀、知識服務等多產品形態不斷涌現,內容知識化趨勢明顯;三是內容傳播全渠道化,尤其隨著智能技術的發展,內容傳播趨向移動化,同時還將與物聯網結合,傳播渠道、服務渠道更加廣泛;四是全面發展數字內容產業,從圖書出版到打造多元IP,延伸至游戲、影視、動漫等跨領域內容產業。
目前,出版融合正向縱深方向發展,我國出版企業模態持續進化。從媒介看,單介質出版向多媒介出版發展;從出版流程看,一次出版向可持續出版發展;從模態看,靜態出版向動態交互出版發展;從編輯加工流程看,傳統內容制作流程向全流程數字化制作流程發展;從產品形態看,單一圖書出版向多產品形態發展;從自身定位看,圖書出版商向知識服務商發展;從業務邊界看,單一書刊出版領域向跨領域出版和數字內容產業邁進。可見,出版業模態進化是落實數字化轉型戰略的重要體現。
三、智能技術全面賦能內容生產和傳播服務
在數智化階段,智能技術將與內容產品服務創新及業務流程優化等場景進一步融合,全面賦能出版業全鏈條、全場景的轉型升級,依托新技術建立一體化內容協同生產傳播新體系,進一步釋放內容生產力。數智化階段有以下特征:一是以智能技術變革生產工具;二是以數據資源為關鍵生產要素;三是以數字內容重構產品結構;四是以信息網絡為市場配置紐帶;五是以服務平臺為產業生態載體。從數字化到數智化,智能技術將是內容產業和出版融合發展的新動能。
智能技術給出版融合創新帶來了新變化,促使出版內容生產和傳播服務實現智能化。在智能選題策劃環節,依托大數據人工智能技術輔助選題策劃。選題策劃是圖書出版的基礎和關鍵,傳統出版流程中的選題策劃主要依靠圖書策劃編輯的經驗積累,如今則可以通過大數據和人工智能等技術挖掘潛在讀者及其感興趣的知識和話題,采集分析熱點話題和同類選題圖書數據,輔助圖書策劃編輯做好選題方案。在智能輔助內容生產環節,知識圖譜、人工智能將賦能內容生產,主要應用場景包括機器寫作、智能排版、知識圖譜及知識體系智能構建、音視頻智能生產(如音視頻智能轉碼拆條、實時語音識別、語音文件轉寫、視頻語音轉寫等)。在內容智能審核環節,將智能技術應用于內容風險控制領域,依托自然語言處理、跨模態的音視頻識別等技術,實現內容文本、圖片和視頻的智能審核,可將智能比對技術用于內容校對環節,實現機器輔助校對。在內容管理環節,利用多模態智能檢索技術,實現文本、圖片、音視頻的智能檢索服務,依托知識圖譜技術構建知識體系。在內容智能分發環節,依托大數據、人工智能等技術構建用戶畫像和用戶行為,實現內容個性化分發;依托大數據、人工智能等技術構建編輯畫像,為編輯推薦相關內容。在內容智能傳播分析環節,依托大數據和人工智能等技術,監控網站、客戶端、微博、微信、頭條號、抖音等新媒體發布渠道,掌握發布平臺的發稿數、原創數、轉載媒體數、轉載次數、原創比例、傳播熱榜、重點欄目、傳播地域分布等。在智能營銷環節,通過分析用戶需求,根據自身所能提供的資源和服務情況,運用算法、模型將用戶需求和資源服務進行匹配,實現精準營銷。
目前,國外很多出版商已將人工智能應用到內容生產傳播等環節中。施普林格·自然積極探索人工智能的應用,在2019年出版了第一本由機器生成的書籍——《鋰離子電池》,該書是人工智能總結的鋰離子電池領域近3年的突出研究成果的摘要,概述了鋰離子電池領域的最新研究進展。2021年,施普林格·自然又利用人工智能出版了一本新書——《氣候、行星和進化科學:計算機生成的文獻綜述》。愛思唯爾也在積極運用機器學習和自然語言處理(NLP)技術更好地服務科學家、工程師,幫助用戶更快地找到相關內容。
四、智能技術賦能出版融合發展
隨著新一代信息技術發展及出版業的數字化轉型進入數智化階段,大數據、人工智能等技術開始應用于出版內容生產各環節。
1.人工智能、大數據技術賦能圖書內容生產
業務流程數字化與智能化是數智化轉型的重要方向和轉型重點,依托人工智能可構建智能編校排一體化的出版業務流程。目前,多數出版單位的內容編審環節還是紙稿流轉、人工排版、人工校對的生產模式占主流位置。但在2020年新冠肺炎疫情期間,傳統出版業務流程的生產能力不足等劣勢凸顯,推動出版單位重新審視數字化能力,依托數字技術重塑出版業務流程。出版業務流程重塑是為了應對經營環境的變化和變革,出版企業對出版業務流程進行根本性再思考和徹底性設計,將可以在出版質量、效率、成本和服務等重要指標上取得顯著性提升。智能編校排一體化出版業務流程就是將人工智能與內容編校排有機結合,實現內容編輯加工流程全數字化。我國很多出版單位構建了智能編校排一體化平臺,如上海辭書出版社《辭海》第七版工具書編纂平臺、中國電力出版社協同編纂平臺、中國標準出版社智能生產平臺、東北財經大學出版社智能生產平臺、重慶大學出版社協同編纂平臺等,這些平臺基于XML結構化數據標準,以內容編校排為核心,應用人工智能集成智能審校、智能排版、智能校對等工具,實現內容數字化編纂、審校、管理和動態出版的全流程數字化。
如上海辭書出版社和北京北大方正電子有限公司(以下簡稱方正電子)共同開發的《辭海》第七版工具書編纂平臺,旨在為作者、編輯、審校人員及管理人員等提供統一的編輯平臺。平臺集成了包括在線編輯、智能編校、知識圖譜構建、XML智能排版、在線發布等子系統(見圖1)。
2.人機協同的內容智能審核,將智能技術應用于內容風險控制領域
在數智化轉型和媒體深度融合背景下,內容安全成為數智化戰略的“方向盤”。采用多模態(音頻、視頻、圖片、文字)分析技術,可以對內容實現全面的風險監控和智能審核。基于文本的智能審校工具利用人工智能、機器學習、大數據等技術,能夠對編審內容進行智能審校處理,完成文章邏輯檢查、上下文查重、易錯詞檢查、敏感詞檢查、連接符號檢查、全半角價差、千分位檢查、格式檢查、知識性審校等工作,幫助編輯高效、準確地檢查并處理稿件錯誤之處,提高編輯審稿效率,確保查全率和準確率;輔助編輯發現知識相關、格式相關、語境相關等疑難問題,提升內容質量。
基于圖像、音視頻的識別技術可以實現政治敏感圖片識別、敏感人物識別,圖片不良場景識別、廣告監測,同時對音視頻中的語音、畫面進行智能檢測和過濾。方正電子借助大數據與人工智能等技術的創新實踐,面向新聞出版產品的質量管理需求,打造了智能內容審核及風控監管平臺,助力出版內容生態良性發展。
3.基于XML智能排版將應用于內容排版環節
XML智能排版工具依托結構化識別技術、XML排版技術將word文件結構化,不僅可以自動規范整理稿件、高效自動化排版,還能提供豐富的版式,實現PDF、EPUB、HTML、XML等多格式數據同步輸出,大大釋放了人工生產力,提高了排版效率。目前,智能排版技術已進入產業化應用,在方正電子推出的方正學術期刊出版云服務平臺上,已有300多種學術期刊使用XML智能排版工具進行內容生產。
4.知識圖譜技術廣泛應用于知識庫構建及知識服務產品創新
知識是企業智能化轉型升級的關鍵,人工智能算法可以使機器從海量數據中高效汲取知識成為可能。知識圖譜分為通用知識圖譜與行業知識圖譜。行業知識圖譜是面向專業領域的專有應用,基于行業知識構建(如金融、醫學、公安等)知識庫,行業知識圖譜對各垂直領域的細分場景更能凸顯價值。以知識圖譜、自然語言處理、語音、視覺等人工智能技術為核心的新一代智能技術,能夠幫助出版行業構建領域知識圖譜、事件圖譜、多模態知識圖譜。依托知識圖譜,出版單位可通過搜索、推薦、問答、推理、可視化等方式高效地實現知識應用。
目前,出版單位正從圖書出版向知識服務商轉型,通過盤活存量資源、整合增量資源,利用知識圖譜技術構建知識體系和行業知識圖譜,打造面向不同領域、基于多應用場景的知識服務產品。如專業數據庫、特色數據庫、知識問答、數字圖書館、移動APP、微信應用等多端應用,為受眾和更多機構提供多形態的知識服務產品。知識圖譜核心技術在出版業的應用趨勢將以大數據采集、知識體系建設為基礎,以知識自動標引為關鍵,以知識計算引擎和知識服務關鍵技術為樞紐,構建行業知識服務生態平臺。
5.智能技術的發展讓內容形態多元化、立體化
隨著融合出版的深入發展,內容產品形態更加立體化,更具交互性。隨著互聯網打破傳統出版物對內容形態的束縛,文字、圖像、視頻,以及包括VR/AR等新元素已成為出版內容表達的重要因素,多模態內容呈現給用戶帶來了更多感官體驗。隨著智能技術的發展,未來元宇宙將越來越頻繁地出現在人們的視野里。元宇宙形態的誕生其實是基于人工智能技術的成熟應用,隨著這些新興技術成熟度的提升,元宇宙有望逐步從概念走向現實,成為數字化轉型的新路徑之一。
五、結語
未來,數字技術將進一步重塑出版生態,出版數字化、融合化將向縱深方向發展,走向數智化。一方面,從內容生產出發,對內容生產的重點環節進行數智化改造,提升出版質量、出版效率、數字化運營能力,進而延伸到客戶側的數字化;另一方面,從讀者和受眾需求,依托平臺構建連接和服務,以平臺產品聚合生態,發展出版新業態、新模式,不斷通過數字化營銷、線上服務、電商服務拓展渠道和用戶群,形成“內容+關系”“內容+服務”的新生態,以提升出版單位自身的發展韌性,并傳導業務生產側的數字化,實現更柔性的按需出版。
在從數字化向數智化演進中,出版單位應注重“數據+AI”雙中臺建設。通過雙中臺體系作為連結上層業務與底層技術的橋梁,整合數據孤島與智能技術孤島,直接為上層業務應用提供支撐;收集業務應用實際產生的數據,逐步完善底層技術,為用戶提供不間斷的數據和資源支撐;積極擁抱智能技術,推進智能技術與產業深度融合,通過技術賦能提升內容出版全要素生產率,助力出版業實現高質量發展。