









摘 要:梳理我國出版人工智能的研究現狀,有助于明確出版行業的發展方向,促進出版學科自主知識體系的構建和完善。本研究采用系統性文獻綜述方法,檢索、篩選并分析了522篇相關文獻,系統歸納了出版人工智能的核心概念、技術架構、行業影響及應對進路。學界認為智能技術正深度介入出版全流程,尤其是生成式人工智能在內容創作和知識生產中的應用,為出版行業的智能化升級提供了重要支撐。但人工智能也帶來倫理和實踐問題,生成內容的版權歸屬和原創性爭論尤為突出。出版業應充分發揮在內容資源上的優勢,向“知識服務提供商”和“知識把關人”角色轉變,探索“出版即服務”模式,努力構建以高質量知識資源為核心的智能出版新生態。
關鍵詞:人工智能;出版業;智能出版;系統性文獻綜述
DOI: 10.3969/j.issn.2097-1869.2025.01.005 文獻標識碼:A
著錄格式:唐嘉駿,楊海林,馬子寒.出版人工智能研究:概念、技術、影響與進路:一項系統性文獻綜述[J].數字出版研究,2025,4(1):29-38.
現代數字技術的廣泛應用提高了出版業的數字化水平,推動傳統出版向數字出版轉型。而在以算法為核心的人工智能時代背景下,出版的未來出現了全新的可能,智能技術遷移到文化產業領域,智能出版也成為傳統出版業在智能時代轉型升級的新方向[1]。生成式人工智能(GAI)不僅加速了內容生產的效率,也具備了介入人類知識生產格局的能力。智能技術一方面激發了出版業界、學界對邁向深度融合發展未來圖景的向往;另一方面也引起了對機器參與知識生產后不良影響的擔憂。因此,充分利用人工智能等技術以推動出版的融合發展,是當下出版學研究的題中之義。
近年來出版人工智能研究迅速發展,理論和實踐問題隨之產生,有必要對相關研究進行回顧整理并進行研究現狀分析,以便系統把握其發展趨勢。張新新等[2]梳理了智能出版研究中的概念和邏輯,探討人工智能、VR/AR等技術下出版發展的進路,呼吁學界關注智能出版研究;陳丹等[3]使用CiteSpace整理了近20年來我國數字出版相關研究,指出應在人工智能等技術背景下開展出版學研究。現有研究大多使用敘述性綜述(Narrative Review)或文獻計量方法對出版人工智能議題進行綜述,而系統性文獻綜述(Systematic Literature Review ,SLR)具有明確的原則、問題和步驟,增加了綜述的透明性和客觀性[4]。因此,本研究使用該方法對國內出版人工智能研究進行梳理,試圖回答下述研究問題:出版人工智能的概念和特征如何?人工智能在我國出版業的相關技術架構與應用實例有哪些?人工智能給出版行業帶來了哪些機遇和挑戰?如何化解潛在風險?
1 綜述過程與計量分析
1.1 綜述方法
系統性文獻綜述第一步是全面搜集領域相關文獻。考慮到人工智能在我國出版研究中的多種表述,本研究在中國知網、萬方數據知識服務平臺、維普期刊3個數據庫中進行檢索,檢索時間為2024年12月11日。構建的檢索表達式為“*出版”AND(“新質生產力”OR“人工智能”OR“AI”OR“大語言模型”OR“算法”OR“ChatGPT”OR“數智化”),限制發表時間為2014—2024年,并通過前向和后向搜索補充,共計3 818篇文獻。
之后確定了文獻篩選納入的標準(見表1),依照該標準對命中結果進行初步篩選。為了保證納入文獻的權威性,首先去除重復文章和非核心刊物文章,其次通過標題、摘要和關鍵詞等信息去除非研究類文章。在此基礎上,排除僅提及出版業與人工智能技術而非研究二者關系的弱相關性論文。共計522篇論文被納入系統綜述的范圍,數量滿足系統性文獻綜述的基本要求。若論文僅將人工智能與出版作為文章的核心議題,則標記為緊密相關,反之則標記為非緊密相關。在此之后,研究者對納入文獻進行了編碼分析,具體研究過程見圖1。
1.2 文獻計量分析
在時間維度上,出版人工智能領域的論文數量呈現出明顯的增長趨勢(見圖2)。2015—2016年僅有2篇論文發表,表明在早期,人工智能在出版領域的應用尚未受到廣泛關注;2017—2019年,隨著人工智能技術的快速發展及其在出版行業的逐步應用,相關研究論文的數量開始迅速增加;而至2020年,全年共發表了57篇相關選題論文,反映了學術界對這一領域的興趣顯著提升;2023年,GAI技術,尤其是ChatGPT等模型的廣泛傳播和應用,使出版學界對人工智能的研究熱情達到高潮,當年相關論文發表數量激增至121篇,不僅數量上實現了飛躍,也表明了人工智能技術在出版領域應用的深度和廣度都在不斷擴展。
在期刊維度上,522篇論文分別發表在37種期刊上,《出版廣角》發文最多,《科技與出版》緊隨其后,《中國出版》《中國編輯》《出版發行研究》和《編輯之友》的發文量均在30篇以上(見圖3)。
在作者維度上,納入的論文涵蓋了791位學者的貢獻,這些作者隸屬于524個不同的機構,其中高等院校(226個)、出版機構(191個)和研究中心(78個)構成了研究的主體,占比高達94.47%(見圖4),反映出高等教育和專業出版機構在推動人工智能與出版業融合方面的主導作用。值得注意的是,來自出版行業的編輯和其他從業者也積極參與了學術交流,貢獻了豐富的業界視角。
本研究使用Gephi軟件將納入論文的關鍵詞及其共現關系轉化為可視化共現網絡圖譜,從而更直觀地展示研究主題的分布和聯系。根據圖5,研究關鍵詞主要形成了4個模塊,模塊一以“人工智能賦能出版”為核心,與“數字出版”和“智能出版”等關鍵詞形成了緊密的聯系,揭示了人工智能技術在推動出版業向數字化和智能化轉型方面的研究趨勢和重要性;模塊二以人工智能生成內容(Artificial Intelligence Generated Content,AIGC)為核心,圍繞人工智能在內容創作領域的應用及其對出版業可能帶來的變革性影響進行了深入探討;模塊三以“出版深度融合發展”為核心,聚焦人工智能和其他技術對出版業深度融合的促進作用,并從新質生產力的角度探討了這些技術對出版學科自主知識體系建設的潛在貢獻;模塊四專注于出版業在采納人工智能技術過程中可能遇到的倫理和安全挑戰,包括版權保護、內容真實性、數據安全等關鍵問題。
2 出版人工智能相關概念
學界提出或使用了諸多概念用于描述出版與人工智能等技術結合的業態,例如智能出版、智慧出版、融合出版、出版人工智能等,但尚未對相關概念的定義達成一致。“智能出版”是目前被最多論文采納的概念(105篇),宋偉等[5]于2018年明確提出“智能出版”的概念,并指出其是基于數字出版流程再造的“人工智能+數字出版”新業態。伴隨著智能技術在出版業的進一步擴散,“融合出版”(34篇)和“智慧出版”(28篇)概念逐漸興起,除此之外,一些研究使用“智能化”(142篇)來描述人工智能對出版全流程的改造。然而,上述概念之間存在著較大的差異,“融合出版”是出版業中內容、平臺、渠道、推廣、銷售與技術的相互滲透,出版物通過新的形態和渠道觸達消費者;“智慧出版”是“數字出版”發展的新階段,重點在于5G、區塊鏈和人工智能等數字技術在出版行業應用后,出版物個性化、互動化和互聯化程度的提高;“智能出版”強調出版全流程的編輯、創作、分發、反饋環節的智能化改進,例如基于大數據實現智能選題策劃、精準圖書推薦、智能排版審核等。上述概念在文獻中仍然存在分歧,張新新等[2]認為“智能出版”是“智慧出版”的高級階段,是在后者滿足讀者個性化基礎上的出版全流程智能化;但亦有學者認為“智能出版”與“智慧出版”均是以技術作為基礎的新產物,但側重有所不同,前者以技術作為驅動力,而后者以知識作為驅動力。通過對文獻的梳理,研究發現所述概念之間的先后衍生或上下從屬關系難以確定,各個概念既有其獨特的關注視角,又存在相互交疊的范疇。作為前提,研究者應當厘清其研究所涉及的概念定義和內涵。
本研究納入文獻所指“人工智能”概念同樣存在差異,概念演變實際上反映了技術快速迭代進步所造成的人工智能與出版業融合演變態勢,包括早期簡單的基于規則自動排版、編校等自動化技術或計算機輔助技術的運用,以及如今復雜的AIGC等智能技術與出版業的深度融合。
從時間維度來看,可將出版研究中的人工智能劃分為3個階段:第一階段研究對象仍處于智能的初級階段,人工智能以基于規則的自動化專家系統為主要形態,在出版業中的應用主要為出版流程的部分自動化,如自動排版、拼寫檢查和語法校對。這一階段的研究大多集中在如何利用計算機工具輔助出版工作,目標是提升出版效率、減少人力成本和規范出版物的質量。
隨著大數據和機器學習技術的興起,人工智能在出版業的研究進入第二階段。在這一階段,研究的核心轉向了數據驅動的智能系統。通過對用戶行為數據、閱讀偏好數據和市場趨勢數據的大規模分析,出版機構能夠實現個性化推薦系統、智能排版和編輯系統及內容優化策略。研究的核心問題從如何自動化出版流程轉向如何智能化數據和內容的交互,學界和業界的研究者開始關注如何利用用戶數據優化內容創作、分發和營銷。
GAI(如GPT等)的出現,標志著出版研究中人工智能的第三階段。這一階段的研究不再局限于出版流程的優化和自動化,而是開始嘗試將人工智能生成能力嵌入內容創作環節,成為出版業發展的“新質生產力”之一。在這一階段,人工智能不只是出版的工具,而是內容創作者的“合作者”,它不僅具有早期基于規則生成新聞報道、詩歌、小說的能力,甚至還能進行一定程度的創作。出版過程中的編輯、排版和審稿等環節,也因深度學習技術的進步而被進一步智能化和自動化。
每一階段的研究側重點不同,但都體現了出版業對技術進步的快速響應和深度融合。在這一背景下,可以總結出版人工智能的5個核心特點:(1)智能化。人工智能深度卷入出版流程,選題策劃、編輯審校、發行營銷等環節智能化水平全面提高;(2)主體化。人工智能推進內容由專家生產(Professional Generated Content,PGC)到機器生產(Machine Generated Content,MGC),以GAI為代表的智能體(Agent)逐漸參與人類溝通過程,演變為意義共同創造者;(3)知識化。人工智能突出知識在出版業的核心地位,改變知識封裝方式,創新知識產品和知識服務形式[6],拓展數字出版的要素構成;(4)融合化。VR、AR等技術與人工智能在出版業融合互補,創新出版內容消費媒介形式,提升沉浸化體驗;(5)個性化。出版內容實現精確創作、精準營銷、個性消費和實時反饋,進一步滿足按需出版(Publishing on Demand,POD)的需求。
3 出版人工智能技術架構
納入文獻共提及104種人工智能支撐或賦能技術,出現頻次前20名的技術名稱見圖6。根據這些技術之間的關系,可將其歸納為數據處理層、硬件支撐層、通用算法層和應用實現層4個維度:(1)大數據、自然語言處理、互聯網等技術構成了人工智能的數據處理層底座,機器學習范式的人工智能依賴大量數據的訓練,而大數據等技術提供海量“數據養料”。對出版選題、編校、生產、銷售和反饋等環節產生的結構化或非結構化的文本、圖像等形式的數據加以收集、處理、存儲和利用,是建構出版人工智能的關鍵路徑;(2)云計算、5G等技術組成了人工智能的硬件支撐層,為出版智能化發展奠定了算力基礎;(3)神經網絡等深度學習算法構成了通用算法層,人工智能獲得從數據中學習、發現規律和模式,從而實現決策的強大能力;(4)VR、AR、區塊鏈等技術與人工智能相輔相成,創造出全新的智能化、安全化和個性化出版消費場景,推動智能出版發展。
出版企業在推進智能化革新過程中,面對的挑戰不僅僅是技術層面的復雜性,還包括業務流程的再造和組織管理的變革。要實現從傳統出版到智能出版的轉型,企業需要將新技術的潛力與出版業務場景的實際需求深度融合。
首先,從業務流程的視角看,出版企業需要重新審視和設計選題策劃、編輯校對、排版印刷、市場營銷和用戶反饋等環節的工作流程。在傳統出版中,這些環節大多以線性方式串聯,但在智能化環境下,各環節的邊界逐漸模糊,信息流動更加靈活。人工智能的介入,使得智能選題預測、自動化校對、個性化內容生成和精準營銷成為了可能。
其次,從技術架構的視角看,數據的獲取、管理和使用已成為出版業智能化的核心任務。與傳統的“作者—編輯—讀者”單向鏈式生產模式不同,智能出版更像是一個“數據驅動的動態反饋系統”。在這一系統中,出版企業需要建設自己的數據中臺,整合來自不同來源的海量數據,并在統一的架構下實現數據的清洗、標注、建模和管理。此外,區塊鏈技術的引入使得數字內容的版權保護和交易管理更加透明和可追溯,增強了用戶的信任感,降低了數字內容盜版的風險。
最后,從用戶體驗的視角看,VR、AR、MR技術的賦能,推動了“沉浸式閱讀”體驗的普及。傳統的紙質出版物受限于二維空間,而VR技術則能讓用戶“進入”書中場景,增強了閱讀的沉浸感和交互感,其帶來的沉浸式閱讀體驗也為教育出版和學術出版創造更多可能性,使“教、學、考、練”一體化的智能化學習平臺逐步成型。
出版企業的智能化轉型是一場“技術—業務—用戶”多維聯動的系統工程。這場轉型不僅依賴于人工智能、大數據、區塊鏈等前沿技術的協同作用,也依賴于出版企業對傳統業務的流程重塑和對用戶需求的深刻洞察。未來,隨著5G、云計算和GAI的加速發展,出版企業的業務形態將進一步突破“內容提供者”的角色,逐漸轉變為“內容+技術+平臺”三位一體的綜合服務提供者。
4 出版人工智能行業影響
人工智能技術在出版業已得到廣泛應用,從出版類型來看,研究者普遍認為專業出版(206次)受人工智能影響最大,其次是大眾出版(94次)和教育出版(80次)。專業出版,尤其是學術出版處于技術創新的前沿,在“人工智能驅動科學創新(AI for Science)”的背景下,眾多學術期刊出版社和編輯部積極開展智能技術在學術出版領域的探索,通過人工智能進行審稿專家匹配推薦、多模態學術成果推廣等。人工智能在科技期刊出版的投稿、審稿、生產和傳播階段均得以應用。投稿階段,人工智能應用可為研究者提供寫作選題和思路,其超越了傳統學術檢索引擎,能夠匹配和研究更相關的文獻,幫助學者進行文獻綜述;審稿階段,人工智能應用可用于學術不端檢測、審稿專家精準匹配,助力推進同行評議進程;生產階段,人工智能可用于輔助論文自動排版、機器翻譯、論文校對;傳播階段,人工智能可用于精準化論文推送和學術推廣。以圖書出版為主的大眾出版是傳統出版業的重要分支,人工智能可幫助完成圖書內容制作、編輯加工和出版發行3個出版核心流程的工作。在教育出版中,人工智能豐富教育出版物的內容和形式、豐富教育出版物的“用戶主體”。人工智能教材賦予傳統教育新形態,提高教材教輔資料的可互動性,促進教材編寫者和使用者間的雙向互動,在與教育出版融合中主要體現出學習個性化、評價過程化、監督實時化的特征。
本研究基于出版的“多環節”論視角[7],探討人工智能技術對出版流程各環節的多維度滲透。
首先,在分析的文獻中,內容創作環節被認為是人工智能介入最深的領域(見表2)。作為出版流程的起點和核心環節,內容創作環節匯集選題策劃、創意生成和內容生產等關鍵任務。人工智能的深度學習算法和自然語言生成技術,使“人機共創”成為出版創作的新范式。人工智能不僅能夠對讀者的閱讀偏好、市場熱點和流行趨勢進行動態捕捉,還可基于大數據自動生成多模態內容(如文本、圖片和視頻),為出版物的內容創作提供源源不斷的“機器敘事”。由此,AIGC不再僅僅是人類創作的補充,而是成為新型出版資源的重要來源之一。人工智能的崛起正在重塑從創作到消費的內容供應鏈,為出版企業提供前所未有的靈活性和響應能力。
其次,編輯校對環節的自動化升級是出版業的另一大變革焦點。在這一環節,傳統出版的人工編輯方式以高頻、重復和規則化操作為主,而人工智能的介入使這些任務的自動化水平大大提升。基于自然語言處理和語法糾錯算法,人工智能可以高效執行文本的自動校對和智能審核,包括語法檢測、敏感內容篩查、格式排版和術語一致性檢查等任務。此外,通過算法生成的視覺方案不僅能夠符合出版行業的規范要求,還能實現個性化的美學創新,從而加快出版物的排版與設計流程。這種“編輯—校對—排版—設計”的一體化智能工作流,將原本分散的多步操作轉變為一個可視化的動態流程,使出版企業能夠以更低的成本、更快的速度和更高的質量交付圖書和部分出版物。
再次,人工智能技術在發行宣傳、市場反饋和用戶體驗環節的深度應用,標志著出版業從“產品導向”向“用戶導向”轉型。在發行和銷售環節,人工智能對于控制出版企業的庫存成本、優化市場投放策略具有重要價值。例如,人工智能可以根據圖書的銷售潛力和市場反饋數據,動態調整印刷批次和庫存規模。智能推薦算法(如電子書平臺中的“千人千面”推薦系統)也可以基于用戶的閱讀歷史、興趣標簽和消費習慣,為每個用戶精準推送個性化的圖書推薦,這一策略已經在數字閱讀平臺中得到了大規模應用。此外,智能聊天機器人在用戶交互中的作用也日益突出,不僅能夠提供即時的售前咨詢和售后反饋,還能充當“閱讀顧問”,為讀者推薦符合其興趣偏好的書籍。“產—銷—消”的智能交互機制,一方面增強了讀者的品牌忠誠度,另一方面使讀者的反饋直接反哺內容創作,實現了一個動態循環的出版反饋系統。
最后,人工智能使出版行業發生了轉型,從“出版商”向“知識服務商”進化。傳統的出版企業以“內容提供者”自居,而在智能出版和知識服務的轉型浪潮中,出版業的角色已經發生重大變化。出版的本質是知識的生產、流動和傳播,但在知識泛化和多元知識生產的背景下,出版企業不再是唯一的知識提供方,GAI作為“知識生產者”的身份正在被廣泛認可。它不只是作為工具被動使用,而是成為一種主動的“社會參與者”,不僅能對既有知識資源進行再組織和再利用,還能在數據驅動的模型中迭代生成新內容和新視角。從操作邏輯來看,GAI的運作機制與人類的知識生產活動有著某種相似性。具體而言,AIGC大多是對“已有知識的再加工和重構”[8],通過深度學習模型對海量數據的“吸收—總結—重組”,人工智能能夠模擬人類的寫作過程,并在生成的過程中生成新的語言表達形式和知識形態。由此,GAI的運作邏輯與人類的知識生產邏輯在一定程度上趨同,這種擬人化生產方式使其成為一種知識服務平臺的核心生產力。在這一新生態中,出版不再局限于“內容生產—成品出售”的線性業務模式,而是轉向“內容生產—知識流動—服務再生”的非線性生態。出版的邏輯從“物的銷售”向“知識的服務化銷售”轉變。
人工智能在出版業已得到廣泛運用,522篇文獻提及了815個實例(見圖7)。其中OpenAI及旗下的ChatGPT深受學界關注,諸多學者對其技術原理和特征進行介紹,并探討其與出版業的融合路徑。回顧出版人工智能的應用,研究者討論了國外的實例以期為我國出版人工智能提供參考。亞馬遜(Amazon)在圖書推薦中引入人工智能算法開辟了人工智能介入出版營銷領域的先河[9]。數字出版時代,越來越多的國家和地區在新聞出版業采用人工智能技術,數字出版與人工智能技術愈發緊密地連接。我國亦有較多出版相關企業探索人工智能落地出版的嘗試,例如人民衛生出版社利用人工智能挖掘醫學數據中廣泛存在的或隱性或顯性知識,從而支撐更智慧的知識服務。
諸多學者提出,人工智能對出版而言是一柄雙刃劍,既帶來技術進步的機遇,也對傳統出版生態造成深刻沖擊。傳統編輯首當其沖,智能技術不僅對出版業從業者的職業素養提出新要求,還使原屬于編輯的工作也逐漸被算法接管,加劇出版業就業的競爭態勢。同時,出版企業在訓練人工智能模型所需的海量數據方面面臨困境,數據資源的不足成為行業智能化升級的瓶頸。
另外,人工智能帶來了著作權等方面的爭議。第一,公開訓練語料中常涉及作家和出版社的內容,導致權利人無法獲得應有的經濟回報;第二,AIGC難以確定著作權的歸屬,無法界定原創和版權所屬范圍,極易陷入版權爭議;第三,AIGC的真實性、準確性難以保障,且存在偏見、歧視內容,存在造假的可能。最重要的是,人工智能介入人類知識生產傳播格局之后,人機倫理問題凸顯,算法與人類在出版流程中的角色邊界變得模糊,出版過程的規則和生產流程被算法形塑,倫理責任分配不清,出版行業面臨更高的倫理監管壓力。因此,出版業亟須重構出版編輯的倫理規約,更新行業的制度保障[10],共同努力設計、構建和部署“負責任的AI”。人工智能所代表的自動生成技術對出版業的深遠影響遠不止于此,傳統的線性生產模式被超文本的非線性知識鏈接所取代,出版與社會的關系發生重構,個性化的內容生成與快速知識獲取削弱出版企業的“中介”角色,消費者的知識獲取路徑從“出版—閱讀”轉向“平臺—搜索”,出版企業的市場地位受到平臺化知識消費模式的沖擊。平臺化的內容生產還解構了出版業對印刷知識的壟斷,讀者注意力逐漸轉向數字平臺,深度閱讀被即時搜索替代。出版企業的專業邊界也在不斷消解,知識的生產主體從精英化擴展到個體和大眾。生成式智能不僅實現個性化的知識輸出,還使人類對知識的生產壟斷地位受到挑戰,甚至顛覆出版業的“知識再加工”功能,知識的定義及其邊界隨之發生變化,人工智能的生成能力不斷拓展知識的外延,促使學界重新審視“知識”的本質。
5 出版人工智能應對進路
本研究將納入文獻對出版人工智能的態度劃分為積極、中立和消極3類,并對其進行線性擬合。根據圖8,在時間維度上,積極態度文獻占比顯著減少(t=-4.88, plt;0.005),中立態度文獻顯著增加(t=4.96, plt;0.005),而消極態度文獻占比變化并不顯著(t=3.02,pgt;0.01),表明隨著技術發展和研究深入,研究者對出版人工智能等技術的態度逐漸回歸技術理性,客觀探討出版人工智能的創新賦能和風險沖擊,從而提供更為全面的見解。
在GAI的迅猛發展中,出版業的角色定位正從傳統的“內容提供商”向“知識服務提供商”轉型。這一轉型不僅是商業模式的變化,更是知識資源管理和技術創新的深度重塑。過去,出版企業的核心使命是為人類讀者提供高質量的內容,而在生成式智能的語境中,出版物的“讀者”不再局限于人類,還包括人工智能等“機器讀者”。這種用戶邊界的拓展為出版業帶來前所未有的創新機遇。出版企業正在從“內容提供商”向“知識把關人”[11]角色轉變。與互聯網平臺依賴開放式的網絡數據不同,出版企業擁有深厚的專業知識資源和嚴密的內容生產流程。大模型的預訓練數據大多來源于互聯網的開放數據,這些數據雖廣泛但質量不均,導致模型“幻覺”現象的出現,即模型輸出的內容可能是無意義的或不準確的。而出版企業的內容則經過專業編輯和審校,其專業性和權威性遠高于網絡數據。德國出版商Springer與OpenAI的合作便是典型案例,后者將出版商的高質量內容作為模型的訓練數據。通過這種合作,出版企業不僅能為模型提供更高質量的數據輸入,還能在產業鏈中扮演關鍵的“知識把關人”,確保生成的內容具有更高的可靠性和權威性。
出版企業的知識資源從“隱性知識”向“顯性知識”轉化。傳統出版物中的知識多以文本或圖片的形式呈現,具有一定的“隱性”特征,無法直接被人工智能模型高效讀取和調用,而GAI的學習過程依賴于大規模、結構化的顯性數據。為此,出版企業可以通過數據倉庫和知識圖譜等工具將傳統出版物的內容進行結構化和語義化處理,將出版物中的專業知識轉化為易于機器理解的“顯性知識”,不僅可提升出版企業的內生競爭力,還能為大模型的訓練提供更高質量的輸入數據來源,進一步增強人工智能的預測能力和生成質量。
與此同時,出版企業應當積極開發和推出多種形式的知識服務產品,為企業、科研機構、教育部門等不同行業用戶提供定制化的知識服務。與傳統的“賣書”邏輯不同,出版企業需要探索更為多樣的服務模式,如專家系統、嵌入式知識庫、社交媒體模式等。專家系統模式的典型應用是在科研和教育領域中提供精細化的知識問答服務,幫助科研人員和學術用戶高效獲取專業領域的前沿知識。嵌入式知識庫模式則是將出版物內容以API或知識插件的方式嵌入大模型的內部,使得人工智能在回答特定領域的問題時,能夠調用出版企業的高質量知識庫,改善GAI的輸出效果。社交媒體模式則結合網絡社交平臺的特性,出版企業可通過社交平臺提供的實時更新機制,將最新的出版內容嵌入平臺的知識流中,以滿足用戶的實時信息需求。
出版企業的轉型不僅體現在服務模式的多樣化上,也體現在內部運營的智能化變革上。通過建立智能中臺,出版企業能夠將內容生產的各個環節智能化和平臺化。智能中臺的核心是基于大模型、數據倉庫和知識圖譜的智能運營系統,它具有內容加工、知識轉化和智能服務的多重功能。在內容加工方面,智能中臺可自動執行文本的智能排版、語義分析、關鍵詞抽取和知識標注等操作,從而提升出版物的生產效率。在知識轉化方面,中臺可將出版物內容轉化為可供人工智能調用的結構化數據,并將這些數據輸入到大模型中,支持問答和生成任務。在智能服務方面,出版企業的智能中臺還可以作為服務平臺向外部客戶提供知識服務,覆蓋科研機構、企業客戶和政府機關等多種用戶場景。
出版企業的這場轉型不僅是自身業務的變革,也是對GAI技術生態的深度嵌入。如前文所述,出版企業在人工智能產業鏈中具備不可替代的“數據話語權”,如果其能將自身的內容數據化、結構化,并以API或“軟件即服務”(Software as a Service,SaaS)的方式提供給人工智能企業使用,那么其業務模式將從傳統的內容銷售轉變為知識服務,進一步擴大收入來源。
此外,GAI的發展促使出版業的競爭優勢從“控制內容”向“控制知識”延伸。與網絡數據相比,出版企業掌握的知識資源更加權威、系統、穩定,這為其提供了與人工智能企業合作的獨特議價權。出版企業不必局限于傳統的書籍銷售,而可以與人工智能企業、搜索引擎、在線教育平臺等多方合作,成為這些平臺的“內容輸入者”和“知識把關人”,以嵌入式、訂閱式的方式提供高價值的知識服務。這不僅能提高人工智能大模型的學習效果,還能幫助出版企業實現“出版即數據、數據即服務”的創新路徑。
出版企業的這場“知識創新”轉型還催生一種新的業務模式——“出版即服務(Publishing as a Service,PaaS)”。在這一模式下,出版企業不再簡單銷售紙質出版物,而是提供一整套的智能出版解決方案,面向企業、政府、科研機構提供的內容不再是“靜態的書”,而是可搜索、可調用的“動態知識庫”。這意味著,出版企業可借助大模型技術,將自己打造成一個智能知識平臺,通過API、數據服務、嵌入式知識庫等多種方式為外部客戶提供知識服務產品。在這種新模式中,出版企業的收入不再局限于出版物銷售的單一收入,而是通過提供嵌入式的智能知識服務,獲取數據授權、訂閱收入和平臺服務收入。出版業的這一業務轉型與SaaS模式類似,未來可能形成“內容即服務(Content as a Service,CaaS)”的新業態。
6 總結與啟示
本研究使用系統性文獻綜述方法對出版人工智能相關論文進行了檢索、篩選,并從元數據和內容2個維度分析了522篇論文。在文獻計量分析的基礎上,整理出版人工智能相關概念、技術架構、行業影響和應對進路4個方面的內容,總結出版人工智能的研究現狀與業界發展。
國內出版人工智能研究已形成了較為成熟的研究圖景,然而也存在一些研究空白。首先,實證證據較為匱乏,研究方法較為單一。人工智能對出版業所造成的影響缺乏數據支撐,理論與實際應用之間的聯系不夠緊密,因此未來的研究應當堅持在實證研究的基礎上建構理論框架[12],從而促進出版學學科自主知識體系的完善。其次,過于強調技術,造成出版研究“本末倒置”。無論技術如何變革,出版業始終以內容為核心競爭力,因此出版學研究應當著重探討如何利用技術更好地滿足社會需求,人工智能介入出版業后用戶的接受度和市場適應性是一個重要因素,這方面的研究需要進一步擴展。再次,人工智能所帶來的風險和挑戰仍需進一步闡釋,如版權侵權、內容確權和學術不端等,特別是對于這些問題的預防和解決方案的探討。這些問題不單涉及社會文化層面,應當結合社會歷史、經濟等背景綜合討論。最后,出版業如何在人工智能背景下維持并增強可持續性,即如何在推動出版業智能化轉型的同時,確保這一轉型的可持續性,包括經濟、社會和環境的可持續性,以及文化的延續性,是一個值得探究的問題。
人工智能對出版業的影響體現在各個環節,從內容創作到市場反饋,均發生深刻的變革。同時,GAI的崛起進一步加劇了這種影響,推動出版業向知識服務平臺轉型。然而,人工智能技術的應用也帶來諸多挑戰,如版權侵權、內容確權和學術不端等問題。出版業需積極探索技術與倫理的平衡,提升技術使用的規范性與可控性,開發具有優勢的知識資源和“出版即服務”的商業模式。
作者簡介
唐嘉駿,男,南京大學信息管理學院碩士研究生。研究方向:數字人文和計算社會科學。
楊海林,男,南京大學信息管理學院碩士研究生。研究方向:數字出版。
馬子寒,南京大學信息管理學院碩士研究生。研究方向:數字閱讀心理與行為。?
參考文獻
胡玉璽,王雨薇,程海威.智能出版:智媒時代傳統出版業務的轉型升級方向[J].科技與出版,2020(11):56-63.
張新新,齊江蕾.智能出版述評:概念、邏輯與形態[J].出版廣角,2021(13):21-25.
陳丹,鄭澤釩,張敏.我國數字出版研究綜述(2003—2023年)[J].現代出版,2024(1):36-46.
LITTELL J H, CORCORAN J, PILLAI V. Systematic reviews and meta-analysis[M].Oxford: Oxford University Press,2008:5.
宋偉,劉禹希,王金金.智能出版:開啟后數字出版新業態[J].傳媒觀察,2018(8):24-29.
易龍.從數字出版到智能出版:知識封裝方式的演進[J].出版科學,2023,31(1):81-90.
李新祥.出版定義的類型研究[J].出版科學,2011,19(1):43-48.
張新新.生成式智能出版:知識生成原理、沿革與啟迪:從智慧驅動到數據驅動[J].編輯之友,2023(11):36-44.
蘇磊,楊曉新.美國出版業人工智能應用研究[J].中國出版,2019(24):65-68.
匡文波,姜澤瑋.ChatGPT在編輯出版中的應用、風險與規制[J].中國編輯,2024(1):72-77.
楊曉新,楊海平.人工智能背景下的出版業知識服務模式研究[J].科技與出版,2019(11):61-65.
王鵬濤.出版業智能化發展研究的學術構想:關鍵維度與可用視角[J].新聞界,2018(11):95-100.
Concepts, Applications, Impacts and Measures of Artificial Intelligence in Publishing Industry: A Systematic Literature Review
TANG Jiajun, YANG Hailin, MA Zihan
School of Information Management, Nanjing University, 210023, Nanjing, China
Abstract: Combing through the current state of artificial intelligence (AI) research in publishing industry helps to clarify the development direction of the industry and promote the construction and improvement of the independent knowledge system of publishing discipline. This study employed a systematic literature review method, retrieved, screened, and analyzed 522 related literatures, and systematically summarized the core concepts, technical architecture, industry impacts, and response strategies of AI in publishing. The academic community believes that intelligent technology is deeply intervening in the entire publishing process, especially the application of generative AI (GAI) in content creation and knowledge production, which provides important support for the intelligent upgrading of the publishing industry. However, AI also brings ethical and practical issues, among which the copyright ownership and originality of AI generated content (AIGC) is particularly debated. The publishing industry should give fully play to its advantages in content resources and shift its roles to “knowledge service provider” and “knowledge gatekeeper”. By implementing “publishing as a service” model , the publishing industry is expected to achieve intelligent upgrading and build a new intelligent publishing ecosystem centered on high-quality knowledge resources.
Keywords: Artificial intelligence; Publishing industry; Intelligent publishing; Systematic literature review
* 基金項目:國家自然科學基金面上項目“隱私政策視角下企業數據合規與風險管理研究”(項目編號:72474101);國家自然科學基金面上項目“基于注意力機制的學術信息動態推薦研究”(項目編號:72074109)。