2025年政府工作報告指出,因地制宜發展新質生產力,推動科技創新和產業創新融合發展,激發數字經濟創新活力,持續推進“人工智能 + ”行動,將數字技術與制造優勢、市場優勢更好結合起來,支持大模型廣泛應用。因此,出版界積極探索DeepSeek大模型產品賦能出版的可能性、路徑以及落地方式。
一、DeepSeek大模型產品的介紹
2022年底ChatGPT的推出,雖被許多科學家認為是宣告大模型時代到來的一個標志,但由于其產品閉源、無法私有化部署、國外政策限制及技術封鎖、產品價值觀不齊等阻礙,國內企業仍未大規模部署應用大模型產品。直到2025年初,DeepSeek大模型產品的推出,國內企業才出現大模型產品的接入、部署現象。本科生院院長、人工智能研究所所長吳飛表示,目前,任何人都可以從DeepSeek網站自行下載與部署相關開源模型,正因如此,國內芯片、云計算以及應用等眾多企業和平臺得以迅速適配DeepSeek模型,讓其更快速地成為現象級AI應用[1]。
DeepSeek屬于通用人工智能(AGD大模型系列產品,為企業及開發者提供高效、低成本的大模型解決方案,解決傳統大模型推理成本高、垂直領域適配性差、中文處理能力不足等問題。2024年12月26日,DeepSeek-V3大模型推出;2025年1月20日,DeepSeek-R1大模型推出。
經過測試,V3以極低的訓練成本實現了與GPT-4o和ClaudeSonnet3.5等頂尖模型相媲美的性能;R1對標OpenAI-o1模型,運行成本僅為OpenAI、谷歌或Meta的流行人工智能模型的極小部分[2]。
從技術特點來看,訓練語料數據和通用能力(語言理解與生成能力、多模態能力)對評價大模型產品的性能十分關鍵。語料是用于訓練人工智能模型的原始數據集合,直接決定大模型產品的能力上限和應用場景,反映其對世界的認知和價值觀。研究表明,ChatGPT使用的訓練語料絕大多數為英文語料,主要源自英文網頁文本、報紙雜志、書籍等,這導致ChatGPT在中文理解及生成能力上存在價值觀對齊難題,更有學者認為西方在ChatGPT等技術手段的領先優勢下會強化全球認知不平等,并將自身的價值觀和利益偏好嵌于智能系統的邏輯[3]。因此,國內企業特別是國內出版企業在使用ChatGPT等國外大模型產品時易出現政策風險、價值觀風險、意識形態風險,學界也針對大模型產品的使用發出“為機器立心”的呼聲[4]。DeepSeek的出現則較好地解決了上述問題。在訓練語料上,DeepSeek大模型產品的訓練數據已達到萬億級token(模型處理的基本數據單位),與ChatGPT-4同屬第一梯隊。DeepSeek大模型產品由國內公司開發,適應我國文化、語言習慣,且中文訓練數據占比高,涵蓋現代漢語、文言文、方言及行業術語,尤其在古籍數字化和現代文本的融合上效果顯著,對中文語義、語法、文化、價值觀等理解能力較強,內置符合我國法規的敏感詞庫和過濾機制,價值觀對齊風險較小,更適合國內出版企業使用。
在通用能力方面,DeepSeek大模型產品引入混合專家模型,將復雜任務拆分為多個子任務,針對特定模式或數據分布優化,避免以往單一模型的“一刀切”現象,計算效率較高,且支持更新單個模塊而不需要重新訓練整個模型;采用知識蒸餾技術,將行業預訓練的大模型知識進行蒸餾,支持構建參數量級更小的模型,強化知識對齊,提高推理效率和資源利用率。可以說,DeepSeek大模型產品在通用性能上已位于第一梯隊,其上下文處理長度支持128KTokens(部分版本),與ChatGPT-4Turbo持平,且成本更低,更加適用于國內出版企業。
在部署成本方面,DeepSeek大模型產品具有多種蒸餾小模型,如1.5B、7B、8B、14B、32B、70B等,便于出版企業按照規模、算力要求、項目預算進行技術選型,選擇“預訓練模型微調”“混合云架構”(本地推理 + 云端訓練)等方式,降低部署配置要求,進一步控制部署成本。此外,DeepSeek大模型產品支持私有化部署,強調數據不出境。
出版企業部署應用DeepSeek大模型產品的現狀及挑戰
目前,國內已有多家出版企業積極應用大模型產品。例如:江蘇鳳凰出版傳媒股份有限公司探索開發了“鳳凰智靈”人工智能應用綜合服務平臺,正式部署了DeepSeek系統,計劃開發針對中小學教育的專業模型服務;龍源數字傳媒集團、中信出版集團接入了DeepSeek產品,并且部署了私有版本;古聯(北京)數字傳媒科技有限公司、陜西人民教育出版社、延邊教育出版社、廣東省出版集團數字出版有限公司都計劃部署或接入DeepSeek 大模型產品[5]。
盡管國內的一些出版企業已經對DeepSeek大模型產品進行部署并將其應用于業務流程改造升級,但在實際工作中仍然存在一些挑戰。首先,在人才隊伍方面,傳統出版企業大多由編、印、發三個環節的業務人員組成,缺少了解人工智能等前沿科技相關的人才儲備。其次,在內容準備方面,傳統出版企業對出版內容的數據化程度各不相同,這對應用DeepSeek大模型產品形成挑戰,如:出版企業是否已經具備成熟的內容數據庫,是否有對數據進行高質量的標引、采集;雖出版企業可以通過云端訓練的方式降低部署DeepSeek大模型產品的硬件成本,但是否結合相關訓練數據的質量、代表性、時效性等現實情況,提高生成內容質量。再次,出版企業部署應用DeepSeek大模型產品面臨版權風險。有研究認為,開發者應為創作主體,因開發者編寫算法、訓練模型,為內容生成奠定基礎;也有研究認為,使用者應為創作主體,因使用者引導內容生成的過程。值得注意的是,出版企業在使用DeepSeek大模型產品進行生成內容時可能生成與以往作品實質性相似的內容,甚至存在侵權情形。最后,出版企業部署應用DeepSeek大模型產品面臨意識形態風險。大模型產品的內容生成結果依賴于訓練語料數據,算法會通過對訓練集的模仿自動輸出具有價值傾向性的內容,若出版企業對語料數據的內容質量把控不嚴,易出現意識形態風險,且DeepSeek大模型產品被惡意使用和濫用,也會導致錯誤價值觀的內容生成[6]。此外,DeepSeek 大模型產品在內容生成時還會出現“幻覺數據”,即在處理大量數據時產生誤導性或不準確性的輸出,從而導致出版企業面臨意識形態風險。目前,出版企業只能通過多種技術和策略盡可能減少“幻覺”的發生概率[7]。
三、出版企業部署應用DeepSeek大模型產品的舉措
中共中央宣傳部印發的《關于推動出版深度融合發展的實施意見》提出,要著眼加強前沿技術探索應用、促進成熟技術應用推廣、健全科技創新應用體系,充分發揮技術對出版融合發展的支撐作用。出版企業作為市場主體和創新主體,應成為發展新質生產力的主要推動者,在機制、內容、人才隊伍等方面做好準備,強化頂層設計,創新運行機制,深入開展DeepSeek大模型產品應用研究,不斷積累和統籌優質數據及其資源,構建人才隊伍,為技術深度賦能出版融合發展提供底層支撐。
(一)創新機制
出版企業要實現技術的深度賦能,就要深入地思考如何將DeepSeek大模型產品與出版工作流程相融合,賦能內容創作、編校、營銷環節等,根據自身業務情況設定具體目標,確定應用場景,保證技術、成本的可控,并進行技術選型,最終實現技術落地,也就是出版企業突破傳統生產模式的束縛,在組織架構、業務流程和管理機制上進行系統性創新。這種創新不僅是技術層面的應用,更是出版企業向智能化、數字化轉型升級的核心驅動力。
第一,以場景驅動技術落地,創新應用評估機制。出版企業應基于實際業務需求,設定清晰的大模型產品應用場景和預期目標。例如,出版企業可以將DeepSeek大模型產品應用于內容創作、編校、營銷環節,建立“需求一場景一技術”三維評估機制,對選題策劃、初稿生成、智能審校、讀者分析等應用場景進行可行性分析,確保技術投入與業務目標高度匹配。第二,優化組織架構,創新管理機制。技術深度賦能出版全流程,勢必改變出版工作的傳統范式,出版企業應在管理機制上進行系統性創新。例如,在選題策劃階段,出版企業可以利用DeepSeek大模型產品進行市場數據分析,在編校環節引入智能審校工具,在營銷環節部署個性化推薦算法,并創新業務管理流程,完善出版流程、數據采集、大模型生成內容審核等配套制度,以建立大模型產品驅動的新型工作模式,使技術真正應用于出版全流程。
(二)統籌數據
出版數據包括在出版全生命周期中產生的各類結構化與非結構化數據,本質上是將人類知識進行數字化編碼的過程。從內容形態看,出版數據既包括傳統圖書生產過程中的選題申報、文本內容、編校記錄等結構化數據,也涵蓋數字出版時代的讀者閱讀行為、交互反饋等非結構化數據。出版企業部署應用大模型產品,實現大模型產品私有化,需要向其“投喂”高質量的行業特定語料數據,以提高大模型訓練數據質量,強化出版垂直領域的應用能力,提高內容生成質量和效果,實現內容產品的精準化生產和個性化服務。因此,出版企業應聚焦知識內容的數據化,將知識還原成數據,把文字、圖片、音視頻等作為數據的一種表現形式,做好數據的挖掘、采集、標引、存儲、計算[8],為數據“投喂”做好準備。此外,出版企業還應建立體系化的標準流程:一是確定數據源,如歷年出版物全文數據、編輯審校記錄、銷售渠道反饋、讀者信息數據等;二是確定數據處理技術,如數據清洗、分類、識別、采集等;三是確定數據質量控制技術及標準,如數據標注的審校制度、專業領域數據審核機制、數據質量評估模型等;四是根據垂直領域進行數據專項優化工程。例如:出版企業可以在教育出版方面針對教材知識點、錯題本等優化數據;在學術出版方面針對引文網絡分析、學科術語等優化數據;在大眾出版方面針對文學作品情感分析、暢銷書拆解、讀者畫像多維標簽等優化數據,從而統籌數據,提升DeepSeek大模型產品應用的精準度,重塑知識生產的底層邏輯。
(三)構建隊伍
出版企業想要將DeepSeek大模型產品真正應用于生產,必須構建“管理 + 技術 + 內容”三位一體的交叉復合型人才隊伍,涵蓋從模型適配、內容生產到業務落地的全流程。
在管理人才方面,出版企業應構建具備將大模型產品嵌入組織結構調整、人才戰略規劃、編印發業務全過程能力的綜合管理人才隊伍,從出版企業的內部管理、業務開展、組織架構、人才梯隊的頂層設計著手,利用大模型產品推動出版企業的轉型升級。在技術人才方面,出版企業應將相關大模型產品部署工作委托第三方技術公司完成,具備能與技術公司溝通算力資源配置、微調和領域適配、出版企業業務場景等具體業務的融合出版復合人才。在內容人才方面,出版企業應突破傳統的內容生產人才隊伍組成,明確編輯的核心價值從傳統的內容加工向智能化內容管理、人機協作創新和價值觀把控等方向演進,重構內容生產流程,使編輯轉變成人機協作設計師、數據內容工程師、價值觀與倫理守門人。
此外,編輯要充分掌握大模型工具的使用方法,如掌握大模型工具的提示詞應用,通過精準指令生成初稿、多語言版本等,由大模型產品完成 80% 的基礎內容,再通過人工注入獨家觀點、情感溫度、文化共鳴,最大化地使用大模型產品賦能內容生產流程,形成人機協作的工作場景。編輯也要理解大模型產品的技術特點、垂直領域內容,建立數據驅動的策劃思維,培養數據敏感性,積極參與出版企業已有內容數據庫的建設,保障數據庫的安全可信、動態更新,參與設計數據的挖掘、采集、標引、清洗等,豐富大模型產品的底層內容,提高內容生成和工作需求的匹配度,并通過數據重構策劃、指導策劃,提升項目的整體策劃水平。編輯還要識別DeepSeek大模型產品中的事實錯誤、偏見與倫理風險,把控意識形態風險,助力建立合理的數據反饋機制和安全可信、動態更新的信源和數據知識庫,對不同類型數據的可信度和危害程度建立標簽體系,降低人工智能幻覺出現概率,提升生成內容可靠性[9]。
四、出版企業部署應用DeepSeek大模型產品的展望
(一)內容生產的提質增效
DeepSeek大模型產品驅動出版生產流程再造。在選題策劃階段,DeepSeek大模型產品可以基于全網熱點分析和歷史銷售數據,智能生成選題可行性報告,提供包括市場容量預測、競品分析、讀者畫像生成等維度的決策支持。在創作階段,DeepSeek大模型產品可以發揮其強大的輔助創作能力,如:在專業出版領域調用行業知識庫,實時獲取最新法規條文、統計數據等參考資料;基于文字生成插圖、信息圖或可視化數據圖表;在文學創作領域根據海量信息分析,智能生成作品大綱;基于敘事學和讀者偏好分析,生成情節發展建議、人物關系圖譜等創意輔助;模仿特定作家的語言特色,幫助新人作者快速掌握專業寫作技巧等。在編校階段,DeepSeek大模型產品可以識別語法錯誤、進行專業知識核查,保證知識內容的準確性、專業術語的統一性,自動核對數據圖表與文字描述的匹配度,并完成書稿的校對、潤色,統一行文風格,縮短書稿編校周期等。在裝幀設計階段,DeepSeek大模型產品可以根據內容特征自動調整版式,提供智能排版設計,優化圖文混排效率等。
(二)融合出版的革新賦能
大模型產品正在豐富融合出版的內涵,助力融合出版的形態和交互方式的革新,賦能融合出版的快速更迭。在內容形態方面,DeepSeek大模型產品可以實現從單一文本到多模態內容的智能轉換,如將文言文自動翻譯為現代漢語,生成配套的解說視頻、互動問答、音樂、圖像等增值內容,豐富內容形態;根據讀者的年齡、職業、知識水平、興趣偏好等形成讀者畫像,將同一出版內容生成不同形態的出版產品,滿足不同讀者的閱讀需求。在融合出版的交互體驗方面,DeepSeek大模型產品可以基于不同圖書資源,開發相關智能體,為讀者提供超越以往智能問答機器人的交互體驗,并根據閱讀場景和閱讀設備的變化,保持多終端的內容同步與體驗連貫,基于對讀者的數據分析開發具備“讀者共創”功能的新型閱讀產品,根據讀者的情緒、喜好等特點,采集讀者反饋數據,實時調整內容深度、走向,自動優化閱讀內容。
(三)出版營銷的精準分析
大模型產品正在重塑出版營銷的全鏈條。在市場預測方面,DeepSeek大模型產品展現超強的趨勢洞察能力,可以通過分析社交媒體熱點、搜索指數、競品動態等多個維度的數據,預測市場走向、識別潛在的小眾爆款或滯銷品種,幫助出版企業調整營銷策略。在讀者洞察層面,DeepSeek大模型產品可以實現從“群體畫像”到“個體理解”的跨越,通過分析閱讀速度、暫停位置等讀者微觀行為,精準把握讀者的知識需求和審美偏好,實現個性化推薦。在社群運營方面,DeepSeek大模型產品可以輔助編輯同時管理多個讀者群,根據聊天內容自動推薦相關書籍,提升社群轉化率。在銷售層面,DeepSeek大模型產品可以實時分析渠道庫存、促銷效果、競品動態等數據,自動生成最優的鋪貨建議,助力庫存周轉率提升。在促銷內容創作方面,DeepSeek大模型產品可以根據內容特性和目標讀者,自動生成數百個營銷文案。
五、結語
DeepSeek大模型產品是出版業發展新質生產力的重要驅動力,無論是出版企業還是編輯,都應合理應用DeepSeek大模型產品,處理好應用過程中的法律、價值觀、意識形態等問題[10],助力構建出版業高質量發展的宏偉藍圖。
[參考文獻]
[1]DeepSeek時刻,撬動AI產業鏈巨變[EB/OL].(2025-02-17)[2025-05-20 ] .https://news.cctv.com/2025/02/17/ARTIcwq1IQq1NRioVFq5kJYF250217.shtml.[2]霸榜刷屏“掀翻”美股引爆AI圈的東方“黑馬”DeepSeek啥來頭?[EB/OL].(2025-01-28)[2025-05-20].https://news.cctv.com/2025/01/28/ARTIseZvpXwrYQqPyqZZTA9u250128.shtml.
[3]鄭恩,劉沫瀟.全球傳播秩序的算法重構:DeepSeek挑戰西方中心主義的AI認知霸權[J].學術探索,2025(05):53-64.
[4]翁之顥.“為機器立心”:智能編輯價值觀對齊的意義、難點與路徑[J].中國編輯,2025(02):87-93.[5]張馨宇.數字出版人熱議DeepSeek[N].中國出版傳媒商報,2025-02-14(03).
[6]許潔,袁小群,朱瑞,等.基于大模型的輕量級智能出版知識服務:理論基礎與實現路徑[J].中國數字出版,2024(01):25-35.
[7]何靜,陳逸然,戴田宇.基于謠言傳播機制的大模型幻覺減輕策略[J].實驗技術與管理,2025(02):96-103.
[8]張新新.“數據要素 × 出版”:從數字出版走向數據出版[J/OL」.圖書情報知識,2025:1-10[2025-05-20].https://kns.cnki.net/kcms2/article/abstract?v Ψ= db-EbSzo3oiRA5g9smximozbDThSzcSyG-OuEaQcEbwpnLszsaEGmDgvyxqdw7OLHrA_mKiDvqGfUdUJixVeCwJBEOnYpG2kutWrW3C4v12b2eveF8O7KYhnBisV6Jc2lcDJUyBchD9XK-ebVIhRyHZnyt8GRNxggtYXcmzgboteI8IayZTzhQ 1== amp;uniplatform τ1= NZKPTamp;language L= CHS.[9]白楊.構建自主可控AI生態警惕“幻覺數據”帶來的風險[N].21世紀經濟報道,2025-03-10(003).[10]張博,馬穎蕾,馬晉宇.基于語義知識圖譜的出版應用模式研究[J].出版發行研究,2025(02):45-53.