
2025年1月,國內深度求索公司推出DeepSeek-R1人工智能大模型,引起全球科技行業關注。R1模型在技術上實現了重要突破一一用純深度學習的方法讓AI自發涌現出推理能力,在數學、代碼、自然語言推理等任務上,性能比肩美國開放人工智能研究中心(OpenAI)的o1模型正式版,同時該模型具備開源形式、高性能和低成本等優勢。根據路透社報道,因受到DeepSeek人工智能大模型沖擊,美國芯片巨頭英偉達NVIDIA)當日股價暴跌約 17% ,博通(Broadcom)公司股價下跌 17% ,超威半導體公司(AMD)股價下跌 6% ,微軟股價下跌 2% 。納斯達克(NDX)副主席麥柯奕(RobertMcCooey)表示,DeepSeek將是人工智能領域革命的重要組成部分[]
DeepSeek作為一款國產開源大模型,其在技術應用上與中文語境中的內容生產更加適配,尤其在新聞行業中,其高效、多元且惠普的特點能夠為新聞生產帶來多層次價值,推動新聞內容生產創新發展,不斷賦能新聞業數智化轉型。
一、DeepSeek大模型對內容生產的影響
隨著近年來人工智能技術在全球范圍內的高速發展,內容生產領域在此趨勢下被賦予新生產動能,生產形態受到深刻影響。DeepSeek大模型的出現更是為中文內容生產帶來更先進的技術支持,同時也以新生產要素角色影響著內容生產領域。
(一)新技術優勢創新內容生產形態
DeepSeek在短時間內迅速躋身全球先進智能大模型行列,成為全球現象級模型,離不開諸多技術層面的開創性特點。例如,DeepSeek于2024年12月發布并開源的DeepSeek-V3模型,在編程能力、數學推理、中文理解和長文本理解等領域表現出色,得益于其采用的混合專家(mixtureofexperts,MoE)模型具備細粒度設計和共享專家策略的獨特之處,能夠通過稀疏激活機制,大幅擴展模型容量的同時減少計算量,從而降低模型的儲存需求和計算成本。加之DeepSeek團隊提出無輔助損失負載均衡(auxiliary-loss-free load balancing,ALFLB)策略,引人8位浮點數(1oalingpoint8-bi1,FP8)混合精度訓練框架等技術創新,都將模型的計算負荷和訓練成本降低,從而顯著提升模型性能。以及DeepSeek團隊于2024年2月提出群體相對策略優化(grouprelalivepolicyoplimizalion,GRPO)的強化學習算法,并運用于DeepSeek-R1-Zero模型,使模型獲得高效而低耗的訓練效果。到DeepSeek-R1模型時,團隊創新傳統的監督微調(Super-visedFine-Tuning,SFT)和強化學習(reinforcementLearning,RL)方式不斷訓練模型,以提高模型的通用能力、可用性和安全性[2。在DeepSeek團隊大量的技術創新與優化訓練中,DeepSeek大模型逐漸擁有更智能、高效而低成本的內容生產價值,也為內容生產帶來創新動能。
(二)新生產要素加深產業倫理困境
DeepSeek大模型作為一種新生產動能,其推動了內容生產領域的創新發展,同時,也逐漸成為新生產要素,對原本以人類勞動者為生產主體的內容產業產生了影響。一方面,DeepSeek天模型以更高效的內容生產力減少了人類重復性勞動,并作為輔助協同角色參與內容生產,形成人機協同新范式;另一方面,DeepSeek大模型強大的內容生產力也再次加劇了文科危機,引起就業結構的變革,一些基礎內容撰寫、標準化設計等簡單類工作需求下降,相應的就業崗位也隨之縮減?!赌巷L窗》在2024年年底發表《全球文科倒閉潮,來了》文章,講述了在新冠疫情爆發、財政壓力加大的全球經濟背景下,世界各地的許多大學都取消或減少了文科學科投人[3。而DeepSeek大模型的出現,則作為國內內容生產領域的新科技變革,以強大的深度學習和自動生成能力在一定程度上進一步擠壓了文科的生存空間,加重了文科生存困境。
此外,DeepSeek大模型與過往人工智能大模型的設計方式一樣,其核心架構依賴于人類主導的訓練范式與社會歷史數據構建的知識體系,而這種建構方式也隱藏著系統性繼承數據帶來的社會文化偏見。DeepSeek的推理模型基于概率預測進行的內容生成也存在真實性風險[4。這些都成為DeepSeek大模型在內容生產過程中可能帶來的倫理風險。
(三)DeepSeek可能產生的“AI幻覺”對內容生產產生不確定性
由于DeepSeek在內容生成時,會根據概率預測而非事實依據生產內容,由此,也可能帶來看似合理,但實際信息與事實不符的“AI幻覺”。現象。例如,DeepSeek在回答“山姆每年為京東即時零售帶來多少訂單”的問題時,DeepSeek語氣肯定地提供了一個虛假數據,并生成不存在的“京東今年將和山姆展開新合作”的信息。在學術領域,有用戶發現DeepSeek生成的文獻綜述中出現虛構的參考文獻,并且DeepSeek被發現擅長使用陌生信息和專業領域的詞匯來胡編亂造等[5]。DeepSeek在內容生產過程中由于其具備推理預測功能,基于詞頻概率生成內容,導致其在缺乏數據支持時“填補空白”而可能產生“AI幻覺”,生成失真信息。根據VectaraHHEM人工智能幻覺測試,推理模型DeepSeek-R1的幻覺率達 14.3% ,是其基座模型DeepSeek-V3的近4倍,遠超行業平均水平[。作為概率模型,DeepSeek的優化目標是語言流暢性而非事實準確性,這也讓DeepSeek在內容生產過程中產生不確定性,尤其在專業領域所產生的“幻覺”往往借助專業術語包裝而具有隱蔽性,對于內容生產而言存在一定風險與挑戰。
二、DeepSeek大模型對新聞內容生產的價值
DeepSeek大模型以更高效智能且低成本的特點影響了內容生產領域,并帶來新的生產要素和生產關系變革,尤其對于內容生產需求龐大的新聞行業來說,DeepSeek大模型帶來的生產價值顯得更為突出。
(一)低成本應用促進智能化生產推廣
相較于此前美國的OpenAI、Anthropic和GoogleDeepMind等依托強大資金、算力和數據優勢,而推出的閉源模型[7],DeepSeek大模型以“低成本 + 高性能 + 開源”策略推出。同時,其推理性能對標OpenAI-o1正式版,從而讓新聞媒體無需巨額投人即可構建智能采編系統。自DeepSeek大模型于2025年1月20日發布以來,來自各地的新聞媒體紛紛接人DeepSeek-R1大模型,“DeepSeek傳媒行業應用創新聯盟”宣布成立。媒體通過將大模型接入于報業集團和廣電集團等主流媒體旗下的新媒體,來推動新聞內容創新和用戶服務優化。例如,天眾報業集團天眾新聞客戶端、河北日報報業集團縱覽新聞客戶端、四川日報報業集團川觀新聞客戶端、成都傳媒集團每日經濟新聞客戶端、江西日報社江西新聞客戶端、河南廣播電視臺大象新聞客戶端、浙江廣播電視集團智媒果平臺等20余家媒體在2月初都宣布接人DeepSeek大模型,并且接人的媒體數量仍在增長中[8。DeepSeek大模型的開源性為新聞媒體提供了低門檻接人的便利,這也成為更多新聞媒體推進智能化內容生產的契機。
此外,DeepSeek大模型在新聞媒體應用過程中也展現出靈活、低限制的特點,更有利于新聞實踐中的智能技術應用。DeepSeek大模型基于其研發過程中的模型框架創新方式,打破傳統Transformer架構局限,提升了 40% 推理效率,并減低對顯存的依賴。分層次知識蒸餾體系讓模型在輕量化進程中精準捕獲復雜語義邏輯等,都讓DeepSeek大模型在新聞內容生產中更便捷智能。尤其在對內容質量、時效要求較高的新聞內容生產過程中,DeepSeek大模型可推動全鏈條自動化創作,如華數傳媒通過DeepSeek大模型,實現輸入原始文本后90分鐘內即可產出高質量短視頻的內容生產效果[。DeepSeek開源推理模型擁有突出的性價比優勢,為新聞媒體提供了“低成本投人,高效能服務”的應用價值,有力地促進新聞內容生產的智能化轉型。
(二)場景化算法模式提升新聞生產效率
DeepSeek應用模型框架創新、模型訓練優化、高效強化學習和數據蒸餾等系列技術創新,能夠通過動態路由機制匹配最優解決方案,顯著提升內容生產各環節的算法適配精度與執行效率。例如,在選題策劃過程中,DeepSeek能夠篩選社交媒體中的熱點話題,快速搜集或定位海量數據資料,通過熱點預測模型識別具備潛在新聞價值的選題;在新聞寫作中,體育賽事、財經報道等領域里,DeepSeek根據結構化數據自動生成新聞稿件,從而減少記者重復、瑣碎的勞動,讓記者將更多精力投人到深度調查和創意策劃等創作性工作中;在新聞傳播分發過程中,DeepSeek運用全面的數據分析與用戶反饋技術,通過深入分析用戶在平臺上的觀著時長、互動頻率、瀏覽路徑等行為數據,結合情感分析算法,精準洞察用戶對不同內容的態度、喜好和反饋意見,從而更精準定位目標用戶,為用戶提供個性化服務、提升新聞內容的傳播效果[10]。DeepSeek以更強大的算法能力為新聞生產帶來更高效的內容生產輔助,促進不同新聞生產場景下的智能精準化內容生產。
DeepSeek以更具場景化的算法模式推動新聞生產高效運作,在新聞生產過程中展現出突出價值。例如,四川日報報業集團自主研發的四川智媒云平臺將DeepSeek-R1大模型能力集成至媒體采編系統,借助DeepSeek強大的自然語言處理能力完善智媒大模型,在智能采編方面,實現通過語義分析技術進行跨平臺熱點追蹤;在內容生成維度,提升智能摘要等實用功能的生成質量;在傳播效果反饋方面,助力平臺對全網傳播效果的監控等工作。四川日報報業集團于2024年7月打造的“智媒大模型”成為同時獲得國家“生成式人工智能服務備案”和“境內深度合成服務算法備案”雙備案的大模型[1],在DeepSeek大模型發布后,四川日報報業集團融入DeepSeek的技術能力進一步加強不同應用場景下的智能內容生產,由此持續提升主流內容的生產效率。
(三)深度互動豐富新聞生產路徑
DeepSeek通過創新負載均衡策略、實現注意力機制以及采用多token預測技術,達到更深度的自然語言對話能力,而這種更精準有效并且實時在線的對話互動能力,能夠幫助媒體打造更智能化的用戶服務,為用戶提供多渠道、個性化的新聞內容獲取方式,同時也豐富了新聞生產路徑。例如,江蘇有線網絡發展有限責任公司江陰分公司通過對公客業務、政企業務的知識庫進行提煉總結,并用信息數據對DeepSeek大模型進行投喂訓練,智能化打造大眾業務,用戶可通過應用平臺與AI客服對話,以全面了解江陰分公司的各類公客業務,獲取當地相關新聞資訊,或進行套餐查詢、故障報修。江陰分公司還計劃把DeepSeek大模型植人具體業務,如應用于數字鄉村(智慧社區)平臺,通過投喂村社區的公共信息、村社區治理規范條例等更好地服務民眾的信息需求,也推動新聞生產的智能化平臺化拓展[12]。
同時,對于新聞生產者而言,DeepSeek的深度互動也在新聞內容生產過程中提供了輔助性作用。一方面,DeepSeek通過可解釋性生成技術(ExplainableGeneration),在內容輸出時同步展示推理邏輯鏈。例如,在撰寫深度報道時,系統會呈現選題價值評估矩陣(如社會關注度、政策相關性、數據支撐度等維度權重)、信息檢索路徑(跨平臺信源關聯圖譜)及觀點生成依據(如專家觀點引用密度與矛盾點標注)。這種透明化的工作流程為新聞生產者提供了創作腳手架,從而激發新聞內容生產的創作靈感。另一方面,DeepSeek的推理和語言表達邏輯嚴密,再現信息的每一步都提供內在聯系與前提,對于新聞生產者而言就如主講人或咨詢機構一樣分步驟、按邏輯進行不斷對話與解答,這種便捷且高效的深度互動方式為新聞內容生產帶來更多元的信息獲取及邏輯思考路徑。
三、DeepSeek大模型賦能新聞內容生產的創新路徑
DeepSeek所具備的高性能、低成本、完全開源等特性,打破了我國生成式人工智能應用面臨的技術壁壘[13],與此同時,也改變了包括內容生產在內的多個領域的產業格局,其不斷擴散的應用浪潮也進一步推進了新聞內容生產的創新發展。
(一)推動新聞生產本土化智能融合
國產大模型DeepSeek在擁有強大技術性能的同時也具備更強的中文適配性,對于中文語境下的新聞生產智能化發展而言具有更突出的創新價值。DeepSeek實現了高精度中文建模,其基于龐大的中文語料庫訓練,不僅在捕捉、運用漢語方面表現出色,還具有多種語言運用能力,從而支持更廣泛的新聞與信息的全球覆蓋。在一系列創新技術和算法架構的基礎上,DeepSeek既提高了模型效率,同時,也在邏輯推理、長文本處理方面表現出色,作為在中文語境下開發訓練的智能模型,其在處理中文環境中的內容生產任務和場景判斷中體現出更高效、準確、安全的特點[14]。例如,中國廣電股份公司依托國家文化大數據服務平臺完成DeepSeek大模型的本地化部署,助力提升內容生產效率、傳播精準度和內容版權的可追溯性;歌華有線將在公有云API部署DeepSeek,推出智能助手,包括高效文本識別、智能分詞與標注、知識圖譜構建、多模態數據融合以及智能輔助創作等多項前沿功能;湖北廣電通過打造“楚韻智能體”,深度融合荊楚文化數字資產,訓練出具備方言理解能力的專屬模型,地域文化內容生成準確度達 92%[15] 。廣電網絡積極接人DeepSeek大模型,借助DeepSeek豐富準確的中文內容處理能力,賦能新聞內容智能化生產,拓寬與創新中文語境下新聞內容智能化融合維度。
(二)驅動新聞行業人機協同高效演進
DeepSeek大模型一經推出便受到包括新聞行業在內的社會各領域的廣泛關注與積極應用,這一技術趨勢也驅動著各行業工作者加強技術應用能力,不斷提升生產過程中的人機協同性。例如,在大眾報業集團,各媒體記者運用DeepSeek輔助分析類、評論類作品的問題分析與創作工作;在智庫研究、輿情分析等業務中,數據分析人員借助DeepSeek進行數據梳理、信息分析和長文本提煉。正如四川日報全媒技術中心首席產品官董曉尚所說,“AI可以承擔重復性工作,如數據整理和初稿生成,而記者則可以轉向深度調查、故事挖掘和內容審核”[16。在DeepSeek 技術融入下,新聞內容生產過程中的人機角色也發生轉變,記者與智能技術的關系不再是簡單的勞動者與工具的關系,而是在相互的配合與輔助下形成新聞內容生產的新模式,即智能技術逐漸轉向成為具有生產主體性質的角色,與記者一起參與到新聞內容生產的過程中;記者則作為主導者將更多精力投人內容生產的方向把控、價值判斷、深度挖掘等工作中。在這種更高效的人機協同內容生產中,新聞內容的生產也不斷具備更高層次的準確性、客觀性和高效性。
(三)促進新聞內容多模態化生產
DeepSeek大模型不僅在內容生產上展現出低成本與高性能的特點,其通過自然語言處理(NLP)、計算機視覺(CV)和多模態的信息融合技術具備了更豐富多元的多模態生產能力。在新聞內容生產過程中,DeepSeek的多模態生產能力能夠實現重大新聞事件中新聞內容的多形式呈現與實時分發,從而保證新聞報道在事件的動態化發展中能夠及時全面跟進,達到新聞事實的充分敘述。例如,在2025年全國兩會期間,各大媒體紛紛利用DeepSeek大模型助力全國兩會報道數智化升級。北京廣播電視臺推出創新性數智化報道平臺,以“AI主持人 + 智能交互”創新新聞內容傳播體驗,在北京時間客戶端上線“BRTV兩會小助手”[17];云南廣播電視臺七彩云客戶端打造“小彩云”,接人DeepSeek大模型,借助DeepSeek的多模態生成能力為用戶提供圖像、聲音、文字等多種媒介形式組合的新聞內容[18]。此外,DeepSeek也在多模態生成方面不斷創新發展,例如,當虹科技BlackEye多模態視聽大模型融合DeepSeek-R1和DeepSeekJanus-Pro后,完成了多個垂類場景的數據調優訓練,模型的推理能力和運作效率大幅提升,有力實現“一鍵成片”。在DeepSeek的支持下,新聞內容生產實現更豐富高效的多模態生成,有力促進新聞生產的智能化創新發展。
結語
DeepSeek人工智能大模型在技術創新、性能優化、生態完善的基礎上展現出更智能高效的生產能力,并以其低成本、高效能、完全開源的特點為內容生產領域帶來深刻影響。一方面,DeepSeek的諸多技術性開創為內容生產帶來更出色的推動力,促進內容生產的創新發展;另一方面,也作為新生產要素擠占人類生產者的生存空間,并由于模型自身運作原理而可能存在內容真實性風險。在新聞內容生產領域,DeepSeek以其低成本應用優勢促進新聞媒體對其廣泛接入,實現智能化生產;技術創新后的場景化算法為新聞生產提供了更高效、精準的內容生成力;進一步的深度互動特點助力媒體打造更豐富的新聞生產路徑。同時,DeepSeek也以其更強的中文適配性、更高效率的生產能力、更豐富的多模態處理特點,創新了新聞內容生產的本土化智能融合、人機協同演進和多模態生產,為新聞生產帶來新興驅動力,不斷賦能新聞內容生產的創新發展。但是,DeepSeek技術應用在賦能主流媒體新聞內容生產的同時,也為新媒體提供了均等的技術應用及信息獲取機會,為主流媒體新聞內容生產專業化、個性化帶來一定的挑戰。主流媒體特別是區縣級媒體要利用自身在地化優勢,進行本地化部署,在算法準、算力強的同時,加大算料“喂料”,突出本地新聞內容生產優勢。
參考文獻:
[1]環球網.DeepSeek崛起沖擊美股,美國芯 片巨頭英偉達股價暴跌后迅速發聲[EB/OL].(2025-
01-28)[2025-03-20].https://world.huanqiu.com/ article/4LFhgmzDsVY.
[2]張慧敏.DeepSeek-R1是怎樣煉成的[].深圳大學學報(理工版),2025(2):226-232.
[3]南風窗.全球文科倒閉潮,來了[EB/OL]. (2024-12-27)[2025-03-20].https://news.qq.com/ rain/a/20241228A040JY00.
[4]新京報傳媒研究.記者應該怎么用DeepSeek [EB/OL].(2025-02-20)[2025-03-20].https://www. Xwpx.com/article/2025/0220/article_71741.html.
[5]虎嗅APP.普通人如何逃離DeepSeek幻覺陷 阱[EB/OL].(2025-02-28)[2025-03-20].https://www. huxiu.com/article/4067127.html.
[6]三聯生活周刊.為什么我的DeepSeek總在一本正經胡說八道[EB/OL].(2025-03-04)[2025-03-20].https://mp.weixin.qq.com/s/Ufm6I7pgG4SLgOdLraZqLw.
[7]段玉聰.搶占AI話語權:DeepSeek的技術優勢、戰略布局與未來生態圖景.新疆師范大學學報(哲學社會科學版),2025(4):1-17.
[8]中國新聞出版廣電報.對接DeepSeek,主流 媒體破浪前行[EB/OL].(2025-02-18)[2025-03-20]. https://epaper.chinaxwcb.com/epaper/2025-02/18/ content_99855062.html.
[9]36氪研究院.36氪研究院|DeepSeek:從技術破局到多領域賦能的AI創變者[EB/OL].(2025-02-28)[2025-03-20].https://36kr.com/p/3185987711967112.
[10]
[16]傳媒瞭望.首批接入DeepSeek的5家主 流媒體講嘗鮮感受[EB/OL].(2025-02-25)[2025-03- 20].http://47.106.15.148/portal.php?mod °leddash viewamp;aid=18372.
[11]四川在線.智媒服務深度求索川觀智媒 大模型融合接入DeepSeek[EB/OL].(2025-02-10) [2025-03-20].https://sichuan.scol.com.cn/ggxw/ 202502/82897643.html.
[12]江蘇有線.擁抱機遇應對挑戰:江陰分 公司“牽手”DeepSeek大模型,探索智能化服務 新業態[EB/OL].(2025-03-13)[2025-03-20].https:// stock.10jqka.com.cn/20250314/c666699033.shtml.
[13][14]魏鈺明,賈開,曾潤喜,等.DeepSeek突破效應下的人工智能創新發展與治理變革.電子政務,2025(3):2-39.
[15]人民郵電報.中國廣電網絡接入DeepSeek在5G智能客服、內容生產革新等領域進展積極[EB/OL].(2025-02-21)[2025-03-20].http://finance.people.c0m.cn/n1/2025/0224/c1004-40424585.html.
[17]北京時間.BRTV全國兩會報道人工智能小助手“小京”首次亮相[EB/OL].(2025-03-03)[2025-03-20].https://item.btime.com/23g3rl72l4tkl247kf9jhbtOhft.
[18]七彩云端.“云南視聽第一端”七彩云端成為云南首個正式接入DeepSeek的媒體應用[EB/OL].(2025-02-21)[2025-03-20].https://www.yntv.cn/news/20250221/1740130432718284.html.