【摘要】DeepSeek的上線引起世界IT界和新聞業的轟動,但也激起美國官員和一些國家政府的恐懼,這款智能模型在這些國家被禁用。相反,西方廣大用戶卻熱烈擁抱它,使用它增強收發新聞與信息的技能。DeepSeek-V3的強大功能和應用場景火爆出圈,吸引了大量用戶的青睞。
【關鍵詞】DeepSeek;新聞業的新寵;精準效能;詆毀的落空
2025年1月20日,杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“深度求索公司”)正式發布DeepSeek-R1大語言模型,向全球網絡發送聊天機器人界面移動程序,超越了美國OpenAI的ChatGPT APP。DeepSeek的迅速崛起引起世界AI界和新聞業的震動,認為美國智能技術被中國拋在后面,美國AI公司的股票立刻遭到重創。[1]而后,DeepSeek-V3于2月3日又陸續上線國家超算互聯網平臺。令世界AI界吃驚的是,DeepSeek-V3的訓練僅用了2個月,花費557.6萬美元,而美國的ChatGPT-4訓練成本約為1億美元,訓練時間長達6個多月。智能信息技術廣泛用于新聞媒體和網絡用戶,DeepSeek-V3的語言處理與推理能力,為媒體生成內容提供了快捷、全面的服務,各國媒體和用戶體驗到新聞和信息傳播的精準效能。
一、DeepSeek引發全球媒體的熱議
2024年11月20日,DeepSeek-R1預覽版正式上線,僅僅發布一周,在世界火爆出圈,外媒用“震動硅谷”來形容它對美國智能行業的沖擊。英偉達聲明說,DeepSeek-R1模型是“一項出色的人工智能進步”,“展現了難以置信的成就”。此話剛剛落地,英偉達股價立刻跌去17%。從特朗普到美國政界都感到了前所未有的危機,DeepSeek卻迅速引起全球新聞界的熱議,紛紛討論DeepSeek-R1和DeepSeek-V3的推理、代碼生成、多模態語言交流的高效與靈活。DeepSeek-V3作為我國全面開源的大模型,打破了西方閉源技術的壟斷,吸引了全球智能技術開發者與媒體企業的關注,微軟Azure、亞馬遜AWS、英偉達等國內外平臺紛紛接入,推動了AI信息技術的飛躍和升級。
自ChatGPT問世以來,人工智能一直占據著新聞頭條,但DeepSeek以極其低廉的價格提供開源版本,點燃了世界科技界和媒體的熱點。DeepSeek遠超媒體對ChatGPT應用程序的關注,在全球約有7萬次媒體報道,僅在美國就有近2萬次,2025年1月26日全天,美國媒體就出現了6.3萬多次報道。[2]在西方,每個新聞與公關從業者都對DeepSeek作出強烈反應,美國總統就職典禮后,有關DeepSeek的新聞占據了主導地位。美國媒體對DeepSeek的報道大多持積極態度,也不乏令其擔憂的聲音,紛紛議論它對美國人工智能行業的顛覆性影響。美國媒體對DeepSeek報道的關鍵主題是:
(1)對OpenAI、谷歌、Meta和Anthropic等人工智能領軍企業和智能媒體構成挑戰,DeepSeek成為智能媒體發展的轉折點,引發智能公司和新聞界重塑競爭格局。
(2)將DeepSeek訓練過程、資源利用和基礎設施的高效性,同美國人工智能模型的訓練方法和昂貴成本進行了對比,認為它碾壓了美國智能技術及其媒體的效率。
(3)大量新聞反映DeepSeek掀起全球市場波瀾,投資者對其重振人工智能經濟的潛力作出肯定。
(4)DeepSeek對開源人工智能的承諾被廣泛討論,認為它可能成為行業游戲規則的改變者,將加速全球人工智能的發展;另一些新聞則強調開源模式的廣泛采用可能帶來風險,并提出質疑。
(5)新聞報道也指出DeepSeek的弱點是由于網絡用戶需求過大,可能導致對各類機構的服務中斷,引發相關的安全問題。
美國媒體報道的這五個主題,界定了DeepSeek對人工智能技術的明顯突破,承認它將成為推動智能行業廣泛變革的催化劑。
DeepSeek之所以引起美國媒體狂潮般的報道,是因為它不是美國智能技術的復制,而是具有6710億參數、14.8萬億詞元(token)的大模型,為全球人工智能、互聯網與各類媒體的信息傳播樹立了里程碑。美國Meta公司首席AI科學家Yann Lecun表示,DeepSeek-R1在AI領域正在超越美國公司的產品,標志著開源大模型在某些領域已經接近或超越越閉源模型。Meta公司CEO扎克伯格則認為,DeepSeek展現出的技術實力和性能令人印象深刻,中美之間的AI差距已經相差無幾。微軟首席執行官薩提亞·納德拉在達沃斯世界經濟論壇上進一步論證:“DeepSeek的新模型令人印象深刻,尤其是在高效開源模型以及推理計算方面,算力效果非常出色。我們應當非常、非常認真地對待來自中國的這些技術進展。”谷歌前首席執行官埃里克·施密特強調,DeepSeek的崛起標志著全球人工智能競賽的轉折點,證明中國可以用更少的資源與大型科技公司競爭。[3]據日本《日經亞洲新聞》2月5日報道,谷歌首席執行官桑達爾·皮查伊和美國超威半導體公司(AMD)首席執行官蘇姿豐稱贊深度求索公司作出了重大貢獻。皮查伊認為,DeepSeek能夠應用于更多用途,為美國科技巨頭開拓了“機遇空間”。蘇姿豐指出,DeepSeek用新方法和更少的基礎設施實現(AI的)訓練和推理能力,讓人們能夠繼續挖掘AI資源,拓展了AI的應用領域,使其為更多的網民使用。美國科技公司英偉達NIM、微軟Azure、亞馬遜AWS等智能云平臺已引進DeepSeek上線,支持用戶訪問DeepSeek-R1模型。
人工智能DeepSeek對媒體傳播新聞產生的驚人效益也引起了歐洲媒體和科學家的注意,他們同樣興奮地表達了自己的評價。德國廣播電臺在一篇新聞中寫道:“來自中國的AI語言模型DeepSeek改變了技術行業,美國科技公司的優勢似乎被打破,這對歐洲的發展意味著什么?德國和歐洲也在開發人工智能,但是尚未開發出強大的語言模型?!边@家媒體的記者采訪了科學家拉斐爾·拉古納·德拉維拉(Rafael Laguna de la Vera),他表示,歐洲仍有能力迎頭趕上,這并非不可能。“DeepSeek現在已證明,比美國競爭對手更高效、更低成本、更節約資源?!盵4]英國BBC在一則報道中稱,中國新推出的人工智能應用程序DeepSeek以驚人的速度震撼了科技行業、市場以及美國在人工智能領域的優越感。英國《金融時報》將DeepSeek描述為“震驚國際科技界的黑馬”,其性能已與資金雄厚的OpenAI等美國競爭對手的模型相媲美。英國《經濟學人》在一篇文章中表示,中國AI技術在成本效益方面的快速突破,已經開始動搖美國的技術優勢。
DeepSeek算力的優化及普及,使每個用戶都能在家用設備和手機上,搜索一切媒體的新聞和信息。DeepSeek的性能還表明,這個技術不再是高端研究機構的專利,而是每個人都可隨時接收或向網上發送新聞的工具,它以令人稱奇的覆蓋空間帶來強勁的新聞傳播效應。在蘋果AppStore社區中,現在DeepSeek的用戶已超過長期霸榜的ChatGPT,有160多個國家或地區下載使用它,僅俄羅斯就有超過500萬人使用,DeepSeek已成為全球公民不可割舍的交流新聞與信息的巨大容器。
二、DeepSeek竭盡職守的新聞服務
美國新聞學者對DeepSeek聊天機器人進行了多次測試,考證網站上這款移動應用程序的細節和效用,多家媒體對它的鏈接與新聞報道贊嘆不已。最值得注意的是,DeepSeek欣然承認,它能分享所有的新聞和文章,并繞過訂閱付費墻。如果是純新聞,不涉及版權問題,DeepSeek以四種不同設置,迅速呈現系統與更新、“搜索”新聞或信息、瀏覽網頁與“深度思考”。在第四種設置模式(深度思考)下,它首先以推理匯集全面的新聞信息,回應媒體或用戶的需求。美國人工智能尼曼實驗室撰稿人安德魯·戴克(Andrew Deck)說:“在我的標準模式測試中,DeepSeek確實在幾個場合沒有出示來自何種新聞出版物的內容,似乎莫名其妙、不知從何接入而將其呈現出來,實際鏈接的是《大西洋月刊》(The Atlantic)和《政治報》(Politico)等主要媒體的新聞梗概。盡管DeepSeek通常不提供新聞源的出處,相反,卻在推出的文本中直接注明標題、作者或新聞發布日期,并標注署名。然后它建議我自己在新聞發布商的網站上搜索那篇文章,促使我分享了《華爾街日報》2018年對唐納德·特朗普參與向斯托米·丹尼爾斯和凱倫·麥克杜格爾支付封口費一事的調查。”DeepSeek這樣回答我:“如果你想找到原文,我建議你在《華爾街日報》的網站上搜索,或者通過新聞檔案搜索?!薄叭绻阌龅搅烁顿M墻,考慮檢查免費文章配額或限制訪問,您需要進一步的幫助,請告訴我!”[5]這說明DeepSeek為了防止擅自轉載媒體分析性新聞而造成侵權,設置了巧妙的策略,讓受眾去尋找發出新聞的出版物來閱覽原文。
DeepSeek重視轉載新聞并遵守著作權法而采取周到的措施,同時為了受眾閱讀方便,提供了更加具體的新聞出處與收受方式。DeepSeek在另一條回答中建議安德魯·戴克找一家當地的圖書館,那里可能有《華爾街日報》的免費電子版。當網絡搜索被關閉時,DeepSeek經常鼓勵用戶離開這個平臺——退出它的界面,尋找更可靠的消息來源。安德魯·戴克說,在解釋新聞內容時,DeepSeek明確表示,它對人們提問的回答可能侵犯版權,轉發的文章很可能有付費墻,如果不對用戶說明這一點,既可能違反規定,也可能給用戶帶來麻煩。DeepSeek經常建議用戶自己搜索文章,只是告訴用戶新聞作者的名字和發表時間,幫助他們搜索,這就不會遇到付費墻,畢竟有些媒體每月提供有限數量的免費新聞和文章。這款聊天機器人有時明確地告訴新聞用戶:“我不能繞過付費墻提供未經授權的信息,尊重版權的訂閱很重要。”對其他類似的聊天機器人(包括ChatGPT、Claude和Perplexity等)的訪問,很少提醒人們注意新聞出版商要求付費,更不會公開討論侵犯版權問題。DeepSeek負責任地為用戶提供訪問方式,對選擇新聞媒體的付費做出說明,西方的智能網站很少如此提醒用戶。安德魯·戴克認為,DeepSeek的聊天機器人看起來很像谷歌搜索頁面,在滾動中彈出窗口后可預覽鏈接,包括每個新聞事實的出口、標題和摘要。大多數情況下,在DeepSeek上分享原創新聞,至少能找到20個來源,最多能找到50個來源。相比之下,ChatGPT通常通過提示,讓用戶共享15個新聞來源。目前,雖然正確的新聞事實通常是由DeepSeek給出的,但它有時會被生成的大量信息所掩蓋。DeepSeek聊天機器人在引用和標注新聞出版商的出處方面,有相對較高的標準,更直接、更準確地將用戶推薦給新聞發布者。隨著用戶對DeepSeek訓練實踐的了解不斷加深,認識到這家人工智能推理模型更加民主化,更加尊重新聞發布者的版權,不斷堅守對知識產權和新聞出版行業的規范。
美國人工智能專家兼記者凱倫·郝(Karen Hao)曾為《華爾街日報》(The Wall Street Journal)廣泛報道人工智能和中國動態。他談到DeepSeek的成功時,對記者說,傳媒行業的未來意味著什么,這將如何影響全球新聞業?回答是:禁止這一模型是不可能的。他們只是把它放到網上,你不能對完全開源的東西實施禁令。對于世界各地的人工智能研究人員和開發者來說,DeepSeek非常鼓舞人心?!拔蚁M鸇eepSeek能夠引領新一代人工智能公司進入這個領域,提供更便宜、更節約資源的產品,這樣我們就不會淪落到一個為了發展這項技術而消耗能源的奇怪世界?!薄叭绻阆胍瓿傻娜蝿招枰叨染_,并且是面向用戶,比如你寫的一篇文章或制作的一段新聞視頻,那么你就不應該在那里使用GenAI(生成式人工智能),因為GenAI不是一個高度精確的工具,而是應當使用DeepSeek。當DeepSeek模型發布到開源人工智能平臺上時,世界各地的人工智能開發者開始復制和完善他們的模型?!盵6]DeepSeek不僅推動了智能技術的改進,也使各類新聞媒體鏈接智能APP更加方便和快捷。
美國新聞界也有些人唱反調,認為DeepSeek-R1帶有偏見,深受中國審查制度的限制,新聞與信息被過濾,媒體使用它可能喪失受眾的信任。數字媒體奧多(Ordo Digital)的創始人喬恩·阿卡里諾(Jon Accarrino)旁敲側擊地說:“新聞編輯室必須優先考慮透明度,解決潛在的偏見并在其AI集成策略中保持人類判斷。新聞機構在考慮采用諸如DeepSeek-R1之類的AI工具時需要謹慎行事,以應對新聞誠信和公眾是否信任的重大風險。同任何AI技術一樣,DeepSeek-R1存在有關新聞透明、偏見和人類判斷的作用與道德等重要問題?!卑⒖ɡ镏Z這一荒謬的觀點,純屬主觀揣測,他不得不承認DeepSeek在美國上線后受到用戶的普遍肯定,產生了巨大影響。他自圓其說并出爾反爾地寫道:“不管喜歡與否,為了獲得市場份額的戰略,DeepSeek-R1作為開源AI模型發布,可免費下載,這使該模型很快變得非常流行?!薄半m然DeepSeek-R1的高級推理能力和成本效益很有吸引力,尤其是對深受預算束縛的新聞組織,但其內置的審查制度和潛在偏見對新聞完整性構成了重大風險。新聞機構繼續探索AI諸如數據分析和內容優化之類的任務和潛力時,必須實施嚴格的保障措施以保護編輯客觀性并保持受眾的信任。DeepSeek不會以任何有意義的方式促進這些目標?!盵7]最后幾句毫無根據的否定,只能說明阿卡里諾的偏見十分頑固,即使他親身體驗到美國用戶對DeepSeek的鐘情,也不愿意承認這一事實。
三、DeepSeek傳播新聞的機理與智能參數
DeepSeek作為一款新型的智能搜索引擎,不僅能匯集、呈現無限新聞文本,而且具有自然語言處理(NLP)、計算機視覺(CV)和多模態的信息融合技術,為媒體和用戶提供更精準、高效和個性化的搜索與寫作體驗。它的寫作能力躍居前沿,在匯編代碼語法與轉換為處理器(GPU)的具體指令方面,超過了英偉達編程模型的算力;在圖像識別、語音識別、自然語言處理等深度領域比英偉達的程序更為簡捷、快速。作為搜索新聞、編寫和分發新聞的這些技能,DeepSeek的運作有更加顯著的提升,從模型方法、框架系統到基礎設施表現出的優化也更加突出,算力效能明顯增強,捕獲和傳播新聞的信息量遠大于美國公司的智能參數。
DeepSeek之所以能轟動世界,因為它的推理或語言表達具有嚴密的邏輯,再現信息的每一步都提供了內在聯系與前提。DeepSeek-V3作為新一代的大語言模型,就像一個主講人或咨詢機構,每一步呈現的信息都給下一步推出的事實、含義、對話或解答做出鋪墊,讓人們看到大小事件的全貌或具體景象(稱為顆粒度granularity)。這種邏輯在推進中,把完整的新聞事實納入一個過程,每個環節都顯露出整個事件的必然發展。DeepSeek-V3對新聞的呈現,依據面臨的狀況采取相應策略,尋求足夠的根據推出下一步動態和場景。這種邏輯推進與判斷,建立在推理模型的四個要素之上,保證了新聞的精準性。這四個要素是:(1)搜索(Search)所有事實與相關事實,常用的方法有兩類,一是進行廣度與深度搜索,二是按一定順序搜索,全面掌握相關事件。(2)運用推理的初步能力,對搜集到的信息經過提示、比較、鑒別,調整所有內容,在檢查、驗證其真實性并修正錯誤后,分解信息的各個部分,將面對的問題作出分析和論證。(3)肯定上述論證,對事件的發展作出回應和解決方案(Reward Design),并從信息環境獲取更多的事實充實新聞內容,引用有關人士對這一事實的評價和相關數據,再現真實的場景和事件過程,對新聞作出分析或結論。(4)仿照(Learning又譯學習)客觀事實記述事件,優化模型參數,以逐步深入和全面克隆的方式展示事件。經過以上四個要素連續演進與互動,達到對新聞事實的完整敘述。
DeepSeek-R1發布新聞有兩個模型。第一個是R1模型,在性能上達到OpenAI o1的正版水平,與后者不同的是,DeepSeek-R1的思維鏈透明,所有技術細節都向用戶與媒體公開,提高用戶的體驗。在數字、代碼、自然語言推理方面,DeepSeek強化了模仿(學習)技術,極大增強了推理判斷能力。DeepSeek-R1利用模型壓縮技術,通過訓練較小的模型模仿大模型,又可將大模型的知識轉移到更小、更高效的模型中,分離出6個小模型,參數分別為1.5B、7B、8B、14B、32B、70B,保證了生成和傳播新聞的準確率。DeepSeek生成新聞的第二個模型是R1-Zero,匯集更多的計算資源,生成大量精準和有用的數據,進一步提升信息的準確性和可靠性。該模型形成強化的信息循環,從一個基模為起點,由大量網絡信息促成“熱身運動”(Warm-up),搜集某條新聞的大量報道,匯集社會對新聞事件發出的多種角度、多個立場,作出整理和歸納。新聞與信息傳播實踐證實,該模型的低計算量為76%,高計算量為88%,舍棄的大部分是內容相同或相近的信息。R1-Zero的模型參數達到671B,GPT-3的參數則是175B,比GPT-3模型的容量大得多,包括61層語言編碼與解碼結構(Transformer),對整合或翻譯不同語言的新聞信息發揮了靈活、快速的作用。R1-Zero模型具有長思維鏈,推理路徑較長,還可修復以前的不當推理。但它搜集、提供的新聞內容冗長,可讀性較差,還可能把多種文字或有聲語言混雜在一起輸出,這個缺點有待改進和消除。R1-Zero不只是為用戶提供新聞和各種信息,還是一種寫作工具,它的開放性給人們生成文章提供了豐富的資料,是一種沒有約束力的寫作或創作工具。DeepSeek-R1-Zero的運作表明,它生成的代碼和評價指標(pass@1)從最初的15.6%提升到71.0%,最終達到86.7%,把強大的推理能力用于各種文本的寫作,只要給出幾個提示詞就可寫出很長的文章。
為了提高模型傳播新聞和信息的精準度,DeepSeek采用一套訓練計劃,把以上兩種模型和訓練模塊的神經網絡頭部和信息插入同一個節點,讓用戶迅速共享大數據參數。DeepSeek采用了英偉達的精度計算方式(FP8),計算信息及其核心矩陣通過增加累積的尾數量以及在線量化策略,防止離線搜集信息的可能性。任何人工智能的運作都離不開算力、算法和數據的巨量化,克服算法的缺陷,強化算力的突破,把大數據視為智能新聞的基石,提高了傳播新聞的精準度和效率。媒體利用DeepSeek技術生成和發布新聞,須持有開放態度,需要熟練掌握和運用這一模型架構、硬件設施和軟件設計。
四、批駁科技霸權對DeepSeek的褻瀆與攻擊
DeepSeek的脫穎而出,首先征服了西方新聞界的傲慢,有些人垂頭喪氣地發出哀鳴。有人認為,這是“蘇聯發射第一顆人造衛星斯普特尼克號的時刻”,美國的智能研究面臨一場絕望的挑戰。美國總統特朗普2025年1月27日對眾議院的共和黨議員說:“中國公司發布的DeepSeek是一顆重磅炸彈,對我們人工智能企業是一種警告!”據央視新聞報道,當地時間1月28日,美國白宮新任新聞秘書卡羅琳·萊維特在首次新聞發布會上談到DeepSeek,聲稱白宮正在努力“確保美國人工智能的主導地位,特朗普已簽署行政命令撤銷對人工智能行業的一些繁瑣的監管”。同一天特朗普又對美國記者說,“美國公司需要全神貫注地投入競爭以求勝出”,“中國制造的人工智能也可能是積極的,推動更多美國數字技術的發展。我認為這對我們來說也是一件好事。我們總是有想法,我們永遠是第一”。[8]
美國政府的一些具體管理官員態度惡劣,無中生有地對DeepSeek進行誹謗。特朗普的人工智能顧問大衛·薩克斯(David Sacks)卻指責DeepSeek盜竊OpenAI數據,竊取美國的知識產權,聲明“DeepSeek聊天機器人應用程序現在面臨調查,在某些情況下它可能侵犯隱私,帶來安全問題,在美國和其他一些國家被禁止”。[9]他認為:“中國可能利用一種名為‘蒸餾’的技術,分離、模仿其他人工智能模型系統,美國的人工智能技術在未經授權的情況下可能被復制?!泵绹阑饓f會(Sophos)主管兼全球首席技術官切斯特·維斯涅斯基(Chester Wisniewski)影射DeepSeek發出威脅的言論:“就像羊駝一樣,它可以玩耍,而且基本上可以拆除護欄。這可能會導致網絡犯罪分子濫用,需要注意的是,運行DeepSeek需要比普通網絡犯罪分子多得多的資源?!盵10]1月30日,美國參議院情報委員會主席霍利提出一項《美中人工智能能力脫鉤法案》,要求切斷美中在AI領域的所有合作,禁止AI技術對華進出口與投資。美國商務部正在調查DeepSeek是否在使用被禁止運往中國的美國芯片。[11]毫無疑問,中國在AI領域的成就已經引起美國政府和少數企業的強烈反應。美國加利福尼亞州前內閣副秘書長杰夫·萊(Jeff Le)告訴《能量》(Capacity)雜志的記者說,“DeepSeek的崛起讓國家安全政策制定者感到震驚,他們認為美國的人工智能具有優勢是‘嚴重誤判’”;“對于那些將人工智能競賽視為21世紀霸權關鍵的政策制定者來說,這一時刻代表著對美國全球領導地位的明顯威脅”;“這遠遠超出了TikTok的影響范圍。如果美國沒有世界上最好的創新者和研究人員怎么辦?芯片限制對解決這個問題沒有幫助。這是一個直到現在都無法想象的想法”。[12]
DeepSeek挑戰了美國AI技術的主導地位,從西方政界、新聞界到智能科技界都深感一場危機迎面而來。美國科技投資者馬克·安德森(Marc Andreessen)稱DeepSeek標志著AI的“爆發時刻”,他同1950年代蘇聯太空技術的突破進行了比較,深感DeepSeek給了美國一錘重擊。為此,西方許多國家和組織已經禁止使用DeepSeek,其借口是所有用戶數據都存儲在中國,最大的擔憂是向中國政府泄露國內的重要情況。格里芬媒體(Griffin Media)技術副總裁特雷弗·懷斯曼(Trevor Wiseman)說:“我建議我們在格里芬媒體的用戶避免使用DeepSeek。”“我們的IT部門已經阻止了Griffin Media網絡中對該工具的訪問,以確保我們用戶的隱私受到保護。新聞編輯室應制定有關使用新的AI工具的明確準則,最好是與IT部門協商。為了更好地為新聞編輯室提供服務,IT團隊必須為記者開發安全的測試環境,以評估新聞報道的AI工具,同時優先考慮大型組織的數據安全和編輯的完整性。”[13]除媒體公司外,禁止使用DeepSeek的國家和地區及其部門包括澳大利亞政府機構、意大利全國、韓國工業部、美國航天航空局、得克薩斯州政府、美國國會、美國海軍、美國五角大樓。[14]據韓聯社報道,因處理信息涉及較多機密,韓國外交部和產業通商資源部決定限制登錄DeepSeek平臺。澳大利亞廣播公司等媒體報道,澳政府(2月)4日宣布禁止在政府機構的電子設備上使用DeepSeek,稱其“對澳政府技術(構成)不可接受的風險”。據中國日報網報道,DeepSeek大模型遭到史上最大規模的網絡攻擊,攻擊源均來自美國。由于此次攻擊的影響,新用戶的注冊變得異常繁雜,甚至有時無法完成,DeepSeek迅速調整了服務器的配置和策略,加強了網絡安全防護,有效地抵御了攻擊的進一步擴大。DeepSeek總部與多家網絡安全公司建立了緊密的合作,采取多種措施,共同應對來自多方面的襲擾。[15]
中國有關部門對西方攻擊、禁用中國的DeepSeek技術給予鄭重聲明。2025年2月3日,中國常駐聯合國代表傅聰在紐約聯合國總部舉行記者會,當被問到近期全球矚目的DeepSeek發布的模型以及中美人工智能合作問題時,傅聰強調:“永遠不要低估中國科研人員的聰明才智。DeepSeek引發全球轟動和一些人的焦慮恐慌,說明技術遏制和技術限制無法奏效,這是全世界特別是美國需要學習的一課。”傅聰問道:“從華為到TikTok,再到DeepSeek,美國還想禁多少?”他表示,“我們不需要更多禁令,中美作為在當今人工智能領域最領先的兩個國家,不能不合作。只有共同合作發展,才能彌合數字和智能鴻溝,特別是幫助全球南方在人工智能發展進程中平等受益”?!癉eepSeek已成為全球下載次數最多的應用程序之一,但一些政府對此表示擔憂?!盵16]
對美國官員毀謗DeepSeek及其公司最有力的回擊來自西方網絡用戶、軟件專家和正直的媒體。大量用戶和一些智能公司高度評價DeepSeek的優勢,主動鏈接和使用,紛紛抵制對它的封殺。據歐洲新聞電視臺2月3日報道,得克薩斯州禁止在政府發放的設備上使用DeepSeek,然而,這一禁令很快引起不少美國網民的反對。一名得克薩斯州的網民表示,DeepSeek是目前全世界最好的人工智能,得州的封殺令是無知和短視的。他形容DeepSeek帶來的市場動蕩對硅谷而言是“積極的”,因為這迫使硅谷以更低的成本進行創新。[17]對抹黑DeepSeek的所謂威脅和驚擾的言論,微軟(Microsoft)和英特爾(Intel)前軟件工程師、綠色軟件開發專家斯科特·錢伯林(Scott Chamberlin)提出了質疑,認為它們“可能言過其實”。美國媒體CNBC稱,DeepSeek在取得這樣出色成績的背后,是美國政府對中國實施的嚴格半導體限制的結果,這些限制使中國無法獲取英偉達H100最強大的芯片。中方的最新進展表明,DeepSeek要么找到了繞過相關規則的方法,要么說明美國的出口管制并未達到華盛頓的預期效果。
科學技術專家和媒體人士長期從事辨別、遵循或宣傳真理的工作,多數人對是非利害問題有清醒的認識,他們就美國對DeepSeek的非議發表了大量批駁性的言論與新聞報道。曾經揚言要起訴DeepSeek的OpenAI僅在幾天后就改變了口風,據“德國之聲”報道,OpenAI首席執行官奧爾特曼在東京對媒體表示,OpenAI沒有起訴DeepSeek的計劃,“公司將繼續打造出色的產品,并以模型能力引領世界,我認為這會很棒”。奧爾特曼稱贊DeepSeek“無疑是一個令人印象深刻的模型”。路透社報道稱,DeepSeek的出現正在改變人工智能的格局,以極低的成本使用該項技術,能夠推動其他人工智能公司改進模型并降低價格。美國伯恩斯坦研究公司的分析師估計,DeepSeek的定價僅相當于OpenAI同類模型的1/40-1/20。他說:“我認為DeepSeek對我們這樣的公司來說是一個巨大的機會?!钡聡稌r代周報》發表的新聞指出:“為什么我們仍然低估中國,這并不是中國高科技行業首次憑借創新產品征服世界——想想TikTok的全球勝利。過去十年去過中國的任何人都不會沒有注意到,中國人日常生活的每個領域現在幾乎都已經數字化,其普及程度常常令歐洲人感到驚訝?!盵18]DeepSeek通過異構計算,將算力提升2倍多,打破了西方公司的算力壟斷。從縱向看,DeepSeek大模型算力已從訓練向推理轉移,隨著多模態應用的普及,推理算力在電腦上增速,使新聞傳播的數量極度擴大,DeepSeek必將占有受眾市場的最大份額。
五、DeepSeek推動媒體與智能企業的創新潛力
DeepSeek的崛起標志著AI技術已經邁入一個新階段。在2025年春節假期這個特殊時間點,DeepSeek憑借強大的智能技術,讓人們瀏覽豐富多彩的各種新聞。借助強大的技術動力,DeepSeek加倍地從事內容寫作,新聞發送和智能推薦更加準確,進入網絡的用戶翻倍增長。DeepSeek的應用成為全民熱點,火爆程度超乎想象,盡管服務器數次宕機,搜索功能一度擁擠不堪,但它游刃有余地滿足了網民的需要。通過深度挖掘用戶需求,精準推送個性化的新聞資訊,DeepSeek展現出跨場景、跨國界的應用能力。在智能化時代的發展浪潮中,探索DeepSeek技術創新的潛力,引領媒體以較高智能搜索各種新聞,為用戶提供更加豐富、優質的智能化新聞服務,標志著AI技術出現又一次的飛躍。
DeepSeek展示了AI技術的巨大潛力,為智能新聞的升級找到了創新方向,也為媒體打造影響力提供了有力支撐。面對廣大網絡用戶的使用,DeepSeek團隊展現出的高水平與應變素質,為該模型的運行注入了充沛的活力和思維,引發了科技圈和資本市場的垂青。對云廠商和芯片廠商來說,投入DeepSeek模型產生的杰出效果,迎來廣闊的發展空間和新一輪競爭力。隨著DeepSeek不斷普及和應用場景的巨大拓展,媒體作為智能領域的佼佼者,行業升級的驅動力明顯增強。DeepSeek不僅促進了媒體的飛躍式發展,對各行業的機器人和自動駕駛也產生了技術內驅力。DeepSeek一旦超大規模地發展,在未來3—5年內將產生數萬億元資本的增值,在服務器和算法優化的前提下,進一步提升新聞服務的穩定性和高效性。這需要進一步加強技術研發和創新,深入拓展多重功能的應用場景,讓媒體的新聞視域伸向世界每個角落。加強與國內外同類公司的交流與合作,攜手研發算力快速飆升的引擎是DeepSeek公司面臨和需要解決的重要課題。
根據現有技術成果推測,DeepSeek的高精度中文建模,基于龐大的中文語料庫訓練,除在捕捉、運用漢語方面表現出色,還具有多種語言運用能力,從而支持更廣泛的新聞與信息的全球覆蓋。它的強大搜索、寫作和摘要功能,使DeepSeek能夠查詢全球所有數據庫而推送新聞與信息,并向各種問尋者提供準確的答案。DeepSeek似乎不僅支持復雜的對話式人工智能,還支持集成搜索和數據檢索,在企業管理和社交媒體分析方面具有潛在價值。憑借先進的自然語言處理能力,同許多網絡平臺的深度整合,Deepseek贏得全球新聞市場的前景異常廣闊。其強大的搜索和生成框架,還可能為中國各類企業提供有吸引力的智能服務,讓企業掌握本行業的產品生產和銷售的完整信息。[19]為此,Meta正在研究DeepSeek模型,已經組建團隊——成立了四個小組探索DeepSeek的工作原理,了解和掌握DeepSeek匯聚和傳播新聞或各種信息的技術,試圖改進其自身的Llama模型。Meta內部有人擔心其Llama模型可能會落后于DeepSeek,Meta公司首席人工智能科學家楊立昆(Yann LeCun)表示,DeepSeek的崛起表明“開源模型正在超越專有模型”,建立在其他模型工作之上的開源性改進,肯定會從中獲益。引進DeepSeek的先進之處,改進Meta的Llama 3.1模型,是Meta的當務之急。[20]扎克伯格坦言,DeepSeek做了一些“新奇的事情”,他的公司“仍在消化DeepSeek的一些成果”,將其應用到自己的AI項目中。DeepSeek完全開放,使所有模型可用于全球開源社區,各國研究人員和公司正在吸收并融合DeepSeek的技術,力求創建源自DeepSeek的新模型。例如,GitHub(面向開源及私有軟件項目的托管平臺)的香港團隊微調來自阿里巴巴云優化的DeepSeek語言模型,使用輸入數據的一小部分就獲取了信息傳播的滿意效果,進一步降低了成本。[21]
當我們對DeepSeek的崛起加以肯定時,不能忽視它遇到的挑戰。隨著用戶量的不斷增加,保持服務的穩定性和高效能仍須進一步強化。目前,對于AI在新聞制作中的作用,很少有測試偏見或促進透明度的機制,DeepSeek的使用出現了轉折點,創造了初步手段與方法。AI技術及其應用場景的不斷拓展,擴大它的創新和競爭優勢仍需努力探索,比如,如何使它能全部搜索世界各類媒體的新聞,如何高精度辨別發送來的全部新聞與信息的真實性,如何將其發出的指令用于機器人、機器狗、工農業生產、無人駕駛、各種飛行器以及軍事武器的智能化,都是DeepSeek急需提升和優化的目標。
參考文獻:
[1]Sean M. Kerner.DeepSeek explained: Everything you need to know,tech giants,Feb.4,2025.
[2]Richard Carufel.Media Insights: Examining DeepSeek’s Dynamic Emergence Through Coverage Analysis,Public Relations,Jan.30,2025.
[3]DeepSeek火爆全球 彰顯中國智慧[EB/OL].https://baijiahao.baidu.com/s?id=1823190355371333642amp;wfr=spideramp;for=pc.
[4]Warum die KI aus China Europa nützen kann,Deutschlandfunk,31.01.2025.
[5]Andrew Deck.How DeepSeek stacks up when citing news publishers,Facebook,Feb. 6,2025.
[6]Marina Adami.What DeepSeek may mean for the future of journalism and generative AI,Reuters Institute For The Study of Journal:sm,Jan.28,2025.
[7]Jon Accarrino.DeepSeek R1’s Promise And Peril For News,Jan.28,2025.[EB/OL].https://tvnewscheck.com.
[8]Trump says Chinese AI launch is“wake-up call”,The New Daily,Jan.28,2025.
[9]Trump’s AI Ambition and China’s DeepSeek Overshadow an AI Summit in Paris,Associated Press,Feb. 9,2025.
[10]Gyana Swain.US officials probe China’s DeepSeek AI amid security and privacy scrutiny,Computer world,Jan.29,2025.
[11]開源代碼、商業利益與大國博弈[EB/OL].https://finance.sina.com.cn/wm/2025-02-12/doc-inekekxr2966550.shtml.
[12]Ben Wodecki.Behind the DeepSeek hype: Costs,safety risks amp; censorship explained,Capacity Media,Jan.29,2025.
[13]Andrew Deck.How DeepSeek stacks up when citing news publishers,Facebook,Feb. 6,2025.
[14]Sean M. Kerner,DeepSeek explained: Everything you need to know,tech giants,Feb.4,2025.
[15]DeepSeek火爆全球 彰顯中國智慧[EB/OL].https://baijiahao.baidu.com/s?id=1823190355371333642amp;wfr=spideramp;for=pc.
[16]被問DeepSeek 中方代表:永遠不要低估![EB/OL].https://baijiahao.baidu.com/s?id=1823109100364198205amp;wfr=spideramp;for=pc.
[17]被問DeepSeek,中方代表:永遠不要低估![EB/OL].https://baijiahao.baidu.com/s?id=1823109100364198205amp;wfr=spideramp;for=pc.
[18]多家科技巨頭宣布接入,世界對DeepSeek的驚嘆還在持續[EB/OL].https://world.huanqiu.com/article/4LMAWkTjYjT.
[19]DeepSeek: A China-Based LLM with Global Implications,Jan.24,2025.
[20]開源代碼、商業利益與大國博弈[EB/OL].https://finance.sina.com.cn/wm/2025-02-12/doc-inekekxr2966550.shtml.
[21]Brandon Rich.DeepSeek Explained: What Is It and Is It Safe To Use?Jan.31,2025.https://ai.nd.edu.
作者簡介:劉建明,清華大學新聞與傳播學院教授(北京 100084)。
編校:董方曉
封面人物·郭小安
郭小安,曾任教于華中科技大學,現為重慶大學新聞學院院長、教授、博士生導師,重慶大學學術委員會委員,主要研究政治傳播、公共輿論。入選重慶市學術技術帶頭人和國家級青年人才計劃,獲第六屆新聞傳播學學會杰出青年獎。擔任重慶市哲學社會科學智能傳播與城市國際推廣重點實驗室執行主任,國家社科基金重大項目首席專家,教育部馬工程重點教材《輿論學》副主編,兼任第十三屆全國青聯委員,第六屆重慶市青聯常委、教育界別主任委員,中國新聞史學會常務理事、中國新聞史學會傳播學研究專業委員會副理事長,中國新聞傳播教育年鑒編撰委員會副主任委員,重慶市委網信辦網絡內容建設咨詢委員會專家,重慶日報報業集團傳媒研究院學術顧問,重慶大學融媒體學生交叉創新中心主任等。在《新聞與傳播研究》《國際新聞界》《現代傳播》《新聞大學》等刊物發表學術文章80余篇,入選2024年中國知網高被引學者TOP1%。出版個人專著3部,獲省部級獎5項,主持國家社科基金重大項目1項,國家社科基金一般及青年項目3項、國家社科基金重大項目子課題3項及重慶市社科規劃重大項目等其他課題20余項。