

人工智能技術的發展正在重塑人類社會的方方面面,在這場技術革命中,DeepSeek以其獨特的技術路徑和創新精神,在AI領域開辟出一條獨具特色的發展道路,迅速成長為行業矚目的新星。近日,中國人工智能初創公司DeepSeek火了,國產AI DeepSeek在中國、美國的科技圈受到廣泛關注,不僅在美區下載榜上超越了ChatGPT,還引發多個美國科技股的股價暴跌。美國總統特朗普稱DeepSeek的出現“給美國相關產業敲響了警鐘”。
DeepSeek是啥?
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創新型科技公司,專注于開發先進的大語言模型(LLM)和相關技術。
2023年11月2日,DeeSeek推出首個模型DeepSeek Coder,該模型免費供商業使用,且完全開源。
2023年11月29日,DeepSeek LLM上線,其參數規模達到67B,性能接近GPT-4,同時還發布了該模型聊天版本DeepSeek Chat。
2024年5月,DeepSeek-V2發布該模型在性能上比肩GPT-4 Turbo,價格卻只有GPT-4的百分之一。
2024年12月底,DeepSeek-V3發布其性能與GPT-4o和Claude Sonnet 3.5等頂尖模型相近,但訓練成本極低,整個訓練在2048塊,英偉達H800 GPU集群上完成僅花費約557.6萬美元。相比之下GPT-4o等模型至少要在萬個GPU量級的計算集群上訓練,且使用的是性能更為優越的H100 GPU訓練成本約1億美元。
DeepSeek-V3發布后,AI數據服務公司Scale AI創始人Alexander Wang就發貼稱,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。“當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”
英偉達高級研究科學家Jim Fan在社交媒體上表示,DeepSeek是2024年度開源大語言模型領域的“最大黑馬”。
DeepSeek的發展歷程,不僅是一家企業的成長史,更是中國人工智能產業創新突破的縮影。這不僅是中國AI技術發展的里程碑,更是全球人工智能競爭格局重塑的重要標志。DeepSeek的崛起,展現了中國在通用人工智能領域的創新實力,也為全球AI發展注入了新的活力。
DeepSeek全球爆火 到底火在哪
不到一個月之后,今年1月20日,DeepSeek正式開源R1推理模型。在數學能力基準測試中達到了77.5%的準確率,與OpenAI的o1不相上下,在編程領域的Codeforces評測中達到了2441分的水平,高于96.3%的人類參與者。
1月27日,DeepSeek應用登頂蘋果美國地區應用商店免費APP下載排行榜,同時其在美區蘋果App Store免費榜,從26日的第六位飚升至第一位超越ChatGPT、Meta旗下社交媒體平臺Threads、Google Gemini、Microsoft Copilot等美國科技公司的生成式AI產品,蘋果中國區應用商店免費榜顯示,DeepSeek成為中國區第一。
DeepSeek表示,DeepSeek-R1在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
這一消息震動了全球AI圈,迅速引起國際社會廣泛關注與討論。
游戲科學創始人、CEO,《黑神話:悟空》制作人馮驥評價DeepSeek:可能是個國運級別的科技成果。
這一模型發布后,引發了海外AI圈眾多科技大佬的討論。例如,英偉達高級研究科學家Jim Fan就在個人社交平臺上公開發表推文表示:“我們正身處這樣一個歷史時刻:一家非美國公司正在延續OpenAI最初的使命——通過真正開放的前沿研究賦能全人類。看似不合常理,但最有趣的結局往往最可能成真。”
DeepSeek R1被討論的焦點集中在兩方面,低訓練與使用成本以及開源,區別于OpenAI“海量數據投喂”的方式。DeepSeek利用算法把數據進行總結分類,經過選擇性處理之后輸送給大模型,在提高訓練效率的同時也降低了DeepSeek的成本。
據了解,此前DeepSeek在美區榜單的排名并無特別突出表現,處于穩步上升階段,但未進入前十。此次突然躥升,與其近期一系列突出表現有直接關系。
據廣州日報報道,“DeepSeek爆火的原因主要可以歸結為兩點:性能和成本。”薩摩耶云科技集團首席經濟學家鄭磊告訴記者。DeepSeek解釋稱,R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。這種卓越的性能不僅吸引了科技界的廣泛關注,也讓投資界看到了其巨大的商業潛力。
更為關注的是,DeepSeek R1真正與眾不同之處在于它的成本——或者說成本很低。DeepSeek的R1的預訓練費用只有557.6萬美元,僅是OpenAI GPT-4o模型訓練成本的不到十分之一。同時,DeepSeek公布了API的定價,每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元。這個收費大約是OpenAI o1運行成本的三十分之一,也因此,DeepSeek被稱為AI界的“拼多多”。
在DeepSeek的高性價比模型發布后,OpenAI創始成員Andrej Karpathy表示,未來或許不需要超大規模的GPU集群了,除了極致性價比,讓DeepSeek大模型脫穎而出的還有其代碼和訓練方法完全開源。目前,DeepSeek-R1已經一躍成為開源社區Hugging Face上下載量最高的大模型,達10.9萬次,這意味著全球的開發人員正在試圖了解這一模型,以輔助他們自己的AI開發。
DeepSeek創始人梁文鋒表示,開源更像一個文化行為,而非商業行為,在顛覆性的技術面前,閉源形成的護城河是短暫的,即使OpenAI閉源也無法阻止被別人趕超。
加州大學伯克利分校AI政策研究員Ritwik Gupta表示,DeepSeek-R1的出現證明了“AI能力沒有技術護城河”,并稱中國的系統工程師人才庫比美國大得多,他們懂得如何充分利用計算資源來更高效地訓練和運行模型。
Meta首席人工智能科學家楊立昆也在社交媒體表示,DeepSeek成功的最大收獲不是來自中國競爭對手的加劇威脅,而是保持人工智能模型開源的價值,以便任何人都能受益,這就是開放研究和開源的力量為AI領域帶來更多可能。
DeepSeek本次“刷屏”起因是1月20日,其正式發布推理大模型DeepSeek-R1,該模型在數學、編程和推理等關鍵領域的表現能與OpenAI的最強推理模型o1“掰手腕”,但其API調用成本卻低了90%-95%。
DeepSeek公布的信息顯示DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下極大提升了模型推理能力。
1月22日,美國《福布斯》雜志網站表示,DeepSeek R1模型應用強化學習等先進技術,不僅已躋身世界最強大模型序列,而且完全開源可供世界上任何人檢查、修改和進一步研發。
1月23日,英國《金融時報》網站刊發評論文章稱,DeepSeek的成功標志著中國在人工智能領域日益強大的自主創新能力。
美國計算機科學家吳恩達表示,DeepSeek的進展令人印象深刻,他們能夠以非常經濟的方式訓練模型,最新發布的推理模型表現非常出色。
微軟CEO薩蒂亞·納德拉公開表示,DeepSeek切實有效地開發出了一款開源模型,在推理計算方面表現出色,且超級計算效率極高。
業內人士表示,通過低成本、高性能、開源共享的模式,DeepSeek正在為全球科研人員和企業提供更多可能性。
DeepSeek爆火 英偉達股價暴跌
當地時間1月27日,美國股市開盤即大幅下跌,科技板塊尤為慘重。市場分析認為,核心原因是中國人工智能初創公司DeepSeek的最新突破,動搖了美國科技行業的“無敵”地位。
因受到DeepSeek人工智能模型沖擊,美國芯片巨頭英偉達(NVIDIA)當日股價暴跌約17%,博通公司股價下跌17%,超威半導體公司(AMD)股價下跌6%,微軟股價下跌2%。此外,人工智能領域的衍生品,如電力供應商也受到重創。美國聯合能源公司股價下跌21%,Vistra的股價下跌29%。
對于DeepSeek爆火,85后創始人梁文鋒回應:中國AI不可能永遠跟隨。
據證券時報消息,白宮人工智能和加密貨幣總管David Sacks在X上發帖稱,DeepSeek R1的表現顯示人工智能競爭將非常激烈,也證明美國總統特朗普廢除拜登行政命令是正確之舉。Sacks說拜登用行政命令束縛了美國的人工智能公司。他還說:“我對美國充滿信心,但我們不能自滿”。
在用R1模型震撼硅谷和暴擊華爾街之后,DeepSeek又在深夜放大招。1月27日晚間10點左右,梁文鋒在社交平臺X上表示,DeepSeek新版本即將發布。三個多小時后,人工智能開源社區HuggingFace就顯示,DeepSeek發布了參數大小從10億到70億不等,名為Janus-Pro和JanusFlow的一系列開源多模態模型。本次發布的新模型,重點在于文生圖能力方面。
據英國《金融時報》報道,1月27日,中國一款聊天機器人的推出導致美國主要科技股指數暴跌1萬億美元,人工智能領域的爭霸戰就此拉開帷幕,一位投資者稱這是世界人工智能超級大國的“斯普特尼克時刻”。
《金融時報》稱,DeepSeek是OpenAI及其ChatGPT工具的有力競爭對手,它的出現動搖了人們對美國人工智能熱潮的信心,因為中國人似乎可以用更少的資源實現同樣的性能。
由于投資者正在消化DeepSeek開發的最新人工智能模型的影響,科技股密集的納斯達克綜合指數收盤下跌3.1%,跌幅一度從上周32.5萬億美元的收盤價值中抹去超過1萬億美元。
新加坡《聯合早報》稱,英偉達(Nvidia)是為人工智能模型提供動力的計算機芯片的領先制造商,其股價下跌17%,市值減少近6000億美元,創下華爾街股票市值單日最大跌幅的紀錄。谷歌母公司損失1000億美元,微軟損失70億美元。
DeepSeek人工智能助手1月26日還在美國和英國的蘋果應用商店登頂,超過了OpenAI的ChatGPT。
美國《紐約時報》稱,美國總統唐納德·特朗普說,DeepSeek應該“為我們的行業敲響警鐘,我們需要集中精力在競爭中取勝”。
他說,他一直在“閱讀關于中國”及其公司的報道,尤其是一家公司提出了一種“更快的、成本更低的人工智能方法”。“這很好,因為你不用花那么多錢。我認為這是一個積極因素,是一筆財富,”特朗普說。
1月28日,由于華爾街的潰敗,與人工智能領域相關的日本科技公司連續第二天下跌。Advantest暴跌超過9%,而科技投資者軟銀(特朗普星際之門人工智能項目的主要投資者)暴跌超過5%,前一天跌幅為8%。
DeepSeek周一遭到網絡攻擊,被迫暫時限制注冊。DeepSeek在其狀態頁面上說,它已于北京時間周一深夜開始調查這一問題。經過大約兩個小時的監控,該公司稱自己是“大規模惡意攻擊”的受害者。雖然DeekSeek限制了注冊,但現有用戶仍可照常登錄。
英國《衛報》稱,DeepSeek在開發模型時使用了比競爭對手更少的芯片,因此生產成本更低,這也引發了人們對近年來美國公司“砸錢狂潮”的質疑。
《衛報》稱,DeepSeek在無法獲得美國最尖端技術的情況下成功建立了一個先進的人工智能模型,這引發了人們對華盛頓試圖遏制中國高科技行業的效果的擔憂。
美國著名風險投資人馬克·安德森將DeepSeekR1模型的發布比作美蘇太空競賽中的關鍵時刻,他在X上發帖稱,這是人工智能的“斯普特尼克時刻”——指的是蘇聯搶先發射了世界上第一顆人造衛星,令其冷戰對手大為震驚。
據美國《財富》雜志、《日經亞洲》網站等媒體報道,美國微軟公司首席執行官(CEO)納德拉當地時間周三(1月29日)談及DeepSeek,稱這對微軟和AI應用是“好消息”。
《財富》雜志稱,納德拉是在微軟公司當天與投資者和分析師舉行的季度財報電話會議上發表的上述言論。其間,在DeepSeek取得成功的背景下,他被問及AI發展的相關問題。
“我認為DeepSeek有一些真正的創新。”納德拉稱。
報道稱,納德拉對AI模型的發展速度和能力印象深刻。“很難想象我們現在是在25年開始的時候,你可以在個人電腦上運行一個需要大量云基礎設施的模型。” 納德拉說,“所以這種優化意味著AI將更加無處不在,因此,這在我看來,對于像我們這樣的超大規模服務提供商,以及像我們這樣的PC平臺提供商來說,這都是好消息。”
美國彭博社稱,納德拉是為DeepSeek“說了一些好話”。報道提到,本周早些時候DeepSeek引發的美股震蕩波及微軟。
多家云平臺官宣接入DeepSeek大模型
DeepSeek大模型自2024年12月上線并開源以來,就以其卓越的性能在數學、代碼、自然語言推理等多個任務上表現出色,一時之間震動了整個市場。該模型由中國企業自研,其強大的功能和廣泛的應用潛力吸引了眾多云平臺的關注。
2025年1月31日,英偉達、亞馬遜和微軟這三家美國科技巨頭在同一天宣布接入由中國企業開發的先進大語言模型 DeepSeek-R1。其中,英偉達宣布 NVIDIA NIM已經可以使用DeepSeek-R1模型。
2月3日晚,百度智能云率先宣布,其千帆平臺已正式上架DeepSeek-R1和DeepSeek-V3模型。為了讓更多用戶能夠體驗到這款先進的大模型,百度智能云推出了超低價格方案,并限時提供免費服務。用戶只需登錄百度智能云千帆ModelBuilder,即可快速體驗DeepSeek大模型的強大功能。值得一提的是,此次接入的模型已全面融合千帆推理鏈路,并集成了百度獨家內容安全算子,實現了模型安全增強與企業級高可用保障。同時,該模型還支持完善的BLS日志分析和BCM告警功能,助力用戶安全、穩定地構建智能應用。據百度智能云官方透露,此次限免活動將持續至2月18日24:00,限免配額為1000RPM和10000TPM,調用Tokens無上限。
同日,阿里云也宣布其PAI Model Gallery平臺支持云上一鍵部署DeepSeek-V3和DeepSeek-R1模型。這一舉措極大地簡化了模型開發流程,用戶無需編寫繁瑣的代碼,即可實現從訓練到部署再到推理的全過程。阿里云PAI Model Gallery平臺的這一功能為開發者和企業用戶帶來了更快、更高效、更便捷的AI開發和應用體驗。
在此之前,已經有多家中國公司宣布接入DeepSeek模型。2月1日,華為云宣布與硅基流動團隊聯合首發并上線基于華為云昇騰云服務的DeepSeek R1/V3推理服務。這一服務的上線標志著華為云在AI領域的又一次重大突破,也為用戶提供了更加豐富的AI應用選擇。
2月2日,騰訊云也宣布DeepSeek-R1大模型已一鍵部署至其“HAI”平臺上。開發者僅需3分鐘就能接入調用這一先進的大模型,這無疑將極大地加速AI應用的開發和部署進程。同時,360數字安全也宣布其安全大模型正式接入DeepSeek,這將為用戶提供更加全面、智能的安全保障。
此外,云軸科技ZStack也宣布其AI Infra平臺ZStack智塔全面支持企業私有化部署DeepSeek V3/R1/Janus Pro三種模型。這一舉措將為企業提供更加靈活、高效的AI應用部署方案,滿足企業對于數據安全和隱私保護的高要求。
2月6日,人民日報健康客戶端記者發現醫渡科技、藥易購、恒瑞醫藥等公司引入DeepSeek,稱將應用于數據挖掘、智能供應鏈、精準醫療等領域。
2月7日,釘釘、智慧芽等多家公司或旗下產品宣布接入DeepSeek系列模型,資本市場也對這一趨勢做出了積極反應。
德意志銀行研報顯示,全球投資者今年將意識到中國制造業和服務業的競爭力優勢。隨著DeepSeek的發布中國或迎來“斯普特尼克”時刻(指迎來變革、發展的重要契機),預計中國股票“估值折價”將消失。摩根士丹利、高盛等多家知名投行都在近期發表了對中國市場的積極看法。
此前,中國電信、中國移動、中國聯通也率先宣布全面接入 DeepSeek布局AI賽道,互聯網巨頭也紛紛在近期表態,宣布接入DeepSeek。 AI(人工智能)應用正在向國內各行各業加速滲透引發變革。
DeepSeek大模型的廣泛應用和多家云平臺的爭相接入,不僅體現了AI技術的快速發展和普及,也預示著企業級智能應用將迎來更加廣闊的發展前景。隨著AI技術的不斷進步和應用場景的不斷拓展,相信未來會有更多像DeepSeek這樣的先進大模型涌現出來,為企業和用戶提供更加智能、高效的服務。同時,我們也期待這些云平臺能夠繼續發揮其在技術創新和應用推廣方面的優勢,推動AI技術不斷向前發展。
為何DeepSeek引發美國恐慌?
據新京報報道:原因一:高性價比沖擊美國大模型壟斷地位。DeepSeek可謂是用最少的錢,干最多的事。其推出的模型,在性能上和世界目前頂尖的GPT-4o等大模型不相上下。但在成本上,OpenAI訓練ChatGPT-4花費的成本高達7800萬美元,還可能達到1億美元。而DeepSeek大模型訓練成本不到600萬美元,僅為同性能模型的5%到10%。新模型訓練方法大幅度降低了大模型行業的入局門檻,大規模預訓練不再是科技巨頭的專利。在模型推理層面,DeepSeek新推出的DeepSeek-R1,價格為2.2美元/百萬詞元,而同性能OpenAI-o1的價格為60美元/百萬詞元,DeepSeek大概是OpenAI的三十分之一。這種“低成本”標志著推理大模型調用進入平價時代,顯著改善了大模型的應用成本,對大模型在科研、企業等智力密集型產業中的應用具有重大的價值。因此,無論是從基礎研究角度還是從商業層面上看,在訓練和推理方面,對此前美國一些大模型公司的既有模式沖擊比較大。
原因二:模式創新,帶來美國高新技術人員恐慌。DeepSeek開發成本與美國大模型相比大幅降低,在于應用了不同的模型訓練模式,打破了美國堆砌算力的“豪氣”方式。在喂養學習數據這一大模型重要環節上,OpenAI選擇了“人海戰術”,堆砌算卡、將資源集中在算力,用海量數據投喂實現能力的提升。而DeepSeek相比于“砸資源”選擇了另外一種方式。利用算法把數據進行總結和分類,經過選擇性處理之后再輸送給大模型,最大優化算力實現了成本的降低和模型性能提升。目前看Meta耗費了大量資金訓練Llama,但是效果上卻沒有成本極低的DeepSeek效果好,Meta高層已經在思考其員工是否在浪費公司資金,而這也引發了不少企業技術人員的恐慌,他們擔心自己被質疑技術能力和創新性從而失去工作。根據海外互聯網平臺對DeepSeek的討論分析,社交媒體帖子的數量遠高于新聞報道,數量約是新聞報道的十倍。時間上來看,社交媒體帖子的討論早于新聞報道,發酵起點比新聞媒體早了五天,這是由從事科技工作的自媒體人以及員工圈層傳播“破圈”造成。
原因三:國產大模型正在厚積薄發。根據中國工業互聯網研究院推出的《人工智能大模型年度發展趨勢報告》,與國際頂尖大模型能力相比,2024年國內大模型的能力進步非常顯著。從2023年第四季度到2025年第一季度的測評顯示,國內外大模型能力差距縮小了將近75%。可以看出,DeepSeek的出現并不是所謂的“異軍突起”,而是中國國內大模型整體發展的階段性成果體現。此外,在報告統計的世界AI領域的投資上,中國55億美元的投資額排在第二位,僅是第一位美國641億投資額的不到十一分之一,中國未來在AI領域的發展上還有很大的空間。
在DeepSeek對全球AI圈帶來的震動下,很多業內人士都喊出了“DeepSeek接班OpenAI”的口號。事實上,DeepSeek的出現,并不是要取代別人,而是提出了更多樣化的方案,打破了國際主流大模型的市場壟斷。 DeepSeek的崛起,展現了中國科技企業的創新實力和全球視野。在通用人工智能這個決定未來競爭力的關鍵領域,中國已經站在了世界前沿。DeepSeek以其創新的技術理念和務實的發展策略,正在書寫著中國AI企業的新篇章。隨著技術的不斷進步和應用的深入,DeepSeek必將為推動人工智能發展、促進人類社會進步作出更大貢獻。這不僅是中國科技的驕傲,更是人類智慧的新高度。