
春節前后,中國“80后”梁文鋒旗下的產品DeepSeek成為網絡焦點。他主導的這款帶著藍色小鯨魚圖標的AI應用,在1月超越了ChatGPT,下載量登頂美國區等全球多個蘋果應用商城的榜首。
稍早前,中國人的社區REDnote(小紅書)迎來了不少TikTok用戶。全球網友在這個以中文為主的社交APP上互動,就不同國度里的工作、生活、醫療等一一“對賬”。
像愛麗絲夢游記里一樣,挖開兔子洞以后,人們驚喜地發現,世界可以如此平靜與美好。“如果真的有不可抗力的因素導致我們的聯絡再次斷開,我們也一定要記住此刻對彼此的愛與信任。”一個中英雙語的小紅書帖子獲得高贊。
2025年,來自中國的“神秘力量”陸續在全球涌現。背后是中國算法的一路高歌。算法(Algorithm),這個最早由波斯數學家的名字衍生的詞,指解決(數學)問題的一種抽象方法。在計算機領域,有了算法,計算機才可以自動執行大量指令,進行大量計算,精準推薦,涌現智能。
人們想知道,中國應用勢如破竹背后,究竟有什么樣的算法以及發展路徑?
1940年代,費城,美國。
在美國賓夕法尼亞大學摩爾學院地下室,一排排從地板延伸到天花板的柜子里,裝載著約17468個電子管。它們看上去毫無章法,由散落四處的電纜連接。實際上,一場史無前例的軍事計算正在進行。
1年后,1946年,全世界第一臺計算機、重達30噸的ENIAC第一次在公眾面前亮相。為了讓在場的記者了解其速率,現場主燈被關掉了。閃爍著亮光的計算機,用20秒算出了炮彈飛到目標地的軌跡,這比炮彈飛行速度還快。
相比之下,人工計算彈道軌跡,得耗時3天。
這是人類第一次了解計算機算法的威力。當時的媒體感嘆稱:“‘電子大腦’在2小時內,計算完本需要100年才能算完的問題。”但這個創世紀的發明由美國人發明、美國人主導,主宰了接下來半個世紀的全球硬科技。而大洋彼岸的中國,直至1958年,才根據蘇聯提供的M-3小型機技術資料,制造出第一臺國產計算機—103機。
了解這樣的起點,也許就能理解外國友人、科技從業者,為什么對如今中國應用火遍全球充滿著不解。“中國人已經找到了吸引人類注意力的最佳計算機算法,這是我們應該好好學習的。”美國科技人士在社交媒體上感嘆。
中美互聯網巨頭正式爭奪全球注意力,始于21世紀的第二個十年。2012年春,福建寧德人、連續創業者張一鳴在北京知春路的咖啡廳,在幾張餐巾紙上寫下了他的暢想。憑借紙上的移動互聯網藍圖,他獲得了投資人的青睞,給予其200萬的啟動資金。
誰也不曾預料到,一個由中國定義的“算法”悄然誕生。
在這張“餐巾紙”上,張一鳴提出,要解決人們在移動互聯網上獲取信息的痛點—不夠高效。傳統門戶網站即使再快,輸出的內容依然是中心化的,無法高效地滿足每一個用戶的需求。
而他希望,用戶一打開手機,就能獲得個性化的、獨屬于自己的內容。事實上,這個想法并不算新穎,早在2006年許,扎克伯格就在臉書推出了信息流(NewsFeed)功能。他們根據用戶的喜好在主頁推薦和排序內容,已經初獲成效。
但張一鳴卻是將個性化信息推薦發揮到極致的人。有人用16字總結字節跳動起家的秘訣,“遍地撒網,確定爆款,獲取流量,集聚平臺”。圍繞著推薦算法,字節跳動早期推出了數十個手機APP,看起來有所聯系,卻又各自不同。它們以各種渠道,大量出現在潛在用戶的面前。
經過一番“田忌賽馬”后,2012年暑假,張一鳴把發展重心放在了新聞資訊上—這促成了“今日頭條”的迅速崛起。
接下來的故事大多數人都有印象,今日頭條在2016年日活量達到了驚人的6000萬,成功超越四大門戶網站。抖音也在這一年問世,接著勢不可擋地成為中國短視頻巨頭。
從這時開始,全球的互聯網從業者都意識到,由今日頭條開創的推薦算法,正在改變世界。曾任Uber和Netflix產品負責人的尼爾·亨特在論文中提到,算法推薦系統讓Netflix每年省下超過10億美元的費用。80%的奈飛用戶都會在“推薦列表”里觀看視頻。
張一鳴的推薦算法,區別于很多先前算法,滿足了用戶自己都不清楚的需求。
過去,以微博、臉書、微信為代表的社交媒體,主要依賴熟人網絡以及考驗忠誠度的訂閱模式。但今日頭條和抖音開創的推薦算法時代,建立在預測用戶需求的前提上。在這類APP上,互關的好友不再是用戶停留的重點,算法的“為你推薦”才是留住用戶的關鍵。
今日頭條資深算法架構師曹歡歡,曾公布其算法原理。所謂的推薦系統,形象地說,“實際上是擬合一個用戶對內容滿意度的函數”。本質上,現在的算法和1940年代的超大計算機沒什么不同,都是為了解決一個數學函數的問題而生。
但今日頭條的“函數”顯然復雜、龐大得多。曹歡歡介紹:“這個函數需要輸入三個維度的變量。第一個維度是內容。第二個維度是用戶特征,包括用戶的興趣標簽,職業、年齡、性別,以及各類模型發掘的隱式用戶興趣等。”
第三個維度是環境。“這是移動互聯網時代推薦的特點,用戶隨時隨地移動,在工作場合、通勤、旅游等不同場景,信息偏好有所偏移。”
結合三方面的維度,模型會給出一個預估,即用戶對哪類內容可能感興趣。與此同時,算法系統還會實時處理樣本數據,包括用戶點擊、展現、收藏、分享等動作,來實現對用戶的精準推薦。
“推薦系統比你媽更了解你。”種種因素背后,各個推薦算法都在追求同一個目標:幫用戶發現自己都未察覺的感興趣內容,讓他們的注意力留得越久越好。
1950年代,達特茅斯,美國。
有了算法的計算機毋庸置疑地精通數學與計算,但人類早已不滿足于此。上世紀50年代,人工智能(AI)的概念由美國數學教授麥肯錫在達特茅斯會議上率先提出。意思是,萬能的計算機,也許可以擁有像人一樣的智能。
至于什么是智能,多年來學術界紛爭不斷。人工智能先驅艾倫·圖靈的說法很有代表性。他說:“最初的那個問題—機器會思考嗎?我認為它太沒意義了。”對于圖靈來說,如果機器的行為與人類已經無法進行區分,無論機器是否像人般思考,我們已經可以得出結論—機器能思考。
21世紀以后,有了算法的加持,擁有學習能力的計算機早已通過了“圖靈測試”。在自動駕駛、人臉識別、蛋白質結構預測、藥物設計等領域,AI經常擁有比人類更高一籌的能力與效率。
首先掀起第四次AI革命的,是大洋另一頭的科學家。2012年,加拿大籍教授杰弗里·辛頓(2024年諾貝爾物理學獎得主)和學生伊利亞(Ilya Sutskever,前OpenAI首席科學家)和亞歷克斯(Alex Krizhevsky)組成團隊,設計了名為“AlexNet”的卷積深度網絡程序。他們設計的AI系統,以最低的誤差,在華裔科學家李飛飛舉辦的ImageNet圖像識別競賽中奪冠。
三人身價隨即水漲船高,導師辛頓收到了來自百度、谷歌、微軟以及DeepMind等巨頭的橄欖枝。最重要的是,他們在短短幾年時間,打敗了主宰過去半個世紀的模式識別研究,在全球掀起了深度學習的海嘯。
彼時,中國的移動互聯網正在興起,中國進入4G時代。2013年,中國搜索引擎巨頭百度想挖辛頓無果,于是率先在國內建立了深度學習研究院和自動駕駛研究院。兩個研究院為中國業界培養了大批AI人才。后者更被外界稱為,中國自動駕駛界的“黃埔軍校”。

主導百度參與辛頓競拍的負責人、現自動駕駛企業“地平線”的創始人余凱回憶:“盡管(百度)競拍(辛頓)失敗,但我還是很開心的。我想我的目的也達到了,因為李彥宏親眼見證了國際巨頭不惜花費巨資來投資深度學習研發,這讓他下定決心自己把深度學習做起來。”
4年后,阿里巴巴創始人馬云也宣布成立科學研究機構“達摩院”,立下目標—“三年投入1000億元”,用于機器學習、自然語言處理等多個前沿AI領域。同一時期,字節跳動人工智能實驗室、騰訊AI Lab等相繼成立。
這些不缺資金的互聯網巨頭,擁有海量數據以及國際化視野與人才團隊,同時有搜索、語音、電商等數字化業務與數據,擁抱深度學習算法成為了必然。以BAT等互聯網大廠為首的大筆投入,加上各類高等院校的科研研究,合力推動了中國AI這些年的飛速發展。
只是,相比于起步很早、資金和資源高度充裕的美國硅谷,中國發展AI始終面臨內部資源有限和外部環境惡劣的困局。所謂的深度學習,是受到人腦神經系統的啟發,通過算法建立更深層次的網絡,讓機器擁有學習的能力。這依賴大量的數據進行預訓練,也非常考驗計算硬件并行計算的算力。
但在2022年10月,美國政府首次實施了先進半導體向中國出口的限制措施,禁止英偉達向中國出售A100和H100等高性能AI芯片。
2025年1月13日,美國商務部發布新規,將AI芯片出口限制范圍從中國擴展至全球。在這份霸道的、高傲的禁售榜單中,中國被其列為高風險國家,無法通過任何正式渠道進口英偉達AI芯片。
從元器件、光刻機到AI芯片,來自全球霸主的封鎖措施已經全面升級。但此時,美國也許也沒預料到,中國的科技團隊和工程師,正以無法量化的努力,用精妙的算法與工程設計,實現了后來者的超越。
杭州,中國。
2025年1月20日,正值特朗普就職典禮前后,成立2年多的中國AI公司DeepSeek(深度求索)引發了中美科技圈人士的持續討論。這個堅持開源、背后是一家量化金融公司的AI小廠,在1月20日發布了推理大模型DeepSeek-R1。
Appfigures的數據顯示,DeepSeek在1月26日升至蘋果美國區應用商店的榜首,此后在全球140個地區名列前茅。在發布后的18天內,其全球下載量達到1600萬次,幾乎是ChatGPT發布18天時的兩倍。
令眾人驚嘆的,不止是中國AI超絕的效果,而是DeepSeek以不可思議的低成本擁有了世界頂尖水平的智能。根據創始團隊的披露,訓練DeepSeek-R1背后的大模型—DeepSeek-V3,共計耗費557.6萬美元,涉及2048張H100的GPU集群。有專業人員指出,同等水平之下,世界AI大廠至少要用1.6萬張以上的GPU并行訓練。
1月20日,同樣年輕的北京AI公司“月之暗面”,發布了Kimi k1.5多模態思考模型。該模型在數學、編程和通用推理領域,趕超OpenAI新發布的o1,還能處理文本和視覺等多模態數據,支持跨模態推理任務。這一新模型的發布,再度讓中國年輕AI公司驚艷世界。
AI圈此前的生態,是完全由美國人定義的。近年流行的AI大模型,首先是由8位谷歌工程師提出Transformer架構引發的創新;2022年OpenAI發布的ChatGPT,向世人證明AI模型大的重要性—參數越大,計算機處理復雜問題的能力越好,越可能涌現智能。
而要想在AI圈不可戰勝,OpenAI首先背靠微軟,擁有無盡的云計算資源。他們也很早便是英偉達的合作伙伴,訓練AI的芯片和算力因此源源不斷。先發優勢一旦形成,與之合作的公司也紛至沓來,形成了美國主導的全球AI信仰。
面對各方領先的對手,中國公司只能另辟蹊徑。以DeepSeek為例,無論是其堅持的技術理想,還是“多token預測”(Multi-Token Prediction, MTP)、混合專家模型(MoE)架構的創新,都在窮盡各種方式,證明此前美國人定義的AI也可能是低效的。大模型不一定要比大、比量,還有更多來自算法、工程上的優化與創新,從而以小成本實現大理想。
中國AI應用的出圈說明,相比于巨無霸式的投資,看不見的算法和工程,也可以起重要作用。美國AI知名學者吳恩達發文感慨:“2022年11月推出ChatGPT時,美國在生成式AI方面遠遠領先于中國。我一直聽到美國和中國的朋友都說,他們認為中國落后了。但實際上,這種差距在過去兩年里迅速縮小了。”
至于為什么是中國公司取得了這一進步,硅谷AI公司Perplexity的CEO斯里尼瓦斯提供了一個較符合現狀的解釋。他說:“需求是發明之母。因為DeepSeek必須找到解決辦法,最終他們創造出了更高效的技術。”
始終在夾縫中突圍的中國科技公司,正是從中國14億用戶的市場中孕育出生命力和創新力。要想在競爭高度激烈的市場中存活,中國公司學會了將需求放在第一位,尤其擅長從惡劣的外部環境以及激烈的競爭中,做出最接地氣的、滿足市場需求的產品。
而共享著相同文化和語言的十多億中國用戶,深度參與著中國互聯網與智能化的進展。他們將個性化數據給了互聯網巨頭,在豐富的應用場景中對算法和產品積極反饋,使得中國算法在反復迭代和優化中,實現了在世界的領先。
在邁向中國特色社會主義現代化的進程中,我國長期被認為擅長從1到多的創新。但2025年,中國公司以算法和卓越產品告訴世界,勤奮的中國人不僅擅長模仿、學習、超越,也樂于做從0到1的創新。
中國人不缺理想,更不缺從0到1的耐心。這是2025年讓人欣喜的開端。