
約翰·卡西迪(John Cassidy)
《紐約客》 特約撰稿人
在農歷新年到來前夕,中國科技初創公司深度求索(DeepSeek)發布了一款低成本又高性能的AI新模型DeepSeek-R1;蛇年的第一天,中國阿里巴巴又發布了自己的全新AI模型。在此背景下,“中國公司是如何取得突破的?美國在AI領域的領先地位能否維持?美國通過限制高科技出口來阻礙中國科技產業發展是否明智?”等議題被熱議。
硅谷風險投資家馬克 · 安德森 (Marc Andreessen)曾用“斯普特尼克時刻”形容DeepSeek面世。對中國頗有研究的路易-文森特 · 加夫(Louis-Vincent Gave)是研究機構Gavekal Research首席執行官,他再次使用了這樣的評價,并強調“技術戰似乎一直是種短視的策略”。
加夫提到的這場競賽始于2018年。彼時特朗普政府以國家安全為由,禁止向中國主要通信企業出口一些關鍵的半導體部件。后來拜登政府又多次加強這方面限制。在特朗普第二次就職典禮的一周前,時任美國商務部部長的吉娜 · 雷蒙多(Gina Raimondo)在宣布新規時強調“目前美國是AI領域的全球領導者,保持領先至關重要”。這時,DeepSeek已發布其V3大語言模型(LLM),并即將發布其更專業的R1模型,而且他們使用了不受美國出口禁令限制的低端英偉達芯片。“美方的限制究竟是DeepSeek創新的障礙還是助力?”為了回答自己的問題,加夫翻找歷史,列舉了德國第二次世界大戰期間部署的虎式坦克的例子:盡管其汽油發動機的功率和燃油效率不如英國和美國坦克的柴油發動機,但前者的性能表現優于后者。加夫表示:“你可以從歷史中找到數不勝數的案例說明‘需求是發明之母’。中國做到了。”
美國科技行業的一些資深人士也發表了類似評論。前英特爾首席執行官帕特 · 基辛格(Pat Gelsinger)在社交媒體上發文指出:“中國工程師在資源受限時,必須找到創造性的解決方案。”這些解決方法似乎包括(相較同類模型而言)限制DeepSeek-R1執行計算的次數,以及以能最大程度發揮中國企業芯片能力的方式使用芯片。著名計算機科學家、OpenAI 聯合創始人安德烈 · 卡帕西(Andrej Karpathy)則表示,DeepSeek“以玩笑般的預算”訓練“最前沿的”大語言模型,結果“讓事情變得看似很容易”。
盡管強加資源限制會激發創新的理論并未被普遍接受,但它確實得到了其他行業和學術研究的一些支持。例如,2014年一項針對瑞士制造商的研究結果就支持該理論;2024年發表的一項針對美國軟件初創公司的研究表明,直到發展后期才獲得外部資金的企業更傾向于“開展大量實驗,也更有可能對其技術棧做出更重大的改變”。不過這方面證據遠非決定性的,一種直覺性的反駁是,擁有充足技術和財務資源理所應當比捉襟見肘的境況更有利于進行更多的實驗。但無論如何,加夫堅持認為,許多西方人過分低估了中國企業的創新能力。實際上,如今中國企業的創新能力在許多行業都很顯著,包括核電、鐵路、太陽能電池板和電動汽車等。
加夫認為,要承認現在中國在一個又一個領域超越西方的現實,要看到中國正圍繞“打造工業超級大國”的戰略推進,這一戰略取得了成效,DeepSeek的出現就是最新最有力的證據。
——莫莊非編譯自The New Yorker