通過自學成才從電報員成為企業家的托馬斯·愛迪生,通常被認為是有史以來最偉大的發明家,而在移民美國之前曾在巴黎的愛迪生公司工作過的尼古拉·特斯拉,要不是馬斯克的電動汽車公司,幾乎沒有人記得他。然則,正是特斯拉在交流電技術上的突破,而不是愛迪生的直流電技術,才使得大規模電氣化成為可能。直流電的高昂成本,會讓愛迪生的城市電氣化技術像他的許多其他發明一樣,成為富人的玩物。
與許多變革性技術一樣,在OpenAI于2022年底發布ChatGPT引發狂熱之前,人工智能已經發展了幾十年。更好的算法、手機等輔助設備,以及更便宜、更強大的云計算,讓這項技術的應用變得更加廣泛,卻幾乎無人關注。
ChatGPT和其他大型語言模型的神奇魅力讓人們產生了一種錯覺,以為生成式人工智能是一項全新的突破。ChatGPT在發布五天內就擁有了100萬用戶,兩年后每周用戶數量達到3億。微軟、Meta和Alphabet等高科技巨頭在人工智能產品和數據中心上投入了數十億美元賭注,很快就忘記了早先對虛擬現實和增強現實的熱情。
2024年,投資20億美元研發Blackwell人工智能芯片的英偉達成為全球最有價值的公司,其市值在兩年內增長了9倍。該公司首席執行官黃仁勛預測,未來幾年將有1萬億美元投資于使用此類芯片的數據中心。所有這一切,都讓蘋果公司對人工智能的謹慎、觀望的態度顯得古板過時。
但在光鮮的外表下,大型語言模型和許多已有幾十年歷史的人工智能模型一樣,無非是使用“模式識別”和“統計預測”來產生輸出,這意味著它們的可靠性取決于未來是否與過去一樣。這是一個重要的局限。人類可以用想象力解釋歷史證據,預測未來可能發生的不同情況;人類還可以通過相互之間的天馬行空的對話來改進自己的預測。人工智能算法則不能。
這一缺陷并非致命。因為遵循自然規律的過程自然是穩定的,所以未來在很多方面都與過去相似。只要有明確的反饋,人工智能模型就能通過訓練變得更加可靠,而即便底層過程不穩定,或者反饋不明確,統計預測也能比人類判斷更具成本效益。由谷歌或Meta算法提供的不知所云的廣告仍然優于盲目的廣告。對著手機口述文字可能會產生錯誤,但仍然比在小屏幕上打字更快捷方便。
不過,如果僅僅因為大型語言模型可以像人類一樣交談,就認為大型語言模型是一個巨大的飛躍,那就太癡心妄想了。根據我的個人經驗,大型語言模型應用程序在做研究、編寫摘要或生成圖形方面簡直一無是處。盡管如此,有關“深度求索”的報道還是在金融市場掀起了軒然大波。
“深度求索”聲稱,它只僅靠低端英偉達芯片就實現了OpenAI和谷歌水平的人工智能性能,訓練和運營成本只有后兩者的幾分之一。如果消息屬實,高端人工智能芯片的需求將低于預期。正因如此,“深度求索”的消息讓英偉達的市值在一天之內縮水了約6000億美元。
誠然,特斯拉在取得交流電突破后的諸多所謂發明都是夸大其詞,但是節儉的、打破常規的創新可以帶來變革。看看馬斯克的低成本可重復使用火箭,即可略知一二。印度成功執行火星任務的成本僅為7300萬美元,比好萊塢科幻電影《地心引力》的預算還低。
如果得到證實,“深度求索”的技術對于大型語言模型的意義,就如同特斯拉發明交流電對于電氣化的意義。它無法克服回顧性統計模型不可避免的局限性,但可以讓這些模型的成本效益足夠高,從而得到更廣泛的應用。