賴鎮桃

暑期上映的好萊塢大片《碟中諜7》里,60歲的阿湯哥依然能打,只是這次他對抗的反派,是存在于虛擬世界卻又無處不在的人工智能“智體”。
銀幕之外的現實世界里,人和AI也在激烈博弈。7月份,好萊塢爆發了63年來最大規模的行業罷工,16萬演員、編劇集體憤怒地走上街頭,抗議數字人、生成式劇本“謀殺”他們的工作。
很快,AI也作出了反擊:人不愿意拍電影,那就我上吧。
兩部重量級影片《芭比》和《奧本海默》熱映之際,一段《芭比海默》的預告片橫空出世:打扮精致的芭比背負“拯救全人類”的使命,日以繼夜在實驗室奮斗,最終空中升起一朵粉色的蘑菇云。兩分多鐘的片子,從對白、演員、運鏡、剪輯、配音全由AI一手包辦。
人工智能,正在不斷突破人類想象力的邊界,而生成式AI的“大腦”—大模型,也成為科技圈熱烈追逐的新風口。
每一項新技術的興起,必然伴隨著大量投資和企業的涌入。無論是在北京、上海,還是在深圳或者杭州,不少人都開始進入這個領域。那么,到底誰可能成為未來的贏家,還是贏家會有很多?
“OpenAI的成功,首先是技術理想主義的勝利。”搜狗創始人王小川曾在朋友圈如此總結。
回溯ChatGPT的養成,也確實始于硅谷極客的“放肆做夢”。OpenAI的創始人、現任CEO阿爾特曼,像大多數硅谷大佬一樣,也擁有天才少年般的履歷:8歲會編程和拆解電腦,考上斯坦福的計算機專業后,安分讀書是不可能的,念了兩年就輟學和同學一起創業,做出來的軟件以4300萬美元被收購,讓他賺到了人生的“第一桶金”。
28歲時,他被“欽點”為硅谷頂級孵化器Y Combinator的總裁,給公司物色項目的同時還個人入股了兩家創新企業,30歲就實現了財富自由。有多自由呢?用他自己的話來說就是“比我需要的錢還多”,以至于他要專門雇用幾十個人來打理自己和家族的財產。
這個時候,追求物質和財富已經不能帶來多少新鮮感,兒時的夢想反而擊中了他:在一個新的世界里,機器替代人完成大部分的工作,從工作中解放出來的人能收到現金補貼,人工智能不是冷冰冰的機器,而是“人的意志的延伸”。
但在2015年,AI的技能點還停留在語音交互、人臉識別、下圍棋這些單項任務,阿爾特曼想實現的是通用人工智能(AGI),也就像科幻小說和電影所展現的類似人類的人工智能。
也在同年,谷歌收購后來打敗李世石的深藍,在AI領域大有一家獨大之勢,阿爾特曼和馬斯克嗅到一絲技術威權的威脅,于是拉攏到一批頂級“碼農”,發起非營利的人工智能實驗室OpenAI,“讓人類以安全的方式構建通用人工智能”。因此可以說,硅谷在AI領域的智力、資本等資源集聚,以及大廠之間的互相競賽,是AI取得突破性進展的重要推動因素。
成立初期,OpenAI實驗室嘗試了不少項目,甚至還包括教機器人如何解魔方,但都沒找到通往AGI的具體道路。
直到2017年,OpenAI的研究人員才確信,AI學會像人一樣讀和寫,才能像人一樣理解和思考,打開AGI的“秘鑰”最有可能是大語言模型。簡單來說,大語言模型的邏輯就是一股腦先給AI投喂一波學習資料,讓它自己學習,訓練出一個初始模型,然后讓它做題,再用“標準答案”來檢驗,碰到做錯的題就反向微調模型的參數,通過“預訓練+精調”提升模型的準確率。
這樣的過程,又被人調侃為像大模型“煉丹”:只有不斷提高參數和數據規模,達到一個質變的閾值,大模型才會猛然“頓悟”,更專業來說是出現“涌現”效應,相當于模型原本答題得分只有60分上下,給它堆更多的參數和數據“上補習班”都沒長進,但堆到一定數量后,模型就突然“開竅”,答題準確率一下子從60分提升到了90分,而且給它一點其他科目的學習資料,它在新的領域就無師自通了。
就拿OpenAI的GPT來說,初代和二代一直被谷歌的BERT吊打,GPT-3將參數由原來的15億猛堆到1750億,表現上堪稱驚艷逆襲。
硅谷在AI領域的智力、資本等資源集聚,以及大廠之間的互相競賽,是AI取得突破性進展的重要推動因素。
不過,“大力出奇跡”的缺點正在于燒錢。雖然還沒有專業的蓋棺定論,但大模型要跨過“涌現”的門檻,參數規模普遍要觸達千億級,這背后是需要強大算力支撐的。當時GPT-3訓練一次,在算力上就要花費460萬美元,讓OpenAI不得不“放下身段”轉為營利機構,投靠微軟。
但無疑,GPT的“驚險一躍”,也是AI發展史上的一大步。
“傳統方式是,一個應用要開發一個模型,比如做語義理解、信息提取,或者人臉識別、指紋識別,不同任務都要一一適配不同的模型和應用。但現在一個大模型就可以解決這幾十上百個任務,也就是AI研發從碎片化走向集成化。”廈門大學信息學院教授紀榮嶸對南風窗記者說。
對大模型的追捧一直在持續,甚至有人說,大模型即使有泡沫也是美麗的泡沫。
“我們已經到達了生成式AI的引爆點”“生成式AI會重塑所有行業”,在英偉達CEO黃仁勛的演講里,你能看到形容大模型的各種美好詞匯。高盛也在研究報告中推算,生成式AI可以在10年內將全球GDP提高7%,全球3億崗位將被自動化取代。
同時,超然冷靜的也大有人在。最明顯的是投資人更謹慎了。“與國外相比,國內AIGC目前融資頻次與體量有一定差距,大部隊還處在缺乏明確邏輯和標的的觀望狀態。”一位專業投資人幾個月前曾這樣講道。
“一冷一熱都有對應到現實,”紀榮嶸對南風窗表示,“按照大模型的發展趨勢,肯定會顛覆人工智能的創新生態,業界和投資圈不可能不跟進。但現在市場上很多模型不論技術過不過關都號稱大模型,水分太高,所以也要謹慎。”
當行業洗牌的齒輪開始轉動,更多大模型的玩家需要回歸價值尺度。
一方面,一些外在標準就能篩掉一批套殼的“大模型”。強大的算力、巨量的行業數據,是訓練大模型的先決條件,同時國內已經推出大模型評測,只有真正去打榜,才能準確判斷模型有多大、性能有多好。此外,國內還有不少企業,都是基于開源模型做微調,也稱不上有自己的大模型。
另一方面,模型的打分又很大程度依賴主觀判斷。上海交通大學軟件學院院長姚建國告訴南風窗:“AI的對話是否流暢,生成的圖片是否有瑕疵,這些都要靠用戶體驗來作出評價,所以ChatGPT現在看來這么成熟,一大原因就在于開放式測試與優化,通過大量的用戶訪問、收集用戶體驗來優化模型參數。”
狂歡過后,大模型的締造者也開始思考向何處去的問題。“巨型人工智能模型的時代將要結束,我們要用新的方式讓它變得更好。”阿爾特曼在4月份的MIT活動上講道。
GPT-4已經將訓練大模型的“報名費”抬到了1億美元,從訓練效果來看,參數堆到5000億以上就會出現邊際效應遞減,一味追求更大的參數、更多的數據似乎已經難以為繼。
姚建國認為,到明年年中,廠商應該會進入相對理智的階段,去分析自己為什么要做大模型,要做哪些行業,解決什么問題,能夠給技術帶來什么提升。無論是小模型還是大模型,用在最適合自己的場景里才能體現價值。
但整體而言,大模型留給外界的更多還是未知:“涌現”究竟如何產生,AI會朝什么方向進化,未來的組織形態會是大模型一統天下還是大小模型彼此共生,都有待時間來回答。
2022年11月,ChatGPT的橫空出世,一掃硅谷上上下下蔓延的“寒氣”。而實際上,更早前的9月,紅杉資本一篇名為《生成式AI:一個創造性的新世界》的重磅文章,就在業界廣泛流傳,里面第一次引出了生成式AI的概念,同時預測,生成式AI至少可以提高10%的效率或創造力,有潛力產生數萬億美元的經濟價值。
就舉一個例子:Midjourney,全球最火的AI繪圖網站,每年一億多美元營收,整個公司只有11位全職員工:1個創始人,8個技術開發,1個法務和1個財務。而全球最大的傳統商業圖片庫,Getty Images,年收入9.26億美元,員工1700人。直白來說,兩者的人均產出比是17比1。
落到城市層面,搶灘AI大模型,不僅是對AI產業的升級激活,還能和大數據、云計算、半導體、基礎軟件等產業形成協同,不但拉動經濟,還能使之轉型升級。
企業忙著“百模大戰”,城市在大模型的競速業已開啟。
今年5月,中國科學技術信息研究所發布的《中國人工智能大模型地圖研究報告》顯示,國內10億參數以上的大模型已發布79個,14個省市都有團隊在開展大模型研發,北京、廣東、浙江、上海站在第一梯隊。
值得關注的是,北京牢牢占據著頭部地位,已發布的大模型占了全國的大壁江山。清華旁的中關村,更是國內大模型“宇宙中心”般的存在,這里有巨頭—百度和智源研究院,有積極投身大模型的二次創業者—搜狗創始人王小川、美團創始人王慧文、京東前AI掌門人周伯文,還有創新工場掌舵人李開復;中關村之外,還有腰部大廠的入局—360、第四范式、昆侖萬維等,北京稱得上是國內大模型密度最高的城市。
落到城市層面,搶灘AI大模型,不僅是對AI產業的升級激活,還能和大數據、云計算、半導體、基礎軟件等產業形成協同,不但拉動經濟,還能使之轉型升級。
“大模型本身屬于人工智能產業,所以大模型的城市格局,基本接近于AI產業的區域分布。一個城市如果沒有領軍企業的帶動,就很難形成一個集群。”姚建國告訴南風窗。
入局大模型,不同城市也有各自的稟賦。
北京,多年來就是國內的“AI第一城”,學術資源和人才資源的加持不可低估。上海,算力硬件是強項,壁仞科技、天數智芯、燧原科技,都是能為大模型提供算力的國產GPU公司,英特爾、英偉達的中國區總部也都坐落上海。深圳擅長頂層應用,“北京做的是0到1的事情,上海做的是從1到10的事情,深圳則是做從10到100的事情”,業內人士曾這樣形容。
“未來哪些城市能領跑大模型,肯定要有這幾個特質:一是成熟的算力中心,這需要政府出錢主導建設,二是有充足的頭部企業,能和政府部門間實現數據打通,此外很重要的是城市的創新基因,從移動互聯網到大模型,頭部的基本都是那幾個城市,這就和城市本身善于擁抱技術、跟上日新月異的技術浪潮有關。”紀榮嶸對南風窗表示。
對于中國的數字經濟重鎮,比如北京、上海、深圳和杭州來說,城市有產業基礎,企業有資本和雄心,當地政府也可能有充足的扶持資金去進軍AI。競賽是好事,就像當年的硅谷一樣,谷歌、微軟和阿爾特曼團隊的競賽,甚至還有馬斯克的加入,才成就了ChatGPT的橫空出世。
但另一方面,任何事情也都必須順應產業趨勢,找到方向和突破口,同時,更要避免泡沫之后的一地雞毛。