DeepSeek發(fā)布了全世界第二個(gè)推理大模型,僅比OpenAI慢四個(gè)月,雙方大模型的性能相當(dāng),但性價(jià)比卻差出二三十倍,這是因?yàn)镈eepSeek做了杰出的工程創(chuàng)新。但工程創(chuàng)新屬于漸進(jìn)式創(chuàng)新,不是從0到1的顛覆式創(chuàng)新,有讀者對(duì)此表示失望,說至少也是從0.5到1吧?
其實(shí)不用失望,因?yàn)閺?到1和從1到100同等重要,完全沒必要厚此薄彼。舉個(gè)例子,托馬斯·薩弗里(Thomas Savery)在詹姆斯·瓦特(James Watt)出生前38年就發(fā)明了蒸汽機(jī),但是不好用,一直未能推廣。瓦特對(duì)蒸汽機(jī)做了重大改進(jìn),使蒸汽機(jī)得以普及,由此引發(fā)了工業(yè)革命。你說是薩弗里發(fā)明蒸汽機(jī)重要呢,還是瓦特改進(jìn)蒸汽機(jī)重要呢?
這篇文章我們接著討論創(chuàng)新規(guī)律。一句話總結(jié):好奇心+自由探索,這七個(gè)字就是DeepSeek的創(chuàng)新精髓。如果再加三個(gè)字,那就是:不差錢。
我先講講DeepSeek的創(chuàng)新力從何而來,再給大家介紹六種代表性的創(chuàng)新思想。
DeepSeek非常低調(diào),對(duì)外界而言它是個(gè)謎一般的存在,我們能看到的關(guān)于它的信息,基本上都來自行業(yè)媒體《暗涌》對(duì)梁文峰的兩次專訪。
梁文峰1985年出生,2010年從浙江大學(xué)信息與通信工程專業(yè)碩士畢業(yè)。2016年,他成立了一家用人工智能炒股票的基金公司——幻方量化,賺了大錢。2022年11月,OpenAI發(fā)布ChatGPT,引發(fā)全球性的大模型浪潮。2023年4月,梁文峰宣布專門成立一家叫DeepSeek的公司做大模型,5月,他首次接受《暗涌》專訪。2024年5月,DeepSeek發(fā)布V2,震動(dòng)業(yè)界,7月,他第二次接受《暗涌》專訪。
在這兩次專訪中,梁文峰講述了創(chuàng)新的原動(dòng)力何來,創(chuàng)新型人才有什么特質(zhì),以及該怎么管理創(chuàng)新型組織。
他說:創(chuàng)新首先是一個(gè)信念問題。為什么硅谷那么有創(chuàng)新精神?首先是敢。過去30多年IT浪潮里,我們基本沒有參與到真正的技術(shù)創(chuàng)新里。大部分中國公司習(xí)慣follow(追隨),而不是創(chuàng)新。中國AI和美國真正的gap(差距)是原創(chuàng)和模仿。如果這個(gè)不改變,中國永遠(yuǎn)只能是追隨者。
DeepSeek的使命就是“做研究、做探索”,推動(dòng)技術(shù)前沿的發(fā)展,從根本上促進(jìn)整個(gè)生態(tài)的成長(zhǎng)。
創(chuàng)新不僅是商業(yè)驅(qū)動(dòng),它還需要好奇心和創(chuàng)造的野心。我們做創(chuàng)新,主要是好奇心驅(qū)動(dòng),對(duì)AI能力邊界的好奇。
梁文峰近日告訴新希望集團(tuán)董事長(zhǎng)劉永好,DeepSeek只有160個(gè)人。他們都是些什么樣的人呢?
梁文峰說:DeepSeek的招聘標(biāo)準(zhǔn)一直基于熱情和好奇心。我們的團(tuán)隊(duì)成員背景各異,充滿個(gè)性和趣味性,他們對(duì)研究的渴望遠(yuǎn)超對(duì)金錢的關(guān)注。
DeepSeek沒有什么“難以捉摸的天才”,只是來自頂尖高校的應(yīng)屆生、博士生(甚至是四五年級(jí)的實(shí)習(xí)生),以及一些有幾年經(jīng)驗(yàn)的年輕人。
這160號(hào)充滿好奇心和創(chuàng)造欲的年輕人聚集在一起之后,又是怎么工作的呢?
梁文峰說:創(chuàng)新需要盡可能少的干預(yù)和管理,讓每個(gè)人有自由發(fā)揮的空間和試錯(cuò)機(jī)會(huì)。創(chuàng)新往往都是自己產(chǎn)生的,不是刻意安排的,更不是教出來的。
DeepSeek完全是自下而上的。我們不預(yù)先設(shè)定角色,而是自然形成分工。每個(gè)人都帶著自己的經(jīng)驗(yàn)和想法,不需要被推動(dòng)。當(dāng)他們遇到挑戰(zhàn)時(shí),會(huì)自發(fā)地拉上別人討論。不過,一旦某個(gè)想法被證明有潛力,我們就會(huì)從上層投入資源,推動(dòng)它的發(fā)展。
DeepSeek的計(jì)算資源,團(tuán)隊(duì)成員使用時(shí)沒有限制。如果有人有想法,他們可以隨時(shí)調(diào)用我們的訓(xùn)練集群,無需審批。此外,由于我們沒有嚴(yán)格的層級(jí)架構(gòu)或部門壁壘,只要彼此感興趣,團(tuán)隊(duì)成員可以自由協(xié)作。
可以看到,DeepSeek是一家高度扁平化的、自組織的、靠員工內(nèi)驅(qū)力往前走的公司。但如此自由寬松和開放式的管理,不會(huì)導(dǎo)致公司散架嗎?
梁文峰說:我們?cè)谡腥藭r(shí)確保價(jià)值觀一致,然后通過企業(yè)文化來確保步調(diào)一致。我們并沒有一個(gè)成文的企業(yè)文化,因?yàn)樗谐晌臇|西,又會(huì)阻礙創(chuàng)新。更多時(shí)候,是管理者的以身示范,遇到一件事,你如何做決策,會(huì)成為一種準(zhǔn)則。
在第二次專訪的最后,《暗涌》的記者問了一個(gè)非常好的問題:“好奇心驅(qū)動(dòng)的瘋狂可以一直持續(xù)下去嗎?”
梁文鋒回答說:“不是所有人都能瘋狂一輩子,但大部分人,在他年輕的那些年,可以完全沒有功利目的,投入地去做一件事。”
我覺得這個(gè)回答體現(xiàn)了梁文峰的現(xiàn)實(shí)主義。極少有人能一輩子理想主義,但很多人年輕時(shí)都是理想主義者,一家公司只要能聚集一批才華橫溢的年輕人,在他們最理想主義的那些年,給他們充分發(fā)揮的舞臺(tái),那就一定能創(chuàng)造奇跡。
當(dāng)然,DeepSeek不差錢也是關(guān)鍵因素,但這是創(chuàng)新的必要條件而非充分條件,正因?yàn)槿绱耍^大多數(shù)顛覆式創(chuàng)新都是初創(chuàng)公司而非行業(yè)巨頭做出來的。
創(chuàng)新是一門學(xué)問,自約瑟夫·熊彼特(Joseph Schumpeter)以來,100多年間有過若干很好的創(chuàng)新理論,或者創(chuàng)新思想。我不知道梁文峰有沒有讀過這些東西,但他在DeepSeek的實(shí)踐,很多都與這些東西吻合。接下來,我給大家介紹六個(gè)相關(guān)的創(chuàng)新思想或創(chuàng)新理論。
Small teams could do amazing things, hiring the best people to surround you, to challenge you, they have skills that you don’t have and being confident with that。
小團(tuán)隊(duì)能帶來驚喜。雇傭最好的人,他們有你沒有的技能,讓他們環(huán)繞在你周圍,讓他們挑戰(zhàn)你,而你要對(duì)他們充滿信心。
谷歌的人工智能團(tuán)隊(duì)有6000人,OpenAI只有600人,DeepSeek才160人,但OpenAI超越了谷歌,DeepSeek有超越OpenAI的跡象。
1)Focus on Users not competition/聚焦用戶而非競(jìng)爭(zhēng)
2)Fail quickly amp; learn quickly/快速失敗,快速學(xué)習(xí)
3)Share everything/分享一切
4)Data, not opinions/要數(shù)據(jù),不要觀點(diǎn)
5)Let People pursue their dreams/讓員工追尋他們的夢(mèng)想
谷歌還有個(gè)著名的“20%自由時(shí)間”制度:?jiǎn)T工可以用五分之一的工作時(shí)間來探索任何自己感興趣的事情。無用之用,恰成大用,Gmail、Google News、Google AdSense等產(chǎn)品都是這20%自由時(shí)間探索出來的成果。
但谷歌的前CEO(首席執(zhí)行官)埃里克·施密特(Eric Schmidt)去年夏天批評(píng)說:谷歌太自由太舒服了,導(dǎo)致公司在AI競(jìng)賽中被OpenAI超越。施密特雖然后來為此道歉,但這個(gè)批評(píng)在私下引發(fā)廣泛共鳴。
錢穎一2006年-2018年擔(dān)任清華大學(xué)經(jīng)管學(xué)院院長(zhǎng),之后擔(dān)任西湖大學(xué)校董會(huì)主席。他的這個(gè)創(chuàng)造力公式是我看到的對(duì)創(chuàng)造力規(guī)律的最好總結(jié)。
如前所述,好奇心是創(chuàng)造之源,想象力則是硬幣的另一方面。蘋果砸中牛頓的腦袋,激發(fā)了他對(duì)引力的好奇心,但沒有想象力,他就不會(huì)用引力來解釋天體運(yùn)行。iPod大獲成功后喬布斯好奇為何不能拿它打電話,但沒有想象力,喬布斯就不會(huì)堅(jiān)持去掉物理鍵盤,從而為多點(diǎn)觸控技術(shù)統(tǒng)治屏幕掃清障礙,這是iPhone誕生的關(guān)鍵一步。
對(duì)于創(chuàng)造力,知識(shí)也不可或缺。《西游記》是中國最具想象力的小說,它的營養(yǎng)至今滋養(yǎng)著游戲娛樂產(chǎn)業(yè)。但吳承恩雖能想象出上天入地的孫悟空,但造不出能把人帶上藍(lán)天的飛行器,因?yàn)樗麤]有相關(guān)知識(shí)——空氣動(dòng)力學(xué)、飛行力學(xué)、材料科學(xué)……
錢穎一認(rèn)為中國教育體系側(cè)重增長(zhǎng)知識(shí),但不鼓勵(lì)好奇心和想象力。因此人才適合在既有知識(shí)體系內(nèi)的追趕型任務(wù),不適合無人區(qū)的從0到1的創(chuàng)造力任務(wù)。我自己的觀察,很多孩子10歲以后就失去了好奇心,變成循規(guī)蹈矩的小大人,當(dāng)然也丟掉了創(chuàng)造力。
可喜的是,從培養(yǎng)梁文峰的浙江大學(xué)身上,我們看到了打破教育慣性的希望,在激發(fā)創(chuàng)新、容忍失敗、鼓勵(lì)創(chuàng)業(yè)方面,浙江大學(xué)已經(jīng)開始有斯坦福大學(xué)的模樣。
《硅谷百年史(1900-2015)》的兩位作者在結(jié)語中總結(jié):
硅谷模式可以用三句話概括:質(zhì)疑權(quán)威、不同凡響、改變世界。特立獨(dú)行的人是硅谷故事的主角,硅谷不可能出現(xiàn)在對(duì)特立獨(dú)行人士不甚友善的地方。
在硅谷,絕大多數(shù)飛躍性的技術(shù)進(jìn)步都是由初出茅廬的年輕人創(chuàng)造的,他們有個(gè)共同點(diǎn):離經(jīng)叛道、敢想敢干,失敗了也沒關(guān)系,不敢嘗試才是恥辱。
在硅谷,工作趣味和個(gè)人理想壓倒了金錢和地位,于是就有了機(jī)會(huì)和創(chuàng)造性。
在硅谷,工程師的地位僅次于企業(yè)家,他們還經(jīng)常是公司創(chuàng)辦人或董事會(huì)成員,但他們?nèi)匀淮┲W醒澓蚑恤衫。在歐洲,比起市場(chǎng)營銷和銷售工作,技術(shù)工作要低人一等,歐洲把成千上萬工程師變成了庸庸碌碌的官員和西裝革履的銷售員。
這本書有兩位作者,阿倫·拉奧(Arun Rao)和皮埃羅·斯加魯菲(Piero Scaruffi),上述第四段話我相信是斯加魯菲寫的,他是意大利人,大學(xué)畢業(yè)后移民美國,曾為一家歐洲大公司工作十年。
實(shí)際上,《硅谷百年史》的結(jié)語令人悲傷。作者寫道:
硅谷原有的精神已所剩無幾,業(yè)余愛好者鉆研下一個(gè)大事件的機(jī)會(huì)渺茫,20世紀(jì)的特立獨(dú)行者已被訓(xùn)練有素但缺乏想象力的書呆子所取代,公司和員工都變成了機(jī)會(huì)主義者,理想主義者越來越少。硅谷的壟斷日甚一日,巨無霸公司不僅想把自己的產(chǎn)品推給市場(chǎng),還試圖把自己的世界觀強(qiáng)加于人。來硅谷的人越來越為了尋求穩(wěn)定工作和良好福利,而不是挑戰(zhàn)現(xiàn)狀和改變世界。
這些話寫于2016年。
《創(chuàng)新者的窘境》(The Innovator’s Dilemma——Why new technologies cause great firms to fail),書名翻譯成《創(chuàng)新者的兩難》更合適。
這本書出版于1997年,作者克萊頓·克里斯坦森(Clayton Christensen)已于2020年1月去世。他身高2米,曾來北京參加《財(cái)經(jīng)》雜志的活動(dòng),我有幸在現(xiàn)場(chǎng)聽過他的演講。
克里斯坦森在書中問道:為什么那么多管理良好、認(rèn)真傾聽客戶意見、積極投資技術(shù)研發(fā)的大企業(yè)卻失敗了?并且這些失敗案例不僅存在于變化迅速的信息技術(shù)行業(yè),也存在于變化不那么迅速的傳統(tǒng)行業(yè)——零售、鋼鐵、機(jī)械等。
他的答案是:大公司容易被新興企業(yè)顛覆,不是因?yàn)樗鼈冏鲥e(cuò)了,而是因?yàn)樗鼈冏龅锰珜?duì)了——它們過于關(guān)注當(dāng)前客戶和利潤(rùn),忽視了新興市場(chǎng)的潛力。它們擅長(zhǎng)漸進(jìn)式創(chuàng)新,但面對(duì)顛覆式創(chuàng)新卻很笨拙。
他給出的對(duì)策是:設(shè)立獨(dú)立團(tuán)隊(duì)或子公司探索新興市場(chǎng),而非試圖讓主流業(yè)務(wù)部門主導(dǎo)顛覆式創(chuàng)新。
《創(chuàng)新者的兩難》對(duì)業(yè)界產(chǎn)生了深刻影響,顛覆式創(chuàng)新(Disruptive Innovation)、漸進(jìn)式創(chuàng)新(Sustaining Innovation)這兩個(gè)概念已在業(yè)界膾炙人口。很多公司也都按書中的建議,成立了獨(dú)立的創(chuàng)新單元。但迄今為止,還沒有哪家公司能夠突破書中描述的創(chuàng)新兩難。比如今天我們討論的人工智能行業(yè),主流公司都在大模型的方向上一路狂奔,他們不可能成為大模型的顛覆者,只可能被局外人所顛覆。
美國是當(dāng)今世界第一科學(xué)技術(shù)強(qiáng)國,這很大程度上要?dú)w功于羅斯福總統(tǒng)(Franklin D Roosevelt)的科技顧問范內(nèi)瓦·布什(Vannevar Bush)。
1944年11月,二戰(zhàn)勝利在望,羅斯福致信布什,提出四個(gè)問題:
1)如何讓為戰(zhàn)爭(zhēng)開發(fā)的科學(xué)知識(shí)激發(fā)新事業(yè),大幅改善國民福祉?
2)如何更好地讓科學(xué)戰(zhàn)勝疾病?
3)公共研究和私人研究的角色和關(guān)系,政府如何促進(jìn)這兩種研究?
4)能否提出一個(gè)發(fā)現(xiàn)和發(fā)展美國青年科學(xué)人才的有效規(guī)劃?
羅斯福在信中說:“我們面前是各類思想的新前沿,如果我們以應(yīng)對(duì)這場(chǎng)戰(zhàn)爭(zhēng)所用的同樣眼光、勇氣和干勁去開拓,我們就能創(chuàng)造更為充分更加豐富的就業(yè)機(jī)會(huì)和生活。”
1945年7月,羅斯福已去世三個(gè)月,布什向繼任總統(tǒng)杜魯門提交了上述問題的答案,這份報(bào)告后來被命名為《科學(xué):無盡的前沿》。這是美國歷史上第一份國家層面的科學(xué)政策,它塑造了美國科學(xué)技術(shù)今天的面貌。布什在報(bào)告中提出了三個(gè)重要原則,歷屆美國總統(tǒng)均遵循這些原則,直到特朗普的第二個(gè)任期。
原則一:必須重視并支持基礎(chǔ)研究。
一個(gè)依靠別人來獲得基礎(chǔ)科學(xué)知識(shí)的國家,無論其機(jī)械技能如何,其工業(yè)進(jìn)步都將步履緩慢,在世界貿(mào)易中的競(jìng)爭(zhēng)力也會(huì)非常弱。我們不能再指望已被二戰(zhàn)蹂躪的歐洲作為基礎(chǔ)知識(shí)的來源,過去我們致力于應(yīng)用國外發(fā)現(xiàn)的基礎(chǔ)知識(shí),未來我們必須更加專注于自己發(fā)現(xiàn)基礎(chǔ)知識(shí),因?yàn)槲磥淼目茖W(xué)應(yīng)用比以往任何時(shí)候都更依賴于基礎(chǔ)知識(shí)。
原則二:必須保障研究自由。
研究自由必須得到保障,廣泛的科學(xué)進(jìn)步源于學(xué)者的思想自由及研究自由,他們理應(yīng)在好奇心的驅(qū)使下探索未知,自主選擇研究方向。
原則三:必須同時(shí)重視社會(huì)科學(xué)和人文科學(xué)。
以犧牲社會(huì)科學(xué)、人文科學(xué)和其他對(duì)國民福祉至關(guān)重要的研究為代價(jià)來發(fā)展自然科學(xué)和醫(yī)學(xué)研究,這是愚蠢的想法。我們不能將整個(gè)國家最杰出的人才以極端的比例吸收到科學(xué)和技術(shù)中,因?yàn)檫@樣的規(guī)劃會(huì)損害整個(gè)國家,實(shí)際上也會(huì)損害科學(xué),科學(xué)不能依靠自身單獨(dú)存在。
諾貝爾科學(xué)獎(jiǎng)(物理學(xué)獎(jiǎng)、化學(xué)獎(jiǎng)、生理和醫(yī)學(xué)獎(jiǎng))自1901年起頒發(fā)。1901年-1945年,歐洲獲得80%以上的諾貝爾科學(xué)獎(jiǎng),僅德英法三國,獲獎(jiǎng)比例就超過50%,這期間美國獲獎(jiǎng)比例不到15%。在《科學(xué):無盡的前沿》后,1946年-2024年,美國拿走了近半數(shù)諾貝爾科學(xué)獎(jiǎng)。
(作者為《財(cái)經(jīng)》執(zhí)行主編;編輯:何剛)