2025年春節(jié)期間,全球科技界的目光聚集在梁文鋒身上。在他的帶領(lǐng)下,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司的國產(chǎn)人工智能(AI)大模型DeepSeek震驚世界,無論是性能還是受歡迎程度,都躍居全球前列。這讓科技界大吃一驚。人們開始好奇,梁文鋒是誰?他是如何一舉成為業(yè)界黑馬的?他的人生,又有怎樣的經(jīng)歷?
喜歡拆收音機,從小就是數(shù)學天才
1985年,梁文峰出生于廣東湛江的一個小村莊。父母為人淳樸,都是小學老師。父親對他的教育方式與眾不同,更注重解決問題的能力,而非單純追求分數(shù)。雖然家庭并不富裕,但給了他理性和堅韌的成長環(huán)境。
梁文鋒從小就展現(xiàn)出對數(shù)學和科學的天賦。他喜歡把家里的“飛躍牌”收音機拆了又裝,裝了又拆,前前后后折騰了30多次。這種對事物的好奇心和探索欲,不僅鍛煉了他的動手能力,更培養(yǎng)了他的數(shù)理思維。他通過拆解和重新組裝收音機,學會了如何從復雜的問題中找到規(guī)律,以及如何用邏輯去解決問題。這種能力,正是數(shù)學思維的核心,也為他后來的創(chuàng)新之路奠定基礎(chǔ)。
讀小學六年級時,梁文峰憑借出色的數(shù)學成績考入?yún)谴ㄒ恢小E匀诉€在為簡單的加減乘除煩惱時,他已經(jīng)開始自學高中數(shù)學,甚至提前“解鎖”大學數(shù)學的高階知識。他對數(shù)字與邏輯的敏感性遠超同齡人。中學時,他為了攻克一道幾何難題,自創(chuàng)“坐標系窮舉法”,每天花3個小時,把所有可能的輔助線都試了一遍。后來,這種方法竟成了他開發(fā)AI模型時的關(guān)鍵算法。
2002年,17歲的梁文鋒考入浙江大學,就讀其王牌學科——電子信息工程,攻讀人工智能方向。其間,他不僅刻苦學習,還積極參加各種數(shù)學建模競賽,逐漸在學術(shù)圈小有名氣。
本科畢業(yè)后,梁文峰繼續(xù)攻讀浙江大學的碩士研究生,研究方向轉(zhuǎn)向更具前沿性的機器視覺。他的導師項志宇教授,是國內(nèi)這一領(lǐng)域的專家。跟從項志宇教授學習期間,梁文鋒的學術(shù)能力得到極大提升。大學期間,梁文鋒堅信“AI將改變世界”。當時,他對金融市場產(chǎn)生了濃厚的興趣,嘗試用機器學習的方法分析金融市場數(shù)據(jù),并開始用編寫的人工智能算法選股。在全球金融危機的陰影下,他帶領(lǐng)一群志同道合的伙伴,探索量化交易與人工智能的結(jié)合,嘗試進行全自動量化交易。他們采集海量的市場行情數(shù)據(jù)、宏觀經(jīng)濟信息,并用數(shù)學建模的方法研究價格波動規(guī)律,積累早期數(shù)據(jù)和經(jīng)驗。這些“超前”的嘗試,為他日后的創(chuàng)業(yè)埋下伏筆。
當時,量化投資(是指利用數(shù)學模型和計算機算法來進行投資決策的一種投資方式)在國內(nèi)還是新鮮事物,但梁文鋒敏銳地察覺到其中的潛力。為掌握量化投資的核心技術(shù),他開始瘋狂學習金融知識。除了讀不少專業(yè)書籍外,他還利用網(wǎng)絡(luò)資源,學習國內(nèi)外頂尖量化投資機構(gòu)的經(jīng)驗與方法。
與許多追求“高薪體面”工作的同學不同,梁文鋒的目標從來不局限于做一名普通工程師。他在學術(shù)研究之余,開始關(guān)注更大的產(chǎn)業(yè)變革方向,尤其是人工智能在實際場景中的應(yīng)用。他堅信,科技將成為未來社會的核心驅(qū)動力,而自己必須抓住這場時代機遇。思來想去,他決定自己創(chuàng)業(yè)。
成立公司,進軍AI大模型
2015年,梁文鋒與浙大同學共同創(chuàng)立了自己的量化私募基金——幻方量化基金。將量化用于投資領(lǐng)域,這是一個融合金融、數(shù)學和計算機科學的交叉領(lǐng)域,需要具備深厚的專業(yè)知識和強大的技術(shù)能力。隨著幻方量化基金規(guī)模不斷膨脹,梁文峰從2019年起累計投資超10億元建設(shè)“螢火一號”和“螢火二號”AI算力集群,這讓幻方量化成為國內(nèi)少數(shù)具備超強算力的企業(yè)。
到2021年,梁文鋒已躋身千億量化私募“四大天王”之列,但他并沒有滿足于此。2023年,隨著ChatGPT(是美國OpenAI公司開發(fā)的大型語言模型)的爆火,AI大模型成為全球科技領(lǐng)域的焦點,一場沒有硝煙的大模型競賽在全球范圍內(nèi)激烈展開。
當許多人還在質(zhì)疑中國能否在人工智能領(lǐng)域取得突破時,梁文鋒看到了人工智能領(lǐng)域的巨大潛力和無限可能。2023年7月,他成立了人工智能研究公司,全力進軍AI大模型研究開發(fā)領(lǐng)域,專注于通用人工智能的研發(fā)。
很多人難以理解,甚至有人覺得他瘋了。搞AI大模型不僅燒錢,而且國內(nèi)普遍認為我國在這方面的能力有限。也許當時連梁文鋒都沒想到,他的這一瘋狂決定,成就了如今國產(chǎn)AI的一段傳奇。
在團隊組建方面,梁文鋒展現(xiàn)出獨特的眼光和魄力。他沒有像其他公司那樣,執(zhí)著于聘請具有豐富AI技術(shù)經(jīng)驗的老將,而是將目光投向充滿朝氣和潛力的年輕人。在他看來,如果追求短期目標,找現(xiàn)成有經(jīng)驗的人是對的,但如果看長遠,經(jīng)驗就沒那么重要,基礎(chǔ)能力、創(chuàng)造性、熱愛才更為重要。
梁文鋒認為,年輕人思維活躍,富有創(chuàng)新精神,沒有被傳統(tǒng)思維模式束縛,更有可能在AI領(lǐng)域取得突破性進展。于是,一群來自清華大學、北京大學、浙江大學等中國頂尖高校的應(yīng)屆畢業(yè)生、在讀生以及畢業(yè)才幾年的年輕人,匯聚在一起。
怎么看,當時梁文鋒的公司都沒法在AI領(lǐng)域闖出一片天。他的團隊僅139人,多為本土高校畢業(yè)生和實習生,團隊成員沒有一個有海外留學背景。不過,雖然梁文鋒團隊很年輕,但他們卻都是出類拔萃的。有的在國際大學生程序設(shè)計競賽中屢獲金獎,有的在頂尖學術(shù)會議上發(fā)表過高水平論文……盡管缺乏實際工作經(jīng)驗,但大家對研究充滿熱情和好奇,擁有扎實的專業(yè)知識和強大的學習能力。在團隊里,大家沒有嚴格的上下級之分,每個人都能根據(jù)自己的興趣和專長,自由加入不同的研究小組。這種管理模式,極大地激發(fā)員工的積極性和創(chuàng)造力,讓他們能夠充分發(fā)揮自己的才能。
過去,梁文鋒看到人工智能技術(shù)被美國少數(shù)公司壟斷,并借此收取很高的費用,就非常痛恨。他曾發(fā)誓——“一定要讓AI變成人人可以用得起的東西!”所以,當他的團隊研發(fā)出AI大模型后,他做出了一個最重要的決定,那就是將代碼開源,讓任何人都可以訪問,目標是用低成本、高性能的技術(shù)。DeepSeek堪稱創(chuàng)新思維與實踐的完美結(jié)合,其核心競爭力在于獨特的技術(shù)創(chuàng)新。梁文峰的公司成立僅一年,就憑借其團隊創(chuàng)新能力,成為AI領(lǐng)域一顆耀眼的新星。
一戰(zhàn)成名,
用中國科技書寫震撼全球的故事
2024年12月,梁文鋒推出了新一代AI大模型DeepSeek-V3。這款模型在數(shù)學運算、代碼生成和中文問答等方面表現(xiàn)出色。更令人震驚的是,它用低成本的芯片,實現(xiàn)了對GPT-4的全面對標,被美國科技圈稱為“來自東方的神秘力量”。從此,梁文鋒成為業(yè)界的一匹黑馬!
梁文鋒真正的人生“爆發(fā)點”,是在2025年1月27日。這天,他發(fā)布了新的開源AI大模型DeepSeek R1,這一大模型不僅在性能上追上了全球最頂尖的GPT-4完整版,而且用550萬美元的訓練開銷,就做到硅谷投入上億美元的效果。同時,梁文鋒通過技術(shù)創(chuàng)新,不斷優(yōu)化模型的性能和效率,使其在保持高性能的同時,推理成本大幅降低。這使得中小企業(yè)和個人開發(fā)者,也能夠負擔得起AI技術(shù)的使用,為AI的普及和應(yīng)用提供了更廣闊的空間。
當世界各地的大量用戶突然涌入使用時,梁文鋒和公司措手不及,甚至導致局部服務(wù)器短暫的系統(tǒng)崩潰。令梁文鋒沒想到的是,短短幾天,這個新的AI大模型就引起世界級的轟動。
在AI領(lǐng)域,DeepSeek宛如一顆重磅炸彈,迅速登上蘋果全球免費榜榜首,引發(fā)廣泛關(guān)注。其采用開源戰(zhàn)略,實現(xiàn)算法革命,在成本控制上也表現(xiàn)卓越,以顛覆性的姿態(tài)沖擊著美國AI從軟件、硬件到生態(tài)的科技金融化邏輯。
更厲害的是,DeepSeek是目前唯一支持聯(lián)網(wǎng)搜索的推理模型,這一點,就連全球頂尖的美國OpenAI還沒做到。毫無疑問,那些AI巨頭躺著賺錢的日子,即將變成“過去式”。
一位業(yè)內(nèi)大佬在電視節(jié)目中說:“中國的AI能力正在迅速趕超美國,在某些方面甚至可以與美國頂尖模型相媲美,這出乎許多人的意料。”
DeepSeek服務(wù)覆蓋了工業(yè)、農(nóng)業(yè)、教育、醫(yī)療等多個領(lǐng)域。它就像一個深不見底的寶庫,任何人都能從中找到自己需要的寶貝。有人說,梁文鋒讓AI技術(shù)真正惠及大眾,這不僅是在顛覆AI市場的游戲規(guī)則,更是他2025年送給全世界的一份春節(jié)大禮!
DeepSeek的成功,證明了梁文峰的遠見和堅持。在全球AI競爭愈發(fā)激烈的今天,他用技術(shù)和創(chuàng)新讓中國AI力量在國際舞臺上占據(jù)了一席之地。正如他所說:“我們不只是追趕,更要在核心技術(shù)上實現(xiàn)真正的超越。”
目前,梁文鋒已經(jīng)將自己的公司定位在中國人工智能革命的最前沿。今年40歲的他,正利用自己的聰明才智,全力以赴地報效祖國,為中國科技書寫更多震撼全球的故事。
編輯|郭緒書