沙敏
王小川率領的百川智能,按部就班,有條不紊地,沿著他提出的“理想上慢一步,落地上快三步”目標在努力。
2024年3月,福布斯中國篩選出51家新晉獨角獸企業(yè)名單,成立僅一年的百川人工智能科技公司(以下簡稱“百川智能”)上榜。4月23日,在中關村啟迪科技大廈,記者來到百川智能,聽百川人講述著百川智能的創(chuàng)立、發(fā)展與未來。
技術極客,屢創(chuàng)奇跡
回首中國互聯(lián)網(wǎng)歷史,1994年被稱為Internet的元年。
清華大學的錢天白教授,協(xié)助中科院網(wǎng)絡信息中心,完成了中國國家頂級域名.CN服務器的設置,從此中國進入互聯(lián)網(wǎng)賽道。網(wǎng)易、搜狐、新浪相繼在納斯達克掛牌上市,成為當時中國三大門戶網(wǎng)站。中國互聯(lián)網(wǎng)江湖上,人才輩出,各領風騷;風云際會,屢創(chuàng)奇跡。如果說張朝陽是中國互聯(lián)網(wǎng)的教父,阿里的馬云,則以電子商務占據(jù)半壁江山;馬化騰創(chuàng)立騰訊后,1999年,騰訊開發(fā)的即時通信工具QQ軟件上線,成為國內(nèi)運用次數(shù)最多的通信軟件。2011年微信應用軟件上線,如今在海內(nèi)外,已擁有1000多億的用戶。
年少有為的王小川,是位技術極客,擅長的是技術創(chuàng)新。在當今計算機應用與技術創(chuàng)新飛速發(fā)展的時代,商業(yè)模式創(chuàng)新與計算機技術應用的創(chuàng)新,改變著百姓的生活。美團創(chuàng)辦者王興,創(chuàng)辦美團App,送餐變得快捷,外賣巨頭誕生;字節(jié)跳動的張一鳴,創(chuàng)辦今日頭條與抖音,成為國民級的運用。技術創(chuàng)新的背后,同樣也要有精湛業(yè)務背景的領導人,率領一支精干高效的團隊。
搜狗與清華有密不可分的歷史淵源,公司CEO王小川,更是清華大學計算機系的高材生,從清華本科畢業(yè)后,又讀完碩士、博士。
搜狗的CEO(首席執(zhí)行官)、CMO(首席營銷官)、CTO(首席技術官)等高管均為清華校友。2003年開始研發(fā)搜狗搜索時,王小川最初的團隊,均來自清華大學奧賽集訓隊,12名兼職學生中,已誕生過技術領軍級人物。
搜狗的創(chuàng)始人王小川,當他還在清華大學讀大三時,就在ChinaRen做兼職,負責站內(nèi)搜索。1999年,21歲的他率領團隊僅用兩個月,就高效研發(fā)出ChinaRen新聞發(fā)布系統(tǒng),搜狗躍升為中國第四大網(wǎng)站。張朝陽邀請王小川加入搜狐,成為愛將,兩年后晉升副總裁。
2004年8月3日,他與團隊正式推出擁有獨立知識產(chǎn)權的搜索引擎搜狗,由于有馬云支持,促成了搜狗與分拆與獨立。搜狗創(chuàng)立了中國第一大輸入法和搜索引擎,擁有獨立的知識產(chǎn)權。
2015年,王小川獲得北京市榮模,北京市科學技術一等獎。2017年11月9日,搜狗在美國紐約交易所掛牌上市,成為中國赴美上市第一股,此時的搜狗市值已破50億。2019年,騰訊的馬化騰入股搜狗,雙方成為合作伙伴。
搜狗新的契機,發(fā)生在2021年。因為騰訊的商業(yè)版圖中缺少這塊業(yè)務,騰訊總裁馬化騰,以20億美元全資收購搜狗,搜狗CEO王小川宣布卸任,4月10日,他宣布成立百川智能。與搜狗總編輯孫彥新等人一起,投身大模型,立志為生命健康與醫(yī)學逐夢,創(chuàng)立中國版OpenAI。
百川智能的團隊認為,大模型將語言變成了數(shù)學模型,語言是數(shù)學模型、參數(shù)模型和權重模型。語言是思維與邏輯、知識與文化和交流的載體,當語言變成數(shù)學模型后,它代表的知識與經(jīng)驗與思維與邏輯,都能夠用數(shù)學模型進行推演。王小川在學習大量醫(yī)學知識的基礎上,基于語言模型的思考,決定出來做大模型。初建的團隊,由搜狗的核心團隊組成,王小川以他任院長的清華計算機系天工智能研究院為人才研究庫,開啟了大模型生命健康與科學的創(chuàng)業(yè)之路。
百川匯海,開源雙贏
“2023年是大模型元年開始,人類從信息時代走向智能時代,走入新的快車道”。王小川在演講時的話語擲地有聲!
百川智能,就誕生在2023年充滿希望和機遇的春天。
4月10日,王小川宣布百川智能成立時,發(fā)表了演講:“生活在二十一世紀是如此幸運,波瀾壯闊的互聯(lián)網(wǎng)革命還沒有謝幕,通用人工智能時代又呼嘯而來。大模型不僅將重塑現(xiàn)有行業(yè),更將創(chuàng)造前所未有的價值和機遇”。
王小川是一個有很深厚家國情懷的人,是完美的理想主義者。
當時國內(nèi)的大量高校、企業(yè)和事業(yè)單位,使用的都是美國的大模型,給核心技術增量自控帶來了很大風險。中國應該有自己的開源模型!在他的率領下,公司員工守望相助,攻堅克難,高效率地完成任務。
4月底,算力迅速到位;6月15日,公司就發(fā)布第一款免費商用的大模型Baichuan7B并開源;第一款大模型一經(jīng)推出,便受到業(yè)內(nèi)矚目。7月11日,第二款Baichuan13B發(fā)布;8月8日,發(fā)布Baichuan53B閉源大語言模型,其寫作、文本創(chuàng)作能力達到行業(yè)最高水平。
9月6日,百川7B升級到2.0版本,發(fā)布Baichuan2-7B、Baichuan2-13B兩款免費可商用的開源模型,并且公開了Baichuan2-7B的技術報告,詳細介紹了Baichuan2-7B訓練的全過程。2.0版本系列模型在評估任務中,大幅領先全球范圍內(nèi)最強的LLaMA2,引領開源社區(qū)走向中文開源大模型時代。Baichuan?2系列模型,在開源社區(qū)的下載量已經(jīng)超過了700萬次。
中國科學院院士、清華大學人工智能研究院名譽院長張鈸,在主題演講中提到“目前我國已經(jīng)推出很多從幾十億到幾百億不同規(guī)模的大模型,這些大模型主要集中在垂直領域的應用上,我很支持開源大模型助力學術研究”。他對百川智能推出的用于基礎研究的、開源大模型研究成果給予高度評價。
2024年1月29日,百川智能發(fā)布超千億參數(shù)的大語言模型Baichuan?3,根據(jù)中文大模型基準測評2024年4月報告,測評選取了國內(nèi)外有代表性的32個大模型,通過SuperCLUE測評結(jié)果發(fā)現(xiàn),
Baichuan?3表現(xiàn)不俗,拔得頭籌。在多個權威通用能力評測中,Baichuan?3均展現(xiàn)了出色能力,在中文任務上更是超越了GPT—4,是中文醫(yī)療任務表現(xiàn)最佳的大模型。
除此之外,百川智能助力知名高校的專項科研,為大模型研究項目提供資金扶持。2023年9月,百川智能與中國計算機學會(CCF)、北京英博數(shù)科科技有限公司一起,聯(lián)合創(chuàng)立了“CCF—百川—英博大模型基金”,支持國內(nèi)外高校及科研院所的青年學者,為大模型開展學術研究,提供資金支持。該基金累計已收到985院校及新加坡知名大學的100余份申請,已經(jīng)完成資助清華大學、北京大學、上海交通大學、復旦大學、中國人民大學、新加坡國立大學等高校的15個申請項目。
2024年3月17日,百川智能與北京大學共同簽署了“北大—百川通用人式智能聯(lián)合實驗室”共建協(xié)議,雙方攜手積極探索大模型的可解釋性、安全性、穩(wěn)定性等層面的創(chuàng)新,解決企業(yè)在大模型對齊領域的技術需求,為大模型的基礎科學研究提供支持。
盡管百川智能成立僅一年,但保持著業(yè)內(nèi)最快的模型更新速度,從以月度為單位,到以半月為單位,堅持開源與閉源結(jié)合,相繼推出11款大模型,涵蓋了開源、閉源、學術科研、國產(chǎn)算力等多個維度。公司未來會發(fā)布Baichuan?4,未來可期。
關愛健康,關愛生命
王小川率領的百川智能,按部就班,有條不紊地沿著他提出的“理想上慢一步,落地上快三步”目標在努力。王小川正朝著生命科學與醫(yī)療領域方向探索與前行。
在業(yè)內(nèi),醫(yī)療領域被稱為“大語言模型皇冠上的明珠”。為了摘取皇冠上的明珠,從國外到國內(nèi),人工智能醫(yī)學研究團隊不懈地努力,攀登這座科學的珠穆朗瑪峰。
在國外,2023年9月21日,谷歌蛋白質(zhì)結(jié)構(gòu)預測模型獲2023年拉斯克獎。拉斯克獎,是在醫(yī)學領域頂級獎項拉斯克獎,這一獎項也被譽為“諾貝爾獎的風向標”。將2023年基礎醫(yī)學研究獎,頒給了研究醫(yī)學大模型的兩位博士,因他們創(chuàng)造了一項能夠預測蛋白質(zhì)三維結(jié)構(gòu)的革命性技術——AlphaFold。頒獎辭中寫道:通過放飛想象力和才華,Hassadbis?Jumper和他們的團隊,完成了讓科學家困惑半個世紀的任務,開啟了研究和操縱蛋白質(zhì)的新時代。
在國內(nèi),王小川提出:“理想上慢一步,落地上快三步”,最新發(fā)布的超千億參數(shù)的最新版本大模型Baichuan?3,表明百川智能的醫(yī)療知識水平有所突破。Baichuan3的醫(yī)療數(shù)據(jù)集Token數(shù)超千億,醫(yī)療能力逼近GPT—4。
對標世界先進的人工智能公司OpenAI,王小川頗有感觸。在談起與美國OpenAI交流時的體會時,他感嘆道:“他們現(xiàn)在正在設計一個把1000萬顆GPU連在一起去做模型的這樣一種技術,這樣一種想法像登月一樣。”王小川說落地快三步,是要實現(xiàn)應用上的盡快落地,與OpenAI不計成本的追求技術上的天花板相比,我們要做的事是發(fā)揮自己的優(yōu)勢。
未來的百川智能有三個方向,一是AI顧問。大模型本身是造人,有知識有經(jīng)驗的顧問;二是要做AI醫(yī)生。三是做太虛幻境。百川的產(chǎn)品在5月份起,將會逐步推向市場,大模型的超級底座和超級應用會接受用戶的檢驗。