百川智能：百舸爭流，勇立潮頭

2024-07-13 04:48:42沙敏

中關村 2024年6期

沙敏

王小川率領的百川智能，按部就班，有條不紊地，沿著他提出的“理想上慢一步，落地上快三步”目標在努力。

2024年3月，福布斯中國篩選出51家新晉獨角獸企業(yè)名單，成立僅一年的百川人工智能科技公司（以下簡稱“百川智能”）上榜。4月23日，在中關村啟迪科技大廈，記者來到百川智能，聽百川人講述著百川智能的創(chuàng)立、發(fā)展與未來。

技術極客，屢創(chuàng)奇跡

回首中國互聯(lián)網(wǎng)歷史，1994年被稱為Internet的元年。

清華大學的錢天白教授，協(xié)助中科院網(wǎng)絡信息中心，完成了中國國家頂級域名.CN服務器的設置，從此中國進入互聯(lián)網(wǎng)賽道。網(wǎng)易、搜狐、新浪相繼在納斯達克掛牌上市，成為當時中國三大門戶網(wǎng)站。中國互聯(lián)網(wǎng)江湖上，人才輩出，各領風騷；風云際會，屢創(chuàng)奇跡。如果說張朝陽是中國互聯(lián)網(wǎng)的教父，阿里的馬云，則以電子商務占據(jù)半壁江山；馬化騰創(chuàng)立騰訊后，1999年，騰訊開發(fā)的即時通信工具QQ軟件上線，成為國內(nèi)運用次數(shù)最多的通信軟件。2011年微信應用軟件上線，如今在海內(nèi)外，已擁有1000多億的用戶。

年少有為的王小川，是位技術極客，擅長的是技術創(chuàng)新。在當今計算機應用與技術創(chuàng)新飛速發(fā)展的時代，商業(yè)模式創(chuàng)新與計算機技術應用的創(chuàng)新，改變著百姓的生活。美團創(chuàng)辦者王興，創(chuàng)辦美團App，送餐變得快捷，外賣巨頭誕生；字節(jié)跳動的張一鳴，創(chuàng)辦今日頭條與抖音，成為國民級的運用。技術創(chuàng)新的背后，同樣也要有精湛業(yè)務背景的領導人，率領一支精干高效的團隊。

搜狗與清華有密不可分的歷史淵源，公司CEO王小川，更是清華大學計算機系的高材生，從清華本科畢業(yè)后，又讀完碩士、博士。

搜狗的CEO（首席執(zhí)行官）、CMO（首席營銷官）、CTO（首席技術官）等高管均為清華校友。2003年開始研發(fā)搜狗搜索時，王小川最初的團隊，均來自清華大學奧賽集訓隊，12名兼職學生中，已誕生過技術領軍級人物。

搜狗的創(chuàng)始人王小川，當他還在清華大學讀大三時，就在ChinaRen做兼職，負責站內(nèi)搜索。1999年，21歲的他率領團隊僅用兩個月，就高效研發(fā)出ChinaRen新聞發(fā)布系統(tǒng)，搜狗躍升為中國第四大網(wǎng)站。張朝陽邀請王小川加入搜狐，成為愛將，兩年后晉升副總裁。

2004年8月3日，他與團隊正式推出擁有獨立知識產(chǎn)權的搜索引擎搜狗，由于有馬云支持，促成了搜狗與分拆與獨立。搜狗創(chuàng)立了中國第一大輸入法和搜索引擎，擁有獨立的知識產(chǎn)權。

2015年，王小川獲得北京市榮模，北京市科學技術一等獎。2017年11月9日，搜狗在美國紐約交易所掛牌上市，成為中國赴美上市第一股，此時的搜狗市值已破50億。2019年，騰訊的馬化騰入股搜狗，雙方成為合作伙伴。

搜狗新的契機，發(fā)生在2021年。因為騰訊的商業(yè)版圖中缺少這塊業(yè)務，騰訊總裁馬化騰，以20億美元全資收購搜狗，搜狗CEO王小川宣布卸任，4月10日，他宣布成立百川智能。與搜狗總編輯孫彥新等人一起，投身大模型，立志為生命健康與醫(yī)學逐夢，創(chuàng)立中國版OpenAI。

百川智能的團隊認為，大模型將語言變成了數(shù)學模型，語言是數(shù)學模型、參數(shù)模型和權重模型。語言是思維與邏輯、知識與文化和交流的載體，當語言變成數(shù)學模型后，它代表的知識與經(jīng)驗與思維與邏輯，都能夠用數(shù)學模型進行推演。王小川在學習大量醫(yī)學知識的基礎上，基于語言模型的思考，決定出來做大模型。初建的團隊，由搜狗的核心團隊組成，王小川以他任院長的清華計算機系天工智能研究院為人才研究庫，開啟了大模型生命健康與科學的創(chuàng)業(yè)之路。

百川匯海，開源雙贏

“2023年是大模型元年開始，人類從信息時代走向智能時代，走入新的快車道”。王小川在演講時的話語擲地有聲！

百川智能，就誕生在2023年充滿希望和機遇的春天。

4月10日，王小川宣布百川智能成立時，發(fā)表了演講：“生活在二十一世紀是如此幸運，波瀾壯闊的互聯(lián)網(wǎng)革命還沒有謝幕，通用人工智能時代又呼嘯而來。大模型不僅將重塑現(xiàn)有行業(yè)，更將創(chuàng)造前所未有的價值和機遇”。

王小川是一個有很深厚家國情懷的人，是完美的理想主義者。

當時國內(nèi)的大量高校、企業(yè)和事業(yè)單位，使用的都是美國的大模型，給核心技術增量自控帶來了很大風險。中國應該有自己的開源模型！在他的率領下，公司員工守望相助，攻堅克難，高效率地完成任務。

4月底，算力迅速到位；6月15日，公司就發(fā)布第一款免費商用的大模型Baichuan7B并開源；第一款大模型一經(jīng)推出，便受到業(yè)內(nèi)矚目。7月11日，第二款Baichuan13B發(fā)布；8月8日，發(fā)布Baichuan53B閉源大語言模型，其寫作、文本創(chuàng)作能力達到行業(yè)最高水平。

9月6日，百川7B升級到2.0版本，發(fā)布Baichuan2-7B、Baichuan2-13B兩款免費可商用的開源模型，并且公開了Baichuan2-7B的技術報告，詳細介紹了Baichuan2-7B訓練的全過程。2.0版本系列模型在評估任務中，大幅領先全球范圍內(nèi)最強的LLaMA2，引領開源社區(qū)走向中文開源大模型時代。Baichuan?2系列模型，在開源社區(qū)的下載量已經(jīng)超過了700萬次。

中國科學院院士、清華大學人工智能研究院名譽院長張鈸，在主題演講中提到“目前我國已經(jīng)推出很多從幾十億到幾百億不同規(guī)模的大模型，這些大模型主要集中在垂直領域的應用上，我很支持開源大模型助力學術研究”。他對百川智能推出的用于基礎研究的、開源大模型研究成果給予高度評價。

2024年1月29日，百川智能發(fā)布超千億參數(shù)的大語言模型Baichuan?3，根據(jù)中文大模型基準測評2024年4月報告，測評選取了國內(nèi)外有代表性的32個大模型，通過SuperCLUE測評結(jié)果發(fā)現(xiàn)，

Baichuan?3表現(xiàn)不俗，拔得頭籌。在多個權威通用能力評測中，Baichuan?3均展現(xiàn)了出色能力，在中文任務上更是超越了GPT—4，是中文醫(yī)療任務表現(xiàn)最佳的大模型。

除此之外，百川智能助力知名高校的專項科研，為大模型研究項目提供資金扶持。2023年9月，百川智能與中國計算機學會（CCF）、北京英博數(shù)科科技有限公司一起，聯(lián)合創(chuàng)立了“CCF—百川—英博大模型基金”，支持國內(nèi)外高校及科研院所的青年學者，為大模型開展學術研究，提供資金支持。該基金累計已收到985院校及新加坡知名大學的100余份申請，已經(jīng)完成資助清華大學、北京大學、上海交通大學、復旦大學、中國人民大學、新加坡國立大學等高校的15個申請項目。

2024年3月17日，百川智能與北京大學共同簽署了“北大—百川通用人式智能聯(lián)合實驗室”共建協(xié)議，雙方攜手積極探索大模型的可解釋性、安全性、穩(wěn)定性等層面的創(chuàng)新，解決企業(yè)在大模型對齊領域的技術需求，為大模型的基礎科學研究提供支持。

盡管百川智能成立僅一年，但保持著業(yè)內(nèi)最快的模型更新速度，從以月度為單位，到以半月為單位，堅持開源與閉源結(jié)合，相繼推出11款大模型，涵蓋了開源、閉源、學術科研、國產(chǎn)算力等多個維度。公司未來會發(fā)布Baichuan?4，未來可期。

關愛健康，關愛生命

王小川率領的百川智能，按部就班，有條不紊地沿著他提出的“理想上慢一步，落地上快三步”目標在努力。王小川正朝著生命科學與醫(yī)療領域方向探索與前行。

在業(yè)內(nèi)，醫(yī)療領域被稱為“大語言模型皇冠上的明珠”。為了摘取皇冠上的明珠，從國外到國內(nèi)，人工智能醫(yī)學研究團隊不懈地努力，攀登這座科學的珠穆朗瑪峰。

在國外，2023年9月21日，谷歌蛋白質(zhì)結(jié)構(gòu)預測模型獲2023年拉斯克獎。拉斯克獎，是在醫(yī)學領域頂級獎項拉斯克獎，這一獎項也被譽為“諾貝爾獎的風向標”。將2023年基礎醫(yī)學研究獎，頒給了研究醫(yī)學大模型的兩位博士，因他們創(chuàng)造了一項能夠預測蛋白質(zhì)三維結(jié)構(gòu)的革命性技術——AlphaFold。頒獎辭中寫道：通過放飛想象力和才華，Hassadbis?Jumper和他們的團隊，完成了讓科學家困惑半個世紀的任務，開啟了研究和操縱蛋白質(zhì)的新時代。

在國內(nèi)，王小川提出：“理想上慢一步，落地上快三步”，最新發(fā)布的超千億參數(shù)的最新版本大模型Baichuan?3，表明百川智能的醫(yī)療知識水平有所突破。Baichuan3的醫(yī)療數(shù)據(jù)集Token數(shù)超千億，醫(yī)療能力逼近GPT—4。

對標世界先進的人工智能公司OpenAI，王小川頗有感觸。在談起與美國OpenAI交流時的體會時，他感嘆道：“他們現(xiàn)在正在設計一個把1000萬顆GPU連在一起去做模型的這樣一種技術，這樣一種想法像登月一樣。”王小川說落地快三步，是要實現(xiàn)應用上的盡快落地，與OpenAI不計成本的追求技術上的天花板相比，我們要做的事是發(fā)揮自己的優(yōu)勢。

未來的百川智能有三個方向，一是AI顧問。大模型本身是造人，有知識有經(jīng)驗的顧問；二是要做AI醫(yī)生。三是做太虛幻境。百川的產(chǎn)品在5月份起，將會逐步推向市場，大模型的超級底座和超級應用會接受用戶的檢驗。