999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

名校海歸創(chuàng)業(yè):讓機(jī)器人掌勺松鼠鱖魚

2025-06-17 00:00:00李曉潔
知音海外版(上半月) 2025年5期
關(guān)鍵詞:智能模型

作為在國內(nèi)第一波具身智能熱潮中創(chuàng)立的公司,星海圖四個(gè)創(chuàng)始人,少見地全是“90后”,都有海外學(xué)習(xí)或工作經(jīng)驗(yàn)。2023年,他們合力開啟學(xué)生時(shí)期就想做的機(jī)器人事業(yè),并把這當(dāng)作可以“做一輩子的事”。盡管當(dāng)下,通用人形機(jī)器人的技術(shù)路線還未聚合,距離終點(diǎn)有多久還很不明朗。但我們想記錄下,在對(duì)技術(shù)的信仰下,人類通往機(jī)器人之夢(mèng)的一個(gè)側(cè)面。

人均“90后”

3月中旬的一天傍晚,接近7點(diǎn),北京市海淀區(qū)東升大廈6樓,星海圖人工智能科技有限公司(簡(jiǎn)稱“星海圖”)里的燈還全亮著。公司最左側(cè)搭建了一個(gè)廚房場(chǎng)景,兩個(gè)灰黑色的人形機(jī)器人靜靜站在飲水機(jī)和櫥柜前。右側(cè)辦公區(qū),三四個(gè)員工坐在電腦前打字,還有幾個(gè)人站在一塊白板后的窗邊閑聊。他們看起來都很年輕,讓人分不清是剛畢業(yè)工作,還是在校實(shí)習(xí)生。

“看起來大家都下班了,只有幾個(gè)人在加班。”帶著這樣的想法,我走進(jìn)會(huì)議室見到了我的第一位采訪對(duì)象,星海圖聯(lián)合創(chuàng)始人許華哲。兩個(gè)小時(shí)后,臨近晚上9點(diǎn),我從會(huì)議室出來,燈依然全亮著,但幾乎每臺(tái)電腦前都坐著人,盯著滿是代碼的屏幕,空氣似乎都變稠了一些。左側(cè)一個(gè)數(shù)據(jù)采集室里,年輕的員工把手放在類似游戲手柄的裝置上,遙控操縱著前方一米外的機(jī)器人手臂,戴著夾爪的機(jī)械臂跟著他的動(dòng)作向前伸出一道弧線,然后落下,瞄準(zhǔn)目標(biāo)方塊后抓取、放到另一個(gè)指定位置,如此不斷重復(fù)——原來機(jī)器人和人類都在加班,傍晚只是中場(chǎng)休息。

這種加班場(chǎng)景,在創(chuàng)業(yè)公司十分常見。聯(lián)合創(chuàng)始人許華哲也經(jīng)常在辦公室待到晚上11點(diǎn)多。許華哲今年32歲,微胖,嘴角總帶著笑意。他正被北京春天的圓柏花粉過敏折磨,大部分時(shí)間戴著口罩。他告訴我,公司員工、包括四位創(chuàng)始人在內(nèi),基本都是“90后”,這是一家以年輕人為主的創(chuàng)業(yè)公司。但早在10年前,幾位創(chuàng)始人就有了機(jī)器人、人工智能相關(guān)的海外學(xué)習(xí)、工作經(jīng)驗(yàn)。

以CEO高繼揚(yáng)為例,他2015年在清華大學(xué)電子工程系本科畢業(yè)后,用了三年半時(shí)間,獲得美國南加州大學(xué)計(jì)算機(jī)視覺博士學(xué)位,之后在Waymo(威馬)和國內(nèi)北京初速度科技有限公司兩家行業(yè)領(lǐng)先的自動(dòng)駕駛公司工作。另外兩位聯(lián)合創(chuàng)始人趙行、李天威分別是高繼揚(yáng)在兩家智駕公司時(shí)的同事。其中趙行離職威馬后,進(jìn)入清華大學(xué)交叉信息研究院擔(dān)任助理教授,之后與加州大學(xué)伯克利分校博士畢業(yè)、回清華任教的許華哲成為同事。四人因?yàn)楣ぷ鳎诓煌A段結(jié)識(shí),有相似的創(chuàng)業(yè)目標(biāo),又有各自擅長(zhǎng)的技術(shù)方向,因此在2023年年初,高繼揚(yáng)提出創(chuàng)業(yè)后,幾人陸續(xù)加入,當(dāng)年9月注冊(cè)了星海圖。

如今,這家成立一年半的公司,發(fā)布了自研的三款機(jī)械臂,兩款仿人形機(jī)器人R1、R1pro,融資總額接近10億元人民幣,成為當(dāng)下這波具身智能(Embodied"Intelligence)創(chuàng)業(yè)熱潮中,融資排名靠前的一員。日常,許華哲和趙行除了在清華教課、做科研和實(shí)驗(yàn),其余時(shí)間就在北京海淀區(qū)的辦公室,負(fù)責(zé)機(jī)器人的算法、軟件類研究。CEO高繼揚(yáng)和李天威在蘇州總部,負(fù)責(zé)機(jī)器人供應(yīng)鏈、本體交付的硬件工作。

許華哲記得,就在三年前,他剛回國任教不久,具身智能還不是一個(gè)被廣泛接受的詞。他寫論文用中文提到“具身智能”概念時(shí),還有人認(rèn)為這是硬造詞。如同1956年,“人工智能(Artificial"Intelligence,AI)”這個(gè)概念第一次被約翰·麥卡錫提出時(shí)的質(zhì)疑一樣——“當(dāng)時(shí)沒人真正喜歡這個(gè)名字,畢竟我們的目標(biāo)是‘真正的’智能,而非‘人工的’智能,但是我必須給它起個(gè)名字,所以我稱之為‘人工智能’。”麥卡錫在傳記中回憶。

而當(dāng)下,具身智能越來越熱,尤其是今年全國兩會(huì)期間,具身智能首次被寫入《政府工作報(bào)告》,與量子科技、生物制造、6G等產(chǎn)業(yè)一同列入未來重要的產(chǎn)業(yè)方向。近兩年,與星海圖相似的初創(chuàng)具身智能公司大量出現(xiàn),被稱為第一波具身智能創(chuàng)業(yè)熱潮。根據(jù)科技智庫“甲子光年”的統(tǒng)計(jì)報(bào)告,截至2024年年底,國內(nèi)有超100家具身智能相關(guān)企業(yè),融資總額超過百億元。

“我覺得現(xiàn)在提起具身智能,大家都興高采烈。”許華哲說,他看到幾乎所有以前做AI的,包括算法模型和自動(dòng)駕駛車廠的人都想要加入進(jìn)來,人才密度特別高。2025年剛過去三個(gè)月,又有一撥公司成立,“比想象中要擁擠”。這讓他想起自動(dòng)駕駛出現(xiàn)后的2016年、2017年,當(dāng)時(shí)他剛?cè)ゼ又荽髮W(xué)伯克利分校讀博不久,自動(dòng)駕駛是學(xué)界、業(yè)界一個(gè)熱門方向。也在那幾年前后,他和星海圖其他幾位聯(lián)合創(chuàng)始人,慢慢明確了各自的創(chuàng)業(yè)想法。

創(chuàng)業(yè)夢(mèng)

如果你讀過美國作家艾薩克·阿西莫夫的科幻小說,一定有印象,他的小說里,機(jī)器人會(huì)以動(dòng)物、汽車或人形等各種形態(tài)的高智能體出現(xiàn),跟人類的關(guān)系密切而微妙。許華哲第一次對(duì)智能機(jī)器人產(chǎn)生興趣,就是高中時(shí)接觸阿西莫夫的小說。“我覺得如果能做一個(gè)書里那樣的智能機(jī)器人出來會(huì)非常有趣,但當(dāng)時(shí)我根本不認(rèn)為自己有生之年能看到這樣的智能機(jī)器人,我以為要等100年。”

第二次接近智能機(jī)器人,是他2015年在清華大學(xué)電子工程系讀大三,有機(jī)會(huì)去多倫多大學(xué)交換一學(xué)期。當(dāng)時(shí)他的導(dǎo)師剛從麻省理工學(xué)院(Massachusetts"Institute"of"Technology,MIT)畢業(yè),年輕的女老師帶他做項(xiàng)目,比如拍一張照片,讓計(jì)算機(jī)去數(shù)照片中的大樓有多少扇窗;比如用計(jì)算機(jī)做“汽車品位的排序”,通過人工智能算法,給不同特點(diǎn)用戶推薦不同顏色和外形的汽車。這些項(xiàng)目讓許華哲意識(shí)到計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)的強(qiáng)大,它有能力做出判斷、選擇。那是不是說明,機(jī)器也可以通過訓(xùn)練,做出智慧的決策?

那次交換的經(jīng)歷,開闊了許華哲的視野,影響了他之后的選擇。他從那些技術(shù)反饋中,感受到一種興奮和模糊的未來。“原來代碼不僅能寫什么圖書館管理系統(tǒng),不只是無聊排序,竟然還能在圖片、視頻上有這么生動(dòng)的呈現(xiàn)。”許華哲說,那是他除了刷題得高分外,第一次在技術(shù)應(yīng)用上感到如此直接的快樂。他決定去國外讀博,研究人工智能。

2016年,許華哲到了加州大學(xué)伯克利分校。加州大學(xué)伯克利分校是研究人工智能、機(jī)器人學(xué)習(xí)的重地,當(dāng)年剛好成立了人工智能研究實(shí)驗(yàn)室(Berkeley"Artificial"Intelligence"Research,BAIR)。許華哲的導(dǎo)師特雷弗·達(dá)雷爾(Trevor"Darrell)就是BAIR的發(fā)起人之一,主要研究方向是計(jì)算機(jī)視覺語言。博士一年級(jí)時(shí),特雷弗鼓勵(lì)許華哲開辟新的方向,研究自動(dòng)駕駛。幾個(gè)月后,許華哲作為第一作者,寫了一篇如何從視覺角度,通過深度學(xué)習(xí)實(shí)現(xiàn)自動(dòng)駕駛的論文,被錄取為2017年計(jì)算機(jī)視覺領(lǐng)域的最高級(jí)別會(huì)議之一IEEE國際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(IEEE"Conference"on"Computer"Vision"and"Pattern"Recognition,CVPR)的Oral論文(最高級(jí)別論文)。

2016年是自動(dòng)駕駛熱度最旺的時(shí)期,國際上各大車企都在做自動(dòng)駕駛技術(shù)研發(fā)。包括網(wǎng)約車平臺(tái),Uber與老牌的戴姆勒汽車集團(tuán)共同開發(fā)無人駕駛汽車;國內(nèi)的滴滴出行也開始組建自動(dòng)駕駛公司。在學(xué)術(shù)界,各個(gè)高校實(shí)驗(yàn)室也積極投入研究,認(rèn)為自動(dòng)駕駛是當(dāng)年人工智能起來后,最重大的可落地智能應(yīng)用。不少人把自動(dòng)駕駛,當(dāng)作四個(gè)輪子的路面機(jī)器人,因?yàn)樗梢越柚曈X、傳感器等技術(shù)理解路面環(huán)境智能移動(dòng),有很大的產(chǎn)業(yè)空間——如同今天的具身智能熱潮。

同一時(shí)期,星海圖另外幾位聯(lián)合創(chuàng)始人,正充滿信心地投入自動(dòng)駕駛研究。

比許華哲大兩歲的趙行告訴我,他2014年開始在MIT讀博,做計(jì)算機(jī)視覺和多模態(tài)研究,同時(shí)接觸了機(jī)器人和自動(dòng)駕駛方向。2015年,趙行聯(lián)合導(dǎo)師開發(fā)了校內(nèi)第一門自動(dòng)駕駛課程,之后課程被推廣到其他十余所高校。“我覺得自動(dòng)駕駛是非常好的行業(yè),雖然它后來的發(fā)展起起伏伏,但從社會(huì)價(jià)值來看,無論是政府、學(xué)界還是產(chǎn)業(yè)界都認(rèn)可這件事。一項(xiàng)技術(shù)驅(qū)動(dòng)的產(chǎn)品,有商業(yè)價(jià)值,并且長(zhǎng)期有社會(huì)價(jià)值,這就是我想做的事情。”因此,2019年博士畢業(yè)前,盡管有Facebook、OpenAI等機(jī)構(gòu)邀請(qǐng)趙行,他還是決定投入產(chǎn)業(yè),加入知名的自動(dòng)駕駛公司威馬做研究科學(xué)家,他在那里認(rèn)識(shí)了高繼揚(yáng)。

至于創(chuàng)業(yè)這件事,幾位創(chuàng)始人都是在學(xué)生時(shí)期萌生的想法。高繼揚(yáng)接受媒體采訪時(shí)曾說過,他在清華讀本科時(shí),就“一直琢磨屬于我們這代人的機(jī)會(huì)到底是什么”。當(dāng)時(shí)(2011—2015年)是國內(nèi)移動(dòng)互聯(lián)網(wǎng)最風(fēng)生水起的時(shí)候,“看著互聯(lián)網(wǎng)巨頭覺得很牛,但也明顯感覺到互聯(lián)網(wǎng)不是我這一代人的機(jī)會(huì),直到大四接觸到AI深度學(xué)習(xí),我很感興趣,覺得這能徹底改變世界,因?yàn)樗ヂ?lián)網(wǎng)不一樣,互聯(lián)網(wǎng)改變了生產(chǎn)關(guān)系,而AI讓生產(chǎn)力再次得到提高。”

“想要改變世界、實(shí)現(xiàn)個(gè)人價(jià)值”,類似的話,我也在許華哲和趙行口中聽過。這群來自中國頂尖高校的學(xué)生,似乎更自然地?fù)碛羞@樣的熱情和沖動(dòng)。尤其在2015年前后,國家出臺(tái)政策,鼓勵(lì)大眾創(chuàng)業(yè)、萬眾創(chuàng)新,鼓勵(lì)運(yùn)用互聯(lián)網(wǎng)和開源技術(shù),構(gòu)建創(chuàng)新創(chuàng)業(yè)平臺(tái),也引導(dǎo)機(jī)構(gòu)投資科技型中小企業(yè)。清北校園里,常有學(xué)生在大大小小、不同的領(lǐng)域創(chuàng)業(yè)。

稍有區(qū)別的是,星海圖這幾位聯(lián)合創(chuàng)始人更在意技術(shù)驅(qū)動(dòng)的長(zhǎng)期創(chuàng)業(yè),而不是以產(chǎn)品是否有噱頭為先。趙行曾在讀博士的頭兩年,以首席科學(xué)家的身份與同學(xué)聯(lián)合創(chuàng)立一家人臉情緒識(shí)別的公司。用計(jì)算機(jī)視覺技術(shù),判斷、搜集人在觀看廣告時(shí)的反應(yīng),據(jù)此數(shù)據(jù)對(duì)廣告內(nèi)容做評(píng)分,再把這個(gè)數(shù)據(jù)反饋賣給廣告公司。大約一年后,趙行離開了公司。“我覺得技術(shù)太薄了,我還是對(duì)硬科技有向往,希望能做長(zhǎng)期規(guī)劃、技術(shù)支撐的事業(yè)。”之后,四人陸續(xù)回國,想在國內(nèi)最大化實(shí)現(xiàn)個(gè)人價(jià)值。

做技術(shù)驅(qū)動(dòng)下的“鏈主”

最先感到創(chuàng)業(yè)時(shí)機(jī)來了的是高繼揚(yáng)。1992年出生的他看起來沉穩(wěn)老練,說話語速很快,左側(cè)頭發(fā)常年有一縷自然白。高繼揚(yáng)很早就在為創(chuàng)業(yè)做準(zhǔn)備,他用極快的速度,三年半讀完博士,畢業(yè)后在威馬和北京初速度科技有限公司的兩段工作都有明確的目標(biāo)——威馬鍛煉技術(shù)能力,后者學(xué)習(xí)量產(chǎn)交付和管理團(tuán)隊(duì)的能力。隨后他也確實(shí)完成了目標(biāo),有自己的技術(shù)成果和管理百人團(tuán)隊(duì)的經(jīng)驗(yàn)。

2022年年底,高繼揚(yáng)覺得做AI機(jī)器人的時(shí)機(jī)來了。這除了與他自身能力提升有關(guān),也有大環(huán)境的因素。那一年,國際上先是有Figure"AI這樣致力于通用人形機(jī)器人的公司成立,迅速獲得關(guān)注和融資,特斯拉也在9月發(fā)布第一代人形機(jī)器人Optimus(擎天柱)。而年底ChatGPT(聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器)的爆火,讓世界看到大語言模型的成功,似乎只要數(shù)據(jù)量增大,模型的智能程度就跟著增大,有無窮上限。而在國內(nèi),關(guān)鍵零部件供應(yīng)鏈不斷成熟,價(jià)格優(yōu)勢(shì)等正在縮小中美差距。高繼揚(yáng)決定,在Momenta(北京初速度科技有限公司)做完最后一個(gè)產(chǎn)品交付后離職創(chuàng)業(yè)。

幾個(gè)月后的2023年,徹底解除疫情封控后不久,趙行和許華哲也有了迫切想要?jiǎng)?chuàng)業(yè)、時(shí)不我待的心情。許華哲記得,他在加州大學(xué)伯克利分校的導(dǎo)師經(jīng)常說,“不要等待一艘已經(jīng)離開的船”。意思是無論做研究還是創(chuàng)業(yè),不要做別人已經(jīng)做到頂點(diǎn)的事。而2023年,具身智能的船可能剛開始搭建。許華哲回看2016年前后國內(nèi)成立的自動(dòng)駕駛公司,雖然也經(jīng)過寒冬淘汰了一批企業(yè),但最終活到現(xiàn)在且活得不錯(cuò)的幾家,還是最先開局就進(jìn)來的人。“他們做得早,積累了各種數(shù)據(jù)、客戶壁壘,寒冬一過可以迅速復(fù)活,具身智能也是一樣,再等幾年,機(jī)會(huì)就少了。”所以在2023年,高繼揚(yáng)陸續(xù)找到互相認(rèn)識(shí)的幾人討論創(chuàng)業(yè)后,幾乎沒什么猶豫,四個(gè)“90后”創(chuàng)業(yè)團(tuán)隊(duì)就成形了。

“從成立開始,我們就有共識(shí),要以技術(shù)驅(qū)動(dòng)為核心,做一家‘鏈主’企業(yè)。”許華哲向我解釋,“鏈主”意味著全產(chǎn)業(yè)鏈的主人,星海圖希望最終能自研本體的各個(gè)零部件、制造本體,同時(shí)研發(fā)出算法模型,訓(xùn)練機(jī)器人在物理世界做各項(xiàng)任務(wù),有直接把整機(jī)產(chǎn)品交付給客戶的能力,不被產(chǎn)業(yè)鏈上任何環(huán)節(jié)鉗制。“就像汽車行業(yè)里的比亞迪、特斯拉,而不僅是供應(yīng)商。”

但剛開始創(chuàng)業(yè),距離“鏈主”還有很長(zhǎng)一段路,要先從哪兒開始?星海圖經(jīng)歷了兩三個(gè)月的探索期。

作為CEO的高繼揚(yáng)是四人中最有產(chǎn)業(yè)管理經(jīng)驗(yàn)的角色。他務(wù)實(shí),非常在意商品的成本、收益,以及可落地性。他在不同場(chǎng)合對(duì)外提到過“失效成本”的概念。他常用Robotaxi(自動(dòng)駕駛出租車,類似于國內(nèi)的“蘿卜快跑”)舉例,假設(shè)它失效一次,發(fā)生碰撞,大概要賠償幾萬到幾十萬美元不等,而ChatGPT失效一次,成本僅僅是浪費(fèi)了用戶20秒的時(shí)間,失效成本很低,收益才能為正。

而星海圖剛注冊(cè)時(shí),具身智能創(chuàng)業(yè)熱潮還未顯現(xiàn),加上疫情后經(jīng)濟(jì)大環(huán)境欠佳,高繼揚(yáng)和伙伴們不確定市場(chǎng)是否看好具身智能,所以選擇偏保守,決定先發(fā)揮自動(dòng)駕駛背景優(yōu)勢(shì),在小區(qū)、園區(qū)內(nèi)做一個(gè)有手臂的物流機(jī)器人,幫助用戶送餐、送貨上門,獲取收益,同時(shí)有數(shù)據(jù)反饋。做通這個(gè)場(chǎng)景之后,再擴(kuò)大業(yè)務(wù)。但很快,他們發(fā)現(xiàn)具身智能“是一個(gè)比想象中更大的事業(yè)”。首先是融資市場(chǎng)反饋很好。2024年1月,星海圖完成天使輪第二輪投資,獲得IDG資本、BV百度風(fēng)投等機(jī)構(gòu)投資的幾千萬美元。另外,他們發(fā)現(xiàn)美國新成立了一家叫作Physical"Intelligence的、致力于機(jī)器人大腦研究的公司。創(chuàng)始人中,加州大學(xué)伯克利分校教授謝爾蓋·萊文(Sergey"Levine)、前谷歌AI研究員切爾西·芬恩(Chelsea"Finn)都是他們當(dāng)年在海外讀書時(shí)非常熟悉的師長(zhǎng)級(jí)別人物,這給了他們更多開拓的信心。

星海圖迅速轉(zhuǎn)變。2024年年初,他們決定不局限于一個(gè)業(yè)務(wù),同步研發(fā)機(jī)器人本體、算法模型和擴(kuò)大商業(yè)場(chǎng)景。同年3月,北京辦公室投入使用。“終局來看,我們想做出一個(gè)通用具身大模型VLA(Vision"Language"Action),類似于現(xiàn)在的ChatGPT,你輸入一個(gè)文字或圖片指令,機(jī)器人能直接做出反饋,不過是動(dòng)作上的反饋。”趙行說。

數(shù)據(jù)閉環(huán)

“放可樂。”

“放雪碧。”

“拿最近的碗。”

“清掃垃圾。”

在一個(gè)廚房桌面前,工作人員直接跟機(jī)器人說話、下指令,機(jī)器人一邊語音回復(fù)“好的”,一邊完成任務(wù),在聽到“停止工作”的聲音后,垂下雙臂靜立。

這是星海圖今年3月下旬發(fā)布的一則一鏡到底視頻,視頻中灰黑色的機(jī)器人R1,是去年初公司決定轉(zhuǎn)向后,花了半年左右做出來的完整本體,除了芯片外,90%以上全自主研發(fā)。R1不同于雙足人形機(jī)器人,下肢選用了輪式360度底盤。“我們現(xiàn)階段客戶所在的工廠、園區(qū),絕大部分都是硬化路面,輪式可以走得更穩(wěn)、更快。而且目前對(duì)機(jī)器人上半身操作能力需求更大,這樣的輪式便宜、落地快,是現(xiàn)階段最理想的商品形態(tài)。”許華哲說。

如果仔細(xì)看這則視頻,會(huì)發(fā)現(xiàn)左上角備注“端到端VLA模型驅(qū)動(dòng)”。這是星海圖的技術(shù)目標(biāo),希望研發(fā)出一個(gè)類似于大語言模型,但能讓機(jī)器人在物理世界執(zhí)行任務(wù)的具身智能大模型。換句話說,只要有了這個(gè)模型,未來智能體可以是任意形態(tài)——人形、輪式、四足……

那么,什么是端到端的方法?許華哲以機(jī)器人伸手抓水瓶為例解釋,傳統(tǒng)的分層方法,可能是把這個(gè)行為分為四步:機(jī)器人先檢測(cè)水瓶在哪兒,再判斷位置,然后伸手到附近,最后抓取。每一步都需要寫一個(gè)規(guī)則,這很容易造成規(guī)則的堆疊,從而每一步都產(chǎn)生小的誤差。而端到端的方法,不去寫過多規(guī)則操縱機(jī)器人,而是讓它通過大量數(shù)據(jù)學(xué)習(xí),最終直接執(zhí)行抓瓶子的任務(wù)。雖然作為觀眾,我們看到這個(gè)動(dòng)作都是一樣的,但端到端的上限更高,機(jī)器人可以自動(dòng)校正誤差,有點(diǎn)類似ChatGPT與人聊天時(shí),可以不斷校準(zhǔn)自己的回答。

聽起來,端到端是一種萬能方法,但要實(shí)現(xiàn)這個(gè)結(jié)果,需要大量的數(shù)據(jù)和模型訓(xùn)練。同樣以ChatGPT為例,訓(xùn)練出如今大語言模型的互聯(lián)網(wǎng)文本數(shù)據(jù)在千億級(jí),圖片和視頻數(shù)據(jù)在百億級(jí),而機(jī)器人這樣一個(gè)幾乎需要物理世界所有數(shù)據(jù)的平臺(tái),目前僅有幾百萬個(gè)數(shù)據(jù)片段。所以,目前行業(yè)內(nèi)公認(rèn)的難題之一就是數(shù)據(jù)采集。趙行告訴我,現(xiàn)在大概有四種方式獲取數(shù)據(jù),分別是真人遙控操作、VR操作、仿真器模擬學(xué)習(xí)、視頻學(xué)習(xí),其中數(shù)據(jù)最精準(zhǔn)、成本也最高的是真人遙操,也是星海圖目前主要的數(shù)據(jù)采集方式。

“這里容易有個(gè)誤解,并不是說大家都‘燒錢’找真人遙操采集數(shù)據(jù),就一定能做到行業(yè)領(lǐng)先。如何采集高質(zhì)量的、機(jī)器人能學(xué)會(huì)的數(shù)據(jù)?如何降低采集數(shù)據(jù)的成本?采集數(shù)據(jù)后如何訓(xùn)練模型?這些問題都很重要。”趙行說,目前機(jī)器人依然在練習(xí)認(rèn)識(shí)這個(gè)世界,它所依賴的除了數(shù)據(jù),還有人的干預(yù)和解釋,這就進(jìn)一步需要優(yōu)秀的訓(xùn)練模型——越好的模型,越能使用較少的數(shù)據(jù),完成低錯(cuò)誤率的任務(wù)。

2024年11月,許華哲帶領(lǐng)團(tuán)隊(duì)發(fā)布了具身基礎(chǔ)VLA模型Efm-1,這個(gè)模型僅需大約50條真人演示數(shù)據(jù)就能學(xué)習(xí)數(shù)據(jù)中的動(dòng)作,成功率達(dá)85%。同時(shí)還能簡(jiǎn)單地泛化,比如不僅能學(xué)習(xí)數(shù)據(jù)演示中的抓玻璃杯,還可以在完全沒訓(xùn)練過的情況下,抓取跟玻璃杯大小、形狀相似的其他杯子。

趙行團(tuán)隊(duì)也在同一時(shí)期發(fā)現(xiàn)一種擴(kuò)充數(shù)據(jù)的方式。原本,訓(xùn)練機(jī)器人的方式之一是在仿真器中建構(gòu)出一個(gè)虛擬環(huán)境,然后在真實(shí)場(chǎng)景中部署。但這種方案往往因?yàn)樘摂M和真實(shí)世界中的誤差,導(dǎo)致機(jī)器人學(xué)習(xí)效率很低。而趙行團(tuán)隊(duì)借助最新的可微分渲染算法,用相機(jī)拍攝一條真實(shí)世界中的視頻進(jìn)行三維重建、渲染,再在仿真器中對(duì)這些真實(shí)數(shù)據(jù)做增廣,訓(xùn)練機(jī)器人。能有效縮小虛擬和真實(shí)世界的鴻溝,還能把一條真實(shí)數(shù)據(jù)擴(kuò)充成上千條,這成為星海圖訓(xùn)練算法模型的數(shù)據(jù)補(bǔ)充方式。

有了基礎(chǔ)的VLA模型和數(shù)據(jù)增廣方式后,星海圖更在意通過數(shù)據(jù)閉環(huán)來迭代模型。趙行告訴我,目前世界上最成功的數(shù)據(jù)閉環(huán)方式是特斯拉的。“他們把車賣給用戶前,就在車內(nèi)裝上了自己的芯片和一套算法,幾百萬個(gè)車主開車的時(shí)候,算法就在后臺(tái)對(duì)比人與人之間的駕駛差異,便于之后優(yōu)化自動(dòng)駕駛算法,特斯拉是第一家這樣做的,所以后來誰也趕不上它的速度。”而具身智能領(lǐng)域,目前還沒有一套這樣公認(rèn)的數(shù)據(jù)閉環(huán)方式。星海圖能做的,就是在把機(jī)器人交付給車企、物流園這樣的客戶后,依然擁有數(shù)據(jù)自主權(quán),在后臺(tái)獲取機(jī)器人執(zhí)行工業(yè)任務(wù)的所有數(shù)據(jù),實(shí)現(xiàn)小型閉環(huán)。“有了數(shù)據(jù)反饋,我們?cè)俑倪M(jìn)算法,這就是數(shù)據(jù)驅(qū)動(dòng)。”

一輩子的目標(biāo)

許華哲經(jīng)常用機(jī)器人做飯的例子,描述他心中理想的具身智能大模型能達(dá)到的程度。

“我最想讓機(jī)器人做的是一道松鼠鱖魚,為什么?首先因?yàn)槲液芟矚g吃松鼠鱖魚,其次因?yàn)檫@足夠難。想象一下,魚是活的,能動(dòng)、又滑又黏,還有顆粒狀的鱗片,外硬內(nèi)軟。處理完活魚,還要會(huì)改刀、油炸、炒糖色、澆汁、擺盤等,如果一個(gè)機(jī)器人能做完這些,一定程度上能證明它的智慧程度非常高。”許華哲說,他一度把這當(dāng)成“一輩子的目標(biāo)”。最近一年多資本、人才的不斷涌入,讓他稍微樂觀了一點(diǎn),覺得也許十幾二十年就能吃到機(jī)器人做的魚。

但另一方面,目前關(guān)于通用具身智能大模型這個(gè)被稱為機(jī)器人大腦的研究,在行業(yè)內(nèi)還只是開始,星海圖的Efm-1模型還需要不斷進(jìn)化。不久前,同在2023年成立的上海智元新創(chuàng)技術(shù)有限公司(簡(jiǎn)稱“智元”)也發(fā)布了自研的具身模型。“大家的目標(biāo)沒有太多差別。”趙行告訴我,行業(yè)內(nèi)不少公司也跟星海圖一樣在做大模型,同時(shí)研發(fā)機(jī)器人本體。只是現(xiàn)在還處于早期階段,沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)評(píng)判誰的模型更好。連互聯(lián)網(wǎng)大廠也少有下場(chǎng)做機(jī)器人的,更多只是投資。“大廠更適合做迭代速度快的軟件,而具身智能目前整體技術(shù)路線還沒有收斂,在通往終點(diǎn)的路上,很難講我們現(xiàn)在走了多遠(yuǎn)。”趙行說。

這樣一個(gè)長(zhǎng)期的賽道,初創(chuàng)年輕公司要怎么活下去?會(huì)不會(huì)又像自動(dòng)駕駛行業(yè)一樣,融資跟不上的時(shí)候倒下一片?長(zhǎng)期關(guān)注具身智能領(lǐng)域的藍(lán)馳創(chuàng)投投資人告訴我,他們看重兩類創(chuàng)業(yè)團(tuán)隊(duì):一類是既懂算法數(shù)據(jù),也有硬件能力,同時(shí)能商業(yè)落地的“六邊形戰(zhàn)士”,具有長(zhǎng)期優(yōu)勢(shì)和競(jìng)爭(zhēng)門檻;另一類是有一技之長(zhǎng),在某些方面有明顯差異化優(yōu)勢(shì)、特色的公司。“比如銀河通用公司的算法能力非常強(qiáng),也很受資本市場(chǎng)青睞。”高瓴創(chuàng)投的創(chuàng)始合伙人李良更關(guān)注具身智能領(lǐng)域的大模型技術(shù),先后投資了智元、星海圖、靈初智能等多家公司。他更看好“技術(shù)極客與行業(yè)老兵”的組合,認(rèn)為這樣才能深刻了解產(chǎn)業(yè)鏈,同時(shí)做出顛覆性的技術(shù)創(chuàng)新。他舉了智元的例子,認(rèn)為智元不僅有技術(shù)極客團(tuán)隊(duì),另外,“智元的董事長(zhǎng)兼CEO鄧泰華,曾是華為副總裁,計(jì)算產(chǎn)品線的總裁,有豐富的管理經(jīng)驗(yàn)、商業(yè)化資源積累以及產(chǎn)業(yè)整合經(jīng)驗(yàn),加速智元從實(shí)驗(yàn)室創(chuàng)新走向規(guī)模化應(yīng)用。而且公司位于長(zhǎng)三角的上海,供應(yīng)商都集中在兩三百平方千米內(nèi),在產(chǎn)業(yè)鏈協(xié)同上非常高效”。

但一個(gè)共識(shí)是,路途遙遠(yuǎn),現(xiàn)在誰都無法說自己能安全到岸。雖然星海圖也擁有“六邊形戰(zhàn)士”團(tuán)隊(duì),自主研發(fā)的具身基礎(chǔ)模型也在迭代,10億元人民幣左右的融資總額算得上行業(yè)前列。但在不斷有新公司涌入的背景下,幾位聯(lián)合創(chuàng)始人都能感受到融資方面的競(jìng)爭(zhēng)壓力。高繼揚(yáng)說,公司目前能做的是“沿途下蛋”,盡早盈利,要一直留在第一梯隊(duì)。

但當(dāng)下,最基礎(chǔ)且必不可少的工作之一還是數(shù)據(jù)采集。3月底,星海圖蘇州和北京加起來有80名員工,其中近20名在做數(shù)據(jù)采集工作,在行業(yè)內(nèi)不算大規(guī)模。我見過這些年輕的數(shù)據(jù)采集員,他們大多本科剛畢業(yè),有些還在試用期,看起來青澀、聽話。我想到兩年多前,我去黃土高原采訪一群做數(shù)據(jù)標(biāo)注的“寶媽”。她們當(dāng)時(shí)正在為大語言模型、人工智能服務(wù)。那份工作無須太多技能,“寶媽”們基本是小學(xué)、中學(xué)學(xué)歷,只要學(xué)會(huì)使用電腦,然后整日坐在桌前,從數(shù)不完的文字、圖片和視頻數(shù)據(jù)中,標(biāo)注出“什么是梨子、蘋果?”“什么是憤怒情緒?”之類的問題。

這群年輕、成天加班的大學(xué)生做的工作,當(dāng)然比數(shù)據(jù)標(biāo)注難一個(gè)層級(jí)。但當(dāng)他們拿掉VR眼鏡,眼眶上露出兩道紅印,以及傍晚6點(diǎn)半,接到電話,下樓去拿他們的“拼好飯”外賣時(shí),又讓人感到有一種相似。"""""""""""""""""□

猜你喜歡
智能模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
智能制造·AI未來
商周刊(2018年18期)2018-09-21 09:14:46
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产精品无码AV片在线观看播放| www.youjizz.com久久| a级免费视频| 91在线高清视频| 精品人妻无码中字系列| 国产精品视频第一专区| 麻豆国产在线不卡一区二区| 91无码人妻精品一区二区蜜桃| 毛片基地视频| 青青国产成人免费精品视频| 毛片基地视频| 亚洲中文字幕av无码区| 欧美成人亚洲综合精品欧美激情 | 国产九九精品视频| 在线播放真实国产乱子伦| 欧美色丁香| 国产www网站| 国产成人欧美| 54pao国产成人免费视频| 久久精品亚洲专区| 成人精品区| 国产成人高精品免费视频| hezyo加勒比一区二区三区| 另类欧美日韩| 中国国产A一级毛片| 国产精品久久久久久久伊一| 日韩国产黄色网站| 婷婷综合色| 中国国产A一级毛片| 国产亚洲视频中文字幕视频| 亚洲国产成人麻豆精品| 毛片免费在线视频| 亚洲专区一区二区在线观看| 欧美国产日韩在线| 亚洲无码精彩视频在线观看 | 综1合AV在线播放| 潮喷在线无码白浆| 亚洲中文字幕23页在线| 国产永久无码观看在线| 欧美一区二区三区国产精品| 久久久久亚洲Av片无码观看| 国产资源免费观看| 国产日韩丝袜一二三区| 国产特一级毛片| 这里只有精品免费视频| 小蝌蚪亚洲精品国产| 久久久久久久97| 日韩欧美在线观看| 亚洲第一黄片大全| 亚洲 欧美 偷自乱 图片 | 亚洲天堂视频网站| 人人91人人澡人人妻人人爽| 久久午夜夜伦鲁鲁片无码免费| 亚洲一级无毛片无码在线免费视频| 永久在线播放| 成人在线不卡| 国产精品思思热在线| 免费激情网址| 久久精品无码一区二区日韩免费| 免费a在线观看播放| 亚洲色图狠狠干| 男女男免费视频网站国产| 欧美精品1区2区| 91免费精品国偷自产在线在线| 日韩二区三区| 一级香蕉视频在线观看| 免费无码一区二区| 免费毛片在线| 色婷婷电影网| 免费观看男人免费桶女人视频| 国产激情在线视频| 国产91丝袜在线播放动漫 | 青青草一区二区免费精品| 熟女成人国产精品视频| 成人第一页| 色综合日本| 亚洲欧美天堂网| 日本中文字幕久久网站| 一级毛片a女人刺激视频免费| 无码中文字幕精品推荐| 中文字幕 91| 色哟哟精品无码网站在线播放视频|