999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

被“斯坦福團(tuán)隊”抄襲,這家公司什么來頭

2024-06-20 14:33:59向治霖
南風(fēng)窗 2024年13期
關(guān)鍵詞:智能模型

向治霖

因為一起抄襲事件,面壁智能意外出圈。

5月末,斯坦福大學(xué)的一個研究團(tuán)隊發(fā)布模型“Llama3V”,號稱只花了500美元,卻做了一個“SOTA多模態(tài)模型”。在AI行業(yè),SOTA(State Of The Art)的意思是“最先進(jìn)的”“最優(yōu)的”,指“在某一特定任務(wù)、領(lǐng)域或指標(biāo)上,當(dāng)前已知的最佳性能或最先進(jìn)的技術(shù)”。

模型的受關(guān)注度,或許佐證了“實力”。Llama3V發(fā)布不久,即在上萬個模型的社區(qū)Hugging Face上名列前茅,排名最高時,位列模型“周排行”的第四位。

只是很快,用戶指出Llama3V“套殼”了中國AI公司面壁智能發(fā)布的開源模型MiniCPMLlama3-V 2.5。

斯坦福團(tuán)隊試圖抵賴,沒撐多久。6月初,兩位作者公開道歉,只是“甩鍋”之意明顯,“責(zé)任全在(已跑路的)編程人員”,“殺個程序員祭天”的傳統(tǒng)得到延續(xù)。

為此,“真大佬”也坐不住了。斯坦福人工智能實驗室主任Christopher Manning發(fā)問抨擊:“為什么不敢承認(rèn)錯誤!”(How not to own your mistakes!)不過他也強調(diào),自己對此一無所知,“似乎是幾個本科生做的,有一些來自斯坦福”,言語間滿滿邊界感。

單論抄襲事件,事實清楚,證據(jù)確鑿。但因此事,AI圈子里掀起一場討論:AI開源社區(qū)中的中國勢力,其能力以及對生態(tài)的貢獻(xiàn),長久以來是否一直被忽視?

“清華簡”揭開真相

大抄一通的斯坦福團(tuán)隊,其實“膽挺肥”——被抄襲的MiniCPMLlama3-V 2.5,在開源社區(qū)可不是什么“無名之輩”。

5月20日,MiniCPM-Llama3-V 2.5正式發(fā)布,僅僅3天后,其熱度登上開源社區(qū)Hugging Face和代碼托管平臺GitHub趨勢榜的“雙榜首”,在GitHub的星標(biāo)數(shù)(可以理解為收藏數(shù))超過3000。面壁智能當(dāng)時稱,MiniCPM-V系列下載總量已超13萬。

5月29日,抄襲之作Llama3V發(fā)布。也就是說,距離“正主”發(fā)布僅9天,且還在“熱搜”時期,斯坦福團(tuán)隊就直接實踐拿來主義了。

抄襲事件給原創(chuàng)項目又添了一把熱度。6月9日,面壁智能團(tuán)隊告訴南風(fēng)窗,當(dāng)前MiniCPM-V 系列下載總量已超24萬,GitHub星標(biāo)數(shù)超過6900。

回到事件本身,從手法上看,抄襲者也顯然是“膽大心不細(xì)”,就連模型名“Llama3V”,在“正主”處也能找到對應(yīng)的字符。赤裸裸的程度令人咋舌。

因此,Llama3V發(fā)布不久就被抓住小辮子。最初是有用戶在項目下方留言:“你們是不是在MiniCPMLlama3-V 2.5基礎(chǔ)上進(jìn)行訓(xùn)練,并且完全沒有提到這一點?”

Llama3V項目的作者先是否認(rèn),并稱只是使用了MiniCPMLlama3-V 2.5的tokenizer(分詞器)。

6月2日,更多的證據(jù)浮現(xiàn)。有網(wǎng)友在項目下方列舉了四大證據(jù),結(jié)果慘遭項目團(tuán)隊刪文。質(zhì)疑者氣不過,將截圖發(fā)到了面壁智能開源項目的評論區(qū),提醒原創(chuàng)團(tuán)隊關(guān)注此事。

該網(wǎng)友列舉的四大證據(jù)中,最令人錯愕的,是斯坦福團(tuán)隊在項目頁上直接導(dǎo)入過“正主”MiniCPM-V的代碼,“重命名”為Llama3V。

面壁智能團(tuán)隊告訴南風(fēng)窗,6月2日深夜,團(tuán)隊正式確定了斯坦福大模型是對其的“套殼抄襲”。團(tuán)隊負(fù)責(zé)人解釋,這般肯定是因為,面壁大模型獨有的“彩蛋”功能,Llama3V居然也有。

這項功能是對“清華簡”戰(zhàn)國古文字的識別。

“清華簡”是清華大學(xué)在2008年收藏的一批戰(zhàn)國竹簡。一參與者回憶,面壁團(tuán)隊的同學(xué)們花費數(shù)個月,從清華簡上掃描得到訓(xùn)練數(shù)據(jù),層層工作后將對清華簡的“識別能力”融入MiniCPM-Llama3-V 2.5模型。“這個能力這次沒有進(jìn)行宣傳展示,沒想到最后成為揭露真相的關(guān)鍵證據(jù)之一。”

距離“正主”發(fā)布僅9天,且還在“熱搜”時期,斯坦福團(tuán)隊就直接實踐拿來主義了。

訓(xùn)練數(shù)據(jù)對于大模型,就像是書本對于學(xué)生,學(xué)生的天資(對應(yīng)模型的參數(shù)量)再高,如果沒有書本,也不能掌握特定的能力。但面壁團(tuán)隊的測試發(fā)現(xiàn),斯坦福團(tuán)隊大模型對清華簡的識別,“不僅對得一模一樣,連錯都錯得一模一樣”。

又過2天,斯坦福團(tuán)隊三人中的兩人,Siddharth Sharma和Aksh Garg公開道歉,但同時稱他們只負(fù)責(zé)其中項目推廣的工作,唯一“技術(shù)骨干”Mustafa Aljadery則無法聯(lián)系上,其社交媒體賬號也已設(shè)置為私密。

開源就是抄?

鬧劇告一段落,6月5日,面壁又有大動作,在官微上宣布,對面壁的性能“小鋼炮”MiniCPM系列大模型開放免費商用。

面壁智能對南風(fēng)窗解釋,今年是其開源社區(qū)OpenBMB三周年,MiniCPM-Llama3-V 2.5是“我們在5月20日送給每位的節(jié)日禮物,很高興現(xiàn)在能夠讓更多人知道我們的節(jié)日禮物”。

回顧抄襲事件的始末,面壁團(tuán)隊的應(yīng)對低調(diào)、周全。面壁聯(lián)合創(chuàng)始人、清華大學(xué)長聘副教授劉知遠(yuǎn)還在回應(yīng)時提到,“(兩位本科生)未來還有很長的路,如果知錯能改,善莫大焉”。

不過,無論是劉知遠(yuǎn)、面壁CEO李大海,還是面壁團(tuán)隊給出的回應(yīng)里,都嚴(yán)肅強調(diào)了“對開源協(xié)議的遵守”。

事實上,被抄襲的MiniCPMLlama3-V 2.5也不是完全自研,其建立在開源模型Llama3 8B(80億參數(shù))的基礎(chǔ)上,后者是美國公司Meta今年4月開源的大模型之一。

開源社區(qū)支持和鼓勵復(fù)用前人成果,由此“站在巨人的肩膀上”,聚集智慧、共享協(xié)作。相應(yīng)地,開源共享的底層邏輯,是對開源協(xié)議的遵守,對其他貢獻(xiàn)者的信任,對前人成果的尊重和致敬。

比較之下,MiniCPM-Llama3-V 2.5在名稱上仍保留“前作”Llama3的痕跡,“致敬”并沒有藏著掖著,而斯坦福團(tuán)隊的“Llama3V”則在臺前臺后都抹掉了MiniCPM。此處順便一提,CPM的全稱是“中國的預(yù)訓(xùn)練模型”(Chinese Pretrained Model)。

澄清開源的邏輯,也就破除了“開源就是方便抄襲”的偏見。“國外一開源,國內(nèi)就自研”一句譏諷意味的話,始終是國內(nèi)開源項目廠商頭上揮不去的一片烏云。斯坦福團(tuán)隊抄襲事件發(fā)生后,仍然有聲音質(zhì)疑說,面壁MiniCPMLlama3-V 2.5也是抄的Llama3,與斯坦福團(tuán)隊不過是“先抄”“后抄”的區(qū)別。

然而兩者絕不等同。前文清華簡的例子說明,新的訓(xùn)練數(shù)據(jù),可以給大模型加上此前未有的功能。框架優(yōu)化、參數(shù)微調(diào)等,也都有同樣功效。

基于開源項目的項目開發(fā),好比一個游戲,基礎(chǔ)大模型如Llama,就是玩家進(jìn)入游戲時拿到的“布衣”角色,通過升級打怪氪裝備,玩家號從“布衣”升級到“黃金圣斗士”。而抄襲呢,就是直接盜號了。

由此一窺事件中真正的主角MiniCPM-Llama3-V 2.5,在以語言模型Llama3 8B為基礎(chǔ)的前提下,主打的卻是多模態(tài)能力,即能夠處理不同類型的數(shù)據(jù),如圖片、文字等。

在開源社區(qū)上,面壁提供的Demo相當(dāng)簡單:模型啟動后,用戶可以在界面上傳圖片,而后模型將對圖片進(jìn)行分析,輸出相應(yīng)的文字信息。

這涉及模型的對圖片識別理解能力和OCR(光學(xué)字符識別)能力。前者是模型對各類復(fù)雜圖片,如票根、營養(yǎng)食譜等的準(zhǔn)確識別和理解,后者是指將印刷或手寫文本轉(zhuǎn)換為機(jī)器可讀數(shù)據(jù)的能力,常用于文檔數(shù)字化等。

各項指標(biāo)中,MiniCPMLlama3-V 2.5的OCR能力尤為突出。面壁團(tuán)隊表示,該模型OCR能力達(dá)到SOTA;在端側(cè)多模態(tài)綜合性能方面超過了Gemini Pro、GPT-4V等千億參數(shù)級的大模型。

如此也就不難理解,MiniCPMLlama3-V 2.5,乃至“抄襲之作”Llama3V,為何能在短時間內(nèi)登上開源社區(qū)的“熱搜”。

小模型,大用處

6月11日凌晨,蘋果在全球開發(fā)者大會上官宣“蘋果智能”,新的Siri成為蘋果版人工智能的入口。可以想見,新的一輪應(yīng)用AI化即將到來。

發(fā)布會上,蘋果的“in-app Action”令人印象深刻。演示中,用戶只需要對Siri發(fā)出指令,如“整理女兒學(xué)習(xí)游泳的照片”“安排下午去機(jī)場的行程”,蘋果智能即可自行整理不同時間拍攝的 “從學(xué)習(xí)到學(xué)會”的照片時間線,以及自動記錄行程、設(shè)計路線、預(yù)測交通狀況等。

用蘋果的話說,新的Siri是一個強大的、懂得手機(jī)的具體使用者個性偏好的個人助理。

目前,蘋果尚未披露上述功能是手機(jī)端模型還是云端模型、抑或兩者協(xié)同來實現(xiàn)的,但從演示效果來看,新的Siri能夠?qū)崟r地理解手機(jī)界面的信息,據(jù)此推理和生成內(nèi)容,其表現(xiàn)與OpenAI演示GPT4o的人機(jī)互動功能時所展現(xiàn)的“同根同源”。

面壁聯(lián)合創(chuàng)始人、清華大學(xué)長聘副教授劉知遠(yuǎn)還在回應(yīng)時提到,“(兩位本科生)未來還有很長的路,如果知錯能改,善莫大焉”。

千億參數(shù)決定了,GPT4o不可能在手機(jī)端運行。如前文所說,上述功能涉及的圖片識別、理解能力,以及OCR能力,是面壁MiniCPMLlama3-V 2.5的主打功能。

但MiniCPM-Llama3-V 2.5的一大優(yōu)勢是,它本就是面向類似手機(jī)等小型終端設(shè)備設(shè)計的。

官方文檔中,面壁演示了該模型在小米14pro上“絲滑”運行。在“最強端側(cè)多模態(tài)綜合性能”表現(xiàn)下,MiniCPM-Llama3-V 2.5量化后為8G顯存,在手機(jī)端推理無壓力,每秒6—8個令牌的推理速度相當(dāng)可用。作為對比,基礎(chǔ)模型Llama3 8B在手機(jī)端的推理速度每秒僅0.5個令牌(一般一個漢字為2—3個令牌)。

當(dāng)然,必須說明,模型的能力與蘋果展示的系統(tǒng)級AI完全不是一回事。但是技術(shù)有了,產(chǎn)品化也只是時間問題。以蘋果的體量所帶來的影響,端側(cè)模型的部署力度和市場前景是值得樂觀的。

端側(cè)模型也可以成為“小模型”,入局者同樣眾多,但面壁智能對小模型格外專注。在言AI必提大模型的過去一年多時間里,這讓面壁顯得有些特別。

面壁團(tuán)隊告訴南風(fēng)窗,押注小模型的關(guān)鍵,是發(fā)現(xiàn)小模型的能力未必弱于大模型,如MiniCPM-Llama3-V 2.5在“讀圖”方面展示的,是“用規(guī)模1/100的模型,達(dá)到了國外知名大模型的同等性能,訓(xùn)練成本也極低”。

另一方面,小模型對應(yīng)的手機(jī)終端,是“離用戶最近的地方”。中國電信的統(tǒng)計顯示,2023年中國存量手機(jī)上的算力總量,是全國的數(shù)據(jù)中心算力總量的12倍。面壁認(rèn)為,“未來的端側(cè)算力的總量,一定是要超越我們在云側(cè)的這些算力總量,這些算力一定要充分利用”。

同時,訓(xùn)練小模型不僅僅是沖著端側(cè)市場,它也對訓(xùn)練出更強的大模型有幫助。

“做端側(cè)的模型比做云側(cè)的模型要求更高。”面壁團(tuán)隊認(rèn)為,原因在于設(shè)備本地端的算力和內(nèi)存部署大模型,相比云側(cè)的大規(guī)模服務(wù)器集群,要求會更苛刻。

面壁把更多的知識壓到一個更小的模型里面去,在設(shè)備本地端就可以運行,并取得非常好的效果。“如果我們一定要去訓(xùn)練一個好的云側(cè)模型,那我們用類似的技術(shù),一定可以做到這個世界上最好的云側(cè)模型。”

當(dāng)然,真正打通這條路徑,會是一個漫長的過程。

猜你喜歡
智能模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
智能制造·AI未來
商周刊(2018年18期)2018-09-21 09:14:46
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲女同欧美在线| 欧美日韩精品一区二区视频| 毛片久久网站小视频| 国产一级在线观看www色| 91午夜福利在线观看| 国产手机在线观看| 免费aa毛片| 亚洲最大情网站在线观看 | 91亚洲免费| 色屁屁一区二区三区视频国产| 人妻中文久热无码丝袜| 99久久精品久久久久久婷婷| 久久人搡人人玩人妻精品一| 久久免费成人| 亚洲国内精品自在自线官| 亚洲三级成人| 久久久精品国产SM调教网站| 亚洲综合婷婷激情| 日本一区二区三区精品视频| 一区二区三区国产精品视频| 亚洲精品va| 国产精品区视频中文字幕| 久久精品国产精品一区二区| 成人亚洲国产| 亚洲成网站| 日本爱爱精品一区二区| 国产精品永久不卡免费视频| 国产一区亚洲一区| 91色国产在线| 日韩东京热无码人妻| 国产手机在线小视频免费观看| 污网站免费在线观看| 黄色a一级视频| 久草视频精品| 国产av色站网站| 亚洲A∨无码精品午夜在线观看| 国产一级毛片在线| 亚洲精品欧美日本中文字幕| 91蝌蚪视频在线观看| 丁香亚洲综合五月天婷婷| 欧美a√在线| 亚洲第一区在线| 免费看美女自慰的网站| 国产第一色| 国产成人精品2021欧美日韩| 四虎精品黑人视频| 不卡视频国产| 动漫精品中文字幕无码| aa级毛片毛片免费观看久| 一级一毛片a级毛片| 91丝袜美腿高跟国产极品老师| 99re热精品视频中文字幕不卡| 国产精品熟女亚洲AV麻豆| 亚洲一本大道在线| 国模在线视频一区二区三区| 狠狠色噜噜狠狠狠狠奇米777| 日韩 欧美 小说 综合网 另类| 国产va在线观看| 日本道综合一本久久久88| 亚洲精品欧美重口| 欧洲日本亚洲中文字幕| 538精品在线观看| 最新无码专区超级碰碰碰| 99re视频在线| 色天堂无毒不卡| 欧美一级高清片久久99| 又黄又湿又爽的视频| 亚洲色图综合在线| 亚洲91精品视频| 日韩毛片免费| 亚洲国产午夜精华无码福利| 美女国产在线| 一级一级特黄女人精品毛片| 国产精品开放后亚洲| 欧美天堂在线| 免费毛片视频| 国产欧美日韩一区二区视频在线| 伊人色在线视频| а∨天堂一区中文字幕| 国产不卡网| 无码在线激情片| 国产亚洲欧美在线中文bt天堂|