
1. AI大模型還處于萌芽階段,既有新方向,也有大忽悠。好多年前,計算機剛剛開始普及,那時候連算命的都叫“電腦算命”,價格還挺貴。不久之后呢?
2. 中國的AI公司或者大模型公司,面對的最主要問題不是技術問題,而是商業問題。我們判斷,未來主流應該是混合模型。有很多同行,都已經在布局更小參數規模的模型。
3. 越大的模型越容易同質化。想象一下,一個班上的同學,訓練數據是相同的,訓練方法是相似的,老師也是同一個,越大規模參數的大模型,不就越可能同質化嗎?
4. 大模型公司能不能養活自己?API(應用程序接口)的商業模式會不會被開源顛覆?隨著行業的“內卷”,大模型本身將不再是一個昂貴的東西,大模型將越來越不值錢。
5. 我們有兩個堅持:第一,我們不愿意收不是AI的錢;第二,我們不只靠賣技術賺錢。小冰(北京紅棉小冰科技有限公司)在積極推進新的商業模式,是一種共享終端利益的商業模式,而非一種提供鏟子的商業模式。
6. 人工智能公司的護城河到底是什么?以前搞人工智能、自然語言處理的團隊,全國算起來可能也沒多少,大模型出現以后大家發現誰都可以做。技術本身越來越不成為護城河。什么是護城河?Deep Relationship(深度關聯),有用戶數據,有深厚關系。
7. AI是助手,而不是對手。小冰是打造用戶與AI的“孤島”,而不是建立用戶與用戶的“廣場”。與同行業者普遍使用的“廣場”“話題”“排行榜”等產品設計不同,小冰的每個用戶僅能與AI接觸,從產品底層設計邏輯上,避免了用戶之間的任何聚集。
8. 產品中不冒然使用大模型,而是使用技術成熟的小模型和檢索模型。小冰目前在產品中,僅使用技術成熟的小模型,模型參數規模最大僅為3.5B,最小為0.5B。同時綜合運用了技術更為成熟的檢索模型作為安全模式。
小冰公司前身微軟小冰團隊,是微軟全球最大的人工智能獨立產品研發團隊。小冰框架目前是全球承載交互量最大的人工智能框架之一,技術覆蓋自然語言處理、計算機語音、計算機視覺及人工智能內容生成。
2020年7月,小冰開始獨立運營,微軟互聯網工程院副院長李笛擔任CEO;2021年7月,小冰公司完成A輪融資,估值超10億美元;2022年11月,小冰公司宣布完成10億元融資,估值超20億美元。少女小冰、Rinna、夏語冰、小堂妹、冬奧裁判觀君等AI虛擬人,都是小冰框架孵化出的AI Being(人工智能數字員工)。
以下內容來自小冰公司CEO李笛的分享,希望能給大家帶來一些啟發。
我必須先談一件事,這件事直接影響我們各行各業如何看待大模型。
坦率來說,我個人觀點,人工智能發展到今天為止,仍處于孟德爾剛剛發現遺傳學規律的那會兒。
也就是說,當下的AI大模型,還處于萌芽階段。
在萌芽階段,可以想象,也可以看到各種各樣跟大模型有關的東西冒出來。有一些是真正的新方向,有一些是大忽悠。
我記得多年前,計算機剛剛開始普及,那時候就出現了“電腦算命”,價格還挺貴。
很多人認為,大模型新的能力會不斷涌現,誰在大模型時代領先一步,誰就能夠在接下來的時間里步步領先。
可惜,事物的發展并不是如此。這更像是一個波形,大模型在接下來也會遇到瓶頸。整個科技界會期待新的方法,下一波浪潮也會來解決我們當下遇到的這些瓶頸問題。
第二點,我想跟大家分享的是,截至目前,對于大模型時代的技術,科學家們還只是停留在一個觀察結果上面,并沒有特別多的關于背后原理的了解。
我們今天還處在人工智能的蠻荒時代,更準確地說,是蠻荒時代的一次劇烈波動期。
我個人判斷,從現在開始,到明年二季度,大模型等技術還會產生劇烈的波動。
我在微軟時,除了是小冰的負責人,還是微軟搜索引擎必應的亞洲負責人。
從我的視角來看,為什么最先推出大模型的公司不是谷歌?是因為它沒有嗎?那是因為,谷歌在搜索引擎領域處于老大的位置。
微軟必應在全球范圍內最大的競爭對手是谷歌。谷歌的規模大約是必應的10倍左右。當微軟使用大模型來沖擊這個市場的時候,谷歌要印證,就必須付出10倍的成本。
此外,由于谷歌在搜索引擎上面的收入非常大,當它使用新的技術范式的時候,就會直接導致毛利迅速下降,已經構建成功的商業模式也會迅速被破壞。
谷歌沒有任何的主動意愿,在自己占據優勢的領域嘗試新的技術模式。
但對于微軟而言,大模型就是一個非常棒的挑戰者的新武器。
百度在幾個月前宣布推出文心一言的時候,很多人都認為它會將文心用到搜索引擎上。我們當時的判斷是不太可能的,更可能的方式是將大模型利用到百度占據老二、老三的位置上去。果然,最后它是和百度云深度捆綁。
對于大公司來講,如果你已經在某一個市場具備了領先地位,就應該把大模型當作戰略性儲備武器。對于挑戰者來講,它是一個比較好的武器,使你有機會在短時間內獲得更多的市場份額。
不同人看待大模型的視角不同,不可避免地會附帶各自的主觀期望。我也會帶有主觀色彩,但盡量客觀。
我認為,中國的AI公司或者大模型公司,面對的最主要的問題不是技術問題,而是商業模式問題。
幾個月前,行業里面普遍認為大模型將通吃。換句話說,就是未來將有一個唯一的大模型,這個大模型能夠取代其他已有的技術范式。這也是很多人貿然布局大模型的原因。
我們當時判斷,不是這樣的。大模型不是越大越好,大模型不會通吃,未來將是混合模型居多。
給大家舉一個簡單的例子:
如果你的模型參數規模控制在130億以內,就可以用單卡的A100驅動這個模型;如果控制在70億參數左右,可以用單卡的V100去驅動;如果控制在40億參數規模,甚至可以用非常廉價的T4去驅動。
而這中間產生的成本差,大概有上百倍的差異。
所以像我們小冰公司,還有很多同行,其實都在布局更小參數規模的模型。
很多的技術創新都會有一種從眾心態,從眾就意味著整個領域會“卷”得非常快。
現在有很多大模型,比如有650億參數以上的,甚至有超過千億參數的。
第一,它們都需要海量的數據。大部分的同行業者所拿到,或者所準備的訓練數據,都是類似的,彼此之間差異不大。
第二,它們的訓練方法也是類似的。大家都想先追上GPT(生成式預訓練Transformer模型,一種基于互聯網的、可用數據來訓練的、文本生成的深度學習模型),所以大家的訓練方法也是相似的。
想象一下,一個班上的同學,訓練數據是相同的,訓練方法是相同的,老師也是同一個,那么越大規模參數的大模型,不就越可能會同質化嗎?
反而是中模型和小模型,因為訓練數據少,所以能精細地篩選訓練數據,訓練方法也可以不同,就有可能產生足夠高的差異性,進而形成壁壘。
還有,到目前為止,大模型的涌現是不是已經到了尾聲?
有一種觀點認為,再要涌現新的能力,可能需要參數規模3個數量級的增長。還有其他的觀點認為,需要新的一種技術范式的變化,比如楊立昆(Yann LeCun,Meta首席人工智能科學家)提到的世界模型。
毫無疑問的是,涌現并沒有像我們所想象的那樣繼續激動人心,這意味著什么?
這意味著對于大模型而言,基于當前的技術進行場景應用的深挖,變成了最至關重要的事情。
大模型公司能不能養活自己,我們甚至都不討論它能不能賺錢。
先跟大家分享一個例子—“這個女孩叫小美”。
可能很多年輕的朋友,在B站(嗶哩嗶哩)、抖音上看過這種電影解說。實際上,這個聲音是微軟云服務里面所包含的一個聲音。
很多視頻創作者都使用了這個聲音。其中,有短視頻做得非常棒,賺了很多錢的人;也有因為種種原因短視頻完全不掙錢的人。微軟作為提供聲音技術服務的公司,能不能從中獲得不同的回報?
答案是否定的。
類比到人工智能。AIGC(生成式人工智能)創造了巨大的價值,但是人工智能企業能不能從巨大價值中獲得應有的價值?
答案可能也是否定的。
人工智能服務提供者,無論使用它做出來的內容是多么賺錢或者不賺錢,都只能按照次數或者時長來收取相同的錢。還有可能面對很多同行,以免費的方式來跟我們競爭,最后大家誰都賺不到錢。
再給大家舉一個例子:
一個媒體朋友跟我咨詢人工智能撰稿,讓AI寫出符合媒體調性又高質量的稿件。
我好奇地問:“你愿意為此付多少錢?”
對方回答:“這不是有定價嗎?1 000個Token(在自然語言處理中,指文本中的一個最小單位,通常是一個單詞、一個標點符號、一個數字、一個符號等)是0.2美分,一個月200篇稿件。”
我說:“刨去成本,我一個月能從你身上掙到多少錢?100元都不到。”
換作人類撰稿,一篇稿件或要1 500元起,200篇稿件則要35萬元。人們是不會給人工智能企業按照創造的價值來付費的。
回顧過去,一些人工智能公司,比如做人臉識別的,幫我們解決了很大的問題,但它的服務很難收到錢,最后不得不去做軟硬結合。
所以說,制約大模型和AI發展的,其實是經濟學規律。
這一波人工智能新技術有一個巨大的特點,那就是:降低了人工智能領域從業者的進入門檻。
以前搞人工智能、自然語言處理的團隊,全國算起來可能也沒多少。大模型出現以后,大家發現誰都可以做大模型,甚至很多傳統領域的企業,也開始親自訓練自己的大模型。
各行各業都可以參與其中,所以技術本身越來越不成為護城河。
那么什么才是人工智能公司的護城河?
我先給大家講一個例子:Inflection Pi(人工智能初創公司Inflection AI推出的首款聊天機器人Pi)。
Inflection AI公司近期宣布,在微軟、里德·霍夫曼、比爾·蓋茨、埃里克·施密特和新投資者英偉達(NVIDIA)牽頭的一輪融資中,共籌集到了13億美元,總計融資達到15.25億美元。據路透社報道,該公司最新一輪估值約為40億美元。
Inflection AI的首席執行官Suleyman(蘇萊曼)介紹說:
“我們不知道所有的答案,但我們正在著手開發一種真正對你有用的個人智能,它就在你身邊。我們的使命是將你的人工智能與你和你的興趣,堅定地聯系在一起。這意味著設計一種人工智能,可以幫助你表達你的意圖,組織你的生活,并在你需要的時候為你服務。”
ChatGPT(美國人工智能研究公司OpenAI研發的一款聊天機器人程序)不管用戶是誰,更關心后端,更像搜索引擎。
Inflection AI則尋找另外一個方向,認為護城河是其對用戶的理解。
如果大家使用Inflection AI,會發現一個很明顯的特點,襲天卷地的各種各樣的提問,他會抓住一切機會去理解你,甚至一天之內會問你200個問題。
說實話,只要是具有相關從業經驗,并且資金儲備、算力儲備差不多,在技術產品上,誰也不會比誰領先一兩個月的時間,但是用戶數據的護城河能夠領先很久。
我們以前認為,人工智能是可以取代人的。但真的是這樣嗎?
比方說,已經有一個莫言了,人工智能是要寫出比莫言更好的小說嗎?不是的。
人工智能真正的特點和價值,是在同樣質量的情況下,人工智能可以不眠不休,可以7×24小時,可以同時和千萬人進行交互。
人工智能會不會取代人?如果他是我的助手,他就不會取代我。大家想想,如果今天每一個人類的創作者都有了一個助手,它可以幫助人類去更好地創作,不是更好嗎?
按照助手的邏輯,AI一定和人是一對一交互的。
小冰公司致力于打造用戶與AI的“孤島”,而不是建立用戶與用戶的“廣場”。
與同行業者普遍使用的“廣場”“話題”“排行榜”等產品設計不同,小冰的每個用戶僅能與AI接觸,從產品底層設計邏輯上,避免了用戶之間的任何聚集。
如果一定要把人工智能摻到人和人之間,無異于破壞式地改變原有的良性結構。
以前,一家公司可以通過技術研發,掌握一種別人很難追上的知識圖譜的能力。現在,這件事情不存在了。
所以,如果做了一個抄襲型的大模型,達到了跟別人一樣的質量,那最后商業模式才是關鍵。如果率先推出了一個原創型的大模型,你就等著被別人追趕吧。為什么?因為大模型短期內看不到新的能力的涌現,所以你自己不能加速甩掉后面的跟從者,你只能在原地等著,直到被后來者追上。
我們可以看到,大模型多是API的商業模式,這個商業模式會不會被開源顛覆?隨著行業的競爭加劇,大模型本身將不再是一個昂貴的東西,大模型將越來越不值錢。
小冰公司在探索商業化時,有兩個堅持:
第一,我們不愿意收不是AI的錢。比方說,有一個智能防盜門,可以人臉識別,它可能賣3 000元。之所以賣3 000元,是因為防盜門的成本有2 800元。所以,這2 800元就不是AI的錢。我們今天有很多智能音箱,更多的是音箱值那么多錢,而不是智能值那么多錢。
第二,我們不只靠賣技術賺錢。OpenAI把研究室的研究成果API直接賣給客戶來使用。我們追求的是,一定要取得實際產生價值的那部分。小冰在積極推進新的商業模式,是一種共享終端利益的商業模式,而不是一種提供鏟子的商業模式。像我們跟奈飛、網易云音樂的合作,就是掙共創的錢。
我們也仍然只是在探索,小冰也有可能是“前浪死在沙灘上”。
到目前為止,人工智能無論是To C還是To B,尚未產生一個成熟或者成功的端到端的商業模式。所以各位,咱們大家都還有機會。