勒川

2023年被稱作ChatGPT元年。全世界驚嘆之余,也給AIGC帶來新動能和新思考。時代級機遇,中國企業應該如何把握?ChatGPT所引領的AI新紀元,又將如何改變我們生活的方方面面?且聽業界專家如何給出答案。
這是全人類的機遇!全球性“AI再造”已經拉開序幕,跟不上的企業將徹底失去未來的競爭力。模型即服務將催生萬億級別的市場。與其說這是“iPhone時刻”,這波浪潮更像是PC互聯網初期。
我們正處于一個關鍵節點。ChatGPT所引領的AIGC新紀元,正在重新定義我們的生產生活。這場全球風暴,每個人應該如何把握?中國企業又有什么樣的新機遇和挑戰?3月29日,首屆中國AIGC產業峰會現場,業界大咖和專家群起激辯,深度探討AIGC新世界,ChatGPT商業化的路徑與思考,以及AI產業新價值。
AIGC新世界
周明(瀾舟科技創始人兼CEO)
進入AI?2.0不代表一定要拋棄1.0的技術
ChatGPT和之前的大模型有什么區別?首先,ChatGPT對用戶的意圖理解非常清晰,也更加準確;其次,多輪對話的建模非常好,還有若干解析能力。但是,站在工業界角度,很多需要解析能力的任務用單獨的引擎能比ChatGPT效果更好。所以,找到ChatGPT的應用場景非常關鍵。To?C時,AGI能力越多越好,用戶在簡單界面完成所有調用;To?B環境下,問題理解、多輪對話的能力,接上企業自己的核心引擎,會有更好結合。
ChatGPT出現后,涌現了單模型、單任務永遠出不來的能力,于是邁入AI?2.0時代,它的特點是一個模型N個任務,未來甚至一個模型可以解決無窮個任務。
但是,企業內部使用時,會發現AGI很多功能用不上,一些能力反而還會出現搗亂的可能。
以此為背景,企業進行數智化轉型時,不要追求必須用AI?2.0、一定要拋棄AI?1.0。企業應該試圖把AI?1.0功能引擎和AI?2.0部分能力(如問題理解和多輪對話的能力)無縫對接起來,形成一縱一橫的合力,練模型的團隊和用模型的團隊持續產生交互,共同提升效率。
瀾舟在做大模型時,尤其考慮了企業落地的問題。不用非得做ChatGPT,在AIGC領域重點突出關鍵詞生成、自定義模板、文圖工作等能力,把模型做得又輕又好,再結合用戶需求,企業數據就能巧妙利用起來。
徐元春
(小冰公司COO)
任何一項技術的誕生都為產生產業價值
AI內容生成的價值,不僅在于降本增效,更重要的維度在于解決問題、提高效率、創造場景。其中,提高效率是最顯著,也最容易被理解的一點。比如視頻領域,2022年卡塔爾世界杯期間,解說員劉建宏的節目,超過半數都是在他本人錄制的基礎上,由AI復刻形象、合成聲音生成的。
提升效率關鍵在于高并發和穩定性,強調穩定性的原因,在于很多技術在實驗室實現了算法價值,但最后一公里的落地非常艱難,所以技術的工業化應用標準要達到穩定性的要求。
在解決問題方面,所有的AI公司或科技公司都應該認識到,需要解決的問題應當是產業尤其是傳統產業迫切需要關注和改變的真實痛點。
舉例來說,利用AIGC能力創造和生成虛擬數字員工,就是在企業現有IP不改變和不稀釋的情況下,能夠在多時空、多場合創造更多內容——這是一個IP最主要的資產和核心生產力。
另外還有拓展新場景。除了利用數字孿生技術,用虛擬人生產、傳播內容,獲得更廣泛的流量,讓運營團隊和IP解耦、內容和形象解耦,滿足大量的內容輸出需求。
比如,數字員工可以直播更多場次。這里提到直播不再局限于視頻錄播,還有實時直播,包括在海外利用當地語言、當地文字回復直播間問題,和用戶產生實時互動和實際交流,最終觸發購買行為。
在這個場景里,虛擬人和AIGC的融合達成交易、促成銷售,從這個角度來講,AIGC不僅產生內容,也產生了實實在在的銷售收入。基于此,如何讓模型更加適合推薦,是大模型里更加傳統化的應用。
方漢
(昆侖萬維CEO)
AIGC最大社會意義是提供低成本終極解決方案
首先AIGC商業模式落地這一方面,我觀察到兩大定律:第一,用戶創作門檻降低,內容創作數量增加十倍;第二,C端工具商業邏輯是社區,B端實質則是功能的完備性。
其次是AIGC對生產者的影響。對于存量知識的理解和表達,AIGC將以低廉的成本做到80分的水準。如果我們人類也只能做到80分,那工作一定會被替代;只有80分以上的人,才能去管理“AIGC操作員”,完成曾經需要腰部工作者去完成的工作,并極大地提升產量,而腰部工作者將大概率被淘汰。
第一,開源大模型是商業閉源大模型的有力補充和替代。就像ChatGPT可以想象成早期的Windows。Windows的存在是整個電腦商業軟件領域的一個基石,也是絕大多數人的生產工具,而Linux通過30年的努力把自己變成Windows替代。因此像“Linux”一樣的開源大模型也一定會出現。
第二,只有開源模式才可以滿足用戶的長尾需求。比如Stable?Diffusion,其質量、性能都低于DALL·E2、Midjourney,但用戶增長很快,而且還催生了許多二次開發工具,解決剛性問題。可控生成作為?AI?創作最后一道高墻,極有可能在可預見的時間內有進一步突破。
第三,各種AIGC工具能力仍受到預訓練大模型限制,這點在GPT-4出現之后更加突出。
未來AIGC對整個社會最大意義,是提供了低成本終極解決方案;其次是將徹底改變藝術創作生產方式,最后具體到內容生成,大量創作內容的涌現,讓VR和元宇宙變得更加可行。
類ChatGPT商業化
關瑋雅
(微軟大中華區首席戰略官)
每個應用程序都可以由?AI?來驅動
越來越多的組織和機構正向云原生、AI技術轉型。可以暢想在人工智能時代,每個應用程序都能通過AI驅動,實現更高的效率、更好的用戶體驗。
OpenAI的成功可以歸結為四個方面:強大的人才梯隊,先進的技術底座,秉承長期主義的研究和投入,開放合作的文化。
除此之外,微軟對于OpenAI的發展也做出了積極的貢獻:10億美金的戰略投資以及打造了世界前五的超級計算機,同時提供多元化、商業化的路徑。
通過企業聯合,不僅訓練出了震驚世界的多個大型AI模型,更將AI技術與微軟的全線產品深度結合,讓企業、個人都能享受AIGC帶來的潛力與可能。
AIGC的創業路徑,可以分成三個功能維度:
第一類是幫助企業降低運營成本,比如最近推出的Microsoft?365?Copilot。
第二類是提高客戶滿意度和產品體驗,比如,通過語音交互技術,幫助不同類型企業為消費者提供個性化產品,這一點在數字人技術體現尤為明顯。
第三類,AGI(通用人工智能)作為一種革命性的技術,也承擔著非常重要的社會責任。比如為殘障人士提供更加便捷的生活服務。
同樣,AIGC在不同行業的商用想象,也是實實在在而具體的,比如制造業、智能車、金融、醫療、游戲、娛樂、教育等領域。

對于企業而言,如何將AI戰略提升到CEO的級別?哪些場景應該作為首選開展試點落地?又如何定位在AI時代下企業的核心能力,以及人才素質模型?如何重塑企業的流程、組織、文化,來更好地迎接新一代生產力革命?這些是所有企業家需要深度思考的問題。
袁佛玉
(百度集團副總裁)
文心一言將改變云計算游戲規則
文心一言將根本性地改變云計算市場游戲規則。源于大模型和生成式AI的兩大突破,全球性“AI再造”已經拉開序幕,跟不上的企業將徹底失去未來的競爭力。
首先,這是百度多年技術積累和敏銳洞察。一方面,如果沒有長達13年、高達千億元的技術研發投入,根本就不可能出現文心一言這個大模型。另一方面,去年就曾精準預測過技術層面的方向性改變,也就是生成式AI。今年文心一言將與百度搜索、小度、Apollo自動駕駛等業務融合,但更大的故事在云計算。百度智能云有信心成為引領者。
其次,生成式AI的興起,將給生產經營效率與用戶體驗效果帶來“雙效”提升,將徹底改變所有行業,加速實現社會“智能化躍遷”。這一點從文心一言所釋放出的能力就可以看出,可以幫助千行百業實現AI再造。
再者,今天IT技術棧已適配AI技術發展的四層架構(芯片、框架、模型、應用)。云計算的主流商業模式將從IaaS(基礎設施即服務)變為MaaS(模型即服務)。
中國擁有全世界最先進、最完整的產業鏈,它能產生大量真實的行業需求、用戶反饋,這會極大推動生成式AI快速發展,并且隨著生成式AI在數字和實體經濟落地,模型即服務(MaaS)將催生萬億級別的新市場。
高建清
(科大訊飛AI研究院常務副院長)
認知智能大模型將帶來重大產業顛覆和機遇
整體而言,科大訊飛在AIGC三大模塊,即音頻創造、視覺創造和文本創造方面,都有積累和進展。以音頻創造這一關鍵技術為例,我認為未來有兩大關鍵趨勢:一是交互領域實現更好的擬人化、情感化甚至口語化;二是內容生產領域,對音色、音律、口音等語義信息進行更好的控制。
目前,語音合成已經應用在新聞播報、紀錄片旁白、游戲解說、廣告直播等十多個領域。
在AIGC浪潮下,語音創造方面也有一些關鍵發展趨勢:既可以利用大語言模型,如Audio?LLM方案,對語音合成中的關鍵因素進行控制;也可以更好地利用AIGC追求聲音藝術,通過插入音效、環境音,對語音合成感受進行改善。
視覺方面,科大訊飛積累了以虛擬人為核心的完整視頻創造能力,包括虛擬人生成和復刻等。利用AIGC,虛擬人的發展趨勢是以虛擬人為中心形成從文本到聲音到圖像的全棧視覺生成能力。
文本生成方面,2023年起,科大訊飛也開始將文本生成能力接入行業應用,尤其在醫療、教育領域。
高建清表示,認知智能大模型將帶來重大產業顛覆和機遇:它將改變信息分發和獲取的模式、內容生產的模式和人機交互的模式。科大訊飛將結合在場景、數據方面的理解,在教育、醫療、人機交互、辦公等方向進行布局。預計今年5月,訊飛將發布在多個行業的大模型進展情況。
張鵬
(智譜華章創始人兼CEO)
預訓練大模型成為AIGC時代的基座
代碼生成插件CodeGeeX,它背后是130億參數、20多種編程語言代碼生成預訓練模型,具有代碼生成、翻譯、注釋等功能,每天幫程序員編寫400萬行代碼。
還有前段時間啟動第一階段內測的類ChatGPT產品ChatGLM,有近2000人內測規模,生成Token量超過730萬。它可以Cosplay聊天,在物理/數學類題目上求解。
除此之外,智譜還開源了其中的一個62億規模的大模型ChatGLM—6B,支持在單張GPU運行,在第三方評測上,相當于70%ChatGPT能力水平。
基于這一模型,智譜探索了MaaS(Model?as?service)的商業模式,既可以從模型訓練、到最后應用開發集成的端到端服務,也可以像OpenAI提供API調用,還可以直接以商用方式供用戶使用。
具體實操即為大模型應用群BigModel.ai,包括解決方案、產品、Demo等,比如編程輔助工具CodeGeeX、大模型輔助寫作應用寫作蛙、個性化機器人小呆等。
AIGC產業基座是預訓練大模型,原因在于兩個方面:第一,通用泛化能力,為AI研發降本增效,這是非常關鍵的特性;第二,融入更多知識,讓大模型能更好模擬人的智能。但與此同時也面臨著一些挑戰,比如成本高昂、訓練數據巨大,周期長等。
時代新機遇
林詠華
(智源研究院副院長、總工程師)
大模型已經從語言模型上升成為認知模型
過去幾年大模型頻繁現身,有兩個趨勢可以總結,一個是模型尺寸越來越大,開始是1億參數,現在已經超過了萬億參數;另一個是單語言模態變成多模態。由此,關注大模型新趨勢時,不僅要在研究領域證明它的創新性,還要直視產業落地時帶來的新挑戰。
從ChatGPT、GPT-4身上爆發出的泛化能力出發,大模型已經從語言模型上升成了認知模型。
未來10年里,大模型面臨最重要的大挑戰:
超大參數量。到底多大參數可以支持應用需求?是盲目追求千億模型,還是百億模型就足夠?
訓練數據。具體多少訓練數據能喂飽一個百億或千億模型?多少的信息和數據可以傳遞到下游任務?
評測任務。從單模態走向多模態,怎么評測已經走向認知的模型?
持續學習和定點糾錯。如何進行低成本的知識和信息吸納?發現錯誤時怎么做到定點糾錯?
可以看到,水面之上的冰山,顯露出文生對話式任務生成模型等AIGC應用,但水面之下還有厚厚的冰山技術棧,用以支撐水面上的冰山一角。因此,大模型評測方法擺到了更為重要的位置。
目前,智源研究院正在聯合多個研究隊伍、機構、廠商,一起打造AI基礎大模型評測系統。另外,智源還在自建AI大模型智算平臺,針對大模型訓練進行多任務優化,并且還在研究跨芯片架構的下一代AI編譯器技術。
過去10年,AI的快速發展離不開開源開放的推動。智源現在就圍繞大模型從底向上的技術體系,打造了FlagOpen這樣一個技術開源體系,把算法、數據、模型、評測系統等開源出來,讓更多開發者企業加入,共同打造大模型的全棧技術。
楊帆
(商湯科技聯合創始人、大裝置事業群總裁)
技術突破和產業化之間的窗口期大大縮短
當全社會在關注ChatGPT和大語言模型時,不能忽視整個AI在最近幾年的核心突破其實是全方位的。
ChatGPT的技術進展顯露出一個特征,即技術突破和形成產業化應用之間的窗口期大大縮短,取而代之的是在這個環節更強的加速效應。不難看到現在的市場上,全世界都有非常多的具體應用在探索成熟。
這一切背后,不僅能看到暴力數據美學,譬如大算力、超大規模計算資源的聚集、超大規模模型結構的設計、海量數據匯聚,還能看到所有環節的強經驗積累。也就是說,現在的大模型研究,離不開大量的軟件工程系統問題,核心功耗需要持續地沉淀和積累。
這樣的技術到底會給AI產業帶來什么變化?
一是生產范式重大改變,再是因為核心能力有大量C端因素,天然能打造更符合AI技術迭代的數據閉環,形成很強的飛輪效應。這意味著產品具備長期持續性,商業壁壘門檻也更容易建立。
應對這樣變化下的AI?2.0,AI?1.0的公司其實不會徹底被顛覆。商湯在2018年起就在做預訓練大模型,它支撐著商湯整體業務的持續發展。
商湯平臺內容“一平臺四支柱”中的“一平臺”,指的就是人工智能基礎設施“大裝置”。多年的持續投入,源于商湯堅持認為AI基礎設施未來會支撐更加百花齊放的產業生態。而從基礎設施層面講開去,大量模型設計和系統調優經驗能夠支撐大模型服務,幫助更多人迭代自有模型。
總體而言,這件事的核心價值在于,整個AI基礎設施會具備彈性和拓展性。通過提供全方位能力,商湯希望為整個人工智能基礎設施、市場及產業,提供更加基礎化的支撐能力。
袁泉
(啟元世界創始人兼CEO)
AGI的中國式探索
啟元視角下,AGI從游戲開始,向互聯網、元宇宙破圈。首先是游戲世界中探索這個AGI,包括從零開始玩星際爭霸。第二階段則是往互聯網世界破圈。尤其Transformer出來之后,AGI在互聯網里面的商業價值比游戲大100倍。第三塊就是元宇宙,這是未來5—10年很重要的事情之一。
元宇宙本質是互聯網豐富的語料、豐富的交互,加上3D開放世界游戲的合體。AIGC如何催生元宇宙、在元宇宙中如何訓練AGI,是未來非常有價值的命題。
最后一步可能是AGI虛實遷移,服務或者應用于現實世界中,這是啟元對趨勢的判斷。
這一過程中啟元的探索主要分為兩個階段,第一階段主要以在各類游戲中訓練決策大模型為主,參數級別在幾千萬或者一億以內,能夠讓AI用小樣本,甚至從零開始,探索這一類任務的邊界。
第二階段是我們從2021年開始做的10億到100億參數的語言模型。基于決策大模型技術平臺,目前啟元目標圍繞能夠啟發人和陪伴人的AGI來展開,去年開始重點做陪聊NPC。這不僅是游戲領域,而是面向更廣泛地虛擬世界,比如一些歷史人物和二次元人物,用戶也想跟他們深度互動。
比如我們基于劉備做了一個陪聊NPC,你問劉備為什么喜歡哭?怎么看待阿斗?他都能給出基于人設、基于事實的交互和對話。
啟元世界認為,AGI服務任何場景,都離不開Understanding。啟元的初心和愿景,就是更多啟發人和陪伴人。