王銳

當地時間2023年2月7日,微軟正式發布了自己的“新必應”,一個集成ChatGPT 的新版搜索引擎。“新必應”最值得關注的技術突破就是它運行的是 OpenAI 專門為搜索服務定制的下一代大型語言模型,比ChatGPT 更強大。這個名叫“普羅米修斯”的模型可以提高回答的相關性,進一步注釋答案,更新搜索結果等等。
由人工智能研究實驗室OpenAI推出的ChatGPT橫空出世,在全球掀起了人工智能(AI)的新浪潮,開啟了AIGC(AI Generated Content,人工智能生成內容)新紀元。
上線僅5天,ChatGPT就收獲了100萬用戶;推出不到兩個月,ChatGPT的用戶日活量就突破1000萬。而根據瑞銀集團研究報告顯示,ChatGPT在2023年1月末月活用戶已經突破了1億,成為史上用戶增長速度最快的消費級應用程序。
2月1日,OpenAI推出ChatGPTPlus訂閱計劃,每月價格為20美元,增值服務包括高峰時段免排隊、快速響應、優先獲得新功能訪問權等,訂閱計劃的推出進一步打開商業空間。同時,OpenAI仍將繼續向消費者提供ChatGPT免費試用。
與其他AI交互機器人不同,ChatGPT可以更好地理解人類意圖,并進行專業性回答,這得益于ChatGPT在GPT3.5的基礎上增加了人類反饋強化模型,引入“人工標注數據+強化學習”來反復訓練模型。
當前,微軟、谷歌、百度等國際國內互聯網巨頭紛紛入局AIGC產業,微軟CEO納德拉稱“AIGC堪比工業革命”,比爾·蓋茨評價ChatGPT的歷史意義重大甚至不亞于PC或互聯網誕生。隨著AI技術的迭代發展,AIGC在變革內容產業的同時,將與搜索、辦公、教育、金融、醫療、工業、影視、游戲等行業結合,進一步拓寬AI應用場景,加速AI商業落地。
隨著AI與下游場景加快融合,同時疊加政策對行業支持,國內AI市場規模有望持續高增。據工信部的相關數據,截至目前,中國AI核心產業規模超過4000億元,企業數量接近4000家,帶動相關產業規模超數萬億元,并將持續快速增加。
招商證券表示,從ChatGPT的流行AIGC已經成為AI技術發展的新趨勢,與傳統AI技術變現困難不同,ChatGPT采用SaaS訂閱的創新收費模式打破了人們對于AI技術大多應用于嵌入式項目的固有印象,拓寬了AI企業的商業模式。AIGC商業空間將進一步打開,不僅B端用戶對AIGC技術存在高需求,未來C端用戶對AIGC技術的付費有望成為常態化,產業鏈相關企業將迎來價值重估。
根據長江證券的研報,人工智能的發展經歷了三次“浪潮”起伏。
第一次浪潮(20世紀50-70年代):人工智能起步階段,首次提出人工智能概念及少數成果,但由于算法理論薄弱及計算機性能缺陷導致無法支持應用推廣。
第二次浪潮(20世紀80-90年代):以專家系統和日本第五代計算機為代表,專家系統的出現推動人工智能從理論走向部分實際應用,例如醫療、氣象、地質等領域。但由于專家系統推理方法單一、數據量匱乏導致人工智能發展受限,再度進入停滯。
第三次浪潮(2000年以后):信息技術的蓬勃發展帶來了行業數據量的爆發以及新型人工智能芯片的進階,為人工智能的發展提供基礎條件。同時理論算法不斷沉淀,以機器學習、深度學習為代表的算法,在互聯網、工業等領域取得了較好的應用效果,并且在圖像識別、語音識別、自然語言處理等細分領域取得巨大進步。
深究人工智能技術發展的驅動力,由算法、算力和數據三大要素構成,學習算法的設計,決定設計出的“大腦”夠不夠聰明(模型的革新);要有高性能的計算能力,可以訓練一個大的網絡(芯片的革新);必須要有大數據(信息技術的發展)。
而以ChatGPT為代表的AIGC興起,在內容創作成本、創作效率、模型計算消耗、用戶流量基礎等維度實現了重大突破,有望推動AI商業化進程的大幅加速。
AIGC是繼專業生產內容(PGC)、用戶生產內容(UGC)之后誕生的,利用AI技術自動生成內容的新型生產方式,其特點是高效性和自動化生產。隨著自然語言生成技術NLG和AI模型的成熟,AIGC開始受到大規模的關注,如微軟、谷歌、英偉達等多家科技巨頭紛紛布局AIGC技術和應用。
在AIGC場景下,AI可以靈活運用于寫作、編曲、繪畫和視頻制作等創意領域。據TBanicDate估計,到2025年人工智能生成數據占比將達到10%。目前AIGC技術可以自動生成文字、圖片、音頻、視頻,甚至3D模型和代碼,在搜索引擎、藝術創作、影音游戲,以及金融、教育、醫療、工業等領域的應用前景十分廣闊。
興業證券認為,AIGC反映出AI的角色正在改變,即從“效率工具”到“生產工具”的顛覆性變革。AIGC能夠以類似人類甚至優于人類的知識水平、制造能力承擔信息挖掘、素材調用、復刻編輯等基礎性機械勞動,從技術層面實現以低邊際成本、高效率的方式滿足海量個性化需求。長期來看,AIGC在提高各行業內容創作效率的同時,更有可能孕育出更多的新業態、新模式。
華西證券表示,盡管此前StableDiffusion、Midjourney等AI繪畫應用已經落地,但注冊及使用門檻仍相對較高。而ChatGPT的對話機器人屬性及免費試用窗口期使其能夠廣泛觸達用戶,瑞銀數據顯示上線兩月用戶數已突破1億,系目前用戶增長最快的消費應用,2023年1月推出付費訂閱版,每月價格20美元。ChatGPT之于OpenAI,可以對標AlphaGo和AlphaFold之于DeepMind,開啟了AIGC認知普及的一大步,是AIGC內容批量規模化生產的起點。
ChatGPT是由人工智能研究實驗室OpenAI在2022年11月30日發布的全新一代聊天機器人模型,使用的模型與兩年前發布的GPT-3底層數據和參數規模一致。
華西證券認為,GPT-3是GPT系列第三代語言預測模型,ChatGPT是從Instruct GPT(GPT-3.5)系列中的一個模型進行微調,相較于Instruct GPT,ChatGPT效果更加真實(擁有非常強的泛化能力和生成能力),模型的無害性實現些許提升(生成帶有有害、歧視、偏見等情況的有問題樣本的概率本身就會很低),編碼能力更強(在GPT-3積累的大量Coding代碼基礎上,部分OpenAI內部員工參與了數據采集工作)。

數據來源:澎湃,中泰證券研究所

數據來源:Precedence Research,中泰證券研究所
相較于進一步擴大原有的數據規模,ChatGPT采取了升級訓練方式的辦法,利用人類反饋的知識,對模型進行強化修改,同時對原有數據略作改良,優化語言模型,對AI的回答方式及答案存在的局限性進行更新,實現了計算機“數據”與人類“知識”的突破性結合。
ChatGPT可通過自然對話方式交互,也可完成生成文本、自動問答等復雜語言任務,在各類AI文字處理的任務中表現出色,體現出較高的實用價值。放眼未來,ChatGPT產品有望通過不斷迭代逐步實現人機協同,核心技術的投入、算力、算法的通用化、更專業的人為標注(行業know-how)可以使得新場景的應用更加快速,能夠加速各個行業的智能化升級,邊際效用實現增長。
中泰證券表示,ChatGPT的爆火一方面是AI經歷多年技術沉淀后的里程碑式事件;另一方面它的影響力已經滿足革命性技術的一個重要標志,可能引領大量的應用重做已經生活方式的變革。如AI接入設備,釋放大量的生產力,或是改變使用傳統搜索引擎的習慣,對內容產業進行革新。
OpenAI 首席執行官稱,GPT-4有望成為多模態的人工智能,根據OpenAI 創始人Altman消息,參數預計更大,計算模型優化有望實現更優化,且GPT-4將是純文本模型(不是多模態)。華西證券認為,GPT-4的推出潛在商業價值巨大,模型更具備“擬人化”的功能,文本生成和內容創作有望更加豐富,并有望進入文字工作的相關領域,例如新聞、金融等相關行業。
根據目前學界的觀點,一個理想的語言模型,應該具備以下性質:具備強大的自主學習、消化知識的能力,其學習過程不需要人為介入;能夠很好地理解人類指令,習慣人類的表達方式;能夠正確、清晰地給出問題的回答。
可以說,ChatGPT在這三個方面的綜合水平上,相比它的前輩們,取得了突破性的成就。GPT-3模型誕生于2020年6月(Language Modelsare Few-ShotLearners),此前自然語言處理(NLP)領域的主流技術是深度學習模型。但是隨著GPT和BERT等兩階段預訓練模型誕生后,NLP領域的研究范式出現了快速切換,海內外大量科技公司選擇了以BERT為代表的雙向預訓練+Fine-tuning的模式。但與此同時,還有另一條技術路線,那就是OpenAI選擇并堅持至今的自回歸預訓練語言模型+Prompting的模式。
ChatGPT成功的背后離不開數據、模型和算力。數據方面:從2018年的GPT到2020年的GPT-3,算法模型上沒有太大的改變,主要的改變在于參數量和數據量。模型的參數量從1.17億個增加到1750億個,預訓練數據量從5GB增加到45TB。
模型方面:ChatGPT在GPT-3.5的基礎上增加了人類反饋強化模型,引入“人工標注數據+強化學習”來訓練模型,可以更好地與人類進行專業性交流。
算力方面:GPT-3.5在AzureAI超算基礎設施上進行訓練,總算力消耗約3640PF-days(即每秒一千萬億次計算,運行3640個整日)。
興業證券認為,大模型的算法復雜度、高訓練成本造就較高的進入壁壘。模型是AI的靈魂,本質上它是一套計算公式和數學模型,“參數”可以看做是模型里的一個個公式,這意味著,參數量越大、模型越復雜,做出來的預測就可能越準確,目前業界主流的AIGC模型都是千億級參數量的水平。據Gartner技術成熟度曲線,當前生成式AI仍處于技術萌芽期,新進入者若希望在類ChatGPT產品上做布局的話,在大模型設計、模型訓練、應用場景落地等維度均需要加大投入。
申萬宏源表示,相比小模型,首先大模型最核心區別在于參數量,例如GPT-3參數量達到了1750億個,是傳統深度學習小模型參數量的至少一萬倍以上。通過模型的擴大,可以帶來提升包括:
一是GPT-2等大模型舍棄了小模型中常見的調參Fine-Tuning過程,轉向容量更大、無監督訓練。
二是在自然語言理解NLP中,常見任務包括翻譯、問答、文本填空等,常見小模型需要對不同的任務使用不同模型分別訓練解決,而GPT-3等大規模預訓練模型不再規定任務,而是對以上不同任務都有較好效果;可以理解為,一個飽讀詩書的人,應該會寫作、對話、閱讀理解等多種技能,而不需要對單獨技能訓練。
三是傳統的模型訓練方式是反向傳播算法,先對網絡中的參數進行隨機初始化(預訓練大模型中不是隨機初始化的),再利用隨機梯度下降等優化算法不斷優化模型參數,這種方式下對數據需求量較大。GPT-3先使用海量數據預訓練大模型,得到一套模型參數,然后用這套參數對模型進行初始化,再進行訓練。大幅降低后續對數據量的需求。
申萬宏源表示,小模型時代,商用模型開發會綜合考慮調參等研發投入量和帶來的商業價值,模型開發出來后能否復用以攤薄研發成本,同時對于部分訓練樣本量較少的場景,沒有很好的解決方法。
大模型可以在長尾場景應用落地,降低訓練成本、減少數據要求。基于大規模預訓練思路,一方面大模型可以應對多個泛化任務,大模型+細分場景微調,更適合長尾落地;另一方面,對于小樣本(fewshot)訓練,大模型也有較好提升。
OpenAI于2015年在舊金山成立,是一家非營利的人工智能研究公司,公司的目標是以最有可能造福全人類的方式推進人工智能,而不受財務回報需求的約束。OpenAI創始人背景深厚,由埃隆·馬斯克與硅谷孵化器Y? Combinator投資人山姆·阿爾特曼等人聯合創立。公司研究人員經驗豐富,包括前Google? Brain研究科學家伊利亞·蘇茨凱弗與前Stripe首席技術官格雷格·布羅克曼等世界一流研究工程師與科學家。
2018年,隨著特斯拉對AI的應用深入,為避免潛在利益沖突,馬斯克主動離任董事會,僅保留捐資人和顧問的身份。由于AI訓練花費金額巨大,2019年公司從非營利性公司轉向部分盈利公司,成立了OpenAI LP利潤上限子公司,即任何對OpenAI LP投資的收益都將統一轉移至一家非盈利公司,回報達到投資的100倍后進行利潤分配。同年,OpenAI收到微軟注資10億美元,就Azure業務開發人工智能技術。2020年發布GPT-3語言模型,由微軟獲得獨家授權。2022年發布ChatGPT的自然語言生成式模型,帶來更大潛在應用空間。
2023年1月23日,微軟宣布向ChatGPT開發者OpenAI追加投資數十億美元,這也是人工智能領域史上規模最大的一筆投資,微軟將在消費者和企業產品中部署OpenAI的模型,并引入基于OpenAI技術的新型數字體驗。
微軟一直計劃將ChatGPT整合到旗下產品中。在Bing中加入ChatGPT模型,可以更精確地幫助用戶查果。微軟還可能會將ChatGPT整合到Word、PowerPoint、Outlook和其他應用程序中,方便用戶可以只通過簡單的提示自動生成文本。
微軟還發布了“2023PowerPlatform第一波”功能發布計劃,RPA產品內置GPT3(ChatGPT基于該技術開發而成),對該平臺的PowerAutomate、PowerApps、PowerPages和PowerVirtualAgents產品矩陣進行了智能升級。
1月26日“美版今日頭條”BuzzFeed宣布和OpenAI合作,未來將使用ChatGPT幫助創作內容。
為應對ChatGPT的爆火,谷歌計劃推出對話人工智能服務Bard。這項實驗性人工智能程序以對話應用語言模型(LaMDA)為基礎。Bard的最初版本和LaMDA的輕量級模型將同時發布,這意味著能夠運用更小的算力擴大受眾并且得到更多的反饋。谷歌也計劃把這些新技術融合進自身的傳統產品例如搜索引擎之中,它正在以最新的人工智能技術為基礎,例如LaMDA、PaLM、Imagen和MusicLM,研究全新的信息接觸方式,預計谷歌帶有人工智能功能的搜索引擎將很快問世。
國內方面,2月7日,百度公布其類ChatGPT項目名為“文心一言”(英文名ERNIE Bot),預計將于3月完成內測并向公眾開放。
百度表示,自己具備ChatGPT的相關技術。在人工智能領域深耕了數十年,百度已經具備跨模態、跨語言的深度語義理解與生成的能力,擁有產業級知識增強文心大模型ERNIE。并且已經全棧布局人工智能的四層架構,分為底層的芯片、深度學習框架、大模型以及最上層的搜索等應用。即將推出的文心一言位于模型層。

資料來源:德勤,浙商證券研究所

資料來源:德勤,浙商證券研究所
2月8日,據阿里巴巴一名資深技術專家爆料,阿里達摩院正在研發類ChatGPT的對話機器人,目前處于內測階段。根據曝光截圖,阿里或將AI大模型技術與釘釘生產力工具深度結合。
同日,網易有道AI技術團隊被傳已投入ChatGPT同源技術AIGC在教育場景的落地研發,該團隊正在AI口語老師、中文作文批改等細分學習場景中嘗試探索,將盡快推出相關demo產品。
科大訊飛亦有相關技術儲備。ChatGPT主要涉及的自然語言處理(NLP)相關技術,正是科大訊飛長期深耕的領域。科大訊飛在2022年12月份啟動生成式預訓練大模型的任務攻關,該技術有望率先落地于科大訊飛AI學習機中,并預計將于2023年5月6日進行產品級發布。
三六零亦稱,其在類ChatGPT、文本生成圖像等技術在內的AIGC技術上有持續性的研發及算力投入,但目前所形成的全部成果均僅作為公司內部自用的生產力工具使用,自家類ChatGPT技術的各項指標只能達到略強于GPT-2的水平,與當前ChatGPT相比尚有代差的落后。
京東集團副總裁何曉冬也回應了相關布局,稱京東在ChatGPT領域擁有豐富的場景和高質量的數據,例如京東云言犀每天和用戶進行1000萬次的交互。他認為,ChatGPT是令人興奮的前沿探索,言犀則是大規模商用的客戶服務系統,未來京東也會不斷結合ChatGPT的方法和技術點,融入到產品服務中來,推動人工智能的產業落地。
此外,字節已經開始對AI+內容的布局,自動生成投稿、輔助寫作、生成短視頻。比如利用AIGC在今日頭條上自動生成內容、在抖音上生成一些圖文類的短視頻。目前AIGC的生成內容質量好于普通的UGC,但相較于PGC還有所欠缺,整體而言質量較好。
AIGC產業生態正在加速形成和發展,根據6pen預測,未來五年10%-30%的圖片都將由AI參與生成,有望創造超過 600億元以上的市場空間。據量子位報告統計,到2030年,AIGC的市場規模將超過萬億人民幣,在內容生產領域和延伸應用領域都有著廣闊的空間。但由于AIGC目前產業化程度有限,大量業務場景尚未成功變現,商業模式也還處于探索階段,未來幾年都將是AIGC商業化的探索期。
長城證券表示,作為AIGC其中的重點細分領域,ChatGPT的成功體現了AIGC產業的快速進展,基于AIGC的應用廣泛,預計ChatGPT的應用場景也多樣化,同時對計算機及通信行業均有所催化。
華泰證券表示,ChatGPT屬于AIGC的具體應用,相比過去的AI產品,在模型類型、應用領域、商業化等層面呈現出新的特點。技術方面:ChatGPT屬于自然語言處理領域,與早期的自然語言技術相比,ChatGPT采用大模型進行訓練,并加入人工反饋增強學習(RLHF)方法,實現了效果的明顯提升;應用方面:ChatGPT屬于生成式AI,相比于分析型AI,不局限于已有的內容,已在文藝創作,代碼處理,營銷等多個創造性場景內得到應用;商業化方面:ChatGPT在商業化方面彰顯出強于以往AI應用的潛力,一方面用戶數快速增長;另一方面得到了微軟為代表的科技巨頭的支持,應用有望快速推廣。
未來,ChatGPT應用場景將包括以下多個領域。
多元傳媒:實現智能新聞寫作,提升新聞資訊的時效。基于算法自動編寫新聞,將部分勞動性的采編工作自動化,幫助媒體更快、更準、更智能化地生產內容。
電商:打造虛擬客服,提供24小時無縫對接服務。虛擬客服能夠填補人工客服的休息間隙,實時為客戶提供服務,并且能快速了解客戶需求和痛點進行交互。此外,通過ChatGPT對虛擬客服的回答信息加以約束,可控性安全性更強。
影視:分析歸納海量劇本,開闊創作思路。通過對海量劇本數據進行分析歸納,并按照預設風格快速生產劇本,創作者再進行篩選和二次加工,以此激發創作者的靈感,開闊創作思路,縮短創作周期。
教育:ChatGPT便于實時答疑解惑,幫助快速生成教育資料。學生可以進行在線實時問答交流解決問題,便利了答疑解惑,提高學習的自主性。ChatGPT還可以幫助教育機構快速生成大量測試題目和課件等。
金融:ChatGPT助力實現降本增效,提供更有溫情的服務。通過ChatGPT實現金融資訊、產品介紹內容的文本自動生成,提升金融機構內容運營的效率,構建虛擬客服在線交互,讓金融服務更有溫度。
醫療:ChatGPT可通過對話交互生成文本,輔助電子病歷錄入,解放醫生精力。
東方證券認為,現階段AIGC的商業模式仍會以To B為核心,B端客戶基于對企業降本增效的要求,對 AIGC的需求和付費意愿是較為強烈的;面向C端用戶的商業化存在訂閱制和按次收費等模式,AIGC能夠大幅降低大眾用戶的創作門檻,未來隨著AIGC生態不斷完善,市場空間也十分可觀。

AI有望進入新紀元,對現有娛樂、傳媒、新聞、建模等應用具有顛覆性的創新。
華西證券認為,AIGC的出世會產生革命性的影響,同時有望賦能千行百業,隨著AI寫作、AI作圖、AI底層建模、AI生成視頻和動畫技術逐漸成熟,AI有望進入新紀元,帶來空前藍海,同時對現有娛樂、傳媒、新聞、建模等應用具有顛覆性的創新。
華西證券表示,AIGC的受益廠商分為三類:AI處理器廠商;AI商業算法商業落地的廠商;AIGC相關技術儲備的應用廠商。
其中,具備自研AI處理器的廠商可以為AIGC的神經網絡提供算力支撐。人工智能的本質及數據的海量運算,相較于AI算法,數據才是重中之重。算力作為數據加速處理的動力源泉,其重要性不言而喻。AI處理器芯片可以支持深度神經網絡的學習和加速計算,相比于GPU(圖形處理器)和CPU(中央處理器)擁有成倍的性能提升和極低的耗電水平。因此,人工智能芯片將發揮大量作用。
具備AI商業算法落地的廠商具備相關算法的領先性。 AI算法的龍頭廠商在自然語言處理、機器視覺、數據標注方面都具有先發優勢。算法上,數據標注屬于AIGC算法的生成關鍵步驟,而在自然語言處理、機器視覺等方面,AIGC已經對此方向應用產生深遠影響,例如已經實現的虛擬人與自然人的對話、AI作圖、AI底層建模,隨著技術的進一步成熟,AIGC勢必對該方向應用產生革命性影響。
AIGC相關技術儲備的應用廠商有望打開海量市場。相關娛樂、傳媒、新聞、游戲、搜索引擎等廠商具備海量文本創作、圖片生成、視頻生成等需求,隨著AIGC的逐漸成熟,相關AI算法不斷成熟完善,并結合相關應用,相關廠商在降本增效的同時,有望提升其創作內容的質量、減少有害性內容傳播等問題,實現創意激發,提升內容多樣性,AIGC有望極大推動相關廠商商業化的發展,從而打開海量空間。
東方證券表示,未來幾年是AIGC的快速發展窗口期,其涉及的相關底層AI模型算法、算力基礎設施以及下游行業應用都有望迎來加速增長。AI模型算法是AIGC的核心,是技術驅動層,需要投入高額的研發與訓練成本;算力基礎設施主要包括存儲和芯片等設施,是訓練大模型必需的基礎架構;下游行業應用則是以AIGC在不同場景中的落地為主,側重于滿足用戶的個性化需求,建立起AIGC產業生態。
長城證券認為,ChatGPT通過升級訓練方式攻關了原有模型局限,帶來出色的用戶體驗及較高的實用價值。科技巨頭的加入、商業形式的豐富或加速ChatGPT乃至AIGC行業的商業化進程。AIGC行業在AI文本生成、音頻生成及圖片生成等細分領域具備廣闊的應用空間,基于技術上的剛性需求,下游的應用落地刺激上游算力需求的提升。
ChatGPT技術方案最大的優點就是單一模型,特點就是參數比較大,達到1750億個參數,代價就是需要巨大的算力。并在算力中心的基礎上構建大模型;這是AI未來發展的大趨勢。這使得AI公司的進入門檻不斷提升,一方面要做出大模型,一方面還需要巨大投入去使用算力中心。
民生證券也表示,ChatGPT能夠實現當前如此強大的交互,離不開背后龐大的算力支撐。根據綠色節能數據中心官方公眾號,ChatGPT的總算力消耗約為3640PF-days。按近期在國內落地的某數據中心為參照物,算力500P耗資30.2億元落成,若要支持ChatGPT的運行,需要7-8個這樣數據中心支撐,基礎設施投入需以百億元計。因此,隨著AI等新技術的發展,對高可靠、高性能、高安全算力需求更加突出,全球正掀起一場算力的“軍備競賽”,數據中心、AI芯片、服務器等環節作為算力基礎設施,有望被高度重視。
當前,存量已經建立優勢的AI公司具備資本實力,拉高了行業壁壘,但是未來AI應用場景廣泛,想象空間巨大,并且基于對數據安全保護的更加重視,未來中國龐大的市場較大概率是由中國公司來做,小型創業AI公司依舊存在生長空間。
隨著AI 等新技術的發展, 對高可靠、高性能、高安全算力需求更加突出,全球正掀起一場算力的“軍備競賽”。
算力增長推動基礎設施擴容,數據中心服務器、交換機、光模塊不斷迭代。AI對于算力最大的挑戰依然來自于核心數據中心的模型訓練,算力需要能耗、成本的堆砌,持續輸入數據耗電做存儲計算,能耗與投入成本密切相關。AI背后所需的算力支撐相較于之前的云計算、電商有成倍的增長,按照傳統速率升級、堆疊算力的方式已經不能滿足當前商業化的發展需求。為了匹配高算力,未來需要對設備實行降本方案。CPO(共封裝光學)有望成為AI高算力下解決方案。
NPO(近封裝光學)及CPO是將網絡交換芯片和光模塊(光引擎)進行“封裝”的技術,用來替代目前的熱插拔式光組件。據Lightcounting預測,CPO未來可能成為大型數據中心的可插拔光收發器的替代方案。產品預計將從800G和1.6T端口開始放量,于2024-2025年開始商用,2026-2027年開始規模上量,主要應用于超大型云服務商的數通短距場景。CIR的預測指出,2026年全球CPO市場規模將達3.44億美元,2030年將達到23億美元。
AIGC的發展有望帶動CPO的需求進一步拓展。降能耗成本需要設備、光模塊、交換機的更新。衍生出的交換機和光模塊融合(COPACKAGE),以前的光模塊演進成光引擎,然后再和交換芯片貼在同一張PCB背板上,通過交換機搭載的液冷板進行物理冷卻和降溫。同時光引擎由于體積、集成度高,搭配硅光封裝規模化后會體現成本優勢,有望替代高算力場景。當前很多大廠已經出貨,其體量較小,未來在數據中心側有望規模性鋪開。
傳統市場的需求會被新方案替代,但由于算力激增,數通投資、光通信的需求量會大幅提升,特別是高算力場景下的出貨量增長前景較好。結構性創新帶來的彈性可能會在2023-2024年體現出來,目前切換新方案的糾結點在于成本和供應鏈是否穩定,預計產品起量后供應鏈會所有突破。AI進度加速,ChatGPT爆火可能帶來光引擎、液冷服務器加速推進。
長江證券表示,ChatGPT的橫空出世以及國內外巨頭紛紛投入大模型,意味著大模型有望帶領新一輪浪潮,當前投資共有兩條主線,一是圍繞人工智能三大要素布局,短期關注軟硬件配套的底層資源,二是中長期關注新一輪技術變革下新場景和新產品的創新落地。
復盤深度學習的發展歷程,長江證券發現,其中有兩類企業伴隨此趨勢得到真正的商業化成長:第一類是底層資源企業,以英偉達為代表。2012年,英偉達看到了GPU在圖形運算之外的潛力,自研出適合深度學習發展的 CUDA(通用冰箱計算平臺),GPU替代CPU成為AI訓練市場的首選,英偉達股價開始飆升,乘深度學習之東風,成為AI芯片領域的絕對霸主。后來不斷在下游進行深耕,除了優勢游戲行業,在智能駕駛的底層資源支持也得到了巨大的突破。
第二類為實現場景賦能的應用企業。首先是互聯網平臺廠商,在互聯網商業變現場景中,廣告變現占有主導地位。2012年,深度學習迅速席卷圖像、語音、NLP等領域,并逐步在互聯網商業化最成功的搜索、推薦和廣告領域獲得突破并成為主流,在此過程中,中國誕生了一系列火爆應用抖音、頭條、快手等,同時互聯網依托廣告變現的商業模式再上新臺階。
其次是將技術與傳統場景結合,實現商業化落地的人工智能技術廠商,但由于落地場景規模的不同,真正實現投入產出平衡的企業屈指可數,其中科大訊飛依托本身在教育行業的數據優勢,實現在教育行業的產品化落地。
因此,在大模型引領的新一波浪潮下,長江證券建議,短期關注軟硬件配套的底層資源,中長期關注新一輪技術變革下新場景和新產品的創新落地,其中可以實現規模化落地場景將誕生公司更大的成長機遇,其次是碎片化場景落地廠商。
在多重利好因素推動下,ChatGPT概念無疑成為A股市場上“最靚的仔”。Choice數據顯示, 2月以來ChatGPT概念指數漲幅已經超過20%。不過,看到機會的同時,投資者也應該看到,這一技術的落地將會是長期而持續的過程,短期行情的過度火爆會讓板塊泡沫破裂的風險提升。
廣發證券認為,近期市場關注度較高的ChatGPT對A股計算機相關上市公司的實質影響極為微小。交易性主題機會的屬性非常突出,基本面極不相稱。與美國公司相比,相關三大要素至少在數據質量和商業化上有不小差距,且存在巨大挑戰。
廣發證券表示,ChatGPT對A股計算機更多是情緒意義。首先,從產業鏈現狀來看,A股計算機公司在AI產業鏈中基本屬于微小的從屬地位,只有算力環節的寒武紀比較突出。AI大模型方面領先者群體主要是百度、阿里、華為、騰訊等頭部互聯網公司或云計算公司,也包括商湯等獨立通用平臺公司。此外,訊飛在語音外的多樣性應用上仍有較多空間待實現。
其次,產業分工生態有較大差異,美國獨立中小科技公司被科技或互聯網巨頭以高估值購入的案例在中國不多見,國內巨頭傾向于通過內生垂直一體化的習慣留給獨立公司的成長空間較美國同類公司小。
再次,相關互聯網公司近三年資本開支增長放緩,在主營業務已過高速成長期,云計算業務依然虧損的背景下,資本開支的恢復力度可能短期相對有限。
廣發證券認為,AI主要是三大要素:數據、模型和算力。其中數據的數量和質量的差異和影響更大。僅以數據質量為例,最大的障礙和挑戰是數據來源的割裂。
在各領先公司或潛力公司之間,各自的數據來源較為割裂。科技公司根據主營業務不同,其采集的數據范圍有限。例如,阿里采集的主要是消費者行為和決策數據,騰訊通過微信采集的是社交類數據,小紅書采集的主要是和生活方式相關數據。有限的數據采集方式在多維度層面影響了可用于模型訓練的數據質量,進一步會影響到AI模型的泛化能力和不同場景的通用化效果。
而OpenAI獨立第三方的中立屬性和開放的風格更容易與產業鏈上下游形成合作,在開放的生態建設上更具優勢,或者說遠遠優于任何一個單一平臺公司的數據來源。其對谷歌的強大挑戰和壓力充分證明這一點。
廣發證券還認為,從商業化的對比來看,AI的投入巨大且持續性強,因此商業化成功與否極其關鍵。迄今為止,ChatGPT較有商業發展潛力的典型案例是微軟從瀏覽器到OFFICE的全線融合應用。以Edge為例,其功能增強達到了質變的程度。這極大提高其商業產品的門檻和附加值,對現有單一產品公司是降維競爭,可以預期其相關產品線的競爭優勢會迅速擴大并能逐步新增體現在全球市場份額和財務回報上。
而此前的NLP在中國市場的商業應用更多存在于精準營銷等C端,已相對成熟。對于要求較高的B端IT應用無論產品還是生態合作、價值鏈均衡都有不小差距,廣發證券認為要達到類似效果有較長的路。
廣發證券表示,總體而言,ChatGPT相關主題對A股計算機相關標簽公司整體幾乎沒有實質驅動,整個產業鏈的追趕都面臨較大挑戰,積極意義主要體現在對市場關注度的貢獻。相關公司絕大多數基本面和主題標桿相去甚遠,且整體在產業鏈中處于相對邊緣的位置。