英偉達2023年的營業(yè)收入為609.22億美元,同比增長125.85%;凈利潤為297.60億美元,同比增長581.32%,業(yè)績創(chuàng)出歷史新高。為了不失去中國市場與業(yè)績持續(xù)增長的需要,英偉達為中國市場定制了三款“特供”芯片,分別為H20、L20、L2,且于近期開始接受預(yù)定。
國內(nèi)方面,以景嘉微、海光信息、龍芯中科等為代表的GPU廠商業(yè)績并不樂觀,2023年僅有海光信息業(yè)績實現(xiàn)顯著的正向增長。不過,在此輪GPU全球競爭中,國內(nèi)廠商似乎并沒有過于落后,從數(shù)據(jù)來看,華為昇騰910B與H20性能大體相當(dāng),在某些關(guān)鍵領(lǐng)域的FP32性能表現(xiàn)略優(yōu)于后者,海光信息深算二號性能相比上一代產(chǎn)品提升了近一倍,昆侖芯、摩爾線程等公司產(chǎn)品也在持續(xù)迭代中。
據(jù)業(yè)績預(yù)告,2023年,海光信息營業(yè)收入為60.12億元,同比增長17.30%;歸屬母公司所有者凈利潤為12.62億元,同比增長57.11%,其業(yè)績增長遠(yuǎn)超國內(nèi)其他競爭對手。
CPU是海光信息主要的收入與利潤來源,因此,海光信息業(yè)績增長的核心原因在于下游服務(wù)器需求旺盛。
據(jù)IDC數(shù)據(jù),中國服務(wù)器市場快速增長。2022年,中國服務(wù)器市場規(guī)模為288億美元,2018-2022年CARG高達20.20%,而隨著東數(shù)西算項目的推進以及國產(chǎn)AI大模型應(yīng)用的爆發(fā),國內(nèi)服務(wù)器需求將穩(wěn)步上升,預(yù)計2027年將達到454億美元。
需要指出的是,X86仍為全球服務(wù)器主流架構(gòu)。據(jù)IDC數(shù)據(jù),2022年,全球X86服務(wù)器市場規(guī)模達1109.55億美元,占服務(wù)器總市場的比重為87.50%。從中國市場來看,2023年第一季度出貨量中,X86架構(gòu)服務(wù)器出貨量占比高達92.40%。
而且,根據(jù)Mercury Research數(shù)據(jù),2021年第四季度,X86 CPU市場幾乎被海外巨頭壟斷,Intel占74%、AMD占比為26%,在中國市場亦是如此,X86 CPU芯片國產(chǎn)化率較低。
海光信息CPU產(chǎn)品可以實現(xiàn)上層應(yīng)用無縫切換,減少遷移成本,相對于ARM服務(wù)器遷移風(fēng)險小,但在2020年,其產(chǎn)品出貨量僅占國內(nèi)總體市場份額的3.75%。
幸運的是,國內(nèi)信創(chuàng)產(chǎn)業(yè)的發(fā)展推動了海光信息CPU產(chǎn)品出貨量的增長。2022年9月,政府下發(fā)79號文,要求到2027年,央企、國企全面完成國產(chǎn)替代。
據(jù)東吳證券數(shù)據(jù),2022年,部分央企、國企服務(wù)器招標(biāo)國產(chǎn)化比例已經(jīng)超過了30%;而且,2023年,銀行、運營商等央企、國企還放出純國產(chǎn)服務(wù)器招標(biāo),其中海光信息和華為是行業(yè)信創(chuàng)服務(wù)器兩大主要供應(yīng)商。
除了國產(chǎn)替代的影響,規(guī)模效應(yīng)使得自研無形資產(chǎn)攤銷金額占營業(yè)收入的比重下降也是促進海光信息業(yè)績增長的重要因素。
據(jù)財報數(shù)據(jù),海光信息一直保持高強度的研發(fā)投入。2021-2022年,公司研發(fā)支出資本化金額分別為8.40億元、6.54億元,占當(dāng)期研發(fā)投入的比重分別為53.02%、31.61%。
截至2023年上半年,海光信息賬面無形資產(chǎn)非專利技術(shù)期末余額為33.15億元,按照3-10的期限進行攤銷,當(dāng)期計提金額3.27億元,而隨著出貨量的增加,規(guī)模效應(yīng)顯現(xiàn),公司毛利率逐步上升,由2019年的37.31%增至2023年前三季度的60.63%。
根據(jù)中國通信院發(fā)布的《中國算力發(fā)展指數(shù)白皮書》數(shù)據(jù),2022年,全球智能算力約451E Flops(基于FP32計算),預(yù)計到2030年,全球智能算力規(guī)模將達到52.5Z Flops,全球智能算力快速增長。
對于中國市場,根據(jù)IDC和浪潮信息發(fā)布的《2023-2024人工智能計算力發(fā)展評估報告》,2022年,中國智能算力規(guī)模為259.9E Flops(基于FP16計算),預(yù)計到2027年達到1117.4E Flops,2022-2027年CAGR約為33.90%。
具體至數(shù)值層面,Gartner研究顯示,2022年,全球AI芯片市場規(guī)模為442.20億美元,預(yù)計2027年將增至1149億美元。而在中國市場,頭豹研究院數(shù)據(jù)顯示,2022年,中國AI芯片市場規(guī)模為954億元,預(yù)計到2025年達到1979億元。
需要指出的是,AI芯片可以分為GPU、FPGA、Asic,其中GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA、Asic則是針對人工智能需求特征的半定制和全定制芯片。根據(jù)TrendForce發(fā)布的數(shù)據(jù),英偉達GPU為AI服務(wù)器主流芯片,其市場占有率約為60%-70%;其次為云端廠商自主研發(fā)的Asic芯片,市場占有率約為20%左右。
另外,全球GPU市場呈現(xiàn)“一超一強”的競爭格局。根據(jù)IDC數(shù)據(jù),2021年,英偉達在企業(yè)級GPU市場份額為91.40%,AMD市場占有率為8.50%。
更為重要的是,由于美國對于中國的制裁加劇,國內(nèi)企業(yè)很難獲得先進的AI芯片,2023年10月17日,美國商務(wù)部宣布計劃限制向中國出售更先進的A芯片,除了H100、A100、L40等產(chǎn)品外,新的政策還將將限制英偉達A800、H800芯片的出口。
為了不失去中國市場以及遵守美國的禁令,英偉達針對中國區(qū)開發(fā)出改良版AI芯片,包括H20、L20以及L2,其中H20性能最強,其采用中國臺灣地區(qū)的臺積電的CoWos封裝,理論上等于H100的20%綜合算力性能,另據(jù)路透社消息,英偉達對H20中國渠道定價設(shè)定在1.20萬-1.50萬美元。
那么,英偉達真的可以憑借“閹割版”的H100在中國GPU市場實現(xiàn)降維打擊嗎?
答案是否定的,近年來,中國頒布了一系列支持采用國產(chǎn)AI芯片的政策,例如北京頒布政策明確推動國產(chǎn)人工智能芯片實現(xiàn)突破,上海市提出拓展國產(chǎn)芯片應(yīng)用,推廣國產(chǎn)算法框架。
與此同時,以華為、海光信息、摩爾線程等為代表的GPU廠商也先后投入大量研發(fā)資金,其產(chǎn)品性能也持續(xù)迭代,甚至在部分領(lǐng)域已不弱于H20。
據(jù)國海證券研報,在FP16精度下,H20算力為148 TFLOPS,F(xiàn)P32精度算力為44 TFLOPS,F(xiàn)P64精度算力為1 TFLOPS;華為昇騰910在FP16精度下算力為320 TFLOPS,昇騰910B算力為376 TFLOPS。更為重要的是,據(jù)IT之家消息,在某些關(guān)鍵領(lǐng)域的FP32精度下算力,英偉達H20表現(xiàn)不如華為昇騰910B,而且昇騰910B市場價格約為12萬元左右。綜合來看,與華為昇騰910B相比,H20并沒有明顯的競爭優(yōu)勢。
海光信息深算二號性能同樣表現(xiàn)不俗,其性能相比深算一號提升了一倍。
公開信息顯示,深算一號FP16精度下算力為24.5 TFLOPS,F(xiàn)P32精度算力為11.5 TFLOPS,F(xiàn)P64精度算力為10.1 TFLOPS;三類精度下,深算二號的算力分別為49 TFLOPS、23 TFLOPS、10.2 TFLOPS。通過對比,海光深算二號在FP16與FP32精度下算力低于英偉達H20,但在高精度FP64的算力優(yōu)于H20。
值得一提的是,據(jù)招股說明書,海光深算一號售價為1.93萬元,低于英偉達A100的5萬元,依次推算,海光深算二號售價大概率低于英偉達的H20,主打高性價比。
對于GPU來說,產(chǎn)品性能是一個門檻,另一個重要門檻是易用性,這涉及到生態(tài)問題,國外大廠經(jīng)過多年的發(fā)展,已經(jīng)形成了比較強的生態(tài)。
相對樂觀的是,國內(nèi)科技企業(yè)正在積極適配國產(chǎn)芯片。據(jù)路透社消息,百度為200臺服務(wù)器訂購1600顆華為昇騰910B芯片。2023年11月8日,在世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會上,360集團創(chuàng)始人周鴻祎表示,360將采購華為1000片左右AI芯片,并與華為合作將AI框架移植到昇騰910B上。
2023年11月6日,寒武紀(jì)也對外表示,思元系列云端智能加速卡與百川智能旗下大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面適配,昆侖芯、摩爾線程等公司新品也持續(xù)迭代,國產(chǎn)GPU進入高速發(fā)展階段。
當(dāng)然,國內(nèi)AI芯片廠商在發(fā)展的過程中也存在一些問題,例如國產(chǎn)AI芯片多采用NPU架構(gòu),例如華為昇騰、寒武紀(jì)等,NPU架構(gòu)的優(yōu)點在于體積小、功耗低、平均性能強,但其問題在于前期投入成本高、不可編輯,且技術(shù)風(fēng)險較大。