
在2023中國算力大會上,工信部信息通信發展司司長謝存介紹,下一步,將出臺推動算力基礎設施高質量發展政策文件,強化頂層設計,提升算力綜合供給能力。
算力,這個近年來在學術界、產業界、公共討論空間中的新寵,起初只是超級計算領域關注的對象,代表著人們對“算得快”極致能力的不懈追求。時至今日,它已經歷了三次泛化,成為一種重要資源,廣泛應用于金融、醫療、能源、環境、交通等各個領域。
算力的第一次泛化,源自一個頗受爭議的區塊鏈產物——比特幣。在這個被“幣圈”稱為“挖礦”的虛擬貨幣生產鏈條中,“礦機”(即用來專門生產比特幣的電腦)每秒鐘能做多少次哈希計算,就成了它在比特幣網絡中能否取得優勢的關鍵。“礦機”中哈希算法輸出的速度,也就成了“算力”的度量單位。
算力的第二次泛化,來自于近年來不斷發展的數字經濟。在全球經濟領域,隨著第五代移動通信技術、大數據與物聯網技術的廣泛應用,“計算無所不在”成為一種趨勢。
隨著“算力”在數字經濟領域廣泛應用,我國政府宏觀經濟部門和以華為為代表的眾多企業提出了“算力指數”概念,即用來評估一個企業、一個區域乃至一個國家所能提供的總計算能力。之后,“算力經濟”“算力網絡”等概念也隨之而出。
其中,“算力網絡”的提出讓算力進入了基礎設施范疇。隨著一批超算中心、云計算中心的建立,高算力設備被密集地部署用于地方公共服務,算力的基礎設施屬性被不斷強化。

基于此,中國科學院計算技術研究所發明了一個構造詞來描述算力,即computility(compute+utility)。
算力的第三次泛化,則來自于奔騰至今的人工智能熱潮。深度學習技術的興起和突破,帶來了人工智能的熱潮,標志著信息化從數字化、網絡化走向智能化新階段。其中,人們把智能計算背后的三個驅動力歸結為智能三要素——算力、算法和數據,代表人工智能模型背后信息處理能力的“算力”更是獲得了前所未有的關注……
從中不難看出,未來,“看不見摸不著”的算力將會像水和電一樣“觸手可及”。
“云”實質上就是一個網絡。就像自來水廠一樣,使用者可以隨時獲取,但是要按使用量付費。
英特爾創始人戈登·摩爾曾說過:“集成電路上可容納的晶體管數目,約每隔兩年便會增加一倍”。在他看來,隨著處理器的性能每隔兩年翻一倍,計算機硬件的成本便會越來越低,直到單個企業也都能買得起大量服務器。
隨著豐富、低價的硬件資源在越來越多行業普及,許多大型企業發現,雖然在業務高峰期所需的硬件資源很多,但平均下來的負荷并不高,然而服務器還得按照最大需求來配,分配很不靈活,還會造成資源浪費。
“能不能將資源租出去呢?”——一些頭腦靈活的企業管理者們不約而同地想到,如果能把這些服務器閑置的能力整合成一個資源池,然后再出租給其他公司使用的話,不但變廢為寶,甚至還能開拓出新的商業模式。
正是這種“我來造池大家共飲”的思維轉變,催生了“云計算”。21世紀初,一些世界頂級互聯網公司提出了“云計算”的相關概念,并推動了“云計算時代”的開啟。
這些開展“云計算”業務的互聯網公司并不是直接出租實體服務器,而是把多臺服務器的CPU、內存、硬盤、網卡虛擬化為計算、存儲、網絡三大類資源池,再分成小塊靈活組合后租給用戶,這就是所謂的“資源池化”。
手握虛擬化的資源池,服務提供商按照用戶需求的不同,將服務級別劃分成了三級。這也就是我們熟悉的IaaS(基礎設施即服務)、PaaS(平臺即服務)、SaaS(軟件即服務)的由來。
其中,IaaS譯為“基礎設施即服務”,也叫“基礎云”。其只是簡單出租計算、存儲、網絡資源,并將這幾類資源組合成虛擬服務器。至于用戶在上面裝什么系統、開發什么軟件、開展什么業務,完全由自己搞定。這就像直接出租地皮一樣,用戶在上面蓋什么房子、種什么花草蔬菜、養什么寵物,自己來規劃。

直接出租什么軟件都沒有的虛擬服務器,雖說靈活性很大,但對有些用戶來說使用難度太高了,因此一些服務提供商將操作系統、數據庫、軟件開發環境等基礎的開發平臺搭建好,就好比為用戶蓋好了房子,通上了水、電、天然氣。這種級別的服務就叫做PaaS,譯為“平臺即服務”。
對于那些沒有時間、精力,也沒有雄心壯志開發什么軟件、只想“拎包入住”的用戶,特別是這類用戶占比還非常大,服務提供商則直接在云平臺上把各種軟件裝好,讓用戶隨時登錄使用就好。這種級別的服務就叫做SaaS,也就是“軟件即服務”。
可以說,云服務就是這樣的理所當然。就像你不需要筑壩蓄水、引水凈水,只需付錢,打開水龍頭就有水用;你也不需要燒煤發電、建設電網,只需付錢就能用電一樣。“云計算”,已經成了信息時代的水和電。
你是否思考過,瀏覽網頁、發送消息以及網購訂單的數據都從何而來,又在哪里運算、存儲?
一切問題的答案,都指向互聯網時代的“糧倉”——互聯網數據中心(Internet Data Center)。
如果說一個個如同“臺式大電腦”一樣的服務器是存儲數據的基本物理單元,那么將10臺服務器放在一個2米多高的柜子里,就形成了機柜。這些機柜不僅需要持續供電,還要有一個能散熱、不震蕩、沒灰塵的環境,于是便有了供眾多機柜集中存放,兼具恒溫、恒濕,防靜電、防震等多項功能的場所——機房。把機房造的足夠大,或者是將幾百乃至上千個機房集結在一起,就成了數據中心。

從地理層面來說,互聯網數據中心必須遠離會帶來灰塵的火力發電廠,還要避開地震帶、臺風、易澇區域,確保地質穩定,且周邊沒有大的噪聲源。
“第三方服務”是互聯網數據中心最為突出的特質。就服務層面而言,互聯網數據中心主要聚焦于數據托管,開展服務器托管業務。通過購買這一“第三方服務”,政府部門、企事業單位就無需再建立專門機房、鋪設昂貴的通信線路,也無需高薪聘請網絡工程師,就可以解決自己使用互聯網的許多專業需求。
在20世紀90年代,一些有服務器硬需求的企業,考慮到噪聲、安全性等因素,開始選擇租用運營商的場地、電力、網絡寬帶,讓對方代為管理和維護。
1997年,蘋果公司推出了一款名叫“Virtual PC(虛擬PC)”的虛擬機軟件。后來,VMWare也推出了現在大名鼎鼎的VMWare Workstation。這標志著虛擬機時代的到來,也為數據中心的演進打下了基礎。
21世紀初,隨著“云計算”的誕生,數據中心迎來了自己的新階段并持續至今——“云計算”階段。
在這一階段,互聯網數據中心通過虛擬化技術、容器技術,將所有CPU、內存、硬盤等資源交由更為強大的虛擬化軟件管理,然后分配給用戶使用,并實現了從物理硬件出租到虛擬硬件出租、軟件平臺出租、服務出租的進化。
帶著多種多樣的服務,互聯網數據中心開始走進千家萬戶、融入生產生活。
2022年12月,微軟投資的AI創業公司OpenAI推出的對話式AI ChatGPT意外出圈,讓人們對“大模型”有了模糊的第一印象——人工智能、人機交互、海量數據處理。
其實,ChatGPT只是大模型在自然語言處理領域中的一個典型應用。所謂的大模型指的是具有非常龐大的參數數量的深度神經網絡模型。這種模型通常需要在大規模的數據集上進行訓練,以盡可能地提高預測準確度。
時至今日,轟轟烈烈的全球大模型浪潮已經持續了七個月,從赫赫有名的OpenAI、Google、Anthropic、Meta,到國內互聯網科技巨頭百度、阿里巴巴、騰訊、京東、華為、360,推出的各種大模型產品已多達數百個,可謂層出不窮。

百度的“文心一言”、阿里巴巴的通義大模型、騰訊的行業大模型……在這場“百模大戰”中,國內大模型活力驚人,已廣泛涉及創業、投資、融資、應用等各個領域。
據中國科學技術信息研究所5月發布的《中國人工智能大模型地圖研究報告》顯示,截至5月28日,國內10億級參數規模以上基礎模型至少已發布了79個,個個都是一等一的大模型。
那么,大模型到底是如何界定的?會產生怎樣的影響效應?
相關專家表示,那些擁有數億乃至數十億個參數的復雜深度神經網絡模型背后,往往意味著大量計算資源、存儲空間、時間和電力等資源的占用,這是大模型區別于小模型的關鍵所在。
有趣的是,標準不是一成不變的,隨著AI技術的不斷迭代,關于“大模型”的標準也在不斷提高。
“在2022年,10億參數的模型就叫大模型,但現在公認的大模型參數動輒上千億”,百度集團副總裁侯震宇介紹說:“因為千億參數以上才會出現‘智能涌現’效應,才會形成泛化能力,才能在各個場景下具備通用能力。基于這種大模型精調出來的模型才具備更好的產業應用效果。”
所謂“智能涌現”效應,指的是模型規模、算力水平超過某個參數閾值后,AI效果將不再是隨機概率事件。
在通用領域,參數量越大,智能通常涌現的可能性就越大,AI準確率也會更高。以百度旗下“文心一言”舉例,在進行中國工業互聯網研究院的系統性知識問答評測中,千億參數級別的“文心一言”表現搶眼,在電子設備、裝備、鋼鐵、采礦、電力、石化、建材等七大行業均獲國內第一。
在專用垂直領域,大模型裁剪優化后更容易獲得精確的效果。以華為云盤古氣象大模型舉例,過去要預測一個臺風未來10天的路徑,人們需要大約3000臺服務器的高性能計算機集群花費5小時進行仿真模擬計算,而現在通過大模型只需要1臺服務器,再等上10秒鐘就能完成臺風路徑的預測。
目前來看,國內互聯網巨頭的大模型正接連投入“實戰”,在商業場景落地方面不斷打磨,大模型賦能產業的序幕已然拉開。