李飛云

阿爾法狗戰(zhàn)勝李世乭用了1920個CPU,256個GPU,它的運算效率約3千萬億次,能耗約500千瓦左右,而李世乭只消耗了約0.1千瓦。
“阿爾法狗戰(zhàn)勝李世乭后,很多人都希望有一個象阿爾法狗這樣的大腦。大家有所不知,阿爾法狗用了1920個CPU,256個GPU,它的運算效率約3千萬億次,能耗約500千瓦左右,而李世乭只消耗了約0.1千瓦,我們可以想像未來在能耗方面是一個多么大的挑戰(zhàn)!”王恩東如此說道。
云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、以大數(shù)據(jù)為依托的人工智能時代的來臨,給人類帶來莫大的興奮和激動,中國工程院院士、中國大數(shù)據(jù)專家委員會副主任委員、中國電子學會云計算專家委員會副主任委員王恩東日前在第八屆中國云計算峰會上給這些炙手可炎的熱潮澆上了一桶冷水:在智慧計算時代,能耗面臨巨大挑戰(zhàn)。
他預測,到了2020年之后,計算可分為三類,一類是面向解決重大科學問題的科學計算;另一類就是如金融、通信應(yīng)用里一些關(guān)鍵應(yīng)用計算;更大的一類可以歸納為智慧計算。
高能耗的數(shù)據(jù)中心
不久前,麥肯錫曾經(jīng)對影響世界的22項技術(shù)做了一次調(diào)查和分析,排在前5位的是移動互聯(lián)網(wǎng)、自動化、物聯(lián)網(wǎng)、云計算、機器人。由此可見,計算機技術(shù)對人類生活、社會發(fā)展將產(chǎn)生越來越大的影響和作用,包括現(xiàn)在炒得很熱的人工智能,更被視為是未來的發(fā)展趨勢。然而,王恩東院士在此時潑了一股冷水,他舉例說,谷歌人工智能,用了十天的時間,通過識別一千萬張圖片,教會了計算機能夠認識貓的圖片,這項人類只需3毫秒就能認識一只貓,作為擁有強大系統(tǒng)的計算機,需這么長時間,它的能耗是“非常非常大的”。
王恩東院士舉例說,目前全球數(shù)據(jù)中心的能耗,每年是3千億千瓦時,中國的數(shù)據(jù)中心大概是1千億千瓦時,相當于一個三峽大壩的總發(fā)電量。現(xiàn)在都在考慮如何降低能耗,而數(shù)據(jù)中心實際用在IT設(shè)備里,PUE值(是評價數(shù)據(jù)中心能源效率的指標,基準是2,越接近1表明能效水平越好)都比較低,美國用自然風制冷,大概能做到1.1和1.1以下,而國內(nèi)包括大規(guī)模的數(shù)據(jù)中心,基本上都是在1.5和2.0之間;現(xiàn)在傳統(tǒng)的PUE值都超過了3,甚至超過4, 就是說大量的能耗并非全用在IT設(shè)備上,今天人工智能的發(fā)展,對能耗會提出更大的挑戰(zhàn)。
“阿爾法狗戰(zhàn)勝李世乭后,很多人都希望有一個象阿爾法狗這樣的大腦。大家有所不知,阿爾法狗用了1920個CPU,256個GPU,它的運算效率約3千萬億次,能耗約500千瓦左右,而李世乭只消耗了約0.1千瓦,我們可以想像未來在能耗方面是一個多么大的挑戰(zhàn)!”王恩東院士如此說道。
數(shù)據(jù)中心集中規(guī)模化帶來的挑戰(zhàn)
隨著智慧計算時代的到來,數(shù)據(jù)量的爆發(fā),使得計算重心向后轉(zhuǎn)移,通過物聯(lián)網(wǎng),前端設(shè)備可以將各種數(shù)據(jù)持續(xù)向后端傳輸,同時數(shù)據(jù)來源多樣性、格式的復雜性和語義的不確定性,使得前端設(shè)備愈來愈趨向輕量發(fā)展,而數(shù)據(jù)中心正朝著集中化、規(guī)模化發(fā)展。
目前,國內(nèi)互聯(lián)網(wǎng)企業(yè)進入全球互聯(lián)網(wǎng)前十強的,有阿里、百度、騰訊和京東,與全球前3家的谷歌、亞馬遜和Facebook,可看到全球大規(guī)模數(shù)據(jù)中心服務(wù)器都非常大:騰訊百度都有50萬臺左右的服務(wù)器,阿里約60萬臺,最多如美國的亞馬遜約有300臺。王恩東說:“在2012年有5萬臺就是最大的數(shù)據(jù)中心,而今天20萬臺、十幾萬臺的數(shù)據(jù)中心已經(jīng)不少了。預計到2020年單個數(shù)據(jù)中心50萬臺就會出現(xiàn),所以數(shù)據(jù)中心的規(guī)模化是一個很明顯的趨勢。”
王恩東院士認為,數(shù)據(jù)中心的集中化和規(guī)模化,也必然會帶來很多的問題和挑戰(zhàn)。
首先是性能。尤其是來自于CPU半導體性能的技術(shù)支撐。從2005年之后CPU的頻率就由于能耗、工藝等各方面的限制,基本上就停留在3G赫茲以下。隨著工藝越來越接近于極限,現(xiàn)在是14納米,接下來是7納米,再往下可能就變成幾個原子這樣一個寬度。所以半導體的工藝越來越挑戰(zhàn)極限。在過去三、四十年間,摩爾定律是半導體技術(shù)快速發(fā)展、性能提升的主要依據(jù),2014年ITTRS(半導體技術(shù)發(fā)展的組織)發(fā)布未來的半導體技術(shù)不再遵循摩爾定律。所以半導體發(fā)展在性能上會遇到一個大挑戰(zhàn)。
還有儲存和網(wǎng)絡(luò)的性能。因為架構(gòu)將計算和儲存做了分離,從CPU與內(nèi)存訪問的延遲,訪問中硬盤外存的延遲,延遲比例變化非常大,因此就形成了這種內(nèi)存強I/O(輸入/輸出)強,影響計算機系統(tǒng)性能的提升。而設(shè)備內(nèi)版間的網(wǎng)絡(luò)速度,和設(shè)備間的網(wǎng)絡(luò)速度是一個逐次遞減的過程,設(shè)備間要通過交換機分配到各個端口上去,交換的模式、交換機的背板限制了端口速度和帶寬。
第二個挑戰(zhàn)是效率的問題。一方面服務(wù)器、儲存的需求在快速增長,與此同時,它們的利用效率卻并不高。現(xiàn)在80%的服務(wù)器,利用效率在25%以下,全球數(shù)據(jù)中心的平均利用率約為15%。現(xiàn)在開始采用虛擬化的技術(shù),希望能夠提高效率,通過虛擬化,使資源能夠在不同的計算設(shè)備之間進行平衡。虛擬化在一定程度上提升了計算設(shè)備的總效率,然而還有很多制約效率的問題,到目前還沒有完全解決,如計算設(shè)備、儲存設(shè)備和網(wǎng)絡(luò)設(shè)備,事實上每一個設(shè)備里面,都有大量的計算、儲存和網(wǎng)絡(luò)的資源,但這些資源都是隔離的,它們之間并沒有得到共享。
此外,就是通用的CPU在效率上不如專用芯片要快。如何來解決這問題?就是能耗。數(shù)據(jù)中心要綠色、要節(jié)能,關(guān)鍵在于能耗的問題。
融合架構(gòu)過度瓶頸
計算能力出路在何方?王恩東院士認為盡管“融合”一詞并不是一個很好的詞,這只是更多地把現(xiàn)有技術(shù)給整合到一起,來滿足某種需要,“但既然今天計算技術(shù)在很多方面遇到了瓶頸,還沒有革命性解決方案出現(xiàn),在未來十年甚至更長的時期內(nèi),也許用融合技術(shù)來提升數(shù)據(jù)中心性能是一條路徑。”他推測,未來的數(shù)據(jù)中心是融合架構(gòu)的數(shù)據(jù)中心。
王恩東院士提出融合架構(gòu)分成三步走,第一步就是首先要把一些非計算的資源進行整合,滿足數(shù)據(jù)中心在能耗、密度方面的要求;第二步把一些儲存同計算、網(wǎng)絡(luò)進行整合;第三步要成為完全可重構(gòu)的數(shù)據(jù)中心,完全用軟件定義的數(shù)據(jù)中心。
什么是融合架構(gòu)?他解釋,即硬件網(wǎng)絡(luò)設(shè)備中的同類資源整合成一個資源池,不同的設(shè)備能夠任意的整合,在軟件的動態(tài)感知業(yè)務(wù)的資源需求,利用硬件重組的能力來滿足各類應(yīng)用的需要。這過程需要一些演進性技術(shù)支撐,像高速互聯(lián)技術(shù)的發(fā)展、新興內(nèi)存技術(shù)的發(fā)展、可重構(gòu)芯片的發(fā)展、軟件定義等,“尤其是高速的互聯(lián)技術(shù),使硅光互聯(lián)進入到芯片間的互聯(lián)成為一種可能,因為光傳輸與電傳輸相比有很多優(yōu)點;現(xiàn)在隨著半導體技術(shù)演進,使資源結(jié)構(gòu)由原來對結(jié)點的結(jié)構(gòu)、對芯片的結(jié)構(gòu),進入細密度的結(jié)構(gòu)。”
按照這樣的整合理念來做的計算儲存設(shè)備,比傳統(tǒng)設(shè)備表現(xiàn)出更強的優(yōu)勢。百度、阿里的數(shù)據(jù)中心,融合架構(gòu)的產(chǎn)品,在部署密度上提高了14%,功耗降低了15%。
另外就是新型儲存材料的出現(xiàn),會改變原來傳統(tǒng)計算機傳統(tǒng)層次,出現(xiàn)更大內(nèi)存的計算機,會縮減訪問慢速儲存所帶來的延遲或者效率資源的消耗。還有一種支撐技術(shù)就是半導體的3D技術(shù)發(fā)展,使處理器內(nèi)部增加速度,使可編程的芯片成為可能。