■文/王 濤
除了使用新型節(jié)能技術(shù),提高算力資源的規(guī)模化程度,可以減少算力設(shè)施本身的碳排放以外,高效充分利用算力設(shè)施不僅可以極大地加快研發(fā)創(chuàng)新進(jìn)程,減少研發(fā)過程的碳排放,還可以優(yōu)化生產(chǎn)經(jīng)營流程,減少生產(chǎn)運(yùn)營的碳排放,助力實(shí)現(xiàn)“雙碳”目標(biāo)。
2020年9月,在第七十五屆聯(lián)合國大會(huì)一般性辯論上,我國首次提出要在2030年前實(shí)現(xiàn)碳達(dá)峰,2060年前實(shí)現(xiàn)碳中和的目標(biāo)。面對(duì)此項(xiàng)重大任務(wù),我國社會(huì)經(jīng)濟(jì)各行業(yè)的綠色發(fā)展轉(zhuǎn)型勢(shì)在必行。長期以來,超級(jí)計(jì)算機(jī)等算力設(shè)施的能源消耗巨大,一直是超級(jí)計(jì)算機(jī)的核心指標(biāo)之一,也一直是算力設(shè)施建設(shè)的主要屏障之一。如何提高能源使用效率是計(jì)算機(jī)技術(shù)的重要研究方向。在每年兩次發(fā)布的國際超級(jí)計(jì)算機(jī)排行榜單中,除了衡量算力大小的Top 500 榜單以外,Green 500 榜單是用來衡量超級(jí)計(jì)算機(jī)的能效,即每瓦電力消耗所獲得的計(jì)算性能。在2021年7月最新發(fā)布的Green 500 榜單中,目前能效比排名第一的是來自日本的MN-3 超級(jí)計(jì)算機(jī),達(dá)到了每瓦29.7 GFLOPS 的計(jì)算能力,而目前計(jì)算速度最快的超級(jí)計(jì)算機(jī)是日本的富岳,能效比僅排名第20 位。我國目前公開上榜的能效比最高的超級(jí)計(jì)算機(jī)排名第27 位,能效為每瓦11.38 GFLOPS。除了計(jì)算機(jī)本身的計(jì)算能效技術(shù)以外,我國算力設(shè)施在提高能源使用效率的其他方面還有廣闊的空間。
在算力基礎(chǔ)設(shè)施中,除了計(jì)算機(jī)芯片本身消耗電力以外,散熱和環(huán)境制冷也消耗了較大比重的電能。減小散熱的消耗、提升能耗效率,成為算力基礎(chǔ)設(shè)施碳中和的重要指標(biāo)。在衡量算力設(shè)施能源使用效率方面,人們往往用電源使用效率(Power Usage Effectiveness,PUE)作為評(píng)價(jià)指標(biāo)。PUE 是數(shù)據(jù)中心消耗的所有能源與信息設(shè)備消耗的能源的比值。其中,數(shù)據(jù)中心總能耗包括信息設(shè)備能耗和制冷、配電等外圍配套系統(tǒng)的能耗。PUE 的值一般大于1,越接近1 表明非信息設(shè)備耗能越少,即能效水平越高。
目前,數(shù)據(jù)中心采用的散熱和制冷方式主要包括風(fēng)冷和液冷兩種。風(fēng)冷是大多數(shù)現(xiàn)存?zhèn)鹘y(tǒng)數(shù)據(jù)中心采用的散熱方式。它通過房間級(jí)或機(jī)柜排級(jí)空調(diào)進(jìn)行制冷,制冷功耗高,噪聲大,平均實(shí)現(xiàn)的PUE 為1.5 ~1.8。相對(duì)于液冷方式,風(fēng)冷方式的主要缺點(diǎn)如下:首先,風(fēng)冷限制了單機(jī)箱功率密度增長,布置相同功耗的信息設(shè)備,占用空間顯著增加;其次,風(fēng)冷易產(chǎn)生局部熱點(diǎn),使芯片長期處于臨界安全溫度運(yùn)行,性能下降,壽命縮短;再者,風(fēng)冷對(duì)機(jī)房環(huán)境要求更高,且長期運(yùn)行造成環(huán)境噪聲污染。但是,對(duì)小規(guī)模、較低單機(jī)柜功率的數(shù)據(jù)中心而言,風(fēng)冷仍然是目前普遍應(yīng)用的散熱方式。
液冷技術(shù)是目前新興的一種數(shù)據(jù)中心散熱技術(shù)。它使用液體取代空氣作為冷媒,為發(fā)熱部件進(jìn)行換熱帶走熱量,分為間接冷卻和直接冷卻。其中,間接冷卻以冷板式液冷技術(shù)為主,直接冷卻以浸沒式液冷技術(shù)為主,并分為相變和非相變兩種。
冷板式液冷是用銅、鋁等導(dǎo)熱性較好的金屬構(gòu)成的冷板散熱器,將發(fā)熱元器件的熱量傳導(dǎo)給散熱器中的冷卻液體,從而將熱量帶走的冷卻方式。其中的冷卻液體可以采用去離子水、水溶液、氟化液等。整個(gè)冷卻系統(tǒng)分為一次側(cè)循環(huán)與二次側(cè)循環(huán)。一次側(cè)循環(huán)為室外側(cè)冷卻塔/冷水機(jī)組等設(shè)備與換熱單元的換熱,即高溫冷卻液與室外側(cè)冷水進(jìn)行熱交換,將熱量傳遞給室外側(cè)的低溫水,從而變成低溫冷卻液,再次輸送到服務(wù)器吸熱。二次側(cè)循環(huán)為換熱單元與服務(wù)器冷板的換熱,即服務(wù)器中冷板式散熱器的低溫冷卻液通過熱交換,吸收發(fā)熱器件產(chǎn)生的熱量,變成高溫冷卻液,輸送到室外冷卻塔。冷板液冷服務(wù)器安裝在機(jī)架中,與傳統(tǒng)風(fēng)冷環(huán)境共同制冷,其中風(fēng)冷負(fù)責(zé)液冷冷板無法覆蓋的部件,散熱占比為10%~30%。整個(gè)系統(tǒng)的平均PUE 為1.2 左右,與傳統(tǒng)風(fēng)冷服務(wù)器相比,節(jié)電率約45%。我國目前公開報(bào)道的最快超級(jí)計(jì)算機(jī)“神威太湖之光”采用的就是冷板液冷技術(shù)。
浸沒式液冷是另外一種效率更高的散熱技術(shù)。它將服務(wù)器完全浸沒在液冷機(jī)柜內(nèi)的非導(dǎo)電冷卻液中,液體與發(fā)熱芯片直接接觸換熱,通過工作介質(zhì)的循環(huán)流動(dòng)或蒸發(fā)冷凝帶走熱量。整個(gè)系統(tǒng)無須傳統(tǒng)風(fēng)冷輔助制冷,液冷散熱占比為100%,PUE 可降到1.1 以下。根據(jù)工作介質(zhì)或冷卻液是否發(fā)生相變,浸沒式液冷可分為單相式冷卻和兩相式冷卻。單相式冷卻即溫差換熱,利用冷卻液的升溫帶走熱量,冷卻液在循環(huán)過程中始終保持液態(tài)。冷卻液吸收服務(wù)器熱量溫度升高后,用泵驅(qū)動(dòng),與室外的冷卻塔或干冷器進(jìn)行熱量交換,變?yōu)榈蜏乩鋮s液,流回液冷機(jī)柜,完成內(nèi)部循環(huán)。兩相式冷卻即沸騰換熱,冷卻液在循環(huán)散熱過程中發(fā)生相變,由液態(tài)變成氣態(tài),通過相變吸熱帶走服務(wù)器產(chǎn)生的熱量。氣態(tài)冷卻液與室外干冷器進(jìn)行熱量交換,冷凝成液態(tài),流回液冷機(jī)柜,完成散熱循環(huán)。相對(duì)來說,兩相式液冷的傳熱效率更高,但對(duì)冷卻液和密封性要求較高。目前,我國最新研制的部分超級(jí)計(jì)算機(jī)就是采用兩相式浸沒液冷技術(shù)。
從成本角度來看,規(guī)模化建設(shè)算力資源將帶來可觀的成本和碳排放收益。風(fēng)冷技術(shù)前期投入較低,一些小規(guī)模、分散、低密度的算力設(shè)施依然愿意采用傳統(tǒng)風(fēng)冷的制冷方式。液冷技術(shù)有較高的前期機(jī)房建設(shè)成本,只有在算力設(shè)施達(dá)到一定規(guī)模后,才能獲得成本效益,因此適合于較大規(guī)模的計(jì)算中心或數(shù)據(jù)中心采用。據(jù)某服務(wù)器廠商測(cè)算:當(dāng)服務(wù)器數(shù)量少于288 臺(tái)時(shí),冷板液冷方式的制冷配套費(fèi)用占總投資的比例隨著服務(wù)器數(shù)量的減少而顯著攀升;而當(dāng)服務(wù)器數(shù)量大于288 臺(tái)時(shí),冷板液冷方式的制冷配套費(fèi)用占總投資的比例維持在2%~3%。同樣以288 臺(tái)典型服務(wù)器為例,采用冷板液冷方式的計(jì)算平臺(tái)與采用傳統(tǒng)風(fēng)冷方式的計(jì)算平臺(tái)相比,運(yùn)行3年節(jié)約的電費(fèi)可完全覆蓋采用液冷方式所增加的投資。隨著服務(wù)器數(shù)量的增加,所節(jié)約的電費(fèi)也顯著增加。例如,若服務(wù)器數(shù)量增加到480 臺(tái),液冷平臺(tái)3年的建設(shè)和運(yùn)營總成本比風(fēng)冷平臺(tái)少0.7%,6年少7.3%。正是考慮到規(guī)模化建設(shè)算力設(shè)施所帶來的成本和碳排放收益,近年來,全球小微型數(shù)據(jù)中心的數(shù)量顯著下降,而大型和超大型數(shù)據(jù)中心的數(shù)量持續(xù)增加。例如,從2016年到2019年,全球數(shù)據(jù)中心減少約2.1 萬個(gè),而機(jī)架數(shù)增加約6.5 萬個(gè)。
從政策角度來看,我國為了提高數(shù)據(jù)中心的能效,已開始限制高PUE 的數(shù)據(jù)中心的建設(shè),相關(guān)政策對(duì)數(shù)據(jù)中心機(jī)房的PUE 提出了明確限制,鼓勵(lì)液冷技術(shù)、IT 設(shè)備高密度集成技術(shù)及IT 設(shè)備能效提升技術(shù)實(shí)施,促進(jìn)數(shù)據(jù)中心液冷技術(shù)進(jìn)一步發(fā)展。例如:2019年,工信部、國家機(jī)關(guān)事務(wù)管理局、國家能源局等三部門出臺(tái)的《關(guān)于加強(qiáng)綠色數(shù)據(jù)中心建設(shè)的指導(dǎo)意見》提出,到2022年,數(shù)據(jù)中心平均能耗基本達(dá)到國際先進(jìn)水平,新建大型、超大型數(shù)據(jù)中心的電能使用效率值PUE 為1.4 以下;2018年,北京市政府公布的《北京市新增產(chǎn)業(yè)的禁止和限制目錄(2018年版)》提出,禁止新建和擴(kuò)建互聯(lián)網(wǎng)數(shù)據(jù)服務(wù)、信息處理和存儲(chǔ)支持服務(wù)中的數(shù)據(jù)中心,但PUE 值在1.4 以下的云計(jì)算數(shù)據(jù)中心除外;2019年,上海在《關(guān)于加強(qiáng)本市互聯(lián)網(wǎng)數(shù)據(jù)中心統(tǒng)籌建設(shè)的指導(dǎo)意見》中提出,新建互聯(lián)網(wǎng)數(shù)據(jù)中心PUE 值嚴(yán)格控制在1.3 以下,改建互聯(lián)網(wǎng)數(shù)據(jù)中心PUE 值嚴(yán)格控制在1.4 以下,且新建互聯(lián)網(wǎng)數(shù)據(jù)中心單項(xiàng)目規(guī)模原則上應(yīng)不低于3 000 個(gè)機(jī)架。因此,算力設(shè)施作為面向高質(zhì)量發(fā)展需要,提供數(shù)字轉(zhuǎn)型、智能升級(jí)、融合創(chuàng)新等服務(wù)所必需的新型基礎(chǔ)設(shè)施,要達(dá)到以上能效要求,規(guī)模化、綠色化是必然選擇。
將算力資源高效充分利用是更高效的節(jié)能減排。在當(dāng)前碳達(dá)峰、碳中和的大背景下,高效充分使用算力資源具有特別重要的意義。
算力設(shè)施可以極大地加快研發(fā)創(chuàng)新進(jìn)程,減少研發(fā)過程的碳排放。目前,計(jì)算模擬手段已成為科學(xué)和工程領(lǐng)域內(nèi)最重要的創(chuàng)新方法之一。很多物理實(shí)驗(yàn)可以被計(jì)算模擬替代,對(duì)于一些極端環(huán)境、危險(xiǎn)困難、代價(jià)高昂的研究內(nèi)容,計(jì)算仿真模擬是不可替代的研究手段。近十幾年來,計(jì)算仿真對(duì)工業(yè)工程領(lǐng)域產(chǎn)生了巨大的影響,并被廣泛用于替代產(chǎn)品研制的傳統(tǒng)方法。很多產(chǎn)品的設(shè)計(jì)制造、運(yùn)行環(huán)境和工程建設(shè)環(huán)境都通過計(jì)算仿真手段進(jìn)行模擬,計(jì)算仿真的水平已成為衡量工業(yè)企業(yè)競(jìng)爭力的主要標(biāo)志之一。例如,在汽車、航空航天和重型裝備制造企業(yè),全周期計(jì)算機(jī)輔助工程技術(shù)被運(yùn)用到從新產(chǎn)品研發(fā)到失效測(cè)試直至老產(chǎn)品的維護(hù)等多個(gè)方面,大大降低了原型產(chǎn)品和測(cè)試產(chǎn)品的數(shù)量,節(jié)省了開支,提高了效率。在鋼鐵行業(yè),計(jì)算模擬被用于產(chǎn)品開發(fā)的物理試驗(yàn)、理化解析、中試生產(chǎn)等,代替了以前動(dòng)輒用大生產(chǎn)線進(jìn)行的試驗(yàn),使產(chǎn)品開發(fā)過程變得科學(xué)、高效和經(jīng)濟(jì)。通過對(duì)物理試驗(yàn)的大量替代,特別是對(duì)一些高能耗、高污染的試驗(yàn),計(jì)算仿真在很大程度上減少了研究開發(fā)過程的碳排放。
算力設(shè)施可以極大地優(yōu)化生產(chǎn)經(jīng)營流程,減少生產(chǎn)運(yùn)營的碳排放。隨著大數(shù)據(jù)、人工智能技術(shù)的興起,算力資源被廣泛用于環(huán)保、交通、工業(yè)生產(chǎn)、城市治理等多個(gè)場(chǎng)景,優(yōu)化生產(chǎn)運(yùn)營流程,實(shí)現(xiàn)減排增效。將計(jì)算能力與工業(yè)互聯(lián)網(wǎng)數(shù)據(jù)分析平臺(tái)相結(jié)合,可以幫助企業(yè)分析改善智能設(shè)備在實(shí)際工作條件下的性能,實(shí)現(xiàn)工業(yè)自動(dòng)化控制、智能化管理,提升企業(yè)生產(chǎn)力和工作效率,有效減少能源使用和碳排放。例如:在鋼鐵行業(yè),神經(jīng)網(wǎng)絡(luò)計(jì)算被用于對(duì)煉鐵、煉鋼、軋鋼等工藝環(huán)節(jié)的能耗和用料進(jìn)行精準(zhǔn)預(yù)測(cè),從而對(duì)生產(chǎn)物資進(jìn)行調(diào)整,節(jié)約成本與能耗;在運(yùn)輸行業(yè),車路協(xié)同技術(shù)通過實(shí)時(shí)交互車路動(dòng)態(tài)信息,采用人工智能計(jì)算,對(duì)整體道路流量、交通事件、路況進(jìn)行預(yù)判,實(shí)現(xiàn)車輛之間、車輛與基礎(chǔ)設(shè)施之間的智能協(xié)同,達(dá)到提高車輛配置效率、降低車輛燃油消耗等減排增效的目標(biāo)。算力設(shè)施和信息技術(shù)的使用大大提升了生產(chǎn)、生活和經(jīng)營活動(dòng)的效率,減少了生產(chǎn)運(yùn)營的碳排放。
算力設(shè)施可以極大地優(yōu)化生產(chǎn)經(jīng)營流程,減少生產(chǎn)運(yùn)營的碳排放。隨著大數(shù)據(jù)、人工智能技術(shù)的興起,算力資源被廣泛用于環(huán)保、交通、工業(yè)生產(chǎn)、城市治理等多個(gè)場(chǎng)景,優(yōu)化生產(chǎn)運(yùn)營流程,實(shí)現(xiàn)減排增效。
算力設(shè)施是支撐我國未來科技創(chuàng)新、經(jīng)濟(jì)發(fā)展和社會(huì)治理的重要新型基礎(chǔ)設(shè)施。不僅其本身需要采用新型節(jié)能技術(shù),進(jìn)行集約化、規(guī)模化建設(shè),共享使用,提高能源使用效率,減少自身的碳排放,而且需要將其廣泛應(yīng)用于生產(chǎn)生活的各個(gè)方面,使傳統(tǒng)產(chǎn)業(yè)智能化、智慧化,提升資源使用效率,從整體上減少全社會(huì)的碳排放,助力我國早日實(shí)現(xiàn)“雙碳”目標(biāo)。