彭慧
(湖南財政經濟學院,湖南長沙 410205)
基于CMP的高密度計算機多目標設計方法分析
彭慧
(湖南財政經濟學院,湖南長沙 410205)
基于CMP的高密度計算機的特點是性能高、集成度高、熱密度高、復雜性高,因此研制這種面向高端應用的計算機是一項十分復雜的系統工程.在該計算機研制的每一個環節中,都需要同時兼顧多個目標,并使其功能、性能以及可靠性相互制約.因此,在實踐中,如何有序展開這方面的權衡設計,是相關工作者亟待解決的重要問題.本文詳細闡述了權衡設計方法的重要性,并針對具體設計流程中其性能、功能、可靠性等特點進行研究.
CMP;高密度計算機;多目標;設計方法
近年來,由于計算機技術的迅猛發展,處理器結構也發生了本質變化,逐漸由傳統的單核處理器轉向多核(chip multiprocessor,CMP)、集成工藝,高密度、高效能計算機也在這一背景下誕生了,其具有高熱密度、復雜性及高集成性的特征,將其集中起來并設計成為一項十分復雜的系統工程.針對計算機中每一環節橫向上來看,該系統的性能、功能及有效性的設計過程中,都應兼顧多種目標,各目標之間又有著相互聯系、相互制約的關系,任何一項功能的增加,與之對應的是器件故障與能耗的不斷增加,這將直接導致高頻信號的出現率提升,進而對系統的整體可靠性產生不利影響.因此,當系統功耗一定時,應在系統功能的完備性和系統性能的高端之間保持平衡,實現系統的安全、有效運行.在這一背景下,針對基于CMP的高密度計算機多目標設計方法進行分析迫在眉睫,具有劃時代的意義.
超級計算機已經進入了千萬億次時代,并逐步向萬萬億次轉變.據相關調查顯示,世界前10臺計算機的各項性能均達到了每秒1千萬億次的浮點操作(peta floating point operations per second. Pflops),排名第一的實測峰值遠遠超過了這一標準,達到了8.3 Pflops,計算機的各項性能、規模得到了有效提高,但是超級計算機也面臨著性能體積比、可擴展性及性能功耗比等多種問題,提出了多維度、嚴格的設計目標.“計算機支持下的協同工作”概念的提出,使斯坦福大學的PACT取得了一定程度的進步.現有電磁兼容與設備散熱的協同設計都取得了一定成效,但就高密度計算機來說,由于其物理工藝、應用需求及設計目標之間的相互關系不是一成不變的,所涉及到的領域十分廣泛,對計算機性能、功能及面積等的協調性和兼顧有著較高的要求,權衡設計方法便應運而生了,其與輔助工具相比,更具適用性.
2.1 機器結構
超級計算機的構建是基于模塊化結構之上的,實現了計算節點的全面設計.從特定性能的計算結點來看,松散型或高密度設計的選擇是十分關鍵的問題.從計算機的性能上看,由于信噪比和系統能耗的原因,限制了系統總線鏈路的最大線長,使鏈路的傳輸延遲相對增加,而高密度設計則更好地保證了總線信號傳輸的穩定性和完整性,最大限度縮短傳輸延遲的時間;從系統功能來看,低密度更多的采用市售元件,可選擇性較強,有助于設計難度的降低;從系統的結構和散熱來看,高密度可節省空間,并易于物理擴展,但與之對應的是熱設計難度的不斷加大,導致多功能難以實現.
2.2 印制板布局
對印制板進行布局處理時,應始終將功能作為前提條件,對布線工作的是否可行以及是否便捷進行評估,并將印制板的體系結構納入到整體考慮范圍內,同時還應將熱密度均勻性、信號完整度對可靠性的影響作為參考.而在具體的設計過程中,應實現物理布局模型、功能模塊原理以及熱分析三類視圖間的電路板自由切換,并要求有關設計人員掌握所有視圖中的改變結果,以便更好實現設計優化質量的提升.當在針對處理器互聯網的規模、種類等進行挑選并確認無誤后,便應注重到印制板的結構與散熱設計,并在此基礎上進行布局方案設定.
一種布局主要包括三個部分:一是主板部分,主板為左右兩板,相互對稱,并有插件互連;二是電源部分,電源放置于主板兩側;三是風扇部分,風扇位于主板的前端;另一種布局中的主板為上下兩板,8行CPU共16片,呈現“之”字形.
前者具有散熱風路暢通、布局規整、線路清晰等特點,但考慮到這一處理器的排列方式為縱向兩路,在橫向上相對更為狹窄,而縱向則表現出過長的特征,要求加大布線量,給印制板的加工帶來較大難度,而后者具有主板熱流密度低、面積適中等優點,便于制板.
2.3 芯片選型
計算機芯片不僅可以實現高密度計算機功能與性能,同時也是發熱源.因此要重視芯片選型,在其滿足計算機功能的基礎上,還應同時考慮芯片的體積、性能和功耗等方面.例如在選擇通信芯片時,除了要重視其網絡連通性,同時要注意芯片的不同幅度性能,因為性能相近的芯片在功耗與體積方面都各有不同.在處理器、芯片組、通信芯片、電源轉換芯片等裝置型號的選擇方面,一般應將上述各類配件的性能、散熱性以及具體功用作為對設計方案進行權衡時的關鍵要素.現以電源轉換芯片為例對此加以說明,就下圖1中的C布局示意圖而言,當其電源的功能水平可很好地滿足需求的前提下,可以從兩個方面設計優化的電源方案,一是性能方面,二是優化方面,這就導致了兩種優化布局的形成,下圖2及圖3即是對應的兩類優化后布局示意圖.由圖2的C.1示意圖可知,電源芯片的位置處于內存條相交區域的間隙內,而在圖3的C.2示意圖中則不難發現,電源芯片的位置處于在印制板邊緣,即內存外側,一個風道被其單獨占用.表1所示為兩種方案相對應的電源芯片溫控目標.

圖3 布局C示意圖

圖4 布局C.1示意圖

圖5 布局C.2示意圖
在表1中可以得知,兩種優化布局方案對應的熱設計有較大差異,其具體表現在:第一,考慮到機箱側壁是否開孔對多個CPU散熱功能的影響及作用,由圖2可知,該布局方式分別進行了機箱側壁開孔以及側壁不開孔的對應設計;第二,通過讀圖可知,在相同印制板上的多個CPU等設備組件,通過巧妙設計使其共用同一個散熱器,確保各器件的溫度保持在均衡狀態;明顯提高;第四,在布局C.2中,主要散熱器與前后面板的開孔處于同一風路,在進風時器件能得到直接冷卻.

表1 兩種布局方案對應的電源選型的溫控目標
基于CMP的高密度計算機是否能實現預期的高性能、高可靠性、多功能以及較好的可擴展性,主要集中于其權衡設計是否良好.以16路1U Rack高密度計算機為例,該計算機作為性能、功能、散熱與結構權衡設計的最終成果,其占地面積為0.46m2,峰值性能為256GFlops,整個計算機的峰值功耗為226W/U.
在對較大規模運行的樣機進行測量,發現其單CPU的實測溫度在32℃以內,實測功耗在10.2W以內(如表2 所示).

表2 整機熱設計在CPU不同功耗下的散熱仿真效果數據表
在現階段的流通市場上,占據主導地位的計算節點普遍為兩路,四路以及更高的計算節點較為少見.表3中以IBM為例,將主流的高性能計算機與本文設計的計算機進行比較,可發現本文設計的計算機明顯具有密度高、消耗低的應有優勢.

表3 相關計算機的比較
由上表可知,16路1U Rack高密度計算機的權衡設計使相應的復雜功能得到良好滿足,不僅能夠較為顯著地表現出其能效高、功率消耗低的優勢,還有應對更高散熱壓力的較大潛力,其結構與熱設計都屬于高效解決方案.該計算機的龍芯3B八核CPU與龍芯3ACPU無差異,但其能耗相對更小,預測值為24-27w之間,故而從對CPU的升級層面來看,現有的熱設計能夠很好地滿足現階段的使用需求,且具有較為優良的擴展性與提升空間.
綜上所述,在系統設計過程中,應在時序縱向和環節橫向兩個方面做出權衡,不斷總結和完善,尋求出最具適用性的設計方法,推動高密度計算機各項功能、性能、有效性和可靠性的發展.本文對基于CMP的高效能計算機進行研究,結合國產的多核處理器中所配備的16路高密度計算機的有關研究方法,在權衡設計的理論前提下,對具體設計流程中其性能、功能、可靠性等特點,為基于CMP的高密度計算機多目標設計方法提供了思路與經驗.本研究中仍存在部分不足之處,希望后期有更多的專業人士投身到這一相關研究中,在現有研究基礎上進行深入探討,并提出改進意見,為我國計算機以及數據庫設計的創新與改革提供理論指導方向.
〔1〕李東生,高明倫.高密度集成與單芯片多核系統及其研究進展[J].半導體技術,2012(02):89-95.
〔2〕劉宇航,祝明發,崔吉順,等.基于CMP的高密度計算機多目標設計方法[J].系統工程與電子技術,2012(04):806-812.
〔3〕王曉軍.基于CMP的高密度計算機多目標設計方法探析[J].計算機光盤軟件與應用,2014(04):56-57.
〔4〕李東生.基于高密度計算的多核芯片設計關鍵技術研究[D].合肥工業大學,2012.
〔5〕李暉.高性能計算機若干關鍵問題研究[D].中國科學技術大學,2009.
〔6〕張軍華,臧勝濤,單聯瑜等.高性能計算的發展現狀及趨勢[J].石油地球物理勘探,2010(06):918-925+936+791-792.
TP338
A
1673-260X(2015)05-0011-03