999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高性能計算處理器進展

2013-11-16 06:52:34季冬
中國教育網絡 2013年11期
關鍵詞:程序計算機

文/季冬

如何從軟件和硬件兩個方面來實現一個可靠和穩定的高性能計算機,是當前面臨的主要問題。

HPC關鍵挑戰

當前高性能計算領域發展面臨如下關鍵挑戰:

1.系統規模持續增大,系統功耗成為制約系統發展的主要瓶頸。例如,在去年SC12上發布的TOP500排名中,世界第一快的高性能計算機Titan包括56萬多處理器核,功率達到8.2MW(兆瓦)。如果按照Titan機器外推,未來的艾級(Exa-Scale)超級計算機的功率將達到300MW,每年的電費就需要大約3億美元。然而,美國能源部目前給高性能計算機設計人員提出的目標是,在20MW功率限制下實現艾級計算機。

2.系統可靠性和可用性。隨著系統規模持續增大,整機的平均無故障時間變得越來越小,如何從軟件和硬件兩個方面來實現一個可靠和穩定的高性能計算機,也是當前面臨的主要問題。

3.應用程序的可擴展性。目前硬件已經發展到很大規模,但是大量的科學應用程序還很難擴展到如此大規模的系統,如何優化當前重要的科學計算程序,使之擴展到大規模系統,同時開發支持大規模系統的性能分析和正確性調試軟件也是當前亟待解決的問題。

如果讓傳統的程序充分利用GPU加速設備,需要使用CUDA編程接口把程序中計算密集部分重新改寫,這無疑給傳統程序移植到GPU設備帶來很多挑戰。

主流解決方案

為了解決高性能計算機系統功耗面臨的挑戰,國際上目前主流的技術是采用通用處理器和加速部件混合的架構來提高整機的性能功耗比。在通用處理器方面,英特爾的至強處理器系列、IBM的Power處理器系列和AMD的Opteron系列是高性能計算機采用的主流處理器,在體系結構方面變化很少。

然而在加速部件上,卻存在很大的變化。Nvidia公司在幾年前發布的基于Fermi架構的圖形處理器,由于其在性能功耗比方面比通用處理器表現出了更好的性能,目前已經大量地應用在高性能計算機上,例如Titan高性能計算機和中國的“天河一號”都采用了Nvidia的圖形處理器。2012年,Nvidia又發布了基于Kepler架構的圖形處理器,在性能方面都有了顯著提升。英特爾公司在加速部件方面也不甘落后,在SC12上,英特爾公司首次官方發布了眾核協處理器Xeon Phi。在2013年中發布的TOP500中,排名第7的Dell公司研制的Stampede超級計算機就采用了最新的Phi處理器。本文重點分析下英特爾這款眾核處理器Phi。

Phi是基于英特爾的眾核集成體系結構設計(Many Integrated Core,MIC),最新發布的Phi處理器有兩個版本:Phi 3100和Phi 5100,都是采用英特爾最新的22納米工藝。Phi5100包括61個處理器核,支持320GB/s的內存帶寬,8GB的GDDR-5內存。每個核的處理器頻率在1GHz左右,每個核都具有32KB L1指令Cache,32KB L1數據Cache和512KB的L2 Cache,Cache之間支持一致性協議。每個處理器核包括4個硬件的線程,總共有244個硬件線程。所有核之間通過一個支持雙向通信的環(Bidirectional Ring)連接在一起,內存控制器均勻地分布在雙向環上。Phi協處理器通過PCI-E總線連接在服務器上,通過PCI-E和系統的處理器之間進行通信。在Phi協處理器上,運行一個單獨的操作系統,管理協處理器的各種硬件資源。

由于目前廣泛使用的Nvidia GPU在編程模型上主要采用CUDA編程接口,如果讓傳統的程序充分利用GPU加速設備,需要使用CUDA編程接口把程序中的計算密集部分重新改寫,這無疑給傳統程序移植到GPU設備帶來很多挑戰。對于英特爾的Phi協處理器,目前它支持多種編程模型。首先,傳統的基于MPI、OpenMP、Pthread等編程模型的并行程序可以無需任何修改直接運行在Phi處理器上。這種方式可以大大減少傳統程序移植到Phi加速部件的時間。其次,它支持對稱運行模式,即主機處理器和Phi協處理器同時執行并行程序的模式,例如一個并行的MPI程序可以同時在主機和協處理器上執行,這種模式可以充分利用主機處理器資源和協處理器資源。最后,Phi還支持英特爾提供的專有Offload編程模型,即僅僅把程序某部分計算模塊在Phi處理器上運行,其余部分仍然在主機運行。該種編程模型需要用戶修改原有程序,明確需要在主機和協處理器之間傳入和傳出的變量。此外,Phi協處理器還提供了512位向量處理單位,最多可以同時處理16個單精度或者8個雙精度運算。充分利用Phi處理器上的向量處理單元是提高程序性能的一個主要因素。

HPC處理器發展趨勢

通過對當前的高性能計算機分析,我們可以看出,在高性能計算領域處理器的發展存在如下趨勢:

1.為了提高高性能計算機整機的性能功耗比,采用通用處理器和加速部件的混合架構成為未來發展的主要趨勢。加速部件處理器的核心相對簡單,比通用處理器可以提供更高的性能功耗比。

2.加速處理器的核心數目增長迅速。目前英特爾Phi處理器最多包括61個核,244個硬件線程,Nvidia最新GPU已經有1000多個核。面對如此多的處理器核心,如何充分挖掘應用程序中的并行性,有效利用這么多的處理器核,是硬件設計人員給軟件開發人員提出的主要挑戰。

3.基于混合模型的高性能計算機對應用程序的移植和優化提出新的挑戰。一般加速部件的編程模型也相對復雜,在程序的性能分析和性能優化方面給程序開發人員提出了很多要求。盡管英特爾的Phi處理器在編程上盡量和傳統通用處理器的編程保持兼容,但為了獲取更好的性能和充分發揮硬件性能,一定的性能調優仍是必須的。

在解決處理器性能功耗問題方面,我們國家也開始了很多自己的研究工作。由于通用處理器在計算某類具體應用程序時,芯片里面很多功能部件處于閑置或者空閑狀態。如何針對特定應用程序設計定制的處理器,刪減不需要的指令和功能部件,這樣可以大大提高處理器的性能功耗比。清華大學在研制針對特定應用程序定制處理器方面已經開始了一定的前期工作。目前主要針對天氣預報程序定制高性能計算機處理器,從而提高高性能計算機的性能功耗比。

猜你喜歡
程序計算機
計算機操作系統
穿裙子的“計算機”
趣味(數學)(2020年9期)2020-06-09 05:35:08
基于計算機自然語言處理的機器翻譯技術應用與簡介
科技傳播(2019年22期)2020-01-14 03:06:34
計算機多媒體技術應用初探
科技傳播(2019年22期)2020-01-14 03:06:30
試論我國未決羈押程序的立法完善
人大建設(2019年12期)2019-05-21 02:55:44
失能的信仰——走向衰亡的民事訴訟程序
信息系統審計中計算機審計的應用
消費導刊(2017年20期)2018-01-03 06:26:40
“程序猿”的生活什么樣
英國與歐盟正式啟動“離婚”程序程序
環球時報(2017-03-30)2017-03-30 06:44:45
創衛暗訪程序有待改進
中國衛生(2015年3期)2015-11-19 02:53:32
主站蜘蛛池模板: 香蕉综合在线视频91| 欧美天天干| 亚洲天堂视频在线播放| 搞黄网站免费观看| av一区二区三区高清久久 | 亚洲视频在线网| 亚洲AV人人澡人人双人| 精品亚洲麻豆1区2区3区| 久久婷婷综合色一区二区| 四虎影院国产| 欧美一区二区丝袜高跟鞋| 99热这里都是国产精品| 国产精品亚洲一区二区三区z| 日韩一级毛一欧美一国产| 亚洲AV电影不卡在线观看| 成年片色大黄全免费网站久久| 欧美国产中文| 国产成人精品高清在线| 不卡色老大久久综合网| 精品国产欧美精品v| 国产杨幂丝袜av在线播放| 亚洲一区黄色| 久久中文电影| 亚洲三级色| 亚洲人妖在线| 99视频在线免费| 亚洲色欲色欲www网| 激情综合婷婷丁香五月尤物| 九色视频线上播放| 91精品国产自产91精品资源| 欧美成人看片一区二区三区| 国产男人的天堂| 亚洲欧美成aⅴ人在线观看| 国产久草视频| 蜜臀AV在线播放| 无码精油按摩潮喷在线播放| 一区二区三区毛片无码| 高潮爽到爆的喷水女主播视频 | 青青青国产精品国产精品美女| 亚洲一级毛片免费观看| 国产在线精品网址你懂的| 天堂中文在线资源| 国产精品99一区不卡| 91久久精品日日躁夜夜躁欧美| 日韩国产综合精选| 日本a级免费| 日韩中文精品亚洲第三区| 国产美女一级毛片| 欧美性久久久久| 综合色88| 在线观看精品国产入口| 久久大香伊蕉在人线观看热2| 一区二区三区成人| 99ri精品视频在线观看播放| 最新加勒比隔壁人妻| 亚洲欧洲日韩国产综合在线二区| 国产成人精品第一区二区| 在线观看国产精品日本不卡网| 亚洲精品va| 97色婷婷成人综合在线观看| 在线国产你懂的| 亚洲视频色图| 99r在线精品视频在线播放| 欧美一级夜夜爽| 国产成人夜色91| www.91中文字幕| 国产一级做美女做受视频| 毛片网站免费在线观看| 视频一本大道香蕉久在线播放| 国产成人福利在线| 欧美第一页在线| 久久精品国产免费观看频道| 免费看av在线网站网址| 五月激情婷婷综合| 欧美α片免费观看| 香蕉eeww99国产在线观看| 欧美α片免费观看| 欧美日韩资源| 欧美一级特黄aaaaaa在线看片| h网址在线观看| 精品偷拍一区二区| 亚洲人成色在线观看|