999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向大數(shù)據(jù)應(yīng)用挑戰(zhàn)的超級(jí)計(jì)算機(jī)設(shè)計(jì)

2016-11-30 14:13:55
科技傳播 2016年18期
關(guān)鍵詞:數(shù)據(jù)處理效率模型

高 莉

南京市人防指揮信息保障中心,江蘇南京 210008

面向大數(shù)據(jù)應(yīng)用挑戰(zhàn)的超級(jí)計(jì)算機(jī)設(shè)計(jì)

高 莉

南京市人防指揮信息保障中心,江蘇南京 210008

在大數(shù)據(jù)時(shí)代,面向高性能的計(jì)算設(shè)計(jì)的超級(jí)計(jì)算機(jī)能夠?yàn)槲覀儙碛?jì)算、通信、存儲(chǔ)和編程等軟硬件體系結(jié)構(gòu)方面的便捷。由此,我們可以通過分析目前主流學(xué)術(shù)界研究成果來介紹超級(jí)計(jì)算機(jī)系統(tǒng)針對(duì)大數(shù)據(jù)處理應(yīng)用所采用的新型異構(gòu)多態(tài)體系結(jié)構(gòu)、自主定制高速互連網(wǎng)絡(luò)等多種優(yōu)化措施,對(duì)大數(shù)據(jù)背景下的超級(jí)計(jì)算機(jī)設(shè)計(jì)具有很大的參考價(jià)值。

大數(shù)據(jù);挑戰(zhàn);超級(jí)計(jì)算機(jī)

大數(shù)據(jù)已經(jīng)成為當(dāng)今世界的發(fā)展潮流,其中代指了那些大規(guī)模的數(shù)據(jù)集。在維基百科中,對(duì)于大數(shù)據(jù)給出了如下的定義:由于牽涉到的資料信息量巨大,當(dāng)下的主要軟件無法及時(shí)地完成數(shù)據(jù)的收集和處理等,而數(shù)據(jù)的整合和管理等是企業(yè)做出正確決策的關(guān)鍵所在。由此可見,大數(shù)據(jù)具有信息量大、復(fù)雜程度高以及時(shí)效性強(qiáng)等顯著特征,僅僅依靠傳統(tǒng)意義上的軟件計(jì)算是遠(yuǎn)遠(yuǎn)不夠的。因此,加大對(duì)大數(shù)據(jù)背景下超級(jí)計(jì)算機(jī)的研發(fā)力度迫在眉睫。

1 大數(shù)據(jù)背景下超級(jí)計(jì)算機(jī)的設(shè)計(jì)

面對(duì)大數(shù)據(jù)的挑戰(zhàn),超級(jí)計(jì)算機(jī)最顯著的優(yōu)勢(shì)在于計(jì)算能力強(qiáng)和處理效率高等,作為一個(gè)信息高度集中的計(jì)算系統(tǒng),超級(jí)計(jì)算機(jī)從多樣化的視角(數(shù)據(jù)存儲(chǔ)、工具媒介等)對(duì)大數(shù)據(jù)應(yīng)用及高性能應(yīng)用進(jìn)行對(duì)比分析,可以看出,在進(jìn)行數(shù)據(jù)處理或者是數(shù)據(jù)計(jì)算時(shí),超級(jí)計(jì)算機(jī)的性能表現(xiàn)也不盡相同。高性能計(jì)算的重點(diǎn)在于節(jié)點(diǎn)計(jì)算效率的提升,而大數(shù)據(jù)應(yīng)用的關(guān)鍵在于通信方面的加強(qiáng)。針對(duì)以上超級(jí)計(jì)算機(jī)在大數(shù)據(jù)背景下應(yīng)用的不足之處,以下將分別從硬件和軟件層面進(jìn)行分開討論。

1.1硬件體系結(jié)構(gòu)

由于大數(shù)據(jù)應(yīng)用具有信息量大和計(jì)算簡(jiǎn)單的特點(diǎn),使得計(jì)算的指令級(jí)別處于相對(duì)較低的水平,同時(shí)也在無形之中加大了數(shù)據(jù)訪問的成本,可見超級(jí)計(jì)算機(jī)在大數(shù)據(jù)應(yīng)用方面的主要問題在于數(shù)據(jù)吞吐率與計(jì)算效率的不均衡,該問題可以從以下兩個(gè)關(guān)鍵點(diǎn)著手解決,首先是對(duì)片上緩存進(jìn)行深層次的優(yōu)化。大數(shù)據(jù)應(yīng)用的指令級(jí)別較低,跳轉(zhuǎn)頻率高,局部性差,再考慮到其數(shù)據(jù)一般僅使用一次的特點(diǎn),可以通過降低指令緩存和構(gòu)建處理器與二級(jí)緩存相連接的通道,使得數(shù)據(jù)吞吐率和計(jì)算效率達(dá)到一個(gè)相對(duì)均衡的狀態(tài)。其次是提升大數(shù)據(jù)計(jì)算的能力。鑒于大數(shù)據(jù)背景下信息高度密集的特點(diǎn),常規(guī)的處理器已經(jīng)顯得力不從心,因此,超級(jí)計(jì)算機(jī)需要部署實(shí)時(shí)性高的處理器,可以選擇異構(gòu)并行處理器,詳細(xì)來講,就是將專業(yè)加速器引入到通用處理器核心中,借助于加速器的推動(dòng)作用,使得在處理數(shù)據(jù)時(shí)可以達(dá)到數(shù)據(jù)集并行的效果。大數(shù)據(jù)應(yīng)用中數(shù)據(jù)處理頻率高,節(jié)點(diǎn)計(jì)算效率的提升和通信方面的加強(qiáng)是大數(shù)據(jù)應(yīng)用需要重點(diǎn)解決的問題。由于大數(shù)據(jù)應(yīng)用中涉及到的數(shù)據(jù)量巨大,其存儲(chǔ)模式也是各種各樣,比較常見的有集中存儲(chǔ)模式和分布式共享存儲(chǔ)模式等。同時(shí)考慮到數(shù)據(jù)通信頻率較高,需要重點(diǎn)提升節(jié)點(diǎn)與節(jié)點(diǎn)間、節(jié)點(diǎn)與設(shè)備間的連接效率。以上可見,為解決大數(shù)據(jù)應(yīng)用方面的問題,關(guān)鍵在于加強(qiáng)對(duì)互聯(lián)通信技術(shù)層面的研發(fā)力度,對(duì)節(jié)點(diǎn)間連接速率的優(yōu)化,通常有兩種方式可以選擇,首先是設(shè)計(jì)軟硬結(jié)合的多接口網(wǎng)絡(luò)芯片;其次是光互連技術(shù)為解決數(shù)據(jù)傳輸難題提供的契機(jī)。

1.2軟件架構(gòu)

大數(shù)據(jù)包含了大量的結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。它們的存儲(chǔ)方式也各有特點(diǎn),其中結(jié)構(gòu)化數(shù)據(jù)多選擇數(shù)據(jù)庫結(jié)構(gòu)存儲(chǔ),其余兩個(gè)通常要借助于不同文件系統(tǒng)之間的相互配合。數(shù)據(jù)處理和數(shù)據(jù)計(jì)算的過程截然不同,當(dāng)進(jìn)行數(shù)據(jù)計(jì)算時(shí),如果數(shù)據(jù)已經(jīng)加載完成,那么需要適當(dāng)控制與系統(tǒng)之間的交互頻率,因此可以選用單一的分布式文件系統(tǒng)。但是在大數(shù)據(jù)背景下的數(shù)據(jù)處理,其處理方式比較豐富,常見的有圖處理和批處理等,這就需要通過不同的文件系統(tǒng)進(jìn)行配合。可見,在超級(jí)計(jì)算機(jī)設(shè)計(jì)中,單一的文件系統(tǒng)是無法滿足運(yùn)行需要的,必須選擇多樣化的文件系統(tǒng)。

在對(duì)非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)方式研究以后發(fā)現(xiàn),通常是分布式文件系統(tǒng),為了提高數(shù)據(jù)處理的效率,谷歌創(chuàng)新性地設(shè)計(jì)出了可擴(kuò)展的GFS文件系統(tǒng),即借助于應(yīng)用層達(dá)到分離控制流以及數(shù)據(jù)流的目的,是一個(gè)分布式文件系統(tǒng),可以存儲(chǔ)和處理巨大的數(shù)據(jù)信息,從而提升了公司的業(yè)務(wù)處理效率。GFS通常包含有以下3個(gè)部分:眾多的塊服務(wù)器、單一的主控服務(wù)器和客戶端。本文以GFS文件系統(tǒng)的思想為前提,并對(duì)已經(jīng)研發(fā)出來的具有代表性的系統(tǒng)(阿里巴巴的分支ADFS等)進(jìn)行分析。阿里的分支ADFS著重對(duì)HDFS NameNode使用過程中顯現(xiàn)出來的單點(diǎn)故障和內(nèi)存不夠等問題進(jìn)行優(yōu)化,其工作原理為通過把內(nèi)存中的非熱點(diǎn)數(shù)據(jù)轉(zhuǎn)移到外部數(shù)據(jù)庫,從而有效降低了NameNode內(nèi)存的壓力,使得數(shù)據(jù)的處理更為快捷高效。而在研究了半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)以后,可以得出,兩者的存儲(chǔ)方式有著明顯的共同點(diǎn),即通常都選擇數(shù)據(jù)庫和分布式表結(jié)構(gòu)。一些相對(duì)簡(jiǎn)單的半結(jié)構(gòu)化數(shù)據(jù)通常會(huì)選擇Key/Value分布式系統(tǒng),比較典型的是Amazon公司的Dynamo系統(tǒng)和Facebook的Cassandra系統(tǒng),前者通過Key/Value方式進(jìn)行數(shù)據(jù)存儲(chǔ),其顯著特點(diǎn)在于較高的可用性和強(qiáng)大的可擴(kuò)展性;后者同樣是通過Key/Value方式進(jìn)行數(shù)據(jù)存儲(chǔ),進(jìn)一步增強(qiáng)了數(shù)據(jù)存儲(chǔ)方面的擴(kuò)展性和一致性。

2 編程模型

大數(shù)據(jù)的時(shí)代背景對(duì)編程模型也提出了更高的要求,傳統(tǒng)的編程比較簡(jiǎn)單,而性能明顯不足,為了解決兩者之間的矛盾,需要構(gòu)建一種全新的編程模型。新的模型應(yīng)在保證簡(jiǎn)單的前提下,盡可能提升性能,通過構(gòu)建清晰明確的編程抽象,使得程序員的編程工作能夠順利的進(jìn)行,而程序員不必在意程序在集群上運(yùn)行的詳細(xì)狀態(tài),只需對(duì)存在問題進(jìn)行逐一攻克。新模型要求程序員關(guān)注待解決問題,從而使得編程過程中的任務(wù)清晰明了,同時(shí)也簡(jiǎn)單化了代碼的維護(hù),極大地方便了程序員的工作。另外,要達(dá)到提升系統(tǒng)數(shù)據(jù)計(jì)算和數(shù)據(jù)處理能力的目的,我們一方面要保障程序在集群上高效穩(wěn)定的運(yùn)行,另一方面也要考慮使不同作業(yè)可以并發(fā)運(yùn)行,共享集群內(nèi)部的資源。對(duì)此,需要克服的問題也很多,如怎么處理異構(gòu)性問題和怎么加強(qiáng)對(duì)本地?cái)?shù)據(jù)的利用等,所以在新的編程模型構(gòu)建方面,我們需要綜合考慮各方面的影響,并進(jìn)行適當(dāng)?shù)娜∩幔瑥亩鴺?gòu)建出一個(gè)簡(jiǎn)單可靠而又高效的全新編程模型。

為提高效率,超級(jí)計(jì)算機(jī)通常會(huì)選擇并行編程模型,如OpenMP和MPI,前者通常使用共享存儲(chǔ)模式而被廣泛用在對(duì)稱多處理器等架構(gòu)的設(shè)備;后者的編程模型一般較為復(fù)雜,因此需要在信息通信計(jì)算模型的前提下,要求編程人員對(duì)程序問題進(jìn)行逐一分類,然后再將其映射至分布式進(jìn)程集合。而對(duì)于大數(shù)據(jù)來講,OpenMP和MPI是不合適的,對(duì)此一些大型互聯(lián)網(wǎng)公司基于公司實(shí)際狀況,開始研制出了專門用于大數(shù)據(jù)處理的模型,不僅提升了職員的工作效率,同時(shí)也極大地加快了大數(shù)據(jù)應(yīng)用實(shí)現(xiàn)的步伐。另外,需要提到的是在新型的內(nèi)存計(jì)算系統(tǒng)中,MapReduce在異構(gòu)內(nèi)存的使用方面仍存在很大的問題,使得數(shù)據(jù)的局部性無法得到有效的控制和利用。

3 結(jié)論

在大數(shù)據(jù)背景下,超級(jí)計(jì)算機(jī)的設(shè)計(jì)可以加入一些高效化的模塊結(jié)構(gòu),如多核和眾核等,同時(shí),不斷提速的寬帶網(wǎng)絡(luò)可以為超級(jí)計(jì)算機(jī)的高速運(yùn)行提供基礎(chǔ)保障,相關(guān)技術(shù)有最優(yōu)網(wǎng)絡(luò)互連技術(shù)等。總之在大數(shù)據(jù)時(shí)代,為了實(shí)現(xiàn)更高級(jí)的機(jī)器計(jì)算和運(yùn)行,我們需要將超級(jí)計(jì)算機(jī)的計(jì)算類型由計(jì)算密集型逐漸轉(zhuǎn)向數(shù)據(jù)密集型。希望通過我們的共同努力,在應(yīng)對(duì)當(dāng)今大數(shù)據(jù)時(shí)代下的數(shù)據(jù)處理問題能夠更加得心應(yīng)手。

[1]張昕,袁曉如.樹圖可視化[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2012(9):1113-1124.

[2]嚴(yán)霄鳳,張德馨.大數(shù)據(jù)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013(4):168-172.

[3]郎楊琴,孔麗華.美國(guó)發(fā)布“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”[J].科研信息化技術(shù)與應(yīng)用,2012(2):89-93.

TP3

A

1674-6708(2016)171-0117-01

高莉,工程師,南京市人防指揮信息保障中心,研究方向?yàn)橛?jì)算機(jī)軟件工程。

猜你喜歡
數(shù)據(jù)處理效率模型
一半模型
認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補(bǔ)與極大似然估計(jì)法*
ILWT-EEMD數(shù)據(jù)處理的ELM滾動(dòng)軸承故障診斷
重要模型『一線三等角』
提升朗讀教學(xué)效率的幾點(diǎn)思考
甘肅教育(2020年14期)2020-09-11 07:57:42
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
基于希爾伯特- 黃變換的去噪法在外測(cè)數(shù)據(jù)處理中的應(yīng)用
跟蹤導(dǎo)練(一)2
“錢”、“事”脫節(jié)效率低
主站蜘蛛池模板: 成年看免费观看视频拍拍| 91在线播放国产| 国产精品手机在线播放| 亚洲欧美成人综合| 呦女亚洲一区精品| 人妻丰满熟妇av五码区| 亚洲中文字幕av无码区| 国产产在线精品亚洲aavv| 色窝窝免费一区二区三区| 在线欧美一区| 99久久婷婷国产综合精| 色婷婷亚洲综合五月| 国产免费羞羞视频| 福利在线一区| 久久久久国产一区二区| 亚洲精品午夜天堂网页| 亚洲天堂成人| 国产粉嫩粉嫩的18在线播放91| 欧美成人区| 亚洲精品久综合蜜| 日韩区欧美区| 夜夜操天天摸| 亚洲swag精品自拍一区| 在线a视频免费观看| 伦伦影院精品一区| 国产噜噜在线视频观看| 亚洲婷婷六月| 国产一区二区三区在线观看视频| 亚洲一级无毛片无码在线免费视频| 色网站在线视频| 啪啪免费视频一区二区| 无码啪啪精品天堂浪潮av| 91久久青青草原精品国产| 日本91视频| 久久性妇女精品免费| 国产日韩欧美一区二区三区在线| 中文字幕资源站| 精品国产美女福到在线直播| 色妺妺在线视频喷水| 精品无码一区二区三区电影| 中文字幕亚洲乱码熟女1区2区| 久久成人18免费| 午夜精品影院| 免费一级毛片完整版在线看| 亚洲日本中文综合在线| 国产色伊人| 国产色偷丝袜婷婷无码麻豆制服| 99精品国产电影| 国产欧美日韩91| 区国产精品搜索视频| 国产91熟女高潮一区二区| 91午夜福利在线观看精品| 免费 国产 无码久久久| 九一九色国产| 在线观看91香蕉国产免费| 成人av专区精品无码国产| 欧美色图第一页| 毛片在线看网站| 亚洲人成色77777在线观看| 天堂亚洲网| 亚洲开心婷婷中文字幕| 欧美成人精品高清在线下载| 97狠狠操| 国产高清在线丝袜精品一区| 第一页亚洲| 国产全黄a一级毛片| 潮喷在线无码白浆| 91福利免费视频| 欧美色综合网站| 久草国产在线观看| 成人日韩精品| 亚洲视频无码| 欧美亚洲国产日韩电影在线| 国产精品免费入口视频| 国产农村妇女精品一二区| 国产毛片不卡| 天堂在线视频精品| 亚洲精品自产拍在线观看APP| 成人午夜亚洲影视在线观看| 日韩av手机在线| 欧美yw精品日本国产精品| 国内精品久久九九国产精品|