999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向大數據處理的并行計算模型及性能優化

2016-03-03 14:11:20文娟
中國高新技術企業 2016年6期
關鍵詞:容錯性計算機優化

摘要:所謂的大數據是指那些無法用傳統方法處理的數據信息,可以將其理解為海量數據與復雜類型數據的總和。大數據時代下,人們可以利用的信息增多,但是獲取有效信息的難度明顯加大,因此研究面向大數據的并行計算機模型及性能優化是非常有必要的。

關鍵詞:大數據處理;并行計算模型;性能優化;數據信息;海量數據;復雜類型數據 文獻標識碼:A

中圖分類號:TP391 文章編號:1009-2374(2016)06-0033-02 DOI:10.13535/j.cnki.11-4406/n.2016.06.017

信息技術的發展將人們推進了大數據時代,數據信息數量大、樣式多且價值密度不高,使用傳統的數據處理方法已經不能滿足實際要求。為了更好地利用這些數據資源,在大數據時代的挑戰中尋找到機遇,人們需要進一步研究并行計算機模型,實現模型優化,抓住大數據時代的機遇,促進大數據的進一步發展。

1 并行計算模型的發展趨勢

首先,從計算機存儲的角度來說,在大數據背景下將面臨更加嚴峻的存儲問題。我國計算機產業格局并不是處理與存儲一體化,處理廠商與存儲廠商處于相互分離的狀態,導致這兩項技術的發展出現不平衡現象,計算機系統的存儲性能已經不能滿足實際需要。從1985年到現在,計算機處理器性能以每年60%的速度提高,而存儲性能的提升速度僅為每年9%。50%左右的差距導致處理性能與存儲性能之間越來越不協調,因此未來在研究并行計算機模型時,會將存儲性能作為重點研究對象。

其次,計算機體系結構中,多核逐漸成為主流。要想進一步提升系統的運算能力,僅僅依靠提升晶體管的集成度是不夠的,因為系統運算能力還會受到材料物理性能等因素的影響,因此,系統中應用多核技術已經成為一種必然趨勢。所謂多核技術,就是將多個計算內核集成在一個處理器中,每一個內核都能完成一個計算指令,這樣一個處理器就能夠完成并行計算指令。多核CPU的計算密度更高,并行處理能力更強,在相同計算條件下所消耗的功率更低,可以滿足實際需要。

再次,異構眾核集成技術在并行計算模型中的應用越來越廣泛。一般情況下模型中都采用CPC與MIC組合構架模式,相對復雜的邏輯計算部分由CPU負責,而一些密集運算則由CPU或者是MIC來負責,這些密集運算的典型特征就是分支較少且并行度高,這種異構方式為超級計算機的發展奠定了基礎。

最后,服務器逐漸向著大規模集群化且廉價化的方向發展,越來越多的互聯網企業和網絡運營商選擇將大規模服務廉價集群作為系統硬件設施。這種集群式服務器的典型特征就是會自動將故障狀態視為常態,因為即使集群中的一部分組間發生故障,也不會對系統整體造成太大影響。同時,該集群會為異構硬件擴容提供支持,或是在系統中加入存儲資源,或是直接加入新的機器,系統根據實際情況對這些資源或者機器進行自動調取,這一過程不會對系統運行產生任何影響。

2 面向大數據處理的計算模型分析

2.1 模型概述

隨著計算機技術的發展,大數據編程模型已經取得了不錯的研究成果,其主要被應用在數據分析以及數據處理上,但是對于并行計算模型的研究卻不夠深入,從目前的情況來看需要解決以下問題:

首先,成熟的計算模型中需要包括以下兩個要素:一是機器參數,包括CPU以及節點規模等;二是成本函數,其代表的是機器參數的函數,具體包括時間成本函數和空間成本函數。對這兩個要素進行深入研究,能夠對并行計算模型的發展提供理論支持。

其次,目前使用的大數據編程模型為了提高計算能力,會為系統資源提供橫向擴展支持,同時程序中自帶容錯機制,一旦出現節點失效問題能夠及時應對,雖然在一定程度上提高了應對能力,但是編程的擴展性以及容錯性都是針對某個案例而言,因此并沒有統一的度量標準,因此面向大數據處理的并行計算模型,需要對擴展性以及容錯性這兩個性能進行準確定義,用統一標準來評判其能力。

最后,大數據的應用效率會受到很多因素的影響,包括并行性級別、通訊問題以及存儲問題等,目前所指的性能優化大多數都是針對某個系統框架或者是某個模型而言的,沒有一個完整、統一的理論,而面向大數據處理的并行計算模型就要解決這一問題,統一優化理論、制定出可以面向所有模型的優化方法。

2.2 p-DOT模型分析

p-DOT模型在設計時將BPS模型作為基礎,模型的基本組成是一系列iteration,該模型主要由三個層次

組成:

首先,D-layer,也就是數據層,整個系統的結構呈現出分布式,各個數據節點上存儲數據集。

其次,O-layer,也就是計算層,假設q為計算的一個階段,那么該階段內的所有節點會同時進行獨立計算,所有節點只需要處理自己對應的數據,這些數據中包括最初輸入的數據,也包括計算中生成的中間數據,這樣實現了并發計算,得到的中間結果直接存儲在模

型中。

最后,T-layer,也就是通信層,在q這一階段內,通信操作子會自動傳遞模型中的消息,傳遞過程遵循點對點的原則,因為q階段中的所有節點在經過計算以后都會產生一個中間結果,在通信操作子的作用下,這些中間結果會被一一傳遞到q+1階段內。也就是說,一個階段的輸出數據會直接被作為下一個階段的輸入數據,如果不存在下一個階段或者是兩個相鄰階段之間不存在通信,則這些數據會被作為最終結果輸出并存儲。

在并行計算模型下,應用大數據和應用高性能之間并不矛盾,因此并行計算模型具有普適性的特征,前者為后者提供模式支持,反過來,后者也為前者提供運算能力上的支持。另外,在并行計算模型下,系統的擴展性和容錯性明顯提升,在不改變任務效率的前提下,數據規模以及機器數量之間的關系就能夠描述出系統的擴展性,而即使系統中的一些組件出現故障,系統整體運行也不會受到影響,體現出較好的容錯性。

p-DOT模型雖然是在DOT模型的基礎上發展起來的,但是其絕對不會是后者的簡單擴展或者延伸,而是具備更加強大的功能:一是p-DOT模型可以涵蓋DOT以及BSP模型的處理范式,應用范圍比較廣;二是將該模型作為依據能夠構造出時間成本函數,如果在某個環境負載下大數據運算任務已經確定,我們就可以根據該函數計算出整個運算過程所需要的機器數量(這里將最短運行時間作為計算標準);三是該并行計算模型是可以擴展的,模型也自帶容錯功能,具有一定的普適性。

3 基于計算模型的性能優化方法分析

3.1 D-layer的優化

要想實現容錯性,要對系統中的數據進行備份,因為操作人員出現失誤或者是系統自身存在問題,數據有可能大面積丟失,這時備份數據就會發揮作用。一般情況下,系統中比較重要的數據會至少制作三個備份,這些備份數據會被存儲在不同場所,一旦系統數據層出現問題就會利用這些數據進行回存。對于數據復本可以這樣布局:一是每個數據塊中的每個復本只能存儲在對應節點上;二是如果集群中機架數量比較多,每個機架中可以存儲一個數據塊中的一個復本或者是兩個復本。從以上布局策略中我們可以看出,數據復本的存儲與原始數據一樣,都是存儲在數據節點上,呈現出分散性存儲的特征,這種存儲方式是實現大數據容錯性的基礎。

3.2 O-layer的優化

隨著信息技術的發展以及工業規模的擴大,人們對大數據任務性能提出了更高的要求,為了實現提高性能的目標,一般計算機程序會對系統的橫向擴展提供支持。隨著計算機多核技術的普及,系統的并行處理能力明顯增強,計算密度明顯提高,對多核硬件資源的利用效率明顯提升。傳統并行計算模型主要依靠進程間的通信,而優化后的模型則主要依靠線程間的通信,由于后者明顯小于前者,因此在利用多核技術進行并行計算時,能夠在不增大通信開銷的基礎上明顯提升計算

性能。

3.3 T-layer的優化

為了提升計算模型的通信性能,需要對大數據進行深度學習,具體原因如下:

首先,無論使用哪種算法,都需要不斷更新模型,從分布式平臺的角度來說,每一次迭代都代表一次全局通信,而一部分模型的迭代次數又非常多,同時模型中包含大量位移參數以及權重,例如模型AlexNet的基礎是卷積神經網絡,其迭代次數可以達到45萬,耗費系統大量通信開銷。

其次,如果分布式平臺上本身就有很多機器,那么迭代過程就需要將機器的運行或者計算作為基礎,就是說要想完成一次迭代,平臺上所有的機器都要逐一進行計算,計算完成以后還需要對參數進行同步。這種迭代模式容易受到短板效應的制約,算法通信開銷并不取決于計算速度最快的機器,而是取決于最慢的機器。為了避免短板效應,在對并行計算模型進行優化時,可以采用同步策略,對于計算速度較慢的機器進行加速,提升迭代類任務的通信性能。

4 結語

當前,人類已經進入了大數據時代,計算機并行機構體系發生了很大改變,人們對計算機系統模型的計算能力也提出了更高要求,這對并行計算來說既是一種機遇,也是一種挑戰,基于此,本文研究了基于大數據的并行計算模型及其優化。

參考文獻

[1] 覃雄派,王會舉.大數據分析——RDBMS與MapReduce的競爭與共生[J].軟件學報,2012,23(1).

[2] 程果,景寧.柵格數據處理中鄰域型算法的并行優化方法[J].國防科技大學學報,2012,34(4).

[3] 潘巍,李戰懷.大數據環境下并行計算模型的研究進展[J].華東師范大學學報(自然科學版),2014,(5).

[4] 張延松,焦敏.海量數據分析的One-size-fits-allOLAP技術[J].計算機學報,2011,34(10).

[5] 董新華,李瑞軒.Hadoop系統性能優化與功能增強綜述[J].計算機研究與發展,2013,(5).

作者簡介:文娟(1982-),女,湖南長沙人,威仁科技(北京)有限公司總經理,研究方向:計算機應用、大數據、云計算。

(責任編輯:周 瓊)

猜你喜歡
容錯性計算機優化
基于N-gram相似度增強蛋白質肽段組裝的方法
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
計算機操作系統
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
基于計算機自然語言處理的機器翻譯技術應用與簡介
科技傳播(2019年22期)2020-01-14 03:06:34
信息系統審計中計算機審計的應用
消費導刊(2017年20期)2018-01-03 06:26:40
基于認知心理學的交互式產品的容錯性設計研究
工業設計(2016年8期)2016-04-16 02:43:26
基于免疫算法的高容錯性廣域保護研究
電測與儀表(2015年2期)2015-04-09 11:28:56
主站蜘蛛池模板: 亚洲欧美自拍中文| 激情国产精品一区| 久久久久国产精品嫩草影院| 国产精品人莉莉成在线播放| 亚洲男人天堂网址| 最近最新中文字幕在线第一页| 亚洲看片网| 人妻丰满熟妇AV无码区| 激情综合图区| 久久男人视频| 青青青国产视频| 欧美精品亚洲精品日韩专| 午夜a视频| 青青青国产精品国产精品美女| 青青青伊人色综合久久| 一本大道无码日韩精品影视| 亚洲欧美另类日本| 一级毛片免费观看久| 国产精品浪潮Av| 亚洲第一视频区| 在线色国产| 青青热久麻豆精品视频在线观看| 9丨情侣偷在线精品国产| 91在线高清视频| 久久这里只有精品2| 亚洲精品日产精品乱码不卡| 亚洲男人在线| 3D动漫精品啪啪一区二区下载| 国产精品无码影视久久久久久久| 亚洲欧美日韩高清综合678| 狠狠综合久久久久综| 国产高清毛片| 日韩欧美高清视频| 亚洲精品桃花岛av在线| 日日拍夜夜操| 国产欧美网站| 国产国产人在线成免费视频狼人色| 久久人午夜亚洲精品无码区| 亚洲国产天堂在线观看| 国产真实乱子伦视频播放| 精品国产网站| 亚洲六月丁香六月婷婷蜜芽| 免费精品一区二区h| 中文成人无码国产亚洲| 国产精品成人一区二区| 国产欧美视频综合二区| 国产黄色片在线看| 日韩专区第一页| 老汉色老汉首页a亚洲| 亚洲经典在线中文字幕| 欧美一级黄片一区2区| 毛片三级在线观看| 亚洲色无码专线精品观看| 久久午夜夜伦鲁鲁片不卡| 毛片网站在线播放| 蜜桃视频一区二区| 久久96热在精品国产高清| 欧美成一级| 92午夜福利影院一区二区三区| 日韩精品一区二区三区swag| 亚洲人成网址| 在线无码私拍| 久久国产高清视频| 久久久亚洲国产美女国产盗摄| 色视频久久| 亚洲黄网视频| 伊人久久精品无码麻豆精品 | 欧美成人区| 真实国产乱子伦高清| 呦系列视频一区二区三区| 久久国产亚洲偷自| 国内熟女少妇一线天| 香蕉eeww99国产在线观看| 深爱婷婷激情网| 久久综合丝袜长腿丝袜| 一级毛片免费的| 精品午夜国产福利观看| 亚洲成人网在线播放| 欧美国产视频| 久久不卡国产精品无码| 2021国产在线视频| 青青草久久伊人|