999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)分析的分布式MOLAP技術(shù)要點(diǎn)

2018-02-02 18:07:48劉磊
電腦知識與技術(shù) 2018年1期
關(guān)鍵詞:大數(shù)據(jù)

劉磊

摘要:實(shí)際工作中需要使用大數(shù)據(jù)技術(shù),但是由于其帶有規(guī)模效應(yīng),不利于數(shù)據(jù)分析、數(shù)據(jù)管理、數(shù)據(jù)存儲等工作。為了確保工作質(zhì)量,相關(guān)技術(shù)人員通過研究和試驗(yàn),發(fā)現(xiàn)使用分布式文件系統(tǒng)優(yōu)勢明顯,應(yīng)用MapReduce編程模型可以解決上述問題。具體而言,使用MOLAP技術(shù)之后,利用多維模型進(jìn)行維度的映射,同時使用線性化算法將測量到的維度等數(shù)據(jù)存儲到分布式文件中。該文對在大數(shù)據(jù)背景下分布式MOLAP技術(shù)要點(diǎn)進(jìn)行分析,希望給有關(guān)人士一些借鑒。

關(guān)鍵詞:大數(shù)據(jù);分布式;MOLAP技術(shù)

中圖分類號:TP3 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)01-0009-02

Abstract: In practical work, large data technology is needed, but because of its scale effect, it is not conducive to data analysis, data management, data storage and so on. In order to ensure the quality of work, the relevant technical personnel through research and experiment, found that the use of distributed file system has obvious advantages, the application of MapReduce programming model can solve these problems. Specifically, after using MOLAP technology, the multi-dimensional model is used to map the dimensions, and the linear algorithm is used to store the measured dimensions and other data into the distributed file. Below on the background of big data distributed MOLAP technology analysis, hoping to draw some reference for the relevant people.

Key words: Big data; distributed; MOLAP Technology

對于MOLAP技術(shù)也稱之為DOLAP,其使用了多維數(shù)據(jù)模型,包括維和和事實(shí)兩個部分,具體操作中必須要找到維和與事實(shí)之間的映射關(guān)系。DOLAP使用了星象模式,同時使用了關(guān)系數(shù)據(jù)庫,將事實(shí)數(shù)據(jù)和維信息都存儲到數(shù)據(jù)庫表中。通過外鍵操作做好對事實(shí)數(shù)據(jù)的映射、維信息的映射等。

1 分析維編碼算法和維的遍歷算法

1.1 對維編碼算法進(jìn)行深度分析

技術(shù)人員都清楚,實(shí)際工作中應(yīng)用OLAP技術(shù)進(jìn)行操作時,需要對維進(jìn)行頻繁的操作,由此可見,實(shí)際運(yùn)行中遍歷算法和維編碼是非常關(guān)鍵的技術(shù)。下面就深入對兩種技術(shù)進(jìn)行分析,希望相關(guān)人員掌握要領(lǐng)。對于維編碼的方法而言,主要包括兩種,分別是十進(jìn)制編碼和二進(jìn)制編碼。對于二進(jìn)制編碼而言,內(nèi)部也將其稱之為位圖編碼,操作中對相關(guān)編碼進(jìn)行拼接,進(jìn)而得到維的級別信息,除此之外,還可以結(jié)合編碼位移做到對維的遍歷,達(dá)到最終的技術(shù)效果。但是實(shí)際使用二進(jìn)制編碼過程中,很容易導(dǎo)致稀疏問題。對于實(shí)際運(yùn)用的十進(jìn)制編碼而言,具體運(yùn)行操作過程中,系統(tǒng)會對所有級別的維值都使用十進(jìn)制數(shù)進(jìn)行編碼,雖然可以達(dá)到相關(guān)目的,但是也存在一定的問題,其不能直接得到維值和編碼,同時也不能得到相應(yīng)的映射。在大數(shù)據(jù)背景下運(yùn)行,為了有效避免出現(xiàn)稀疏等問題,在DOLAP技術(shù)當(dāng)中進(jìn)行了處理,其應(yīng)用十進(jìn)制進(jìn)行編碼,在此基礎(chǔ)上,還開創(chuàng)了一種維的遍歷算法,通過這一算法對維值、編碼間的映射進(jìn)行計算。具體而言,設(shè)l是維d中的某個維級別,對x∈[1,|md(l)|],vx∈md(l),vx的編碼為code(vx),那么就有code(vx)=x1.[1],具體的算法如下:

維編碼算法.Input: Dimension d: A target dimension;

Function: DimensionCoding.

1. FOR i=1 TO |L(d)|;

2. FOR j=0 TO |md(li)|?1;

3. Dimension value of vi,j∈md(li)

4. Vi

5. j.code=j;

5. END FOR

6. END FOR

在現(xiàn)實(shí)環(huán)境中大多數(shù)維屬于數(shù)值型,例如其流水號、價格、經(jīng)度、高度等,可以結(jié)合其值域進(jìn)行劃分,由此可見,對于數(shù)值的維可以很容易滿足約束條件,但是還有非數(shù)值的維,包括部門、城市、日期等,根據(jù)這一情況,實(shí)際操作時可以使用空值填補(bǔ)維值數(shù),在同一節(jié)點(diǎn)上包含相同數(shù)目的子節(jié)點(diǎn),相關(guān)人員可以參考日期維編碼結(jié)果。一般在月級別上每個月的天數(shù)都是不同的,但是為了滿足在這一技術(shù)系統(tǒng)中的相關(guān)定義,就要設(shè)定每月都是31天,針對這一情況,實(shí)際操作時一般技術(shù)人員會在2月插入29日,或者插入30日和31日。維在實(shí)際應(yīng)用中會變得更加復(fù)雜,為了提高工作效率,要將其進(jìn)行簡化,維層次的劃分方法有很多,包括維值數(shù)法,但是必須滿足定義條件。具體處理時可以選用取舍和合并的方法,將TCP-H的雪花模式進(jìn)行化簡,將其變?yōu)樾切湍J剑玫降慕Y(jié)果可以是SSB數(shù)據(jù)集中的維模式。對于SUPPLIER維表而言,可以選用區(qū)域?qū)傩裕∟ation,Region,City)作為劃分維層次的重要依據(jù),最終會得到維層次Nation-Region-City。除此之外,可以在維Nation-Region-City維值樹中添加空值,這樣就滿足相關(guān)定義,符合其約束條件[2]。endprint

1.2 分析維的遍歷算法

對于DOLAP的維技術(shù)人員可以將其視為單根樹,記作Td,但是要記住ALL是Td的根節(jié)點(diǎn),可以記做第0級別,對每個級別中的維值視為節(jié)點(diǎn)。對于其中每個兄弟節(jié)點(diǎn)而言,都有其相同數(shù)目的子節(jié)點(diǎn)。具體進(jìn)行OLAP操作時,需要對維值樹Td進(jìn)行遍歷操作,而且操作頻率較高,工作量比較大。例如要沿著Td下降,或者沿著Td攀升,設(shè)其有關(guān)系i∈[1,m1],li+1dli,然后就有l(wèi)i+1→li,技術(shù)人員要清楚,其中的(vi+1)=vi是比較重要的一個操作內(nèi)容,利用制定的編碼機(jī)制,可以表示為vi∈md(li),vi+1∈md(li+1),這樣就會得到vi與vi+1二者上卷之間的關(guān)系ρd。這種上卷關(guān)系,我們可以通過編碼運(yùn)算實(shí)現(xiàn)Td中的上卷操作[3]。

2 分析數(shù)據(jù)的存儲

對于傳統(tǒng)的DOLAP技術(shù)而言,進(jìn)行數(shù)據(jù)立方存儲成本比較高,而且操作復(fù)雜,尤其對高維數(shù)據(jù)立方進(jìn)行存儲,或者對維包進(jìn)行存儲,其里面含有大量的維值,其存儲成本就更大。在傳統(tǒng)技術(shù)當(dāng)中,利用訪問過程中的多維數(shù)組提高OLAP的操作,但是在大數(shù)據(jù)環(huán)境下這一操作非常難實(shí)現(xiàn),其多維組是利用計算機(jī)得到的,沒有必要進(jìn)行存儲,由此可見,其使用數(shù)據(jù)立方進(jìn)行存儲代價非常小。DOLAP技術(shù)可以對維進(jìn)行簡化,確保在同一級別上維的編碼時連續(xù)十進(jìn)制數(shù),在此基礎(chǔ)上,每一個兄弟節(jié)點(diǎn)都有一個相同的子節(jié)點(diǎn),針對這一情況可以得知,每個維信息只需要維級別的信息進(jìn)行存儲,降低了存儲的代價。技術(shù)人員可以設(shè)維d由m個維級別組成[4],直接記作{li|i∈[1,m]},這樣就有d,其存儲可以表示這一維級別和維級別規(guī)模的序偶所組成的集合,記做{li,|li||i∈[1,m]},在這一公式中l(wèi)i表示這一維級別的名稱,由此可見,在這方面使用DOLAP技術(shù)之后,工作人員就可以使用XML文件進(jìn)行信息的存儲,同時將其保存到集群主節(jié)點(diǎn)中。

3 對OLAP算法進(jìn)行深入分析

通過對OLAP算法和MapReduce進(jìn)行分析,發(fā)現(xiàn)其建立了不同視圖,在使用OLAP算法時[5],可以將其抽象為四元組進(jìn)行表示,分別是Target,Range,Aggregation,Result,其中,Target代表待分析的數(shù)據(jù)立方(元數(shù)據(jù));Range代表立方中待分析數(shù)據(jù)的數(shù)據(jù)范圍。Aggregation指的是聚集函數(shù),例如mean、sum、maximum、minimum。其中的Result表示元數(shù)據(jù),如果Target最高值比Result的最高維級別低時,就表示已經(jīng)完成了上卷操作,無論輸入還是輸出都是數(shù)據(jù)立方。技術(shù)人員要清楚,經(jīng)過查詢之后會生成新的立方,由此可見,Result、Target二者的維度可能有所不同。一般都使用維度進(jìn)行度量的查詢,對于OLAP算法而言,在操作查詢中也是由維度構(gòu)成的,Range屬于一個多維二元組,準(zhǔn)確指出了Target需要分析數(shù)據(jù)的范圍。該算法和傳統(tǒng)的MapReduce進(jìn)行對比,可以使用比較特殊的多維模型對度量、維和等進(jìn)行組織。存儲代價比較小。因此在實(shí)踐中得到了普及,一線人員也非常青睞這一方法。

4 總結(jié)

通過以上對大數(shù)據(jù)下DOLAP技術(shù)的分析,發(fā)現(xiàn)這一技術(shù)主要包含以下四方面的內(nèi)容,第一點(diǎn),該技術(shù)可以使用比較特殊的多維模型對度量、維和等進(jìn)行組織。第二點(diǎn),通過對維編碼、遍歷算法的分析,可以做到對維值樹上的上卷下鉆操作。第三點(diǎn),傳統(tǒng)維的存儲方式比較復(fù)雜,代價較大,為了提高工作效率,對存儲方法進(jìn)行了簡化,并做到維和度量的映射關(guān)系。第四點(diǎn),技術(shù)人員通過深入研究,最終提出了一種OLA算法,將這一算法和HaoLap進(jìn)行對比,發(fā)現(xiàn)后者在數(shù)據(jù)裝載方面沒有優(yōu)勢,OLA算法的優(yōu)勢非常明顯,在此基礎(chǔ)上對這一算法的特點(diǎn)進(jìn)行總結(jié),希望為以后的發(fā)展奠定基礎(chǔ)。

參考文獻(xiàn):

[1] 宋杰, 郭朝鵬, 王智,等. 大數(shù)據(jù)分析的分布式MOLAP技術(shù)[J]. 軟件學(xué)報, 2014, 25(4).

[2] 姜博. 大數(shù)據(jù)分析的分布式MOLAP技術(shù)[J]. 通訊世界, 2015(24).

[3] 熊寧. 大數(shù)據(jù)分析的分布式MOLAP技術(shù)[J]. 信息技術(shù)與信息化, 2015(2).

[4] 周青. 大數(shù)據(jù)分析在智能變電站狀態(tài)監(jiān)測系統(tǒng)中的應(yīng)用研究[D]. 華北電力大學(xué), 2016.

[5] 蔣外文, 熊東平, 張肖霞. 基于多維數(shù)據(jù)庫的MOLAP存儲及查詢技術(shù)研究[J]. 計算機(jī)工程與應(yīng)用, 2005, 33(24).endprint

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产国模一区二区三区四区| 国产无码高清视频不卡| 午夜精品区| 色综合婷婷| 99re免费视频| 久久人人97超碰人人澡爱香蕉| 最新无码专区超级碰碰碰| 免费不卡在线观看av| 国产精品尤物铁牛tv| 黄色一级视频欧美| 不卡无码网| 国产杨幂丝袜av在线播放| 亚洲人成色77777在线观看| 亚洲无码视频图片| 免费A∨中文乱码专区| 国产不卡一级毛片视频| 又黄又湿又爽的视频| 潮喷在线无码白浆| 国产女人在线观看| 成年人国产视频| 国产成人乱无码视频| 亚洲欧洲日产国码无码av喷潮| 91精品亚洲| 特级aaaaaaaaa毛片免费视频| 全裸无码专区| 日韩精品欧美国产在线| 国产精品免费入口视频| 欧美一级夜夜爽www| 999国产精品| 亚洲成a人在线播放www| 干中文字幕| 这里只有精品在线播放| 国产精品丝袜在线| 99久久精彩视频| 亚洲视频影院| 国产无套粉嫩白浆| 午夜人性色福利无码视频在线观看| 国产成人综合久久| 亚洲无码四虎黄色网站| 亚洲欧洲日韩久久狠狠爱| 九九九久久国产精品| 黄色在线网| 成人欧美日韩| 亚洲VA中文字幕| 婷婷综合缴情亚洲五月伊| 久久久91人妻无码精品蜜桃HD| 国产网友愉拍精品| 日韩少妇激情一区二区| 国产美女一级毛片| 国产高潮流白浆视频| 亚洲视频三级| 免费看a毛片| 国产91精选在线观看| 亚洲精品片911| 手机在线免费不卡一区二| 中文字幕无码制服中字| 片在线无码观看| 老司机久久99久久精品播放| 91啪在线| 尤物精品视频一区二区三区| 亚洲中文无码av永久伊人| 天天视频在线91频| 国产91特黄特色A级毛片| 国产精品美女网站| 999国内精品久久免费视频| 免费观看亚洲人成网站| 日韩欧美网址| 日韩在线视频网站| 亚洲成人网在线观看| 国产毛片不卡| 91亚洲视频下载| 国产永久在线观看| 在线观看亚洲人成网站| 亚洲精品免费网站| 三上悠亚在线精品二区| 青草视频免费在线观看| 国模在线视频一区二区三区| 亚洲国产看片基地久久1024| 国产日韩AV高潮在线| 国产微拍一区| 国产人人射| 欧美日韩国产成人高清视频|