999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)可視化在大數(shù)據(jù)時(shí)代中的應(yīng)用探究

2014-10-21 20:09:56沈杰
電子世界 2014年23期
關(guān)鍵詞:圖表可視化文本

沈杰

【摘要】隨著大數(shù)據(jù)時(shí)代的來臨,數(shù)據(jù)挖掘和分析的發(fā)展已具有相當(dāng)重要的現(xiàn)實(shí)意義。用戶對(duì)數(shù)據(jù)進(jìn)行分析的需求增長, 數(shù)據(jù)可視化的要求也會(huì)變得愈發(fā)強(qiáng)烈。能有效呈現(xiàn)出用戶需要的數(shù)據(jù), 并易于理解進(jìn)而幫助用戶做出決策的數(shù)據(jù)可視化技術(shù)將在當(dāng)前及未來大有作為。本文描述了當(dāng)前數(shù)據(jù)可視化的時(shí)代背景,主要應(yīng)用,并表明其作用與注意點(diǎn),揭開數(shù)據(jù)可視化在現(xiàn)代社會(huì)的作用。

【關(guān)鍵詞】數(shù)據(jù)可視化;大數(shù)據(jù);商業(yè)智能;數(shù)據(jù)挖掘

1.時(shí)代背景

自21世紀(jì)以來,數(shù)據(jù)爆炸已是人類的重大挑戰(zhàn),人們淹沒在數(shù)據(jù)海洋中,卻對(duì)信息,知識(shí)極其缺乏,人類分析數(shù)據(jù)的能力與獲取數(shù)據(jù)的能力相差甚遠(yuǎn)。同時(shí),數(shù)據(jù)的多態(tài)、高維、獲取的動(dòng)態(tài)性、數(shù)據(jù)關(guān)系的異構(gòu)更增加了數(shù)據(jù)使用的難度。在傳統(tǒng)企業(yè)占據(jù)主流地位的關(guān)系型數(shù)據(jù)庫有越來越多無法進(jìn)行管理的數(shù)據(jù)。這類數(shù)據(jù)的量巨大,具有多樣性,如各類文本、圖像、視頻、傳感器信息,且數(shù)據(jù)產(chǎn)生和更新的頻率上升到一個(gè)新層次??偨Y(jié)下即為海量化(Volume),多樣化(Variety),快速化(Velocity),這三點(diǎn)為大數(shù)據(jù)的主要特征。人們要從海量非結(jié)構(gòu)化數(shù)據(jù)中挖掘有用信息的這種推力,使大數(shù)據(jù)技術(shù)正逐步代替?zhèn)鹘y(tǒng)信息管理技術(shù)。伴隨著推力巨大的互聯(lián)網(wǎng),大數(shù)據(jù)時(shí)代的大幕正逐步拉起。而在這發(fā)展過程中,能有效呈現(xiàn)多元化數(shù)據(jù), 便于決策的數(shù)據(jù)可視化便越來越引起關(guān)注。

2.數(shù)據(jù)可視化的作用

在信息科學(xué)與知識(shí)管理中,DIKW(Data,Information,Knowledge,Wisdom)體系作為最基礎(chǔ)的模型,在數(shù)據(jù)處理流程中完成從數(shù)據(jù)到智慧的轉(zhuǎn)化。人們急切的需要能展示演繹數(shù)據(jù)的工具,并且能夠傳達(dá)數(shù)據(jù)身后真正的知識(shí)與智慧的工具。在整個(gè)轉(zhuǎn)化過程中,可視化于溝通,傳遞,表達(dá)方面表現(xiàn)出明顯的優(yōu)勢(shì)。

數(shù)據(jù)可視化運(yùn)用計(jì)算機(jī)圖形學(xué),圖像處理等技術(shù),并以其在視覺感知與人腦認(rèn)知上的優(yōu)勢(shì)使美學(xué)因素融合在數(shù)據(jù)分析中。優(yōu)秀的數(shù)據(jù)信息圖甚至可以達(dá)到藝術(shù)的層面,令人賞心悅目。其在數(shù)據(jù)處理流程中持續(xù)的優(yōu)勢(shì),使數(shù)據(jù)可視化交互工具市場(chǎng)逐步做大。

數(shù)據(jù)就是石油,傳統(tǒng)的各類領(lǐng)域中不被重視的數(shù)據(jù)重新歸納總結(jié)會(huì)釋放出巨大潛力。新聞中的數(shù)據(jù)信息可以歸納為信息圖表,再與其他新聞進(jìn)行分析整合,人們往往可以從中有收獲。政府機(jī)關(guān)的數(shù)據(jù)通過有效整理并進(jìn)行可視化,可以增加其透明度,民眾可以更容易獲取有效信息。企業(yè)數(shù)據(jù)可視化,可以對(duì)整個(gè)企業(yè)運(yùn)營流程有很好的掌控,便于管理與盈利。網(wǎng)絡(luò)數(shù)據(jù)及公共資源的潛在價(jià)值也極大,各類社交網(wǎng)站開放的API可以供開發(fā)研究人員挖掘人們生活消費(fèi)習(xí)慣,甚至可以通過文本分析并進(jìn)行可視化發(fā)現(xiàn)流行病的爆發(fā)趨勢(shì),購物網(wǎng)站對(duì)用戶已購貨物記錄進(jìn)行地域偏好分析,也可獲得有價(jià)值的情報(bào)。

3.主要應(yīng)用

3.1 文本可視化

將文本信息提取技術(shù)與可視化相結(jié)合的文本可視化可以輔助用戶將文本中的信息簡(jiǎn)潔地呈現(xiàn)出來。原始文本經(jīng)過文本信息挖掘,視圖繪制和人機(jī)交互,這便是基本的可視化流程。在諸多網(wǎng)站上,文本可視化的標(biāo)簽云技術(shù)已越來越常見,其為基于關(guān)鍵詞的最簡(jiǎn)單的文本可視化技術(shù),用顏色和字體的大小體現(xiàn)關(guān)鍵詞于文本中的分布差異,衍生的Wordle技術(shù)改進(jìn)了空間布局,提升了美學(xué)效果。在進(jìn)行信息檢索時(shí),也可以使用TileBar,Sparkler等可視化方法來提升檢索效果。除此之外,文本信息中還包含了大量的人類主觀信息,可以在RSS新聞內(nèi)容,社交平臺(tái)中挖掘用戶情感傾向信息,幫助調(diào)查者從宏觀角度進(jìn)行分析并為決策提供依據(jù)。

3.2 多媒體數(shù)據(jù)可視化

大數(shù)據(jù)時(shí)代,人們?cè)缫褜?duì)半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)充滿了好奇。圖像,視頻,音頻中的數(shù)據(jù)價(jià)值推動(dòng)了多媒體數(shù)據(jù)的可視化。比如社交照片中群體成員之間的關(guān)聯(lián)多使用了海賽圖方法;視頻的可視化則經(jīng)常使用將圖像堆疊成立方的方法,為抽取視頻中的運(yùn)動(dòng)信息提供方便;音樂的可視化如今也多是媒體播放工具的一個(gè)功能。

3.3 商業(yè)智能的數(shù)據(jù)可視化

如今的大量在線商業(yè)數(shù)據(jù)具有強(qiáng)烈的跨媒體特征與豐富的時(shí)空地理屬性,用戶的消費(fèi)日志包含了大量個(gè)人信息,這些都催生了該領(lǐng)域的可視化發(fā)展。當(dāng)前商業(yè)智能的數(shù)據(jù)分析大多借助于OLAP的多維分析模式實(shí)現(xiàn),采用可視化技術(shù)進(jìn)行數(shù)據(jù)探索。從最早的柱狀圖、餅圖、網(wǎng)狀圖等簡(jiǎn)單圖表,發(fā)展到呈現(xiàn)公司狀態(tài)與商業(yè)環(huán)境的儀表盤、子彈圖,新成長的技術(shù)能有效地傳達(dá)數(shù)據(jù)背后的知識(shí)和思想。同時(shí)隨著Tableau,Spotfire等軟件的推廣,可視化極大推動(dòng)商業(yè)智能的大眾化,降低了普通人進(jìn)行數(shù)據(jù)分析的門檻。

3.4 Web端可視化

Web端的可視化是通過HTML,CSS,Javas-cript技術(shù),在網(wǎng)頁上實(shí)現(xiàn)可交互的可視化作品及時(shí)全面顯示信息。Web端的可視化可以提升用戶效率,使選擇操作更加方便,感官更加舒服。D3.js就是一套面向Web的數(shù)據(jù)可視化的Javascript庫,具有極大的設(shè)計(jì)靈活性和可移植性。國內(nèi)開發(fā)的DataV.js同樣出色,可以便捷的調(diào)用且兼容各類瀏覽器。

4.數(shù)據(jù)可視化的注意點(diǎn)

可視化雖然是非常好的了解數(shù)據(jù)的方式,不過也很容易以錯(cuò)誤的方式執(zhí)行從而背離了其價(jià)值所在。為充分展示信息而不顧圖表的整體協(xié)調(diào),想要包含更多的信息效果卻適得其反,這樣做很容易使圖表缺乏美感。有限的儀表盤空間要包含的是重要的且值得優(yōu)先考慮的數(shù)據(jù),且當(dāng)圖表顯示過多的信息時(shí),過于緊密的布局很容易顯示出錯(cuò)誤的信息。而另一種錯(cuò)誤則是為了追求畫面的美觀,卻使數(shù)據(jù)內(nèi)容的表達(dá)不佳。所以在可視化的過程中,目標(biāo)的確立是最為基本的,專注于自己的目標(biāo)有助于更好地傳遞表達(dá)數(shù)據(jù),同時(shí)與圖表的美觀之間也能達(dá)到一種平衡。

真實(shí)的數(shù)據(jù)往往需要占用大量時(shí)間進(jìn)行規(guī)范化,特征選擇,維歸約等預(yù)處理操作,數(shù)據(jù)集的清洗與規(guī)范化或許是實(shí)踐中占最多時(shí)間的部分,此點(diǎn)不容忽視。同時(shí),數(shù)據(jù)可視化是一種輔助分析的工具,非分析工具,正常的處理流程還要借助傳統(tǒng)的統(tǒng)計(jì)手段及其他專業(yè)的知識(shí)??偠灾?,數(shù)據(jù)可視化作為一種對(duì)數(shù)據(jù)信息進(jìn)行專業(yè)化處理的優(yōu)秀工具,其理論與技術(shù)將在未來獲得逐步提升,最終一定會(huì)對(duì)商業(yè)社會(huì)及科研領(lǐng)域的發(fā)展作出重大貢獻(xiàn)。

參考文獻(xiàn)

[1]涂子沛.正在到來的數(shù)據(jù)革命:大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012.

[2]陳為,沈則潛,陶煜波.數(shù)據(jù)可視化[M].北京:電子工業(yè)出版社,2013.

[3][美]Nathan Yau著,向怡寧譯.鮮活的數(shù)據(jù)——數(shù)據(jù)可視化指南[M].人民郵電出版社,2012.

猜你喜歡
圖表可視化文本
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
在808DA上文本顯示的改善
“融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
雙周圖表
足球周刊(2016年14期)2016-11-02 10:54:56
雙周圖表
足球周刊(2016年15期)2016-11-02 10:54:16
雙周圖表
足球周刊(2016年10期)2016-10-08 18:30:55
圖表
世界博覽(2016年16期)2016-09-27 18:25:26
主站蜘蛛池模板: 国产一区二区精品高清在线观看| 国产 在线视频无码| 国产美女精品人人做人人爽| 亚洲人成影视在线观看| 久久天天躁狠狠躁夜夜躁| 婷婷亚洲天堂| 久久精品中文字幕免费| 五月天福利视频| 国产精品人成在线播放| 91福利在线观看视频| 日韩欧美中文亚洲高清在线| 永久免费无码日韩视频| 人妻一区二区三区无码精品一区| 幺女国产一级毛片| 日本91视频| 国产地址二永久伊甸园| 亚洲AV无码久久天堂| 亚洲男人的天堂在线观看| 国产十八禁在线观看免费| 亚洲AV人人澡人人双人| 亚洲天堂啪啪| 国产18在线播放| 国产一区二区三区精品欧美日韩| 国产白浆一区二区三区视频在线| 亚洲无卡视频| 香蕉在线视频网站| 亚洲啪啪网| 伊人五月丁香综合AⅤ| 国产成人91精品| 国产福利2021最新在线观看| 激情在线网| 中文无码日韩精品| 丝袜无码一区二区三区| a级毛片在线免费| 22sihu国产精品视频影视资讯| 成人午夜免费视频| 中日无码在线观看| 亚洲va在线∨a天堂va欧美va| 老司机aⅴ在线精品导航| 中文字幕乱码二三区免费| 亚洲国产成熟视频在线多多| 欧美国产日韩在线播放| 亚洲中文字幕23页在线| 国产男女XX00免费观看| 人妻21p大胆| 国产成人a毛片在线| 日本黄色a视频| 亚洲高清在线播放| 日韩毛片在线播放| 强乱中文字幕在线播放不卡| 欧美在线天堂| 国产清纯在线一区二区WWW| 18禁不卡免费网站| 国产一级做美女做受视频| 久久久久人妻一区精品| 视频一本大道香蕉久在线播放| 国产精品欧美亚洲韩国日本不卡| 国产呦视频免费视频在线观看| 亚洲人成影视在线观看| 伊人久久综在合线亚洲2019| 成人午夜在线播放| 青青热久麻豆精品视频在线观看| 日本高清免费不卡视频| 玖玖免费视频在线观看| jijzzizz老师出水喷水喷出| P尤物久久99国产综合精品| 92精品国产自产在线观看| 亚洲成肉网| 91视频区| 久久综合干| 少妇人妻无码首页| 国产免费福利网站| 亚洲人成在线免费观看| 国产对白刺激真实精品91| 国产综合网站| 国产在线观看一区精品| 亚洲中文久久精品无玛| 国产清纯在线一区二区WWW| 天天躁夜夜躁狠狠躁躁88| 狠狠色丁香婷婷| 伊人丁香五月天久久综合 | 亚洲综合色区在线播放2019|