文 | 本刊記者 孫杰賢
大數(shù)據(jù)落地需要可視化
文 | 本刊記者 孫杰賢
“在互聯(lián)網(wǎng)+的大背景下,新奧能源正在思考未來管理的模式以及公司戰(zhàn)略升級的方向。我們需要打造出基于大數(shù)據(jù)驅(qū)動的智能運營體系,通過持續(xù)的大數(shù)據(jù)治理和大數(shù)據(jù)應(yīng)用迭代,推動公司管理的變革提升和業(yè)務(wù)的創(chuàng)新發(fā)展。同時,針對于燃?xì)猱a(chǎn)業(yè)的特點,我們希望通過業(yè)務(wù)數(shù)據(jù)的深度挖掘來保障公司資源的高效整合與利用。”新奧能源控股有限公司信息副總監(jiān)崔占海這樣表述新奧能源啟動大數(shù)據(jù)項目的初衷。
其實,新奧能源的大數(shù)據(jù)項目還有一個現(xiàn)實的背景:從全球范圍看,政府為改善環(huán)境質(zhì)量,大力推廣清潔能源發(fā)展,而公民環(huán)保意識整體提升,清潔能源可謂集萬千寵愛于一身,市場前景看好。而與此同時,新能源企業(yè)正面臨著日趨嚴(yán)格的政府監(jiān)管、激烈的可替代能源的競爭和更嚴(yán)苛的消費者需求。新能源企業(yè)如果繼續(xù)以現(xiàn)有的業(yè)務(wù)模式來面對當(dāng)前的市場環(huán)境,往往會捉襟見肘,而大數(shù)據(jù)為其提升管理效率和拓展業(yè)務(wù)邊界提供了前所未有的可能性。
原始數(shù)據(jù)是零散和沒有規(guī)律的,經(jīng)過篩選和組織后會成為信息,而把相關(guān)聯(lián)的信息整合并有效地呈現(xiàn)最終轉(zhuǎn)化為知識與價值才是最關(guān)鍵的。“如何快速(甚至是實時)和準(zhǔn)確地對這些海量數(shù)據(jù)進(jìn)行建模、分析與展現(xiàn),從而真正實現(xiàn)數(shù)據(jù)的價值”是新奧大數(shù)據(jù)平臺重點解決的問題。“數(shù)據(jù)可視化分析是最好的工具。” 崔占海說,“不是人人都能夠成為數(shù)據(jù)科學(xué)家,這需要有極高的專業(yè)知識和深厚的行業(yè)經(jīng)驗和洞察力。而有了數(shù)據(jù)可視化分析工具,一個普通人也能看出一些關(guān)鍵指標(biāo)和一些重要的趨勢性暗示。”
大數(shù)據(jù)整體產(chǎn)業(yè)鏈基本分為這樣幾個環(huán)節(jié):數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化在簡化數(shù)據(jù)量和降低大數(shù)據(jù)應(yīng)用的復(fù)雜性中,大數(shù)據(jù)分析發(fā)揮著關(guān)鍵的作用。對于大數(shù)據(jù)的存儲、管理和處理任務(wù)離不開云計算,而與人交互離不開數(shù)據(jù)可視化。數(shù)據(jù)可視分析解決的是大數(shù)據(jù)落地問題。當(dāng)經(jīng)過數(shù)據(jù)可視分析和可視化的方法以邏輯形式呈現(xiàn),企業(yè)決策層就能輕松通過數(shù)據(jù)實現(xiàn)輔助決策和預(yù)判了,從而讓數(shù)據(jù)與行業(yè)結(jié)合,成為商品、產(chǎn)生價值。
數(shù)據(jù)可視化是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程,是大數(shù)據(jù)信息處理最為重要的環(huán)節(jié)。數(shù)據(jù)可視化不僅能夠幫助數(shù)據(jù)的最終呈現(xiàn),也對發(fā)現(xiàn)數(shù)據(jù)中新的信息氣到了非常關(guān)鍵的作用。舉個例子,錯綜的關(guān)系是眾多大數(shù)據(jù)場景中的重要一環(huán),社交網(wǎng)絡(luò)或許就是最顯著的例子,想要通過文本或表格的形式理解其中的大數(shù)據(jù)信息是非常困難的;相反,可視化卻能夠?qū)⑦@些網(wǎng)絡(luò)的趨勢和固有模式展現(xiàn)地更為清晰。
總結(jié)來說,可視化可以幫助大數(shù)據(jù)獲得完整的數(shù)據(jù)視圖并挖掘數(shù)據(jù)的價值,讓普通人也能變成“數(shù)據(jù)科學(xué)家”,這是其最大價值所在。正如中國傳媒大學(xué)教授沈浩所說:除了上帝,每個人都須用數(shù)據(jù)說話!怎么說?顯然“可視化”很重要,因為“只有看得見才做得好,看得見才能做得到”。
可視化方法可通過創(chuàng)建表格、圖標(biāo)、圖像等直觀地表示數(shù)據(jù)。但與一般性存儲應(yīng)用的可視化方案不同,由于面對的是大數(shù)據(jù),所以在數(shù)據(jù)獲取和統(tǒng)計方面是難點。
比如統(tǒng)計當(dāng)前云存儲系統(tǒng)的文件總量是一個相對困難的問題:一方面時效性難以把握,另一方面文件總量是不斷變化的,導(dǎo)致結(jié)果的誤差總是存在。而要解決這個問題必須從底層、從云存儲系統(tǒng)入手。可以在元數(shù)據(jù)服務(wù)器存儲盡量多的文件元數(shù)據(jù),同時計算和存儲統(tǒng)計模型數(shù)據(jù)等等,同時必須意識到:當(dāng)數(shù)據(jù)集達(dá)到一定數(shù)量級,那么必須允許統(tǒng)計值存在允許的誤差。而在數(shù)據(jù)的呈現(xiàn)與交互方面,基于大數(shù)據(jù)的可視化分析也面臨著挑戰(zhàn)。統(tǒng)計圖和主題圖,不同的需求導(dǎo)致了不同的數(shù)據(jù)呈現(xiàn)和交互方式。但每次根據(jù)不同的需求去更改設(shè)計是個勞心費力的工作,需要同時帶有用戶驅(qū)動的數(shù)據(jù)簡化模型、高可擴(kuò)展性與多級層次的數(shù)據(jù)可視化工具。
所以,大規(guī)模數(shù)據(jù)和高維度數(shù)據(jù)會使可視化工作變得困難。對于像新奧能源這樣的企業(yè)用戶來說,首先應(yīng)該保證網(wǎng)絡(luò)與硬件設(shè)備能夠滿足數(shù)據(jù)的高速獲取以及完整性,并通過數(shù)據(jù)治理或信息管理確保數(shù)據(jù)準(zhǔn)確與安全,必要的時候可以請專業(yè)人士比如數(shù)據(jù)科學(xué)家來對數(shù)據(jù)進(jìn)行解讀。
但是可視化只是讓企業(yè)的數(shù)據(jù)講述方式更加豐富了一些而已,要成功的完成數(shù)據(jù)講述,關(guān)鍵還是在于數(shù)據(jù)的質(zhì)量。
Qlik亞太及日本區(qū)副總裁Phillip Beniac是可視化分析領(lǐng)域的技術(shù)專家,在該領(lǐng)域有20多年的經(jīng)驗。而Qlik是一家可視化分析廠商,該公司不久前剛剛宣布在中國成立外商獨資企業(yè)。Phillip Beniac認(rèn)為,企業(yè)在進(jìn)行大數(shù)據(jù)的可視化分析時,最重要的一點是數(shù)據(jù)的完整性和準(zhǔn)確性。
他說:“數(shù)據(jù)已經(jīng)成為企業(yè)和機(jī)構(gòu)的戰(zhàn)略性資產(chǎn),數(shù)據(jù)也帶來了無限可能。但是要想把數(shù)據(jù)、終端和人連在一起,實現(xiàn)人機(jī)交互,唯一能做到的就是通過平臺來實現(xiàn)。沒有平臺,就沒有辦法把這些數(shù)據(jù)和人連接起來,也無法隨時隨地將數(shù)據(jù)的價值和人的能力充分發(fā)揮出來。可視化分析固然重要,用戶能夠以自己喜歡的形式來使用和利用數(shù)據(jù)。但關(guān)鍵是用戶是否有這樣一個平臺,能夠提供一個安全的、準(zhǔn)確的信息和數(shù)據(jù),讓用戶真正了解數(shù)據(jù)背后隱藏的內(nèi)容,從而以此做出正確的商業(yè)決策,提高企業(yè)管理和運營效率。所以,一個理想的大數(shù)據(jù)可視化分析平臺應(yīng)該具備的能力是吸收所有的數(shù)據(jù)來源,不僅僅是一部分的數(shù)據(jù),這對數(shù)據(jù)分析或者是數(shù)據(jù)視覺化非常重要的,要整合所有的數(shù)據(jù),而不是部分?jǐn)?shù)據(jù),而且這些數(shù)據(jù)是準(zhǔn)確和安全的。”