孫敏 王琳
摘 ?要: 本文主要以大數據時代下的數據可視化方法分析為重點進行闡述,結合當下大數據時代數據管理實際情況為依據,首先分析大數據時代下的數據可視化方法產生背景,包括數據可視化概述、大數據時代下的數據可視化的必要性、大數據時代面臨的機遇和挑戰,其次從結合信號和噪音,科學使用統計手段、事先研究,提前時間、全面分析,強化數據質量、統計探究不是簡單的數字計算,應保證簡約性、評測變異性,檢驗假設、增加重復幾率,完成數據可在現幾個方面深入說明并探討大數據時代下的數據可視化方法,最后闡述大數據時代下的數據可視化思考,旨意在為相關研究提供參考資料。
關鍵詞:?大數據時代;數據可視化;方法;有效措施
中圖分類號:?TP311.5????文獻標識碼:?A????DOI:10.3969/j.issn.1003-6970.2019.09.041
本文著錄格式:孫敏,王琳. 大數據時代下的數據可視化方法分析[J]. 軟件,2019,40(9):182-184+191
Analysis of Data Visualization Approach in Big Data Era
SUN Min, WANG Lin
(Shanghai Publishing and Printing College, Shanghai 200082)
【Abstract】: In this paper, the data visualization approach in the era of big data was mainly analyzed. Firstly, the background of data visualization approach under the actual situation of data management in the era of big data was analyzed, including overview of data visualization, necessity of data visualization in the era of big data, opportunities and challenges faced in the era of big data. Secondly, the data visualization approach in the era of big data was be further explained and explored in several aspects including combination with signal and noise and scientific use of statistical means, researching in advance and ahead of time, comprehensive analysis and focusing on data quality, simplicity guarantee since statistical inquiry was not a simple digital calculation, variability assessment and hypothesis check, and increasing repetition probability and completing data reproducibility. Finally, the thinking of data visualization in the era of big data was stated, aiming to provide references for relevant research.
【Key words】: Era of big data; Data visualization; Approach; Effective measures
大數據時代的到來使得用戶給予數據的分析需求加以增加,數據可視化的需求呈現的越來越明顯。數據可視化也就是借助計算機圖形學和圖像加工技術等,作用在人類視覺和腦部認知方面,從而保證美學因素完美結合。良好的數據信息圖像可以給人一種較強的藝術感,且圖表的研究為一項巨大工程,包括圖形選擇以及顏色搭配等等,這些都需要對數據信息進行可視化的處理和優化,因此大數據時代下的數據可視化方法研究十分必要,以下為筆者給予的相關分析與建議。
1.1??數據可視化概述
在21世紀開始,信息數據爆炸發展為人類的巨大機遇,人們沉浸在信息海洋中,然而針對信息和知識的掌握相對匱乏,人類研究信息的能力和獲取信息的能力相差比較遠。并且數據信息的高維度和動態性在無形中增強信息使用的難度。在以往企業占有較高地位的關系型信息庫中涉及諸多難以管理的信息,這些信息存在多樣化的特征,包括各個種類的文本以及視頻和傳感器數據,與此同時信息更新的速度發展到全新的層次[1]。歸納之后可以理解
為大數據時代的特征為大量化、多樣性以及迅速性,人們在大量的數據信息中獲取有用數據,使得大數據科學技術在潛移默化中替換以往的信息數據管理技術。在互聯網視角下,大數據時代正式拉起帷幕,在此期間可以高效的表現出多元化數據模型,有助于數據可視化的宣傳與推廣。
1.2大數據時代下的數據可視化的必要性
數據分析需要人們將海量的數據信息內涵挖掘出來,歸納出分析對象的內在本質,幫助相關管理者進行數據的有效性判斷。其按照用戶的基本需求,在數據庫中尋找需求的數據,便于適應用戶的特殊性需求,數據信息挖掘科學技術成為人們長時間給予數據庫研發的結果[2]。在如今的數據爆炸時代中,選取圖形化的方式,清晰的溝通信息成為數據可視化的終極目標,其充當信息媒介一種類型,存在諸多的數據信息表現形式,展現一定的趣味性和生動性,更加具備理性以及感性,可謂美和用的巧妙融合。除此之外,圖表設計需要建立在設計要點基礎之上,同時顏色的選擇也要滿足個性化需求,結合愛好的選擇加以設置,若一個公司內部的設計原則圍繞藍色系展開,則選擇的圖表顏色需要和設計理念進行切合,防止使用紅色或者黃色等屬于暖色系的色彩,進而提升數據信息的理想化處理思想。
1.3大數據時代面臨的機遇和挑戰
云計算和收集以及平板電腦已經遍布世界上各個范圍之中,圍繞數據產生以及承載的手段開展。社交網絡在持續化普及,促使人們的生活行為以及情緒等呈現細節化發展趨勢[3]。依據用戶自身的行為和愛好,繁雜的數據信息之下找到更加貼合用戶習慣的產品,同時優化與整合數據信息,凸顯出大數據存在的效用。
大數據時代的產生作為每一個行業前進的動力,涉及的技術方針并不是直接管理大規模的數據,而是專業化加工諸多信息數據。也就是說,若將大數據視作一種新時代的產業,則這種產業獲取綜合效益的關鍵便是提升數據處理能力,在數據的深入處理之下完成數據信息的“增值”,更好的推動社會發展。
對于可視化數據的使用,應該制定前期信息研究與信息挖掘準備工作,具體的操作要點如下:
2.1結合信號和噪音,科學使用統計手段
刻畫變異性成為統計學領域內的一項重點主題,在一些情況之下,變異性存在較強的實用性[4]。由于人們需求預測變量來源于變異性中的些許差異,變異性的形式豐富多樣,大多數統計研究步驟的起點便是基于數學進行抽象加工,統計往往選取概率分布的方式描述某一個結果在個體分析中存在的集體性差異,大數據促使相關問題呈現重要性。
按照統計方式發展為科學數據問題的思想轉變會塑造一個個體數據獲取的具體形式,以完全掌握問題為基礎,統計研究者會深入的思考解決問題方式的有效性,并且確保每一中變異性的產生會突破理想中數據與統計之間關聯的假設,之后對數據信息進行可視化處理。
2.2事先研究,提前時間
在數據獲取要耗費諸多的實踐與精力時,統計主題總是無法簡單的總結成獨立的問題,包括樣本量的數值確定?而存在豐富的數據統計經驗的人們便不會僅僅注重設計中的一些此節,而是基于整體目標進行思考。包括數據處理預期的結果應該是什么?所以在數據可視化研究過程中,要事先研究,加快研究時間的速度和進程。
2.3全面分析,強化數據質量
即便數據進行預算處理,然而在實際的分析中總會需要更多的努力,也就是數據整理或者數據優化,檢測機構也需要充分認知這一個事實,數據的缺失被軟件及時檢測與識別至關重要[5]。數據轉成便捷的格式之后,需要對數據進行探索性研究,這項流程通常出現在信息量比較多的情況。此外,要研究數據獲取的具體方式以及獲取方式對數據處理帶來的影響。
2.4統計探究不是簡單的數字計算,應保證簡約性
統計加工軟件提供一些便于分析數據的工具,并不是定義層面上的研究。問題相關背景的出現比較特殊,研究的本質成為和研究方式息息相關的一項問題。即使在某種情況下可以使用特殊算法,然而并不能代表數據可視化的最終答案。并且把研究中一些流程轉成結構化算法,能夠巧妙的幫助人們進行重復性研究[6]。而簡約性也就是選取簡便的方式,在必要的情況下引進復雜性理念,促使數據可視化的研究進程。
2.5評測變異性,檢驗假設
通常而言,一切的生物學檢測在重復的過程中會出現顯著的差異性,引起數據計算出的一切結果存在一定的變異性,統計數據研究的目標之一為便于研究者進行變異性的評測,往往按照標準差以及置信區間的思想加以呈現。統計數據建模以及推斷需要建立在數據參數評估基礎之上,在得到相關的報告結果時,給出部分變異性說明。與此同時,大數據的典型特點為其自身具備的變異性評測比較樂觀,大數據在某些情況下并不十分龐大,針對小樣本的重復檢測相應標準差應該保證認真評估的性質,由于這些檢測之間存在較高的相關性。
除此之外,經常使用的統計數據模型為線性關系的思想,但是在數據確定之后,便會出現線性模型使用的合適性相關問題,所以需要被進一步篩選和分析。不僅是非線性以及統計問題,還包括數據信息缺失和檢測偏差等,這些都會在一定程度上和統計數據的真實模型產生偏差,所以在具體的數據可視化分析中要格外注意。
2.6增加重復幾率,完成數據可在現
一個優秀的研究者會認真處理每一項數據信息,找到諸多情況下出現的結果,此項過程和諸多操作流程存在關聯,涉及部分可視化與數據信息切片,最后數據信息中的隱含特征會呈現出趣味性,記錄在結果表格中。理想視角下,多次實驗需要獨立的研究者加以完成,而在不同的情況下檢測的結果需要諸多的時間加以分析,在多次實驗視角下,合適的數據信息排列存在一定價值[7]。在現在的科學結果體系分析過程中,一個容易實現的數據處理方式便是可在現性,在特殊的數據完整描述中,在現某些結果中的表格信息以及圖像信息成為可能性,所以針對數據的計算框架以及軟件設定等流程應該保證數據信息的可在現,保證數據可視化的處理成效。
在大數據時代的來臨之際,社會上關注消費信息的人群逐步龐大,發展為“數讀”人群,并且數據可視化的研發人群數量不斷增加,要想更好的完成數據可視化,要最大限度上給人們提供數據可視化觀念的機會,跟隨新科學技術的產生腳步,采取相應的方式進行用戶和信息數據之間的交互,全面完成數據可視化的操作理念。
3.1多維度疊加式數據可視化
此類型的數據可視化往往存在于社交網絡以及生活消費層面上的疊加,相應的疊加模式給予年輕人充分的吸引力和感染力,站在地理位置的網路數據分析視角上,可以體現出信息數據傳遞的互動性和娛樂性,包括在微信的實際應用,用戶可以憑借對方與自己之間的地位距離信息對好友進行篩選[8],對于佳緣網絡,設置一種地圖查找位置的模式,用戶借助此項模式并且對他人進行地理數據的標注,之后制定交友地圖;對于大眾點評手機使用期間,按照地理信息準確的查找周圍酒店以及餐廳,用戶在對應的地圖上進行店鋪留言評價處理,或者給予其他消費者留下參考信息,所以數據可視化的具體操作和使用,可以確保用戶獲取信息數據存在多維度的性質。
3.2及時性數據信息關聯
大數據時代下的數據可視化不僅僅存在單一模式下的數據狀態,還具備實用性功能,便是對存有關聯性的可視化數據加以對比,挖掘數據信息之間的關聯性。對于大數據的視角,此種數據可視化操作可以隨時生成。換言之,數據收集之后可以迅速產生可視化計劃,支付寶的電子對賬單數據服務便是如此,以用戶為中心自動化產生個性數據圖表信息,輕松的找到自身消費情況,對消費加以調整與計劃,此類型的服務可以隨時給用戶搭建數據可視化平臺,便捷性的凸顯數據和數據之間的關聯[9]。
3.3全媒體網絡數據的可視化處理
大數據時代一方面要加工大量的數據信息,另一方面要對數據進行加工與傳播。在不知不覺期間,數據可視化會存在于生活中的每一個環節中。包括智能手機,其不僅是采集信息數據的工具,還是數據可視化彰顯平臺。如今的新聞聯播也逐步使用數據圖表,動態化的演示相關報道內容,電子游戲中時常產生的數據可視化元素,無形中促使作品的科技感更加強烈。教育和科普層面上處理數據可視化,人們逐步感興趣于數據的高效呈現,滿足數據可視化的發展需求。此外,智能手機以及平板電腦的使用背景下,全新的交互方式勢必會推動數據可視化的進程。
3.4大數據可視化運用的領域
其一,氣象預報。在大量的天氣數據研究工作中,不管是基本形式的云圖或者中尺度的數值預報,數據可視化都能夠把其中的數據信息細致化傳遞給用戶,提供天氣全面性的動態數據。把大量的天氣信息轉換成圖像,之后在用戶使用界面上出現溫面以及壓面,準確定位暴雨我位置或者其他天氣變化
位置,提供科學依據[10]。其二,工程領域。建筑設計或者水利工程中使用數據可視化,切合實際的分析數據產生來源和數據信息的使用效果,保證每一個領域的數據信息得到規范與科學化處理。
綜上所述,在網絡技術快速發展的如今,在量變轉換成質變的數據時代全然產生,所以關注數據分析和研究存在巨大的現實意義,所以開展研究課題具有十分重要的價值。相關人員要基于數據可視化的基本特征和含義,深入分析用戶需求的數據信息,促使其可以有效的幫助用戶做出數據處理決策,通過科學的方式,基于多維度疊加式數據可視化、及時性數據信息關聯、全媒體網絡數據的可視化處理的發展前景,帶動社會的持續化發展。
參考文獻
[J]. 軍民兩用技術與產品, 2017.
[1]?陳偉, Smieliauskas Wally . 大數據環境下基于數據可視化技術的電子數據審計方法[J]. 中國注冊會計師, 2017(01): 85-89+4.
[2]?柏茂源, 代福平. 數據可視化在電子商務大數據領域的應用研究[J]. 藝術與設計(理論), 2017(03): 76-78.
[3]?何雨宸. 探析大數據時代可視化傳播的重要意義及實踐價值[J]. 新聞研究導刊, 2018, 9(01): 43+46.
[4]?數字冰雹, 夏進. 駕馭數據, 洞悉價值——數字冰雹大數據可視化系統行業應用分享[J]. 大數據時代, 2017(02): 52-56.
[5]?李炎, 馬俊明, 安博, 等. 一個基于Web的輕量級大數據處理與可視化工具[J]. 計算機科學, 2018, 45(09): 60-64+93.
[6]?陳海蕊. 基于電子商務大數據領域的數據可視化分析系統設計[J]. 科技創新與應用, 2018, (24): 82-83.
[7]?郝芳. 基于大數據可視化技術分析高校教師壓力現狀[J]. 現代商貿工業, 2018, 39(13): 90-91.
[8]?閆實, 付佳, 石莉. 大數據環境下基于智慧校園的教學改革[J]. 軟件, 2018, 39(02): 208-211.
[9]?孫斐婷, 朱朋飛, 尹珊. 面向統計應用的數據可視化系統設計[J]. 測繪與空間地理信息, 2017.