鐘偉松
?
大數據的發展及應用
鐘偉松
公誠管理咨詢有限公司,廣東 廣州 510610
首先對大數據的產生以及興起進行了簡要介紹,并在此基礎上,從關聯性、數據可視化以及經濟性與社會學角度出發對其應用展開了研究。
大數據;發展;應用
近年來,信息技術以日新月異的速度飛快發展,世界各國在積極進行現代化建設的過程中,都積極增加對信息技術的應用,促使社會運行過程中每天都會產生海量的數據。這標志著人類文明進入了大數據時代。大數據時代給予各個領域較多的發展機遇,同時也帶來了較多的挑戰,我國在長期發展中積極做好準備工作,采取多種措施來面對大數據的機遇和挑戰,在這種情況下,積極加強大數據的發展及應用研究具有重要意義。
近年來,我國在積極發展中,對大數據和云計算的應用越來越廣泛,人們普遍意識到我國已經進入到了大數據時代。20世紀90年代,數據的功能已經開始顯現出來,美國某超市在經營過程中,為了加強POS數據分析功能,及時融入了Apriori算法,這樣一來就能夠對商品的銷售狀況進行清晰的掌握,從而對顧客的購買習慣以及行為等進行有效的預測。在這一算法有效應用的過程中,該超市工作人員通過分析發現,年輕的男子在購物中常常習慣于同時購買尿布以及啤酒,因此在接下來發展中,為了方便顧客的購買,開始將尿布同啤酒擺放在相鄰位置,這一舉動一定程度上提升了銷售額。
從以上事例可以看出大數據的重要性,在這種情況下,近年來世界各國展開了對大數據的研究和分析,這也是大數據快速發展的主要原因[1]。我國在積極進行現代化建設的過程中,積極借鑒了美國等發達國家對大數據的應用經驗,并在日常經營中的多個領域開始進行大數據應用的實踐,如工業、學術甚至是政府工作中。現階段,我國的大數據應用和建設還處于初級階段,在未來的發展中,人們必須加大對大數據功能的重視以及認知程度,并將其合理部署于我國各個領域,為實現技術以及科技的創新奠定良好的基礎。
2.1 關聯性分析
一般,如果給定已知條件,X、Y保持關聯,那么如果對X的狀況進行了解的過程中,可以有效對Y進行預測;反之,如果已知Y的狀況,也能夠對X進行有效預測。由此可見,如果在因果關系不明確的狀況下,X、Y在使用過程中,可以成為對方的預測指示器。這種關聯性的實例較多,例如,John Hopkins大學計算機專家在日常工作中,能夠對二十億條推特帖子進行利用,并運用自身的方式構建數據建模,從而有效計算出相關的流感傳染率信息,將這些信息同“谷歌流感趨勢研究”中的相關數據進行對比,發現二者具有高度的一致性[2]。
現階段,如果一定的關聯性在新數據源中得以體現,那么傳統官方統計就能夠被準確地反映出來,這一過程中,相關方向的預測以及研究將更加便捷和快速。例如,MIT工作者在日常工作中,要想對通貨膨脹率進行有效的估計,就可以對商品價格以及網上銷售狀況等數據進行充分的分析來實現[3]。這一手段在使用過程中,關鍵在于獲得商品每一天的網上價格,但是多數國家在日常運行過程中,都是按月發布消費價格指數的。在這種情況下,在對通貨膨脹進行檢測的過程中,該手段要較傳統手段更加快速和準確。

圖1 流感傳染率的官方數據與基于推特的數據比較
2.2 數據可視化
視覺表現形式在數據中的體現研究就是數據可視化,在對其展開研究的過程中,目的在于通過圖形化方式,促使相關信息的交流更加清晰有效,值得注意的是,這一方法的產生遭遇大數據,當大數據時代來臨,該技術的應用更加廣泛。以往,對大量數據進行多維度觀察是可視化實施的主要用途,這一過程中,相關數據的變化、趨勢等都能夠得到有效的反映,當大數據時代來臨時,可視化不僅能夠實現以上功能,同時還可以有效展示大數據中隱藏的模式內容,從而提升相關趨勢預測的準確性。

圖2 2015年美國全國槍擊死亡情況
上圖為數據可視化表示在2015年美國全國槍擊死亡情況中的體現,其中年齡用橫軸進行表示,槍機致死人應用不同的弧線進行表示,而弧線都擁有統一的起點,代表年齡為0,終點代表死亡年齡。弧線呈現出兩種顏色,分別為灰色和橘色,而槍擊身亡的年級應用中間分界點進行表示[4]。由此可見,2015年,美國死于槍擊的人數共為9595人,因此產生了9595條弧線,構成了以上圖形,通過圖形展示出來的數據信息,促使人們在對其進行觀察的過程中就能夠意識到槍擊的可怕性,也因此將可視化的功能進行了充分的展現。
2.3 在經濟性與社會學當中應用
以上兩種大數據的功能在應用的過程中只是一種手段的體現,而大數據真正的功能在于利用以上功能針對各個領域制定科學的應對措施。例如,USGS為美國地理測量會,其運行過程中運用相關系統對地震爆發的信息進行了有效的檢測和預測,并將該信息有效傳遞給當局,當USGS對地震發生的實際狀況進行了驗證以后,可以對發生地震的震中以及等級進行明確。通過該系統的運行檢測表明,其中正確警報率高達90%。
同時,經過多年實踐表明,多數數據源在使用過程中,已經不再局限于發揮速度和規模的功能,同時其包含的大量數據能夠具有全面性,對多個角度產生重要的影響。多數情況下,官方在展開各個方面的統計過程中,不僅會對大數據進行應用,更重要的是利用其能夠實現對細節以及深度內容的挖掘[5]。現階段,社會媒體定性信息越多,就越能夠對一件事物的整體進行全面描繪,而相關部門以及人員就越能夠及時采取有效措施來面對多種變化。這一過程中呈現出來的是速度、規模等大數據功能和價值。
綜上所述,近年來,世界各國以及各個領域在積極發展的過程中,都增加了對信息技術的有效應用,海量數據的產生,極大地轉變了人們的生活以及工作。在這種情況下,我國在謀求可持續發展的過程中必須采取積極的態度來面對大數據時代帶來的各種機遇和挑戰。本文首先對大數據的產生以及興起展開了研究,并從聯性、數據可視化以及經濟性與社會學角度對大數據的具體應用進行了探討,希望對我國社會的進步起到促進作用。
[1]李娜.對應用大數據推動經濟社會發展創新的思考[J].價格月刊,2015(3):77-82.
[2]李仲達,林建浩,王美今.大數據時代的高維統計:稀疏建模的發展及其應用[J].統計研究,2015(10):3-11.
[3]省人民政府印發《關于加快大數據產業發展應用若干政策的意見》、《貴州省大數據產業發展應用規劃綱要(2014-2020年)》的通知[J].貴州省人民政府公報,2014(3):9-21.
[4]鄔賀銓.制定國家大數據發展戰略提升技術創新與應用水平[J].世界電信,2014(Z1):37-43.
[5]楊震乾,楊泳丹.面向大數據的分布式存儲技術的發展與應用[J].電子技術與軟件工程,2016(2):201.
F49
A
1009-6434(2016)04-0059-02