王惠
[摘要]隨著信息技術的發展與應用,各種數據信息通過互聯網、云終端、交際圈、物聯網等之間的大規模傳遞,人類進入到一個大數據時代,數據信息之間的傳遞影響著人們的決策成本,傳統的信息不對等所造成的差距條件已經消失,而不起眼的數據卻能夠創造巨大的價值。本文對大數據時代背景下數據分析理念進行分析和指導。
[關鍵詞]大數據時代;數據分析理念;分析
[DOI] 10.13939/j.cnki.zgsc.2015.22.074
在傳統的商業運作模式中,在運營過程中對自身經營發展的分析只停留在數據的簡單匯總層面,缺乏有效地對客戶網絡、業務范圍、營銷產品、競爭對手優劣等方面進行深入解析;而在當今大數據時代,通過所接收的大量內部和外部數據中所蘊含的信息中透露的市場彈性,可以預測市場需求,進行分析決策,從而制定更加行之有效的戰略發展計劃。“大數據”是一個量特別大,數據類別特別大的數據集,并且這樣的數據集無法用傳統數據庫T具對其內容進行抓取、管理和處理。在當今信息時代,很多企業用戶在實際應用中把多個數據集放在一起,已經形成了PB級的數據量;數據類型廣,數據來源種類多,且數據種類和格式日漸豐富,囊括了半結構化和非結構化數據,早已打破傳統的結構化數據范疇,如何在大數據時代背景下進行科學有效的數據分析這需要加強對市場的了解,對泡沫經濟的規避,了解數據所傳遞的信息真假。
1 數據化決策的興起與運用
在大數據時代,信息之間的爆炸增長,使得各種信息傳遞非常之快,只需要拿起網絡終端就可以了解到地球另一邊發生了什么。文字、圖形、影像都化作數據流在網絡中以電信號的方式傳遞著信息。數據流在傳遞各行各業的信息同時形成了滲透于各行業的核心資產和創新驅動力。在大數據時代,企業所擁有的數據集合規模及數據的分析和處理能力決定著企業在市場中的核心競爭力。
因此通過數據分析進行決策漸漸成為新的分析理念,例如,在支付寶上進行對電影票房的投資,這些投資通過對導演往期作品和演員的表演張力,及投資方的選角等數據進行分析,預測電影的票房,選取投資可獲利的電影,進行票房投資,從而獲取票房分紅。我國的石油油田根據地震技術的收集數據,進行科學統一規劃的分析處理,形成對地下油田的分析建模,能夠有效直觀地展示地下油藏的分布情況,從而選擇油井的開采點。中國人民銀行通過對人民幣匯率的漲幅,進行數據分析,來制定符合中國國情的外匯貨幣政策,對貨幣進行宏觀調控,這能夠有力的保護人民幣升值時,在國際貿易市場中國進出口貿易所面臨的壓力。在大數據時代背景下,通過直覺和經驗進行決策分析的優勢不斷下降,在商業、政治及公共服務領域中,通過對大數據進行數據分析從而做出符合時代背景的決策,已成了目前的潮流。
2 數據分析理念及方法
(1)數據分析要引入統計學思想。在大數據時代背景下,傳統的抽樣分析已經并不適用于對大數據的分析中,在大數據時代應當要轉變思維,轉變抽樣思想,樣本就是總體,要分析與某事物相關的所有數據,而不是依靠少量數據樣本,這樣才能夠在最大限度地明白事物發展變更過程,能夠對數據所表露的信息進行更好地處理。要更樂于接受數據的紛繁蕪雜,不再追求精確的數據,這并不是說其嚴謹性降低了,而是往往不起眼,不符合常理的數據更能夠反映實際的情況。通過對數據網絡之間的聯系進行分析,不再探求難以捉摸的因果關系,通過數據的分析處理更能夠反應數據的變更。這些想法都與統計學相關通過所收集的數據,進行有效的分類處理,能夠更好地反應事物的變化,更有利于做出決策。
(2)數據分析流程。在實際的數據分析過程中,因大數據貫穿區域較廣,在地域和行業之間穿插交錯,顛覆了傳統的線性數據收集模式,而形成了顛覆傳統的、非線性的決策基礎,這種決策方式要求我們通過對數據進行收集,將各行各業所收集的基本信息,轉化為數據,將數據經過初步的整合分類,做出符合當地當時的數據信息,將數據進行深層次的技術處理,將處理過后的信息化為知識,運用到實際的決策中去。在大數據時代,數據的積累并不會貶值,而且還會不斷增值,為了更全面、深入地了解研究對象,往往需要對數據進行整合,這就使得數據的積累尤為重要。
(3)數據分析對統計學的意義。在大數據時代背景下數據分析理念能夠有效地對數據流進行合理地分類處理,進行科學的統計行為,統計與分析主要利用分布式數據庫,或者分布式計算集群來對存儲于其內的海量數據進行普通的分析和分類匯總等,這就意味著所有有用的數據信息均來源于數據分析處理之后的結果。大數據的數據分析理念擴寬了統計學的研究范圍,而不僅僅只是實現數據的對比,而是從根本上豐富了研究的內容,如:一些實時性需求會用到EMC的Creen-Plum、Oracle的Exadata,以及基于MySQL的列式存儲In-fobright等,而一些批處理,或者基于半結構化數據的需求可以使用Hadoop,滿足大多數常見的分析需求,對傳統的統計T作有著四個轉變。統計研究過程的轉變,使統計過程成為收集與研究。統計與分析這部分的主要特點和挑戰是分析涉及的數據量大,統計研究T作思想的轉變,數據的收集不斷增加,信息的錄入不斷升級,其對系統資源,特別是1/0會有極大的占用。這就使得能夠更好地進行數據分析處理決策。
3 數據分析過程中注意事項
3.1數據分析要明確變量
將數據收集進行處理是為了明確市場中的某一個變量意義,這就使得在進行數據分析的時候要能夠明確地找尋變量存在前后所發生的變化,通過數據對比可以知道該變量在大數據的市場中所存在的影響因素。是否對市場有著風險或有利于市場的開發利用,能夠在數據分析后做出合理決策。
3.2統計中不再追求精確的數據
大數據時代下,數據的不精確性不僅不會破壞總體信息可靠性,還有利于進行剝絲抽繭,從而了解總體情況。大數據時代,越來越多的數據提供越來越多的信息,也會讓人們越來越了解總體的真實情況。錯綜復雜的數據能夠反映數據之下到底是泥潭還是機遇。數據之間傳遞的信息良莠不齊,如果要一一追求準確性不利于統計工作的開展,因此可以將個別的異常值剔除。大數定律告訴我們,隨著樣本的增加,樣本平均數越來越接近總體,這就使得樣本與總體的差異性很小,更加符合實際情況。
4 結論
綜上所述,大數據包含結構內外的海量數據,隨著云計算平臺進行大規模收集處理,通過建立數據庫的手段,對數據分流,使用數據挖掘等方法進行處理、分析,使得所數據結果更加符合顯示狀況。數據分析理念是通過闡明存在于世界、物質、感官享受上的復雜網絡關系,從而做出符合時代背景的分析決策。