馬會寧
摘要:文章簡要地介紹了大數據及云計算平臺的相關概念,通過對大數據在統計學中的重要作用和應用思想進行分析,來探討大數據在統計學中的有效應用,以充分發揮大數據技術,提高云計算平臺利用率,幫助企業做好統計工作,加強企業信息管理,從而促使企業實施高效的風險管理,提升統計人員的工作水平,獲得更多的經濟效益。
關鍵詞:大數據驅動;云計算平臺;統計學;有效應用
隨著科學技術的高速發展,21世紀儼然成為一個大數據時代,其已經滲透于全球各大行業中,為企業的經營發展提供了重要技術支持。在過去,企業想要獲得各類信息,需要眾多人員去進行調查和收集,而且所獲得的信息也不夠全面,缺乏時效性。現如今有了大數據技術后,企業告別了傳統信息收集方式,可快速獲取有關企業各方面的信息,了解市場行情,并能根據所收集的各類數據來進行科學統計和詳細分析,以為企業經營決策提供可靠依據。在大多數企業中都建立了大數據驅動的云計算平臺,這是因為大數據和云計算密不可分,大數據需要依托云計算來進行處理。有效應用大數據驅動的云計算平臺,有利于提高企業統計能力,推動統計學的長遠發展。
一、大數據及云計算平臺的相關概念
大數據具有強大的處理能力,具有多元性和實時性,其信息來源于龐大的數據群組,基本特征表現在四個方面,即數據量大、數據類型多、數據有價值、數據處理速度快。其和云計算具有密不可分的關系,必須依仗于多臺計算機的協同操作,采用的是分布式計算架構。大數據驅動的云計算平臺,能夠收集海量數據,并對這些數據進行科學分析,涉及到分布式處理技術和云儲存技術,而且還有分布式數據庫。大數據和云計算都是互聯網技術的衍生,逐步走向數據化、信息化時代下的統計學,需要大數據的支持。有效利用大數據及云計算,可對復雜的數據進行統計和分析,建立關系型數據庫,從而得到高價值的數據信息。
二、大數據在統計學中的重要作用和應用思想
大數據在統計學中能夠起到重要作用,不僅可帶領統計學走向現代化、智能化,還能滿足企業當前的統計分析工作需求。有效的應用大數據統計分析工作,可幫助企業實施高效的風險管理工作,獲得具有時效性和準確性的信息數據,為企業的未來發展提供科學的信息支持。
大數據在統計學中的應用思想主要體現在以下幾個方面:一是強調了大數據抽樣調查工作。其不同于傳統統計學內容,大數據的樣本,其實就是過去所有資料的總和,對其進行調查和分析,不僅能了解數據的局部信息,還能掌握數據的總體信息;二是強調大數據統計分析的精確性。對于龐大而復雜的大數據來說,不夠精確的數據會帶來嚴重后果,得不償失;三是數據和數據之間具有關聯性和匹配性,不僅要了解數據的表面特征,更應當深入挖掘數據背后隱藏的關系,以提高數據價值。
三、大數據在統計學中的有效應用
(一)大數據下的統計運行流程
相較于傳統統計學來說,大數據時代下的統計學在深度、廣度方面都有著一定的變化。如當前統計學的分析研究對象不再局限于數量,還囊括了無法用數據來度量的文本信息、圖片信息、視頻信息、動畫信息和地理位置信息等。這種即使不屬于結構數據的信息,同樣也能進行統計和分析。而大數據下的統計分析工作,也不再如過往般復雜,變得更為簡單。
首先,要對數據進行收集。這是完全不同于傳統數據收集和保存的工作,面對龐大的數據組和復雜的數據類型,不可能對現有的數據進行簡單的匯總、編制和繪制統計表,而是利用大數據驅動的云計算平臺來對這些數據進行審核和儲存。雖然這些數據之間并不一定存在客觀而穩定的聯系,但是仍能從中發現和分析出隱藏的關系模式,比起統計樣本來說,這種大數據統計方式所得到的信息更加全面,數據也更有價值。
其次,要深入挖掘數據的價值。一是大數據時代下所收集到的數據價值并不只存在于表面,很多時候在對一個數據進行了分析后,其還能產生新的價值。為全面發現數據的價值,則需要對數據進行有效整合,將整合后的數據作為一個整體來進行統計分析,以此來研究數據之間的關聯性,獲取新的信息;二是要實現數據的可視化,對數據所展示出來的匹配性進行分析總結,得出結果;三是要深入而正確地解讀數據,這需要實施跨界合作。
(二)創新數據收集和分析方法
大數據下的統計工作具有一定的復雜性和難度,其在收集數據的過程中會發現諸多復雜數據,這些數據來自于一些復雜事件。由于大數據基于互聯網技術,因此其需要面臨一定的網絡安全風險,數據很可能遭遇突發狀況而受到損傷。在這種情形下,為規避數據安全威脅,一方面要加強網絡安全管理,另一方面則要不斷地創新復雜數據收集和分析方法,不僅要識別數據的表面特征,還應當深入了解數據的結構特點。
大數據驅動的云計算平臺,為大數據統計工作提供了一定的支持,尤其是在大數據規模逐漸擴大,大數據數量逐漸增多的情形下,開展大數據統計分析工作,需要多臺計算機的協同操作,這就涉及到大數據統計分析成本和時間問題。對于企業來說,其當然希望將大數據統計分析成本控制在最低范圍內,盡可能地縮短統計分析時間,提高統計時間效率。而要實現這一目標,則必須加強對大數據在統計學中的應用研究,創建一套能夠滿足企業大數據統計分析日常需求的理論體系,并且根據大數據的特征來進行統計和分析工具的開發,以促使其有效應對復雜的大數據,節約數據統計分析資源成本和時間成本。
在面對復雜數據的統計和分析時,常常會遇到數據類別重疊,數據類別不均衡等問題。為有效解決這些問題,不僅要重視對統計學相關理論的研究,還應當提出科學的統計分析算法,如舍棄法、分隔法和合并法等。可充分利用AdaBoost技術,并在此基礎上,實施局部聚類組合數據統計法,以使所收集到的復雜數據更加均衡。另外,常見的復雜數據統計分析方法還有C2C電子商務共謀欺詐識別、網絡入侵檢測等。
(三)全方位把握統計分析工作各環節
大數據在統計學的應用過程中,要求統計人員從各方面來把握工作細節,不斷地優化每一個工作環節,可從以下方面著手。
第一、要轉變傳統的統計學思想,充分掌握大數據的特征,堅持現代化統計分析工作理念,重視抽樣調查和測量工作的開展,并著重于發現和分析數據之間的關聯性。應當理清所收集的數據,并且不斷地挖掘數據的價值,從數據呈現的形態來分析出結果,得到科學而準確的數據信息反饋。
第二、要加強大數據下統計學研究,創新統計分析工作方法。應當融合不同學科,如自然科學、數據科學等,并充分發揮實質性科學的主導地位。需改進當前的統計分析工作手段,實施全過程性數據分析,保障數據的時效性,對每一次統計分析工作進行反思,轉變傳統的被動統計模式,主動地開展數據統計分析工作。在保證數據準確性和時效性的基礎上,對數據走勢進行科學分析,以提高預判性的準確率。
第三、要加強對統計人員的培訓,為其提供再教育機會。這是因為與傳統統計分析工作相比,大數據下的統計分析工作,對統計人員的要求更高,其不僅要掌握基礎的統計學知識,還要對大數據等現代技術有所涉獵,需要其融合應用統計技術和云技術。另外,要強化統計人員的責任意識,使其認識到自身職責的重要性,主動地投入到工作中,提升統計人員的職業道德素養。
第四、為滿足社會對統計人才的需求,企業和學校應當實施有效的校企合作,企業為學校統計學專業的學生提供實踐平臺,用豐富的實際案例來教導學生;而學校則可為企業傳輸更多優秀的統計人才。
四、結語
大數據技術的應用,對于各行各業的企業來說,有著極大的價值和作用。其不僅能夠為企業轉型提供大量的有效數據,還能幫助企業實現精準營銷,提高企業風險管理水平,優化企業資源配置,充分發揮人的作用。有了大數據技術的支持,企業可以獲得龐大的信息數據,而這些數據僅收集還遠遠不夠,要真正體現數據的作用,還需要企業加強統計分析工作,轉變傳統的統計分析思想,結合當前大數據應用實況來進行不斷創新,針對大數據的特征來采取有效的統計方式,以實現統計分析工作效益最大化,從而提高大數據在統計學中的應用水平,促進企業市場競爭力的提升。
參考文獻:
[1]張媛媛.基于云計算的大數據統一分析平臺設計與應用[J].信息與電腦(理論版),2018(18).
[2]喻勛勛.試論大數據及云計算平臺的應用[J].電腦編程技巧與維護,2018(07).
[3]劉士源.大數據和云計算平臺的應用淺談[J].科技風,2017(24).
[4]楊華.基于云計算的大數據分析平臺設計[J].電腦編程技巧與維護,2018(06).
[5]胡雯.基于大數據和云計算平臺應用[J].中國新通信,2019(02).
[6]張騰.淺談大數據和云計算平臺的應用[J].數碼世界,2018(01).
(作者單位:河南財政金融學院)