劉雨蓉
(寧波工程學(xué)院,浙江 寧波 315211)
在數(shù)據(jù)分析上,傳統(tǒng)統(tǒng)計(jì)學(xué)理論是利用概率論、數(shù)理分析工具來挖掘數(shù)據(jù)規(guī)律,以構(gòu)建數(shù)學(xué)模型,大數(shù)據(jù)分析是通過計(jì)算機(jī)技術(shù)來整合、分析龐大數(shù)據(jù)庫,挖掘數(shù)據(jù)本質(zhì)規(guī)律,以發(fā)揮出對(duì)生產(chǎn)的指導(dǎo)作用。相較于以往的統(tǒng)計(jì)學(xué)分析理論,大數(shù)據(jù)分析技術(shù)更為完善,統(tǒng)計(jì)學(xué)分析會(huì)受到各類人為因素的影響,抽樣調(diào)查也可能會(huì)遺漏數(shù)據(jù),應(yīng)用大數(shù)據(jù)分析,可以從根本上解決上述問題,提高數(shù)據(jù)分析的準(zhǔn)確性。
在傳統(tǒng)統(tǒng)計(jì)分析與大數(shù)據(jù)分析上,分析對(duì)象均為定量數(shù)據(jù),并非抽象事物,因此,在獲取數(shù)據(jù)時(shí),需要通過有效渠道來轉(zhuǎn)化原始信息,形成良好數(shù)據(jù)形式,因此,從本質(zhì)來看,傳統(tǒng)統(tǒng)計(jì)學(xué)分析、大數(shù)據(jù)分析在數(shù)據(jù)形式上是相同的。
大數(shù)據(jù)的應(yīng)用符合社會(huì)發(fā)展趨勢(shì),在海量數(shù)據(jù)中,應(yīng)用大數(shù)據(jù)技術(shù),可以做出精準(zhǔn)預(yù)測(cè),目前,大數(shù)據(jù)分析已經(jīng)在各個(gè)行業(yè)中得到了廣泛應(yīng)用,統(tǒng)計(jì)工具也在不斷升級(jí)、轉(zhuǎn)型,統(tǒng)計(jì)學(xué)理論與大數(shù)據(jù)分析的結(jié)合也成為大勢(shì)所趨,針對(duì)此來看,統(tǒng)計(jì)學(xué)理論在大數(shù)據(jù)時(shí)代的應(yīng)用會(huì)表現(xiàn)出幾個(gè)趨勢(shì):
應(yīng)用傳統(tǒng)統(tǒng)計(jì)抽樣方式,無法對(duì)龐雜數(shù)據(jù)來進(jìn)行分析、處理,也難以展現(xiàn)出大數(shù)據(jù)的知識(shí)密度,獲取的分析結(jié)果自然不夠精確,這無疑會(huì)影響數(shù)據(jù)的挖掘、使用成效。將數(shù)據(jù)分析、統(tǒng)計(jì)學(xué)理論之間結(jié)合,能夠打破傳統(tǒng)數(shù)據(jù)分析模式的限制,充分發(fā)揮出大數(shù)據(jù)的價(jià)值。大數(shù)據(jù)內(nèi)容多元、混亂,對(duì)數(shù)據(jù)形式準(zhǔn)確性要求不高,可以利用統(tǒng)計(jì)學(xué)分析方式來對(duì)比數(shù)據(jù)變化,同時(shí),大數(shù)據(jù)對(duì)數(shù)據(jù)精度的要求并不是很高,而是“以量取勝”,更加側(cè)重于整體研究,通過數(shù)據(jù)分析、統(tǒng)計(jì)學(xué)理論之間的結(jié)合融合了兩者優(yōu)勢(shì)。
大數(shù)據(jù)具有價(jià)值、多樣、高速、大量4個(gè)方面的特點(diǎn)。基于大數(shù)據(jù)分析的特點(diǎn),既往相關(guān)專家總結(jié)出了如下公式,即:大數(shù)據(jù)=高頻海量數(shù)據(jù)+復(fù)雜類型的數(shù)據(jù)。在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)分析工作便是對(duì)海量數(shù)據(jù)的分析、歸納、統(tǒng)計(jì)、總結(jié),挖掘出其中具有價(jià)值的信息和內(nèi)容,進(jìn)行對(duì)比,以得出具有價(jià)值的信息。在數(shù)據(jù)收集、處理環(huán)節(jié)中,需要進(jìn)一步創(chuàng)新數(shù)據(jù)分析渠道,擴(kuò)充數(shù)據(jù)來源,對(duì)于相關(guān)人員而言,要具備數(shù)據(jù)積累、處理的意識(shí)。大數(shù)據(jù)具有一定的流動(dòng)性,在時(shí)間的流逝下,數(shù)據(jù)信息數(shù)量會(huì)繼續(xù)增加,因此,相關(guān)人員要具備創(chuàng)新化的數(shù)據(jù)分析理念,讓數(shù)據(jù)真正實(shí)現(xiàn)增值,以幫助人們更好地解決問題。
在信息技術(shù)的發(fā)展與完善下,對(duì)大數(shù)據(jù)分析技術(shù)的應(yīng)用也提出了更高要求,在具體操作上,需要基于傳統(tǒng)數(shù)據(jù)分析方式來對(duì)各類現(xiàn)象進(jìn)行預(yù)測(cè)、解釋,發(fā)揮出大數(shù)據(jù)在數(shù)據(jù)分析中的作用,應(yīng)用多元化的數(shù)據(jù)分析方式,與實(shí)際情況結(jié)合,在確保數(shù)據(jù)分析準(zhǔn)確的基礎(chǔ)上,優(yōu)化統(tǒng)計(jì)質(zhì)量管理模式,進(jìn)一步挖掘大數(shù)據(jù)的價(jià)值,為行業(yè)發(fā)展注入全新活力。統(tǒng)計(jì)學(xué)理論在大數(shù)據(jù)時(shí)代的應(yīng)用主要包括幾種方法:
統(tǒng)計(jì)學(xué)方法:統(tǒng)計(jì)學(xué)理論主要研究的是概率分布指數(shù)族,其內(nèi)容包括圖表指數(shù)族、羅協(xié)變量信息效應(yīng)等,應(yīng)用十分廣泛,在統(tǒng)計(jì)學(xué)理論中,指數(shù)族發(fā)揮著重要作用,在大數(shù)據(jù)時(shí)代的應(yīng)用上,也要高度重視該種方法的應(yīng)用。
大數(shù)據(jù)建模:基于云計(jì)算、大數(shù)據(jù)支持,快速線上算法也得到了廣泛應(yīng)用,在數(shù)據(jù)體量較大的情況下,傳統(tǒng)的挑選、調(diào)取技術(shù)無法滿足實(shí)際需求,此時(shí),即可應(yīng)用快速線上算法來解決問題。
巨型分布系統(tǒng)建模:在社會(huì)經(jīng)濟(jì)的發(fā)展下,每天都會(huì)產(chǎn)生海量數(shù)據(jù),對(duì)于數(shù)據(jù)的存儲(chǔ)、運(yùn)行平臺(tái)提出了更高要求,此時(shí),可借助億億兆系統(tǒng)來處理,應(yīng)用分布式綜合大型科學(xué)數(shù)據(jù)庫建模,再通過空間降維技術(shù)來得出多種算法。
不同類型、形式的大數(shù)據(jù)思維,其應(yīng)用領(lǐng)域、重點(diǎn)也各有差異,在具體應(yīng)用中,需要做到因地制宜,根據(jù)數(shù)據(jù)分析要求來探索有效的解決方法,積極改革傳統(tǒng)統(tǒng)計(jì)工作,為統(tǒng)計(jì)分析的正常運(yùn)行打下基礎(chǔ)。
統(tǒng)計(jì)學(xué)理論在大數(shù)據(jù)時(shí)代的應(yīng)用需要從多個(gè)角度著手,充分結(jié)合統(tǒng)計(jì)學(xué)理論與大數(shù)據(jù)分析的優(yōu)勢(shì),促進(jìn)兩者的深度融合,做到趨利避害,明確分析目標(biāo),排除冗余特殊值,提取出海量信息的規(guī)律,繼而更好地為實(shí)踐活動(dòng)提供指導(dǎo)。