馬平前
摘 要:隨著我國社會進入數字化時代,經濟數據和信息內容不斷累積,對于經濟統計工作的要求在不斷上升,而統計工作對于社會經濟的發展有著重大的意義和作用,行業和國家都需要參照詳實的最新統計信息來進行發展調整和政策調整。數據挖掘技術的主要作用是為了保障經濟統計工作的開展順利,需要在海量數據當中有效地提取價值程度較高的信息,依據有效的數據信息的提取與分析,為經濟發展提供參考依據。本文簡要的分析了經濟統計工作之中數據挖掘技術的應用范圍及其意義,希望對從業人員有所啟發和幫助。
關鍵詞:數據挖掘;經濟統計;應用探討
隨著我國社會進入數字化時代,經濟數據和信息內容不斷累積,使經濟統計數據變得越發龐大,對于經濟統計工作的要求在不斷上升,傳統統計技術已經無法實現對龐大的數據進行準確和有效的分析,而統計工作對于社會經濟的發展有著重大的意義和作用,行業和國家都需要參照詳實的最新統計信息來進行發展調整和政策調整。數據挖掘技術的主要作用是為了保障經濟統計工作的開展順利,需要在海量數據當中有效地提取價值程度較高的信息,依據有效的數據信息的提取與分析,為經濟發展提供參考依據。本文在以下幾個方面對數據挖掘技術在經濟統計工作中的意義做出了闡述和分析。
一、數據挖掘技術的簡介
數據挖掘技術從字面上就可以理解為對數據的更深層次的開發應用,而在專業的角度上我們將對原生數據的整理和開發過程稱之為數據挖掘,這是一門新興的、具有多個學科交叉特征的技術,這門技術可以集中整合并深度處理海量的結構復雜、內容繁瑣的原生數據信息,可以剝離原生數據的模糊性、隨機性、不完全性等自然屬性,使其變得規范和有價值。該技術的內容涉及了數據統計、數據庫、機器學習和神經網絡等,還包括諸多技術類型,比如模式識別系統、、模糊概念等。數據挖掘技術能夠幫助經濟統計從業人員或者數據使用者在獲取和讀取使用數據信息時更加的便利與快速。
二、數據挖掘技術在經濟統計中的應用的優勢
1.有效性顯著
作為新興的應用技術,數據挖掘還處于推廣階段,但是在實際應用中,數據挖掘不僅可以高效管理累積的龐大經濟數據信息,還可以重新加工原有數據內容,在此基礎上多層次分析既有經濟數據應用的目的性,以保證使用人員可以對數據深層次意義以及使用價值形成有系統化地了解,能夠在使用過程中一定程度上地更加深入地對一些有用信息進行開發,為使用人員的實際需求提供最大化的數據服務,這些特性使其在實際應用的過程中呈現出了較高的有效性。
2.較高的綜合應用性
當下的經濟統計工作之中,越來越多的領域已經開始重視應用起數據挖掘技術,該技術并非僅僅是一種分析數據的工具,同樣能夠充分的滿足數據使用人員對于一些特定數據的需求。數據挖據技術能夠實現定向整理和開發統計數據的效果,構建系統處理體系與數據解讀的方式,使數據可以以多元化呈現方式,確保進一步優化數據處理的效果。
3.海量的數據處理能力
數據挖掘技術是基于龐大的數據難以技術處理而運用產生的技術。宏觀的數據庫是數據統計結果的優化的基礎。傳統的經濟統計方法無法同時處理大量的不同部門的復雜數據信息,這樣很難使數據信息形成一個有機的整體,在使用過程中無法最大限度的發揮數據有效價值。而數據挖掘技術可以整合海量數據,可以得到更加豐富和良好的數據資源,同時可以借助多元化經濟統計體系的運用與深化,盡量規避統計工作重復,為經濟管理活動需求提供必要的服務,也可以為數據的優化提供必要技術手段,進一步優化統計信息完整程度,搭建數據信息化平臺,集中提供更好更完整的數據服務。
三、數據挖掘技術在經濟統計中的應用范圍
經濟數據統計基本分為三個階段:預處理、集成化處理、數據轉化。所以相應來說數據挖掘技術的主要應用也在這三個階段。
1.數據預處理
對經濟數據進行預處理是經濟統計的基礎,經濟信息統計收集的過程常常會存在所收集到的數據發生模糊或者缺失的問題。數據信息的預處理是非常重要的管控措施。通過預處理能夠將數據中偏差較大、不準確、不真實的數據進行去除,處理這些數據的方法叫作數據清理。例如:預測法、平滑法、均值法等。在對預處理方法運用的時候,可以智能分析所提取出來的基礎信息,通過經濟統計預處理,可以保障數據的真實性以及正確性。
2.數據集成化處理
數據集成的含義就是對大量不同的數據進行垂直集合整理,經濟統計數據來源多樣,有可能出現有多個數據源重疊統計,內容也越來越復雜,導致數據集成變得更加困難,這就要對數據進行統一的整理,使其變的精簡、有效、系統、深入,而這個過程也就是數據集成化處理。經過處理所得到數據信息更全面、更真實性、更具有實用性,可以讓數據使用人員在使用數據時更加方便快捷直觀。
3.數據轉換
轉換環節是經濟數據信息的呈現環節,數據的轉換方式要能夠保證數據使用人員滿足其使用需求,數據轉換要將數據變得更加直觀,將高層次的數據信息替代低層次的數據信息,方便各種數據使用人員對數據進行有效利用,而不是二次處理。要在數據轉化構建系統化的處理體系與數據解讀的方式,使數據可以以多元化呈現方式,確保進一步優化數據處理和使用的效果。
以某果蔬零售企業為例,該超市會員卡中含有會員身份證號信息,進而可得到會員年齡數據集合,將會員卡與手機微信綁定后可以方便為會員提供實時信息咨詢。假定會員年齡為會員購物籃中商品,從而可以將其轉換為單屬性關聯規則問題進行分析。遵循深度優先遍歷法從年齡節點開始進行計算檢驗,可以得到固定年齡段消費者對于各類商品的喜好程度以及購買欲望,如假定該商品的最小支持度(minsupport)為30%,在某年齡段節點中得到滿足支持度的頻繁2-項集以及頻繁3-項集,依此類推,由此可對各個年齡段最大頻繁項集進行分析,進而得出營銷結論。
四、總結
數據挖掘技術隨著數據化時代的到來,必然會在經濟統計工作中發揮顯著作用,從業人員要深刻認識數據挖掘技術并且了解數據挖掘技術的特點,積極運用數據挖掘技術,滿足各類統計分析的需求,進而提高數據統計分析的質量。
參考文獻:
[1]辛金國,柯芳,李紹君 ,et al.數據挖掘技術在經濟統計中的應用探索[J].統計與決策,2009(9):24-27.
[2]楊梅冰,梁思思.關于數據挖掘技術在經濟統計中的應用[J].時代金融,2015(24):173-175.
[3]周光華,李岳峰.數據挖掘技術在衛生統計信息工作中的應用研究[J].中國衛生信息管理雜志,2012,9(06):82- 86.