山東省菏澤市定陶區統計局 張麗麗
試析數據挖掘技術在經濟統計中的應用
山東省菏澤市定陶區統計局 張麗麗
我國社會經濟體制的變更推動著我國社會經濟的快速發展,2016年我國國民生產總值已達74萬億,同時在社會經濟活動當中,因為不同類型經濟發展因素的影響,逐漸形成了一種比較復雜的經濟關系體制,經濟的快速發展已經開始超過了人類大腦可以分析和理解的范圍。因此我們需要對當代先進的統計技術加以有效應用,來對經濟發展的趨勢進行分析。在我國最近幾年的統計學發展過程中,數據挖掘技術慢慢發展成為了經濟統計和分析的全新形式,在社會的統計活動當中得到廣泛應用。
數據挖掘 經濟統計 應用分析
自我國改革開放之后,我國在社會經濟的發展速度上不斷加快,我國在歷經幾十年的經濟發展建設活動之后,已經積累下了大量的經濟發展數據。因為經濟數據本身都具備一定的發展性與信息量的龐大性,造成了對統計數據人員在對其中的數據信息進行使用的過程中,只是單純地局限于對其中樹據數字信息的分析和使用,并且對數據信息中的重要統計資料不進行更加深入的挖掘工作。對數據挖掘技術來講,它作為一種全新的統計方式,它的優勢主要表現在對所有的信息數據實施橫向或者是縱向的開發,在實際的研究范圍上都得到了相應的延伸,并且可以通過對數據的挖掘,可以從基礎性的數據當中獲得更多更有價值的數據信息,可以更好地為社會中的統計數據提出良好的需求。
數據挖掘技術主要是指通過比較深層次的開發,從大量的數據當中挖掘出比較有價值的信息,并且對所挖掘出來數據進行分析和整理,有效地實現對比較復雜和混亂的數據進行有效的整合。這其中我們所提到的大量數據具有比較強的模糊性、隨機性以及不完全性的特性,通過對數據挖掘技術可以將其變成比較有價值和新型的信息。數據挖掘不但是在經濟信息中實現信息的變化,同時還是一種具有科學交換特性的數據技術,其中重點涉及了學習、數據分析以及數據庫等方面的內容,在統計行業當中得到了非常廣泛的應用。
在經濟數據統計工作當中,作為一種基礎性的數據處理形式,是實現經濟數據實現預處理的主要方式,因為數據挖掘技術本身就屬于一種為基礎性信息提供準確分析的技術,數據挖掘受到了基礎數據信息的限制性,它不可能用來代替經濟數據中所具有的數據信息收集功能。因此作為數據挖掘系統中的基礎性的數據信息,都需要提前進行預處理技術,所處理的內容主要包含了對這些方面數據的不準確性、不真實性以及不同經濟數據相互之間出現比較大的差異性[1]。
由于當前我國在社會活動中,對經濟數據的統計內容比較龐大,其中對眾多的經濟數據的統計工作,并不是來源于在官方統計局當中,而是從社會中的一些統計組織或者是一些社會經濟個體當中所提供的數據,在對數據信息實施挖掘的過程中,其中這些經濟數據主要來源于多方面的數據模式的集合,通過經濟數據的集成化來實現對實體經濟數據信息的識別工作。
數據轉換的方式,主要是指在對其中某種方式的數據變化形式,可以充分滿足數據要求變化的方式,轉換的方式主要分成數據的泛化和數據的準確性。對于后者來講其中主要涵蓋了數據的最大規范化、最小規范化以及平均值的規范化,但是數據中的泛化主要是指對最高層次中的數據信息對低層次中的數據進行替換,其中主要包含了對數據連續性的處理,但是因為這種方式對實現數據的連續性的處理比較困難,所以說,通常只選擇離散的方式,也就是對數據進行區間形式的劃分[2]。
決策樹屬于一種預測性的模型,是對象價值和對象屬性相互之間形成的一種映射性的關系。其中每個葉片點對應的從根部的節點到這個葉節點上,所經歷的過程上所表現出的對象的數據,同時還可以作為一種預測性分析。在經過了這種環節之后就可以有效實現相關的管理決策人員對數據信息的使用。決策樹的方式首先需要建立決策樹:第一是通過對相關的數據信息進行大體的分析,通過測試集成來實施模型測試工作,并且進行簡單的處理工作,然后再建立起輸出模型[3];第二是通過建立起完成的決策樹系統,來對數據信息實施簡單化的處理,這個過程有稱之為“遞歸”,在完成整個決策樹的建立之后,再對決策樹中的枝葉信息進行修剪,以此來避免在之后的調試工作中一些不相關數據,對決策樹產生的影響。
數據的回歸分析,主要指的是通過兩種或者多種變量相互之間產生的依賴性,通過數據之間形成的一種定量的關系形成一種的統計學的分析方式。通過對數據回歸的分析可以有效的建立起變量相互之間的回歸方程,通過相關的因素分析和判斷,對其中的變量和次變量之間的關系進行分析,通過這種不同類型方式的實驗,實現測量誤差降到最低,通過回歸的數據分析方式,可以實現對社會市場的占有率、品牌的銷售量以及整體的經濟發展趨勢等進行有效的解釋,將其中的兩個或者兩個以上的數據關系,通過函數的關系進行表達,以此方便與更有效的解決問題[4]。
數據挖掘技術作為一種對數據信息進行深層次加工的統計基礎,它本身具備著比較明確的目的性,在實際的使用過程當中,可以通過長時間的積累統計數據,來對基礎性數據實施深層次的處理和加工。在實際的使用過程當中,基于數據使用者的具體要求,從不同的分析角度上出發對數據在應用過程中,對數據本身存在的數據信息實施統計和分類,將原本比較混亂的數據庫實施科學和系統的歸類整理,通過這種方式來保證數據信息管理的高效性和便利性。
對于數據挖掘技術來講,它屬于一種系統型的數據統計工具,并不屬于一種單一性的數據分析,可以有效地實現對使用者本身對各種不同類型的信息的需求性,伴隨當前我國社會經濟的快速發展,其中經濟管理部門中需要對社會當中大量的經濟發展數據進行統計和分析,并且數據信息所表現出的管理和處理的權限各不相同,這就需要經濟管理部門需要針對不同需求的經濟管理內容進行統計分析,將其中的數據轉換成不同的數據形式,并且可以依照信息的具體來源以及統計信息的計算形式對其可靠程度來進行評估,保證數據統計信息的準確性[5]。
在我國的經濟管理部門當中,對職權的管理工作上表現的比較分散,其中不同類型的經濟管理部門中,對數據信息的需求量以及需求的類型也是不盡相同的。在很多地區,很多的經濟管理部門對其統計活動的傳統實施方式,具有比較明顯的局限性,很難通過經濟管理活動來提供更加優良的服務,在實際的工作當中經常會出現一些重復性統計或者統計不完全的現象,嚴重影響到了經濟數據分析的有效性,通過數據挖掘技術的應用,有效地避免了這方面的問題,只要充分地保證所得數據的準確性,通過數據挖掘技術就可以對其實施有效地整合和處理,從而使數據資源變得更加豐富多樣。
本文通過對數據挖掘技術在經濟統計中的應用分析,從中得出結論,在受到了不同類型經濟發展因素的影響,經濟的發展逐漸形成了一種比較復雜化的經濟關系體制,經濟的快速發展已經開始超過了人類大腦可以分析和理解的范圍,我們就需要對當代先進的統計技術加以有效的應用,來對經濟發展的趨勢進行分析,通過對數據挖掘技術的有效的應用,有效實現了對比較復雜的經濟數據的分析,對我國社會經濟的發展起到了保障性的作用。
[1] 楊梅冰,梁思思.關于數據挖掘技術在經濟統計中的應用[J].時代金融,2015(24).
[2] 董靜.試析數據挖掘技術在經濟統計中的應用[J].商,2015(31).
[3] 柳楓.基于統計的數據挖掘技術在CRM系統中的應用研究[D].大連理工大學,2013.
[4] 楊杰,黃欣,呂永.數據挖掘技術在建模、優化和故障診斷中的應用[J].紅外與激光工程,2015(03).
[5] 楊振艦.可視化數據挖掘技術在城市地下空間GIS中的應用研究[D].河北工業大學,2014.
F222.3
A
2096-0298(2018)01(a)-013-02
張麗麗(1975-),女,漢族,山東省菏澤市人,本科,中級統計師,主要從事統計設計方面的研究。