邱建舒 艾泓宇 四川大學華西第二醫院
目前,我國市場經濟正保持穩步提升的發展狀態,且時有爆炸性增長的情況出現,這促使經濟統計工作中,涉及的數據規模日漸龐大,與此同時,經濟市場的越發繁榮,必然會導致經濟數據信息更為繁雜,在這一背景下,市場經濟的發展,對經濟統計工作的準確性、高效性提出更高要求[1]。正因如此,我國經濟統計相關部門,正在持續探索如何提高經濟統計工作水平,不斷創新統計的模式與方法。數據挖掘技術的成熟,促使經濟統計工作取得了新的思路與方法,可以實現經濟統計中海量數據的資源整合,且可在最短時間內,對數據進行準確挖掘及分析,促使數據統計質量不斷提升,所獲取的信息也更為準確、廣泛[2]。
數據挖掘技術是人工智能領域和數據庫領域重要的研究內容,屬于多學科交叉技術。具體而言,數據挖掘是指從隨機、模糊的海量數據中,挖掘、提取出具有一定價值的數據這一過程,主要是在神經網絡、統計學、可視化技術、模式識別、人工智能基礎上開展。簡單來說,數據挖掘技術即從冗雜、海量的數據中,提取有價值信息的技術方法,可以實現數據的智能化、自動化分析,并進行歸納、整合和推理,從而為決策者提供科學數據支持,以便決策者對市場經營策略及時調整[3]。當前信息時代的到來,讓數據變化高度復雜,很多時候必須通過數據挖掘,將重要數據提取出來,從而對信息數據予以整合。因此,數據挖掘技術已經成為現代社會重要的分析技術。
因現代社會需要處理的數據量極大,而傳統統計分析的方法,是在未明確假設的基礎上展開信息挖掘,這樣工作效率相對較低,在解決問題時,效果也不十分理想。換言之,傳統數據統計分析方法,并未探索不同數據彼此之間內在的關聯,因此其分析工作只能對過去的情況加以反映,而對未來難以提供預測價值,對于要探索的目標,也無法獲取相應結論。數據挖掘技術可以將獲取的信息作為基礎,獲知潛在、未知的內容,是在原有數據基礎上,發現傳統統計分析無法預料的、人的感官無法察覺的,或是和實際生活相違背的信息[4]。可以說,數據挖掘技術是對傳統技術的高度拓展,是統計分析和人工智能的結合,符合現代社會對數據分析要求不斷提高的現實局面,正因如此,數據挖掘結果在現代社會具有極高應用價值。
如今,數據挖掘技術已經從其他學科中,獲取了海量經驗與知識。這一技術具有如下特點:
1.信息數據量較大
借助數據挖掘技術,可提取出大量信息,其信息可用TB或GB這一容量進行描述,可見,數據挖掘技術處理的信息十分復雜,涉及范圍廣泛。不過在運行中,離不開統計人員對數據的精加工、深加工處理。
2.提取關鍵詞信息
在應用數據庫的過程中,若用戶未能獲取自身搜尋的信息,或不知自己需要搜尋哪些信息,可借助關鍵詞來展開搜索,提升查找效率,縮短用戶獲取信息的時間,可促使經濟統計效率大幅提升。
3.可擴展性強
計算機技術與信息技術不斷發展,促使數據挖掘技術內部容量逐漸擴大,同時數據挖掘精準度也逐漸提升。數據挖掘技術具備的可擴展性,使其適應性更強。目前我國經濟發展迅速,經濟信息量不斷增長,經濟統計工作日益繁重,數據挖掘技術的這一特點,能夠滿足經濟統計工作的發展需求。
借助數據挖掘技術,可從海量的原始數據中,準確挖掘出真實性、高價值性的數據,同時還可對挖掘出的數據展開處理、分析,進一步提升其價值。在挖掘技術不斷創新、不斷完善的背景下,這一技術對于經濟統計的應用意義可逐漸提升。在經濟統計工作中,應用數據挖掘技術,具有如下優勢:
在經濟統計中運用數據挖掘技術,不僅能對數據展開分析,同時也可滿足使用主體對于信息的需求。我國各行各業,在生產運營中均會形成海量的經濟統計信息,而這些信息能夠為經營者的經濟管理決策提供重要支持[5]。因為不同管理部門的經營管理范圍、所涉及經濟領域各有不同,經濟管控權限也差異較大,各部門需根據自身的具體情況,構建系統化處理機制,形成符合自身實際情況的數據解讀方式。正因在這一過程中需要處理的數據信息量極大,因此不同部門的數據統計工作,對數據處理信息路徑、數據統計系統均提出更高要求。在選擇統計方式及處理方法時,不僅需要考慮不同管理部門具體需求,同時還需根據需求以不同方式將數據換算、呈現出來,從計算層面、信息來源層面,實現信息評估可靠性的提升,從而確保數據處理更為全面,更加高效。
運用數據挖掘技術,可以構建宏觀的數據庫,這可對數據統計的效果加以優化。在具體的數據統計工作中,可以借助多元化經濟統計機制,為經濟管理活動整體的需求提供支持,避免數據統計的重復性。并且,通過這一技術,可對不同的統計系統加以整合,讓數據信息彼此融合。因此,借助數據挖掘技術構建宏觀的數據庫,可以為數據優化創建更廣闊的平臺,確保統計信息更加完整、準確。
因數據挖掘技術本質上屬于深加工技術,其目的性十分明確,特別是在實際的應用范圍之中,可對長期積累的海量數據加以統計,對數據進行解讀,這樣使用者可通過分析數據,來對其深層次的應用價值、象征意義有所了解[6]。現階段,在應用數據實踐中,數據挖掘技術不僅能夠實現對長期積累的經濟數據的高效管理,同時還可從多個角度出發,分析現有經濟數據的目的性,或可基于經濟數據管理的視角,實現數據分類、明確信息統計單元,以更加系統、科學的歸類方式,來整合數據庫中原本混亂的信息,提升這些信息中的價值含量,從而提升統計數據管理應用的便利性,提高數據使用效率。在進行經濟數據處理、再加工時,對數據進行統計、分析的目標,是要對原始數據組成的內容展開重新加工,而這也需要通過數據挖掘技術來實現。原始數據的加工可以將數據背后的價值充分發揮出來,這樣經濟統計數據可為管理者具體的應用需求提供最大限度的服務。
在經濟統計過程中,運用數據挖掘技術,首先需要通過預處理方式對基礎信息實現智能化分析。數據挖掘結構會被經濟信息所影響,無法無中生有建立數據收集的體系,在應用這一技術的過程中,數據信息的預處理是重要的控制措施,也是一種管理機制。經濟統計的數據預處理,可統籌劃定數據的差距、不真實性及不正確性。數據挖掘技術中的數據清理過程,即對基礎數據中的問題加以全面處理,其方法包括平滑法數據處理、均值法數據處理。
(1)平滑法數據處理:這一方法可對基礎數據中空值、噪聲數據統一展開計算,借助加權平均數的處理及時,對提取到的數據展開影響權重值分析,這樣獲得的計算結果和真實數值更為接近。在應用中,可借助下列公式來分析當前數據點的取值結果。
備注:Wj為CJ實際的權值。
(2)均值法數據處理:這一方法指的是對基礎數據中的噪聲數據、數據點空值來實施均值處理,確保數據可借助屬性均值,填充、補足數據的空白。只有數據挖掘系統充分分析基礎數據,才可確保數據的統計分析具有實效性和完整性。在當前數據點取值分析時,可用公式如下:

在對經濟數據進行預處理后,需構建相應決策樹。運用數據挖掘技術實施經濟統計,在構建決策樹的過程中,工作人員在初步構建過程中,可借助訓練集這一工具,之后再通過專門決策樹算法,來簡化構建的初步決策樹,而這時構建的模型,就是數據輸出分析的模型。之后,統計工作人員需充分利用構建的決策樹,來準確分類經濟數據,并對數據展開深度分析。根據決策樹,從決策樹的根本向決策樹的各枝干進行延伸,到數據符合既定條件之后,分割即可終止。若同時展開兩個分割,且這兩個分割點上具有完全相同的數據,那么分割會自行終止,決策過程即可順利完成。若數據并無分類的屬性,不過可將經濟數據繼續實現分割,此時需將分割立即停止。在具體的經濟統計過程中,還可結合該地區企業歷年提供的數據報表,建立企業對應序列模式,借助數據挖掘來計算企業的預測值,并且將預測值和歷年所報的經濟數據展開對比,即可得知差別率。之后,工作人員可以分類分析所得差別率,根據差別率占比情況,將之劃分成三大類,如20%以上者劃為A類,10%-20%者劃為B類,10%以內可劃為C類。
對某一地區展開經濟統計分析時,應用數據挖掘技術時,工作人員可以根據本地區企業以前報告的數據,結合企業規模是否出現變化、企業內部是否出現重大的經營事件等,來判斷是否需要進一步展開調查、分析[7]。若數據挖掘之后發現,企業規模的變化差異率大,不過仍在合理范圍之內,則不需展開進一步的調查,即可獲取可靠、準確的經濟信息。若企業的規模有較大變化差異率,且超出了規定的范圍,或雖然企業規模的變化差異率很小,不過在其內部出現了一些重大的經營事件,這時工作人員就需對當地企業中的經濟問題進行深入了解,以便制定切實有效、針對性強的經濟決策決議,在保證經濟統計結構可靠、完整的基礎上,協助企業提升自身的競爭力,促使其經濟效益規模逐漸擴大,實現推動當地經濟發展的目的。
現階段,我國市場經濟活動過程中,部分管理部門在職權劃分中還缺少清晰界限,經濟統計管理工作也有其局限性,而經濟主體管理人員不同,對數據挖掘的需求及目的也有所不同[8]。在經濟統計工作中,管理部門需要改變傳統數據處理的方式,充分應用數據挖掘技術,才能從根本上促進經濟統計工作質量不斷提升。這是因為數據挖掘技術可以規避傳統數據統計分析工作中的不足,降低不完全統計、重復統計的可能性,對于我國經濟統計工作而言十分適用。相信在未來的市場發展中,數據挖掘技術將有很大的發展空間。值得注意的是,在具體應用中,我們應該對這一技術的應用方式及時調整,確保數據挖掘技術保持其適用性,以滿足經濟統計管理工作的需求。
另外一方面,數據挖掘技術對信息深度加工處理后,可以為數據統計工作人員提供數據支持,且其數據信息可以長期保存,能夠增強工作人員理解相關數據的程度,有助于構建一體化、系統化的信息結構[9]。數據挖掘技術還可促使信息數據管理更加高效、便捷,是數據統計工作有序開展的基石。數據挖掘技術在積累海量數據信息后,其應用價值可以進一步凸顯。相信在未來的發展中,這一技術具備的有效性優勢可以進一步發展,對數據庫中數據混亂、信息重復的現象進一步優化,促使數據信息得以整合,進而提升經濟統計的工作質量。
總體來看,將數據挖掘技術用于經濟統計工作中,可以推動經濟數據資源的擴展,且可為經濟局勢、經濟發展走向的判定,提供可靠、真實的數據知識。在具體應用過程中,數據統計工作人員需要把握數據挖掘技術的原理、應用方法及特征,對原始統計數據展開預處理,構建對應決策樹,在實現數據分類、對調查對象予以確定的基礎上,必要時結合企業經營情況,展開進一步調查,通過挖掘獲取價值較高的經濟數據,從而為經濟管理活動提供數據支持。