肖麗娜
中圖分類號:F253 文獻標識:A 文章編號:1674-1145(2018)9-306-01
摘要 統計數據質量作為統計工作的命脈,其內涵演變經歷了以“準確性”為核心向以“用戶需求”為核心的轉變。在大數據背景下統計數據的質量問題受到關注,之前統計數據秉承精準性的內涵,要求統計數據準確無誤。但是這樣精準性的內涵在大數據背景下不能使企業得到很好的發展,企業要想得到長足的發展必須要在統計數據質量方面最大程度滿足用戶需求。統計數據質量包括數據搜集質量、整合數據質量、存儲數據質量以及最后用戶的使用數據質量,具有重要的意義。
關鍵詞 大數據 統計數據 質量 影響因素
一、導言
大數據的技術應用正在向各個行業滲透,未來的數據將會像石油一樣成為重要的資源,推動社會的進步和發展。然而,大數據具有海量、非結構化、實時、多元和電子化易處理等特點,數據質量中一些原本微不足道的問題,在大數據面前將會凸顯,甚至會給數據質量帶來災難性的傷害。因此,如何保證大數據環境下統計數據的質量,已經成為統計部門亟待解決的問題。
二、統計數據的質量
(一)統計數據核心的轉變
在大數據的背景下,數據統計的核心正發生著變化。傳統的數據統計對于數據的核心要求是“準確性”,統計數據要能真實反映發生的問題。而今天的數據統計最終是要向消費者服務的,數據統計的核心要求是“客戶需求”。
(二)統計數據的質量要求
針對目前的大數據發展情況,統計工作面臨的最大挑戰是海量的,多樣的大數據獲取和處理問題,它們決定著大數據的質量。如何解決這種問題,有關專家學者提出:要從技術,流程和管理三個方面人手進行相關問題探討,而且對統計數據的質量評估也要進行多維度的驗證,主要從邏輯規則檢驗、核算數據重估、計量模型分析、統計分布驗證、調查偏差評估、多維評估延伸六個角度。
三、影響因素分析
(一)數據搜集
數據統計的基礎是數據的搜集,每個企業的統計部門搜集數據的方式會有差別,傳統的搜集數據的方式是統計調查,企業委派相關工作人員對原始數據進行搜集,搜集到的重點數據應當重點關注,再將搜集的數據做成統計報表。大數據時代的來臨,傳統的搜集數據的方式不能夠提高數據質量和提高企業的經濟效益。搜集數據是在海量的數據基礎之上,數據的范圍較廣,需要解決很多實際的問題,例如:時效問題,數據講究時效性,可以通過智能設備和統計數據的技術實時更新數據,才能在大范圍的數據中搜集高質量的數據。
(二)技術因素
大數據時代新技術是影響統計數據質量的重要因素,對統計數據影響最大的是數據庫技術、數據質量檢測識別技術以及數據分析技術。企業的數據每天都在變化,統計部門要掌握瞬息萬變的數據必須要依靠數據庫技術,數據庫技術具有較全面的數據,企業可以通過數據庫技術找到自己想要的數據,促進企業更好地決策。在大數據時代背景下如何判定一項統計數據的質量是否符合標準,為了解決這一問題,數據質量檢測技術應運而生,數據質量檢測技術通過建立統計數據評價體系以及反饋體系及時檢測出數據庫中統計數據所存在的問題,監督數據庫的運行,利用質量檢測算法對新的統計數據進行檢測,使企業及時、準確發現存在的問題,及時采取措施解決問題。
四、提高大數據背景下統計數據質量的對策
(一)流程方面的解決對策
政府部門應該進一步增強對大數據的管理意識,建立專門的數據質量監控和評估機構,建立健全和完善統計產品質量管理體系,形成統計數據質量保障的長效機制。數據收集的時效性和數據收集過程中的干擾是影響數據質量的關鍵因素,新型的統計數據集成平臺必須致力于收集過程的規范化和透明化,提升時效性和減少統計的干擾因素。建立基于數據倉庫的統計數據集成平臺,實現多類型數據的存儲,提升數據集成以及后期數據分析處理效率。
(二)專門的數據庫人員配備
大數據的特征決定了其復雜的本質,導致其較難進行管理。在這樣的環境下,需要既能解決技術問題,又能熟知企業業務的綜合型人才,才能管理好企業數據,確保大數據的質量。數據管理方面的落后是阻礙數據質量的提升以及大數據應用的重要因素。大數據時代下,需要專業、高端的人才來沒計數據庫和維護工作,從而能更好地確保大數據質量,深度挖掘大數據的潛在價值。
(三)技術方面的解決對策
技術方面的解決對策需要關注的一個是技術本身,另一個是使用技術的人。在技術引進上,云存儲技術專注于向用戶提供以互聯網為基礎的在線存儲服務,是一種高效率和低成本的數據存儲技術。最大方便地滿足了用戶對數據存儲的需求。為了保證統計數據的質量,必須將數據質量檢測技術貫穿整個數據周期。
五、結語
綜上所述,大數據背景下,應建立“大統計”體系,將政府統計、企業統計、民間統計等機構有效的銜接起來,實現統計數據的共享與協同分析,促進統計數據質量的提升。樹立科學合理的統計觀念,加強統計法制法規的建設,完善數據標準和統計制度體系,來保證統計數據質量的提高。