戴衛章 濱海縣統計局
?
大數據背景下對政府統計工作的思考
戴衛章 濱海縣統計局
摘 要:互聯網購物、物聯網、云計算等技術的迅速發展,使傳統統計工作中的數據來源、統計理念、統計方法等發生了重大變革,政府統計工作面臨大數據帶來的一系列挑戰。本文對大數據背景下政府統計工作的優勢及面臨的機遇和挑戰作了詳細分析,并給出了對策建議。
關鍵詞:大數據政府統計機遇挑戰
麥肯錫全球研究所提出大數據是一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。如今,大數據已經深刻改變了人們的日常生活和工作方式,隨著我國互聯網購物、物聯網、云計算等技術的迅速發展,必將推動傳統統計工作中的數據來源、統計理念、統計方法等重大變革,政府統計工作面臨大數據帶來的一系列挑戰。
(一)擁有海量的數據資源
政府統計數據來源主要有兩種,一是人口普查、經濟普查、農業普查以及常規調查所收集取得的各種類型數據,通過加工、匯總提供給政府相關部門進行分析供領導決策參考。二是工商、稅務、質監等部門的行政記錄。行政部門在行使監督、管理和服務等職能,如辦證、登記、檢查、稅收、罰款等過程中形成的文字描述和記載是政府統計資料的一種重要補充。
(二)擁有不斷更新數據的能力
我國目前已初步形成以周期性普查為基礎,以經常性抽樣調查為主體,綜合運用全面調查、重點調查等方法,并充分利用行政記錄等資料的統計調查方法體系。“四上”企業數據采集方式已經實現了通過互聯網直接向全國數據中心報送原始數據、各級統計機構在線同步同享的工作模式。在價格、人口普查中,大力推廣應用電子采價器、住戶記帳器等電子終端采集原始數據并通過網絡向全國數據中心報送原始數據。
(一)大數據背景下政府統計面臨的機遇
1.大數據有利于政府拓寬統計數據來源渠道。大數據為政府統計調查工作提供了大量的原始數據。運用高科技手段進行數據搜集和數據挖掘工作,可以大量減少統計調查負擔、縮短數據生產時間,從而提高統計工作的效率。
2.大數據有利于政府推進統計信息化建設進程。要運用大數據,需要提供相應的軟件和硬件技術,提高數據挖掘分析能力的技術、工具和方法,這對政府統計信息化建設提出了更高要求,推動政府加快統計信息化建設。
3.大數據有利于政府提高統計數據質量。通過物聯網和互聯網等設備產生的數據,基本上避免了人為干預數據的可能,搜集的數據更真實、可靠,也從側面驗證政府統計數據真實性,從而倒逼政府必須提高統計數據質量,才能提高統計公信力。
(二)大數據背景下政府統計遭遇的挑戰
1.大數據挑戰政府統計數據壟斷地位
大數據時代政府統計部門不再是數據的唯一擁有者。長期以來,傳統統計服務產品單一,服務渠道狹窄,絕大部分服務對象是政府機構,提供給一般企業和個人的信息較少,統計信息效用大打折扣。當前,社會公眾和企業經營者對統計數據的需求日益旺盛,迫切需要貼合他們需求的統計服務產品,而大數據的出現,恰好滿足了這一需求。政府統計數據的壟斷地位將受到挑戰。
2.大數據挑戰政府統計數據整合能力
大數據時代的數據服務,不再是政府統計機構一家的事情,它是政府各部門以及各專業機構掌握數據資源的總和。政府統計機構亟需建立統一的數據信息共享平臺實現全方位數據共享,避免不同部門數據各自為戰現象,這對政府統計機構整合能力是一項挑戰。
3.大數據挑戰政府統計數據搜集智能化水平
與傳統統計方法不同,大數據時代數據來源于信息技術記錄下的原始數據,這些數據僅僅依賴于測量方法(如阿里巴巴、GPS 定位系統、ETC 電子收費系統),都是無意間獲得,不需要調查對象刻意配合。政府統計機構若不提升數據搜集智能化話水平,統計調查難度將加大,數據可靠性也得不到保證。
4.大數據挑戰政府統計數據分析能力
“大數據”背景下的數據分析,面臨的是大量存儲于各處(包括“云端”)的非結構化或半結構化數據環境,首先要將這些無法識別和運算的信息轉化為結構化的數據,針對結構化的海量數據分析挖掘數據之間的內在關系,尋找更多價值信息。在這一背景下,數據分析就變成了統計部門一個關鍵性的環節,需要專業化的數據挖掘與處理技術。
1.加強大數據基礎環境建設
建設完善大數據云計算運行環境,利用云計算環境下的分布式存儲的多服務器存儲資源滿足海量、多類數據的存儲需求,構建高效、可擴展的大數據存儲體系,同時保證數據讀寫操作的安全性,提供可靠性與高性能。充分發揮云計算并行計算、按需分配資源等優勢,構建高效的快速大數據集群處理環境,支撐各類數據統計、分析、挖掘、預測和可視化展示。
2.加強大數據處理技術水平
目前,我國的統計工作人員計算機應用水平參差不齊。大數據時代,統計人員應具備較高計算機信息處理技術,要懂得大數據采集、設計和挖掘方法。統計工作人員應向數據專家、數據分析師方向轉變,因此有必要加強現有統計人員統計數據處理技術培訓。
3.加強統計數據的管理
大數據時代統計數據的搜集方式多樣,這就要求政府統計部門強化對統計數據的管理。目前“聯網直報”采取IP 定位控制、修改痕跡保留等方式就是統計數據管理的應用。比如為了保證每個采價員按照“三定原則”進行采價,可以對每臺采價器進行數字化定位,其采價的時間、地點、數據情況可以即時傳到服務器,即可進行監測管理。
作者簡介:戴衛章(1983-),男,漢族,江蘇連云港人,統計師,南京財經大學本科學歷,西北師范大學碩士研究生。單位:江蘇省濱海縣統計局,研究方向:數量經濟學、統計學。