倪德志
摘??要:隨著IT新技術的迅速發展,全球信息化都進入了一個新的歷史階段,而大數據就是這個高科技時代的產物。如何推動大數據思想在統計工作中應用,利用大數據推動統計工作再上新臺階,更好地發揮“參謀部”、“信息窗”、“晴雨表”的作用,如何搶抓數字經濟變革的新時代機遇成為一個課題。作者擬就大數據思想如何在統計工作中應用談點個人看法,供參考。
關鍵詞:大數據;智能時代;統計工作
黨的十九大對建設現代化經濟體系作出重要部署,提出建設網絡強國、數字中國、智慧社會,推動互聯網、大數據、人工智能和實體經濟深度融合。利用大數據推動政府治理能力的提升,加快公共數據開放共享,推動大數據在科學決策、政府管理和公共服務等領域的應用,助推簡政放權和萬眾創新勢在必行。筆者認為推動大數據思想在統計工作中應用必須要做到以下三點:
一、充分認識大數據的“4V”實質,為大數據順利應用打牢思想認識基礎
大數據顧名思義數據量必須大,建設什么樣的數據庫用何種方式來承載海量數據成為需解決的第一個問題;大數據類型繁多,不僅僅包括字符、數值等數據,還包括網絡日志、音頻、視頻、圖片、地理位置信息等等,對多類型的數據如何進行數據處理也是必須解決的問題;第三個特征是海量數據價值密度相對較低,無處不在的信息感知和采集終端為我們收集了海量的數據,但這些數據價值密度較低,如何使用新算法、新技術高效的完成數據的價值“提純”,是亟待解決的第三個問題;傳統數據的采集、挖掘和應用對實效性沒有要求,而大數據對時效性要求高,數據處理要求速度快,如何及時取得數據并根據數據快速挖掘分析得到所需結果成為第四個問題。
在大數據時代,我們必須要轉變傳統觀念,改變傳統思維模式,才能確保為大數據在統計工作中順利應用掃清思想觀念障礙。
首先顛覆觀念的轉變是,大數據處理的是全體數據而不是隨機樣本,以前在統計工作中常常用到的隨機抽樣、樣本推算整體在大數據里面被摒棄掉了,大數據時代,我們可以利用更多的數據,甚至就是對能采集到的全部數據進行數據處理;第二個顛覆觀念的轉變是從對數據的精確性要求變為接受數據的不精確性或者說混雜性,以前我們盡可能對采集到的數據要求精確,主要原因是因為數據量太小,而現在擁有了大數據,通過技術手段哪怕忽略了部分微觀層面上的精確度,但依然可以掌握事物大體的發展方向,依然可以在宏觀層面做出正確判斷;第三個顛覆觀念的轉變是由尋找事物之間的因果關系轉變為尋找事物之間的相關關系,在統計工作中我們以前都是希望通過已有的數據來推斷未知的數據就是典型的尋找因果關系,而在大數據分析的幫助下,通過相關關系,我們雖然不能準確地找出某件事情發生的原因,但是會提前知道這件事情即將發生。
二、統一標準規范,推動大數據思想在統計工作中的應用
(一)構建統一的數據標準規范體系。通過新的信息技術構建統一的數據標準規范體系,打造具有完整數據承載能力的數據中心(系統)勢在必行。通過將元數據描述數據的思想引入數據中心建設中,建立起通用的元數據指標體系,確保每個指標橫向可比、縱向可追溯;通過自定義建表、自定義審核、自定義匯總、自定義查詢、自定義導出五個“自定義”功能構建起統一的數據標準規范,將不同格式的數據通過數據標準規范轉化為固定格式的數據;根據對統計數據來源不同將數據劃分為五種類型,分別為自采數據、部門數據、網絡數據、購買數據、政務大數據,根據統計工作的實際情況,做好不同的類型數據的接收,是實現大數據思想應用的前提條件,打造的數據中心可以通過接收、清洗、轉換、裝載的方式將任何數據處理成統計調查需要的數據,面對復雜多樣的數據來源打造出符合統計工作要求的數據源。
(二)構建統一的軟件系統標準接口規范體系。當前數字經濟正在顛覆傳統商業模式和資源利用方式,加速向經濟社會各領域、各環節滲透和覆蓋,深刻改變著傳統經濟的生產方式、商業模式和發展軌跡,在這個互聯互通和開放共享的時代,作為數字的權威發布者,我們需要各行各業的數據,需要不同形式的數據,建立統一的軟件系統標準接口規范體系勢在必行,通過軟件系統雙方互相認可的數據交換機制、數據傳輸加密驗證機制建立統一API接口,對接不同軟件系統,實現不同軟件系統數據的自由流轉和實時交換,可以解決大數據應用場景中不同數據源、非結構化數據不可實時使用的問題,為在統計調查工作中實時分析處理大數據打通壁障。
(三)構建統一的數據安全體系。在推動大數據思想在統計工作應用時,除了保質保量高效的完成采集和處理數據任務,同時也要注意數據的整體安全性,在建設系統時一定要構建數據安全中心,安全中心負責對所有系統進行統一安全管理,強化安全管理和數據隱私保護,增強安全技術支撐和保障能力,依靠完備的數據安全標準,建立管理嚴密、措施完備的數據安全防護體系,在推動數據的快速、實時、無縫流動的同時,實現數據安全事件快速響應和應急處置。
(四)堅持用系統性思維、平臺性思維做指導。推動大數據應用的數據處理體系,絕對不是一個程序或者兩個系統就能獨立完成的,必須要用系統性思維、平臺性思維做指導,整體考慮數據處理體系的建設工作,并堅持循序漸進原則,充分考慮體系需具備完整的數據承載能力、多系統數據的自由流轉和實時交換能力、以“微服務”形式將各業務系統融合的能力、保障系統數據的整體安全性能力、適用對不同媒體發布數據的能力。樹立系統性思維、平臺性思維,在更高的層面上思考如何全方位、多視角、多維度認知大數據,如何集合更多人的智慧與力量、集中方方面面的數據、整合多種新技術來提高更為深刻、全面的數據洞察能力,才能搭建起一體化高可用的平臺,才能更好的掌握和使用大數據。
三、遵循大數據發展規律,結合工作實際,推動統計工作水平大提升
隨著大數據時代的來臨,大數據技術呈現井噴狀態,大數據的商業價值正在被充分挖掘并在市場競爭中成為新的利潤增長點,大數據標準體系初步形成,數據倉庫、數據分析、數據挖掘這些詞匯也被大家熟知。
一是對現有數據來源與生產過程進行更好的把握,通過業務系統完全掌握現有數據的產生過程和評估方法;二是要建立外部數據的網絡采集或者交換渠道,用網絡采集數據和交換到的數據對現有數據開展評估,在成熟的時候建立相關指數,對現有發布數據進行佐證與評估;三是通過標準化的流程提高數據質量和數據管理能力,做到上述數據的跨專業的開放共享;四是在上述過程實現后,將工作向大數據推進,數據庫升級為數據倉庫,提升裝載能力和清洗能力;將數據規范化升級為數據語義引擎,解決非結構化數據的多樣提取性解析帶來的挑戰;將數據查詢升級為可視化分析,實現直觀展示數據,讓數據自己說話;將業務流程邏輯審核升級嵌入數據挖掘算法,深入數據內部,挖掘價值,不斷提高預測性分析能力。
四、結束語
大數據為我們看待世界提供了一種全新的方法,任何決策行為不再是憑借經驗和直覺做出,而是基于數據分析理性做出判斷。將大數據思想引入統計工作,推動大數據在統計工作中落地生根,必將為推進統計調查現代化建設注入強勁動力,掀起一場統計改革發展的新高潮,推動統計事業的繼續高水平發展,譜寫新時代統計工作新篇章。
參考文獻
[1]??苗譽威.大數據環境下統計信息化建設的思考[J].信息通信,2015(12).
[2]??吉鵬宇.關于大數據時代統計模式變革的思考[J].中國統計,2018(6)