孫慶波 王曉燕 趙慧 李曉娜
【摘 要】在政府統計工作中,如何充分利用云計算的各種技術,以提高統計數據處理的效率,具有重要的實踐指導意義。本文基于云計算的理論和技術以及政府統計數據的特點,分析云計算在政府統計工作中的研究現狀以及具體應用,探索政府統計部門建設云計算中心的困難與問題,最后展望統計云的發展。
【關鍵詞】虛擬化技術;云計算;統計云
1.前言
云計算技術是科技創新的前沿領域,深刻改變著人類的生活方式,對世界政治、經濟、軍事、科技、文化、社會等領域產生著重要影響。現代信息技術的迅猛發展為發展統計生產力、提升統計工作現代化提供了有力支撐。在科學技術日新月異的今天,如何充分應用云計算技術,實現統計工作電子化、網絡化,以適應社會現代化發展的需要,這是統計工作規范化建設的需要,在未來的統計工作中,云計算技術的廣闊發展前景,需要不斷與實踐結合,從而更好地為統計工作服務,這在當前統計工作中具有重大意義。
當前,網絡信息技術領域中云計算的發展和應用給政府統計信息化工作帶來了機遇和挑戰。本文基于云計算的理論和技術以及政府統計數據的特點,分析云計算在政府統計工作中的研究現狀以及具體應用,探索政府統計部門建設云計算中心的困難與問題,最后展望統計云的發展。
2.云計算在政府統計中的研究現狀
2.1 云計算定義
對于云計算,美國國家標準與技術研究院(MST)將其定義為一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網絡訪問,進人可配置的計算資源共享池(資源包括網絡,服務器,存儲,應用軟件,服務),這些資源只需投人很少的管理工作或者只需與服務供應商進行很少的交互就能夠被快速提供。根據該定義,云計算就是通過網絡提供可伸縮的廉價的分布式計算能力:云端就代表了互聯網,通過網絡的計算能力,取代使用原本安裝在自己電腦上的軟件,取代原本資料存在自己硬盤的動作,通過網絡龐大的虛擬空間來進行各種工作。
2.2 云計算特點
根據云計算的定義,其主要特點可歸納如下:
2.2.1計算資源的集成提高了設備計算能力。即使一般規模的“云”也至少擁有數百上千臺服務器,這造就了用戶能擁有前所未有的計算能力。云計算把大量計算資源集中在公共資源池中,通過多種租用方式讓不同用戶共享計算資源,為支持超大數據量計算提供有力保障。
2.2.2高可靠性。云計算中的分布式數據中心保證了系統的容災能力,“云”采取了數據多副本容災、容錯機制和相關計算節點同構可互換等措施,確保了服務的可靠性,從這個意義上講,使用云計算比使用本地計算機更可靠。
2.2.3虛擬化。云計算支持用戶在任意位置、使用不同的終端獲取應用服務。用戶所請求的資源來自“云”,而不是固定有形的實體,同時,獲取的應用運行在“云”中,用戶無須了解、也不用關心應用運行的具體位置,只需要一臺筆記本或者一部手機,就可以通過網絡獲得“隨需隨取”的人性化服務,甚至包括超級計算的應用。
2.2.4低成本。在云計算中,由于在整個用戶群中減少了大量價格極高的服務器等硬件設施的重復購置,不僅節約了成本,同時還減少了由于設備運轉帶來的電力耗費和碳排放量。
2.3 云計算在政府統計中的現狀
大多數政府統計信息化部門的建設模式是一個服務器運行單個應用,大多數時候,這些服務器的負載在15%以下。隨著各級政府對統計調查頻率的提高,同時統計調查與分析覆蓋面的迅速擴大,帶來以下問題:(1)報送流程長;(2)統計人員錄人等問題上花費太多時間,難以在統計分析方面做出貢獻;(3)數據易丟失,且難以共享,難以適應統計業務發展的需要,需要不斷購買新的應用系統及硬件設備。
因此,使用日臻成熟的云計算對現有的政府統計設備資源和數據資源進行整合,通過集群的方式組成系統資源池,可以有效解決基礎設施資源無法共享和協同調度、資源利用率低下、管理和維護成本高等問題,建設網絡化、開放化并具有高并發業務處理能力的政府綜合統計信息化平臺,實現更強的策略執行力度和更高的數據安全。
3.云計算在統計業務中的應用與問題
3.1 云計算在統計業務中的應用
政府部門的統計數據生產、處理過程涉及行業范圍廣,數據量大,對數據審核、匯總、分析等都要依賴于現代信息技術手段,隨著社會的不斷發展,統計數據也在爆炸式增長,要滿足分散的數據分布、海量的數據存儲、高效的數據運算等需求,而云計算在這方面體現出來的優勢,正好滿足統計業務這一需求。
關于云計算技術在政府統計中的應用,鄭慧勇(2011)提出在總結歷年使用的統計軟件、電子政務及辦公自動化系統經驗的基礎上,利用先進的云計算技術模式,以規范的統計業務流程、統計信息標準為前提,開發集網上直報、數據管理、統計查詢、業務自定義為一體的專業通用統計信息管理軟件平臺,從而構成一個面向統計調查對象、統計工作者、政府相關部門和社會公眾的“統計專業數據庫云計算平臺”。
國家統計局數據管理中心主任許劍毅(2011)提出要加快部署“統計云”。他認為國家統計局和地方政府統計部門需要建立一個國家統一的核心業務系統,即統計云。
近年來,統計系統已成功使用的企業聯網直報系統,及近期開展的第三次全國經濟普查數據采集、數據處理都是云計算的典型應用。由國家統計局的高性能服務器池與節點省份的服務器共同構架了云基礎設施平臺,在此基礎之上開發構建三經普數據采集處理平臺。
在數據采集階段,“三上”企業通過使用聯網直報平臺,其他單位和個體戶采用PDA移動終端分別將數據傳送到位于“云端”的三經普數據處理平臺。
在數據處理與開發階段,各級普查機構通過統計內網登錄三經普數據處理平臺,按照各自的權限進行本地區所有單位的排重、數據的審核與匯總等工作。對本地區的普查數據進行合庫、審核、匯總、數據評估和資料開發。這些數據最終經過國家統計局審核、匯總后分類存入國家基本單位名錄庫、國家統計地理信息系統和經濟普查數據庫。
這些相關工作的整個過程都是在國家統計局的云計算平臺上一氣呵成,所有的數據都直接存儲于該平臺之中。參與三經普數據采集、數據審核、數據匯總等各環節操作的不同用戶,都登陸這個平臺進行操作,每個操作都有日志記錄,從而保證數據的真實可靠,提高了統計數據的質量。
3.2云計算在統計業務中的問題
云計算由于技術寬廣性、實現綜合性導致企業從事云計算研發的技術、資金門檻很高,所以目前從事云計算的政府部門、企業還不是很多。地方政府統計平臺如何應用云計算技術尚在探索過程中,其中主要面臨以下問題:
3.2.1信息安全問題
作為統計數據的公共部門,數據對于統日來說就是生命。如何保證統計數據的安全性至關重要。“云安全”包括兩個層面的問題,一是內部層面的信息安全,二是外部層面的信息安全。
3.2.2行業標準缺乏
統計云的實施另一個很大的問題是國家、省、地、縣、鄉、村六級系統相互之間標準不統一,難以達成有效溝通。
3.2.3基礎設施不足
互聯網的帶寬、穩定性和數據長途傳輸的延遲,都會影響云服務發展和交付的問題。而現有的數據中心不能滿足云計算的發展需求。
4.結束語
近幾年,統計系統云計算基礎構架的覆蓋范圍逐步擴大,最終將形成以國家統計局的計算機資源為核心,分層次涵蓋全國各級統計部門的“統計云”。在“統計云”中,資源可以根據業務的需求實現橫向縱向調度,可以進一步深入開展以云計算為基礎的多種業務系統應用。當系統的資源匱乏時,可以隨時往里面加資源,實現對資源的高效使用。
參考文獻:
[1] 張為民,唐劍峰,羅治國,等.云計算:深刻改變未來[M].北京:科學出版社,2009.
[2] 王慶波,金何樂,等.虛擬化與云計算 [M].北京: 電子工業出版社,2009.
[3] ARRASJID J, EPPING D, KAPLAN S. Foundation for Cloud Computing with VMware vSphere 4 [M].Berkeley,CA,USA: USENIX Association,2010.
[4] 房秉毅,張云勇,程瑩,徐雷.云計算國內外發展現狀分析[J].電信科學,2010年S1期.
[5] John W. Rittinghouse,JamesF.Ransome. Cloud Computing: Implementation,Management, and
Security[M].2009.08.
[6] 劉鵬.云計算的關鍵技術與應用實例[M].上海:人民郵電出版社,2010.01.
基金項目:
本文系2015年度全省統計科研重點課題“大數據環境下云計算技術在統計工作中的應用研究”,項目編號:KT15165。
作者簡介:
孫慶波1983—),男,碩士研究生,講師,主要研究方向為:網絡技術。