王振杰
(邢臺市清河縣統計局, 河北 清河 054800)
[摘 要] 在網絡信息技術的普及影響下,人們的日常生活已經與互聯網建立了密切的關系,并在此產生了大量的數據信息。而政府部門則可以通過利用互聯大數據,完善自身的信息統計能力。
[關鍵詞] 大數據;互聯網;政府;統計;應用路徑
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 07. 084
[中圖分類號] C829.2 [文獻標識碼] A [文章編號] 1673 - 0194(2017)07- 0191- 02
0 引 言
政府在統計工作的開展中,依靠傳統的數據統計手段需要耗費大量的人力、物力、財力,且效果不佳。為提高統計效果及質量,做好互聯網大數據在政府統計中的應用則勢在必行。
1 大數據在政府統計中的應用路徑分析
1.1 經濟發展中的使用
以往官方都以月度、季度等對各項經濟指標進行統計,通過GDP、采購經理指數、社會消費零售額等對經濟發展狀況進行分析;現如今,互聯網企業能夠利用大數據實現所有經濟指標的搜索與完善,使其在第一時間對國民的經濟運行情況進行展現,讓宏觀經濟監測及時性、可靠性及覆蓋面積得以提高,同時也為宏觀經濟部門對未來經濟的發展行情、預測等提供了數據支持。
1.2 統計人口
以往政府進行統計人口的時候,需要消耗大量的人物財,才能完成普查,并獲得數據包括全國和地區人口數量、城市和農村人口數量、人口性別比例、人口地域分布、年齡結構、出生匆死亡率等;若使用互聯網,將極快的獲取PC段及移動端網民所在的地域、性別等數據,同時還可以通過對網民行為的研究,得出其消費的能力、興趣愛好等特征。
1.3 旅游管理中的使用
以往政府部門都是在旅游結束后,對旅游總量進行事后統計,但是引入互聯網大數據后,可以通過對網民旅游出行路線的搜索,大致預測網民旅游的趨勢。然后,利用對網民熱搜旅游關鍵詞與實際出游人數數據進行分析,對未來旅游景點的人流狀況進行預測,從而幫助旅游管理部門預測未來旅客數量,完善疏導、突發事件應對方案的制定。
1.4 社會就業中的運用
以往政府部門都利用畢業生人數增長數量與勞動力需求增長狀況的數據比較,分析就業形勢。但引入互聯網大數據后,就可以利用對網面搜索關鍵詞趨勢的研究,了解畢業生就業需求與壓力所在。例如,通過對“找工作”一詞的搜索數量變化,掌握畢業生求職需求,從而填補人社部數據空白,掌握社會就業需求及就業趨勢,做好政策的制定與微調。
1.5 價格統計中的運用
以GPI統計為例,價格統計的最新數據來源包括互聯網企業數據、電子商務交易數據等,相關數據具有量大、更新速度快等優點,做好相關數據的使用,將進一步減少統計開支,增加指標發布次數。一般可通過以下三種方法利用大數據完善價格統計工作:一是采用搜索方式收集網上交易價格數據;二是與電子商務企業進行合作,獲取交易價格數據;三是建立商場、超市、醫院等實行電子計價的采價點向統計部門報送交易記錄的制度。
1.6 醫療衛生中的運用
以往政府部門多利用對醫療機構的個數、就診人數及次數等事后數據,對醫療服務狀況進行研究,但引入互聯網大數據后,可以使用在線數據對疾病發展趨勢進行分析。通過對熱搜關鍵詞的研究,組建大數據模型,實現對某區域未來疾病動態數據的預測及各城市熱點疾病的重點治療醫院進行排名。通過互聯網搜索大數據的使用,將提高衛生監測部門對流行疾病發展狀況的掌握程度,使其可以提前做好預防策略的制定,完善熱點醫院的管理督查工作。
2 使用互聯網搜索數據對房地產價格進行預測
國統局通過對北上廣、南京、西安、沈陽這6大城市的二手房價格的百度搜索數據為依據,對我國大中型城市的二手房價值銷售指數、影響變化因素進行了預測建模分析。從而得出了每月與上月的新房與二手房價格變動指數。通過科學收集數據,六大城市的二手房與新建房銷售價格指數均是解釋變量。
二手房與新房價格有關關鍵詞的網絡熱搜指數被稱為解釋變量。一般對關鍵詞的選擇需經歷三步:第一步,以購房人購房決策時關注的主要內容進行關鍵詞初步確定;第二步,利用百度搜索引擎的關鍵詞自動推薦技術,得到與二手房價格相關和新房價格相關的關鍵詞,剔除重復和數據量較少的關鍵詞,組成關鍵詞庫;第三步,對關鍵詞和房產價格指數相關性關系進行研究,實現關鍵詞的篩選。通過多重篩選,選出了對二手房價格變動影響最大的12個關鍵詞和對新房價格變動影響最大的8個關鍵詞。變量的關聯性可使用數據挖掘技術探查,經研究,預測效果最優的是支持向量機和隨機森林模型,而二手房與新房價格網絡熱搜關鍵詞則是宏觀經濟形式與房產政策。所以,使用網絡熱搜數據,不僅可以有效預測房價變化,還能掌握經濟主體的發展規律與趨勢。
3 對大數據在政府統計中的應用展望分析
3.1 使用互聯網搜索指數建立霧霾和環保關聯性指數
通過構建霧霾與環保關聯性指數的方式,對城市的空氣質量及霧霾與環保出行指數進行研究、呈現。然后借助合理手段,宣傳低碳理念,將提高群眾對霧霾的重視與出行行為的調整力度,同時也有助于政府部門了解“市民對霧霾及環保的關注度”。
3.2 通過分析互聯網購物搜索數據對居民收入進行預測
統計資源的重要組成部分就是住戶收支數據,由于個體會利用網購的方式在互聯網中留下熱搜數據,所以可以通過對網絡搜索內容的研究去了解居民的關注熱點,然后對居民的收入水平進行推算、預測。接著基于居民家庭消費特征,建立科學的收入測度模型,從而提高統計數據質量的控制效果與預測準確性,為政府宏微觀政策的制定提供數據支持。
4 結 語
采用科學的方法對互聯網中不同含義的關鍵詞進行篩選、統計、建模、分析,所得的數據才有助于完善政府統計數據的準確性等。因此,做好大數據應用方法的科學探索與應用,將為政府宏、微觀決策的制定,提供可靠而科學的信息數據。
主要參考文獻
[1]武小紅,尹發能.“互聯網+”時代的中學地理教師專業發展策略[J].當代教育實踐與教學研究,2016(6).
[2]龍喬.大數據與官方統計方法制度改革和發展[J].市場經濟與價格,2016(2).
[3]彭小年,倪進.“大數據和政府統計”研討會論文觀點綜述[J].統計科學與實踐,2014(2).