鄭 娜
(河北農業大學 河北 保定 071000)
關鍵字:大數據;人社;信息化平臺;監管決策
隨著我國社會保障事業的快速發展,已經初步建成了社保公共服務體系,社保的覆蓋范圍迅速擴大,參保的人數和資金也不斷增長。但是人社數據信息整合力度不高,統計調查力度有限,統計數據信息公開力度不夠,數據對服務決策、服務管理、服務社會的巨大潛力并沒有開發[1]。因此,建設統一共享的人社數據平臺具有非常現實的意義。
人社大數據平臺的建設,主要是利用大數據技術、GIS技術和手機通信數據,進一步挖掘數據的更深層次的價值,如可以對于勞動力的遷徙、就業、居住等情況進行目標性、區域性的監控、跟蹤和預警,從而推進社會公共服務信息化的發展,進而提升整個社會的信息化水平,提升人社部門的服務水平以及監管決策能力。
大數據在各個行業的應用與服務已經成為了趨勢,通過數據之間的共享和價值再造以及數據之間的進一步挖掘,可以提升統計分析的功能和準確率。由于通訊公司的信令數據與人力資源與保障廳的數據的格式以及信息化程度都不盡相同,對于數據的融合和挖掘需要逐步進行,要先對相關數據進行篩選,對數據格式進行統一制定,并且對數據業務應用進行統一建模。
1.1 大數據平臺人員責任分析。人社大數據平臺建立主要涉及的人員是人社部門的技術人員以及通信公司的技術人員,這些人員負責對人社數據以及通信數據進行加密、傳輸、建模以及分析輸出結果。
人社廳技術人員負責將數據進行加密和傳輸,然后通過通訊部門的專線進行傳輸,運用雙方約定好的方式進行解密;通信公司技術人員進行通信信令的采集,將數據進行存儲或傳輸。雙方根據業務需求進行建模,根據模型數據進行分析,分析結果可視化展示,展示方式可以是圖表、圖標、熱力圖等。人社大數據平臺的系統構成圖如圖1所示。

圖1 人社大數據平臺系統構成圖
1.2 大數據平臺的功能性分析
1.2.1 功能需求。利用人社部門提供的人員身份信息,例如籍貫、年齡、參保、應往屆畢業生等,結合通訊公司的位置信息等數據,根據業務模型分析出省內人口遷徙、勞動力來源、大學生就業分布等情況。
1.2.2 維度分析。根據需求,可以從多個維度進行分析。例如,可以根據年齡數據,分析遷徙人口的年齡分布;根據性別數據,分析遷徙人口的性別分布;根據ARUP值(用于衡量電信運營商業務收入利潤的指標),分析遷徙人口的消費分布。
1.2.3 建模需求。該系統平臺是以業務需求為驅動力,借助于通訊公司的用戶位置數據、資料數據、消費數據等,利用身份數據進行關聯,使得通訊數據和人社數據進行初步融合、統一建模,建立起針對人口遷徙、人口流動、大學生就業的分析模型。結合過往的歷史數據,實現對重點地區、行業、企業的用工趨勢分析,為勞動力的就業趨勢提供預測,為就業者提供就業機會,為政府以及用工市場提供決策依據[2]。
人社大數據平臺的數據主要來源于人社部門的基礎數據以及通訊公司的信令數據兩部分。
2.1 人社部門的數據采集。對于人社數據的采集,可以分成兩種情況,一是通過人社部門提供的FTP服務器,數據平臺負責從指定的接口進行采集,采集后的數據加密后存放在指定的接口機;二是通過人社信息系統在通信公司指定的FTP機器上存放文件,然后從FTP機器上采集文件進行機密存放[3]。
2.2 通信公司的數據采集。通訊公司將相關用戶的身份及位置信息生成文件,并將文件進行加密存放在指定的接口機,這樣,接口機上的所有數據文件都是加密存放的。接口機和FTP服務器,都要求通過申請訪問來確保信息的保密性。為了數據采集時的安全,在整個數據采集過程中可以采用三層數據處理。
2.2.1 確保接口機安全。人社數據資料和通訊公司用戶身份等信息資料通過加密后存放在接口機,該接口機的秘鑰需由專人統一掌握,接口機不允許私人訪問,非管理人員必須通過申請訪問[4];接口機上可以允許處理數據程序,進行解密以及人社數據和通訊公司數據的匹配。
2.2.2 接口機處理安全。匹配成功后人社資料信息直接加密入庫人社存儲專區,通過MD5不可逆進行加密[5]。匹配失敗的人社資料信息直接傳遞給通訊公司的指定接口機。集團客戶查詢返回用戶資料入庫到通信公司的資料庫。
2.2.3 數據訪問安全。關鍵字段進行MD5加密。視圖權限可以放給人社存儲專區庫用戶。人社數據存儲的專區庫相對獨立,需要的訪問權限相對較高。
數據解密過程可以由下圖進行描述:

以人口流動分析模型為例,分析的結果是身份信息為本省不同人群的遷徙特征,按照勞動力的組成進行分類,從而整體分析人口流動的遷徙情況,并將最終的分析結果通過GIS等圖表的形式呈現出來,通過這樣直觀的數據分析來及時更新重點區域的勞動力組成以及不同人群的遷徙情況。
3.1 人口流動分析模型的建立。根據全省整體人口的遷徙特征主要分析屬于某省份戶口的人員外遷情況,根據該省份的通訊公司采集到的信令數據,分析人員的位置、遷徙軌跡、長期居住地、工作地以及在各地區的居住時長。
利用省人社部門提供的用戶社保信息,以及該用戶的通訊位置信息,分析該省繳納社保用戶在全國其他地區的分布情況,這可以非常方便的查詢該省向其他地區的遷徙情況,并將這些信息以報表和GIS地圖的形式進行形象的展示。
3.2 人口流動模型數據處理流程分析。人口流動的平臺處理流程見圖2所示,首先選取常駐信令6個月的相關數據,從該數據中提取出去過同一個城市或者地區3次以上用戶的用戶編碼、工作地點,然后提取去過研究區域3次以上的用戶的信息,將提取出的兩種用戶信息進行關聯,得到該人群的年齡區間、性別、消費層,再通過用戶資料表來提取用戶的身份信息,從而在相關的地區表上提取對應的地市區號。

圖2 人社平臺數據處理流程分析
在大數據的背景下,本文提出了一種利用人社數據以及通訊信令數據進行整合分析,設計建立人社大數據分析平臺的設計思路。該思路具有一定的創新性和實用性,但在實際系統搭建時,還要對硬件設備、系統潛能、系統進行更進一步的優化,對關鍵算法和代碼進行深一步的探討,對數據庫設計進行規范,以合理搭建高效運行的系統平臺。