張岳靜
(1.南京市信息中心,江蘇 南京 210000;2.南京藝術學院 平面藝術系,江蘇 南京 210000)
針對目前南京市政府重點關注的人口流動情況,勞動力資源構成,高校畢業生、農村轉移勞動力等重點人群的就業情況,以及各行業企業發展情況等問題,實施南京市就業數據分析系統的建設,為南京市政府宏觀決策、社會管理、政務服務等提供數據依據。依托大數據的發展,提高決策效率,改善政府管理方式,加強市場監管,提升服務能力,實現社會勞動力資源的合理配置,將有效解決南京市800多萬社會公眾的就業問題,有力地促進南京市城鄉就業,有效緩解經濟體制轉軌過程中的就業壓力。同時,通過對南京市適齡社會勞動力資源的構成、求職意向、崗位需求、最低工資等方面的綜合監測和預測分析,為南京市政府的產業規劃、就業形勢監測與預測、剩余勞動力的培訓與安置等民生事項提供基礎數據支撐。
該項目以標準規范體系和信息安全體系為建設基礎(見圖1),主要包括系統平臺層、數據資源層、系統應用層3個層次[1]。其中系統平臺層包括人社信息化系統平臺、人口與計劃生育系統平臺兩大系統平臺。數據資源層包括南京市政務數據中心,以及南京市就業分析知識庫、南京市就業分析結果庫。其中南京市政務數據中心匯聚了來自人社、人口兩大平臺的社會勞動力資源和就業分析所需的基礎元數據,南京市就業分析知識庫主要包括各種分析模型數據,南京市就業分析結果庫主要為存儲依據各種分析模型統計分析所產生的結果性數據。系統應用層為南京市就業數據分析平臺,主要包含基礎數據管理、數據質量管理、數據比對管理、數據交換管理、統計報表制度和管理、統計和綜合查詢、宏觀就業形勢分析、就業信息主題分析等功能。

圖1 總體框架
南京市就業數據分析平臺建設需要大量的就業信息、人口信息等數據支撐平臺。智慧南京平臺沉淀的數據有人口數據庫、法人數據等,規范數據采集和應用標準,拓展數據采集范圍,積極整合人社、民政、公安等部門人口系統的相關就失業信息、人口信息,構建多領域集成融合的大數據支撐平臺[2]。以人力資源和社會保障部全國就業信息監測指標體系為基礎,對業務、數據進行梳理,建立南京市就業信息監測指標體系。結合南京市政府信息中心已有的政府部門數據指標體系,進行監測指標計算、數據質量處理,建立南京市就業數據指標體系,實現對數據的采集、交換、分析預測管理。
數據資源中心資源數據庫數據資源分布、交換共享采用以下策略。
為了充分保障管理的準確性和高效率,中心資源數據庫采用數據集中管理的模式。在充分考慮了管理和技術可行的前提下,將所有的業務結果性數據歸集于中心資源數據庫,為跨區域、跨業務部門的業務協同提供支持,也方便領導實時了解業務的執行和匯總情況,滿足高質量、高效率的管理和服務需求。
中心資源數據庫是一個應用種類眾多、數據量巨大的系統,數據絕對集中存儲在一個數據庫對系統的運行效率影響較大,且各個相對獨立的子系統也會因為數據的存儲問題而相互牽連在一起,影響系統的安全性和可擴展性[3]。因此數據存儲應考慮集中與分散相結合,既保證各個主要子系統的相對獨立,又要建立良好的數據交換體系,保證信息在整個中心資源數據庫內及時、準確、安全的流通。
在中心資源數據庫中設置交換庫,負責與外部系統之間的數據交換,在保證對外信息交換與共享實施的同時,保持數據中心系統的相對獨立性。
根據數據存儲集中與分散相結合、保證各個主要分系統的相對獨立的原則,對應核心業務、決策支持、基礎信息和外部信息交換,分別設立不同的數據庫,保證各個分系統操作的獨立性。
傳統的信息系統大都采用集中式的數據庫架構,但隨著海量數據的爆發式增長,集中式數據庫系統已經逐漸不適應業務需求。傳統的數據存儲方式由于過于強調集中管理而造成了大量數據的集中堆積,用戶需要大量的存儲數據的介質而導致服務器的回應下降乃至崩潰,這樣一來就會有大量數據隨著服務器的崩潰而丟失[4]。而數據對于政府來說是至關重要的,絕對不允許有數據丟失情況發生。集中式數據庫系統隨著系統涵蓋群體的擴大還面臨著高并發的訪問瓶頸,這些問題隨著分布式數據庫的日益普及得到了完美的解決。
由于采用了分布式數據存儲技術,隨著數據量的不斷增加,系統可以方便地進行彈性擴容,滿足業務量發展的需求。隨著云計算技術的發展,若將系統遷移到云平臺上,分布式數據存儲的先天優勢會更加明顯地發揮出來,在架構層面可以適應云平臺的遷移改造工作。
數據管理和共享交換平臺采用人性化的配置界面,通過優異的UI展現技術將豐富的數據管理功能簡捷地展示出來,用戶可以便捷的操作系統功能進行源數據管理、數據采集、數據抽取、數據質量分析等工作,并且可以輕松地設計數據全生命周期管理,對每個數據節點進行邏輯處理和流程配置。
本系統有強大的圖表展示功能,同時圖表類型豐富多樣,提供了幾乎所有常見的圖表類型,包括常用的柱形圖、餅圖、折線圖,也包括較高端應用中的儀表盤、雷達圖、全距圖、數據地圖等。圖表可以直觀地展現數據的內在關系,形象地展示數據的狀態,更好理解數據,輔助決策。
3.1.1 基礎數據管理
提供對就業監測基礎表和指標信息的管理和維護功能,實現南京市對就業監測基礎信息表和數據指標的靈活擴展,同時提供給上級行政單位對下級行政單位基礎信息表和數據指標擴展情況的查詢和監測功能。
本項目的基礎表和指標信息來自南京市信息中心政務數據中心,包括就失業登記、就業援助對象、就業政策享受情況、求職招聘、培訓信息、職業技能鑒定、創業貸款、孵化基地管理、參保信息、繳費信息、醫保消費信息、教育信息、人口庫等政府數據信息。
3.1.2 數據質量管理
定制就業、人口、監測數據質量檢測標準;實現對數據質量檢測條件、方案的建立和修改;實現按照所選定的數據檢查方案進行質量檢查;提供質量檢查結果的靈活查看,問題數據的打印及導出等。
數據質量管理是指對數據從計劃、獲取、存儲、共享、維護、應用、消亡生命周期的每個階段里可能引發的各類數據質量問題,進行識別、度量、監控、預警等一系列管理活動,并通過改善和提高組織的管理水平使得數據質量獲得進一步提高。不僅包含了對數據質量的改善,同時還包含了對組織的改善。針對數據質量的改善和管理,主要包括數據分析、數據評估、數據清洗、數據監控、錯誤預警等內容;針對組織的改善和管理,主要包括確立組織數據質量改進目標、評估組織流程、制定組織流程改善計劃、制定組織監督審核機制、實施改進、評估改善效果等多個環節。
3.1.3 數據比對管理
實現橫向部門報送的各類數據的差異化比對分析,如社保、公積金、人口庫數據差異比對。主要包含個人基本信息,如姓名、性別、年齡、身份證號、參加工作時間、工作年限等指標信息和單位基本信息,如單位名稱、所屬產業、行政區域、單位類型、經濟類型等指標信息。
3.1.4 數據交換管理
制定統一的數據交換標準和接口管理規范,實現與橫向對外系統交換數據的查詢、抽取、轉換功能,并按照規定的文件格式導出。按照國家及部委有關數據交換安全管理規定,制定數據交換加密、解密算法,對交換數據進行加密處理,可實現脫機模式下不同部門間數據交換管理。
3.2.1 統計報表制定和管理
提供全市就失業情況、高校畢業生人口流動情況、留寧大學生的分布情況、高校畢業生失業率、失業高校畢業生專業分布、高校畢業生創業人數、創業帶動就業人數、高校畢業生勞動者基本情況、農村轉移勞動力情況等動態分析報表的靈活定制[5]。實現統計表按照固定報表和臨時報表等進行分類管理,按照市、區進行統計表分級權限管理。
3.2.2 統計和綜合查詢
實現市、區級各級統計報表,如就業人口、高校畢業生人口流動情況、留寧大學生籍貫統計、高校畢業生失業人數、失業高校畢業生專業分布,根據需要進行單表或批量統計,自動生成統計報表;在統計報表基礎上進行過錄、匯總等二次分析;提供統計結果的圖表展示,統計結果的查詢導出等。實現對明細數據的靈活查詢;提供對統計報表數據的靈活查詢和圖表展示及導出、打印等。
本方案根據項目需求,對國家和地方政策,技術、進度、經濟、效益、風險等各個方面關鍵要素進行分析、論證。通過本項目的建設,可為南京市政府財政、稅務、人社等部門提供就業形勢和企業運行發展的數據支撐與預測分析,將有力地促進南京市城鄉就業,有效緩解經濟體制轉軌過程中的就業壓力。