徐佩 黃愛國(guó) 陳震 熊紅林 沈儉 樊重俊
摘要:在電子政務(wù)的背景下,民政部門已建立的信息系統(tǒng)每天會(huì)產(chǎn)生大量數(shù)據(jù),針對(duì)如何讓數(shù)據(jù)提升價(jià)值,本文提出了民政業(yè)務(wù)數(shù)據(jù)海平臺(tái),并通過平臺(tái)架構(gòu)、數(shù)據(jù)資源、應(yīng)用功能三個(gè)方面分析設(shè)計(jì)了民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)。民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)通過高效采集、有效整合,深化應(yīng)用民政業(yè)務(wù)數(shù)據(jù),從而實(shí)現(xiàn)民政精準(zhǔn)化、動(dòng)態(tài)化服務(wù)的目標(biāo)。
關(guān)鍵詞:大數(shù)據(jù);電子政務(wù);數(shù)據(jù)海;Hadoop
引言
在大數(shù)據(jù)時(shí)代,每天會(huì)產(chǎn)生大量數(shù)據(jù),那么在數(shù)據(jù)層面獲得大量的、有關(guān)聯(lián)的民政業(yè)務(wù)數(shù)據(jù)集合卻不能直接獲得數(shù)據(jù)的業(yè)務(wù)價(jià)值,而民政業(yè)務(wù)數(shù)據(jù)海的提出在于,一方面是整合生成并管理民政業(yè)務(wù)大數(shù)據(jù),另一方面是在民政業(yè)務(wù)大數(shù)據(jù)的基礎(chǔ)上,提升民政業(yè)務(wù)數(shù)據(jù)集合的數(shù)據(jù)應(yīng)用價(jià)值,為各業(yè)務(wù)部門建立實(shí)用的數(shù)據(jù)分析模型與數(shù)據(jù)挖掘模型,搭建對(duì)民政業(yè)務(wù)指導(dǎo)、服務(wù)改善、輔助決策有實(shí)際指導(dǎo)價(jià)值的信息化應(yīng)用,切實(shí)改進(jìn)民政信息化生態(tài)。
1、民政業(yè)務(wù)數(shù)據(jù)海簡(jiǎn)介
民政業(yè)務(wù)數(shù)據(jù)海是基于民政各項(xiàng)業(yè)務(wù)和服務(wù)運(yùn)行而匯聚的、能夠長(zhǎng)期、真實(shí)反映民政業(yè)務(wù)過程、狀態(tài)和結(jié)果的民政數(shù)據(jù)資源之上的數(shù)據(jù)價(jià)值分析和挖掘應(yīng)用。它設(shè)計(jì)的目的就在于提升民政業(yè)務(wù)數(shù)據(jù)集合的數(shù)據(jù)應(yīng)用價(jià)值。一方面,民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)能夠聯(lián)接構(gòu)建民政業(yè)務(wù)全息信息,不但追溯業(yè)務(wù)的過去、還原業(yè)務(wù)現(xiàn)狀,還能預(yù)測(cè)未來業(yè)務(wù)的發(fā)展。另一方面,以民政業(yè)務(wù)需求為導(dǎo)向,選取若干當(dāng)前民政領(lǐng)域比較熱點(diǎn)的業(yè)務(wù)子域,如社會(huì)救助、居家養(yǎng)老服務(wù)等開展數(shù)據(jù)價(jià)值分析研究,探索研發(fā)若干數(shù)據(jù)分析模型,并以數(shù)據(jù)模型為依托,開發(fā)若干業(yè)務(wù)監(jiān)控應(yīng)用,用民政業(yè)務(wù)大數(shù)據(jù)監(jiān)控預(yù)測(cè)業(yè)務(wù)走向,提高服務(wù)能力和水平。
民政業(yè)務(wù)數(shù)據(jù)海與傳統(tǒng)的民政數(shù)據(jù)中心之間既有聯(lián)系又有區(qū)別,兩者的聯(lián)系在于業(yè)務(wù)數(shù)據(jù)海的數(shù)據(jù)基礎(chǔ)來源于民政數(shù)據(jù)中心的數(shù)據(jù)資源,這些數(shù)據(jù)既有民政領(lǐng)域內(nèi)部的業(yè)務(wù)數(shù)據(jù)和服務(wù)數(shù)據(jù),也有來自于民政領(lǐng)域之外的、有公信力的、可公開使用的數(shù)據(jù);兩者之間的區(qū)別在于數(shù)據(jù)海的重點(diǎn)不在于數(shù)據(jù)的匯聚和整合,而是側(cè)重于數(shù)據(jù)價(jià)值分析與挖掘應(yīng)用的搭建,在于業(yè)務(wù)數(shù)據(jù)內(nèi)在聯(lián)系和價(jià)值的發(fā)掘,并通過信息化工具展現(xiàn)出分析結(jié)果,從而指導(dǎo)民政業(yè)務(wù)和決策。
2、民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)架構(gòu)設(shè)計(jì)
民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)通過收集結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù),利用ETL工具對(duì)數(shù)據(jù)進(jìn)行分析處理,并通過Hadoop系統(tǒng)對(duì)大數(shù)據(jù)內(nèi)容進(jìn)行數(shù)據(jù)挖掘,形成支撐面向政府決策支持和相關(guān)行業(yè)應(yīng)用的決策支持?jǐn)?shù)據(jù),實(shí)現(xiàn)靈活、快速的數(shù)據(jù)重組服務(wù),系統(tǒng)架構(gòu)如圖1所示。
該架構(gòu)采用分布與集中相結(jié)合的方式,將民政行業(yè)內(nèi)與業(yè)務(wù)活動(dòng)密切相關(guān)的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行匯聚、分類,逐步實(shí)現(xiàn)由分散存儲(chǔ)向集中存儲(chǔ),孤島數(shù)據(jù)向關(guān)聯(lián)數(shù)據(jù)的推進(jìn),為各類數(shù)據(jù)應(yīng)用提供堅(jiān)實(shí)的基礎(chǔ)。在形成統(tǒng)一的數(shù)據(jù)平臺(tái)的基礎(chǔ)上,通過對(duì)基礎(chǔ)數(shù)據(jù)的分析、挖掘獲得各種加工數(shù)據(jù),合理地構(gòu)建各類數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù),并對(duì)大數(shù)據(jù)內(nèi)容進(jìn)行處理。
3、民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)數(shù)據(jù)資源設(shè)計(jì)
依照平臺(tái)總體架構(gòu)設(shè)計(jì),利用時(shí)間序列分析方法、聚類以及分類等方法將數(shù)據(jù)分為五大區(qū)數(shù)據(jù),本平臺(tái)的數(shù)據(jù)庫(kù)規(guī)劃設(shè)計(jì)如圖2所示。
數(shù)據(jù)庫(kù)規(guī)劃主要?jiǎng)澐譃榛A(chǔ)數(shù)據(jù)區(qū)、應(yīng)用數(shù)據(jù)區(qū)、統(tǒng)計(jì)數(shù)據(jù)區(qū)、交換數(shù)據(jù)區(qū)、歷史數(shù)據(jù)區(qū)五個(gè)區(qū)。其中基礎(chǔ)數(shù)據(jù)區(qū)用來保存民政業(yè)務(wù)全域的基礎(chǔ)性數(shù)據(jù),包括服務(wù)對(duì)象個(gè)人數(shù)據(jù)、家庭數(shù)據(jù)、企業(yè)法人數(shù)據(jù)、非企業(yè)社會(huì)組織數(shù)據(jù)、系統(tǒng)元數(shù)據(jù)、空間地理數(shù)據(jù)等。原則上,基礎(chǔ)數(shù)據(jù)區(qū)屬于跨條線共享數(shù)據(jù)。
應(yīng)用數(shù)據(jù)區(qū)用來保存業(yè)務(wù)運(yùn)行數(shù)據(jù),包括結(jié)果數(shù)據(jù)和過程數(shù)據(jù)。進(jìn)一步劃分為條線業(yè)務(wù)專有數(shù)據(jù)、跨條線業(yè)務(wù)共享數(shù)據(jù)以及民政知識(shí)庫(kù)數(shù)據(jù)。
統(tǒng)計(jì)數(shù)據(jù)區(qū)用來保存各種統(tǒng)計(jì)分析數(shù)據(jù),這些數(shù)據(jù)的來源是應(yīng)用數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù)區(qū)還可以進(jìn)一步劃分為指標(biāo)數(shù)據(jù)、模型數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)、多維數(shù)據(jù)、動(dòng)態(tài)監(jiān)控?cái)?shù)據(jù)等統(tǒng)計(jì)服務(wù)數(shù)據(jù)。
交換數(shù)據(jù)區(qū)用來階段性保留各類民政外部的交換用數(shù)據(jù),比如人力資源和社會(huì)保障數(shù)據(jù)、公安數(shù)據(jù)、醫(yī)保數(shù)據(jù)、保障房數(shù)據(jù)、殘聯(lián)數(shù)據(jù)等等,這些數(shù)據(jù)都是支持雙向傳輸?shù)模扔忻裾I(yè)務(wù)數(shù)據(jù)海提供給其他委辦系統(tǒng)的數(shù)據(jù),也有其他委辦提供給民政業(yè)務(wù)數(shù)據(jù)海的數(shù)據(jù)。
歷史數(shù)據(jù)區(qū)用來保存各個(gè)數(shù)據(jù)庫(kù)區(qū)所存儲(chǔ)的超過3年的各類數(shù)據(jù),為了便于管理、響應(yīng)迅速,歷史數(shù)據(jù)區(qū)的設(shè)計(jì)也分為應(yīng)用數(shù)據(jù)、基礎(chǔ)數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)、交換數(shù)據(jù)等類別。
4、民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)應(yīng)用功能設(shè)計(jì)
業(yè)務(wù)數(shù)據(jù)海門戶是數(shù)據(jù)分析應(yīng)用的訪問入口,依照工作職責(zé)和使用需求來確定平臺(tái)的使用權(quán)限,依照權(quán)限的不同,開放給三類人員,即業(yè)務(wù)人員、管理人員和系統(tǒng)運(yùn)維人員。該門戶的具體應(yīng)用功能包括以下四個(gè)方面:
(1) 數(shù)據(jù)整合任務(wù)管理
主要是指對(duì)數(shù)據(jù)整合相關(guān)數(shù)據(jù)庫(kù)編程腳本的調(diào)度任務(wù)進(jìn)行管理,以實(shí)現(xiàn)對(duì)相關(guān)聯(lián)業(yè)務(wù)數(shù)據(jù)的有效整合,具體功能包括:數(shù)據(jù)整合任務(wù)的新增、調(diào)度執(zhí)行、執(zhí)行結(jié)果監(jiān)控等內(nèi)容。
(2) 自定義查詢管理
業(yè)務(wù)數(shù)據(jù)海的數(shù)據(jù)范圍需要涵蓋業(yè)務(wù)信息化覆蓋的所有民政業(yè)務(wù)領(lǐng)域,而且需要通過以服務(wù)對(duì)象主體為中心進(jìn)行數(shù)據(jù)整合。系統(tǒng)提供針對(duì)使用者的完全動(dòng)態(tài)化、個(gè)性化的數(shù)據(jù)查詢與組織功能,即自定義查詢管理。該功能包括數(shù)據(jù)源選擇、數(shù)據(jù)表選擇、數(shù)據(jù)過濾條件選擇、數(shù)據(jù)項(xiàng)選擇等功能要求,不但支持?jǐn)?shù)據(jù)過濾條件的動(dòng)態(tài)組合,而且還需要能夠支持業(yè)務(wù)領(lǐng)域數(shù)據(jù)字段的動(dòng)態(tài)組合。
(3) 業(yè)務(wù)數(shù)據(jù)海監(jiān)控管理
隨著民政業(yè)務(wù)和服務(wù)的持續(xù)進(jìn)行,民政業(yè)務(wù)數(shù)據(jù)海的數(shù)據(jù)量必然會(huì)持續(xù)膨脹,對(duì)支撐資源的要求也會(huì)不斷提高,因此需要監(jiān)控工具對(duì)業(yè)務(wù)數(shù)據(jù)海的數(shù)據(jù)情況進(jìn)行統(tǒng)計(jì)和監(jiān)控,對(duì)觸發(fā)或靠近支撐資源運(yùn)行警戒線的情況做出預(yù)警,便于用戶方在資源方面及時(shí)做出調(diào)整,具體功能包括:監(jiān)控指標(biāo)項(xiàng)管理、監(jiān)控預(yù)警報(bào)表管理。其中監(jiān)控指標(biāo)項(xiàng)管理是指對(duì)業(yè)務(wù)數(shù)據(jù)海的相關(guān)監(jiān)控指標(biāo)項(xiàng)進(jìn)行管理,包括數(shù)據(jù)存儲(chǔ)空間、數(shù)據(jù)查詢時(shí)間、數(shù)據(jù)整合任務(wù)運(yùn)行時(shí)間等內(nèi)容,具體包括:監(jiān)控指標(biāo)項(xiàng)新增、修改等維護(hù)功能。監(jiān)控預(yù)警報(bào)表管理是指在現(xiàn)有有效監(jiān)控指標(biāo)作用下的監(jiān)控預(yù)警報(bào)表進(jìn)行管理,具體包括報(bào)表的生成、展示、存儲(chǔ)、打印等管理功能。
(4) 業(yè)務(wù)數(shù)據(jù)海應(yīng)用設(shè)計(jì)
業(yè)務(wù)數(shù)據(jù)海應(yīng)用設(shè)計(jì)主要包括以下幾個(gè)方面:
① 服務(wù)全息信息查詢,主要包括兩大方面:自然人服務(wù)全息信息查詢和社會(huì)組織服務(wù)全息信息查詢。自然人通過證件類型和證件號(hào)碼,社會(huì)組織通過組織類型和組織機(jī)構(gòu)代碼定位到某一具體自然人和社會(huì)組織,查詢結(jié)果會(huì)集中呈現(xiàn)其目前所有民政業(yè)務(wù)和服務(wù)的相關(guān)狀態(tài)和業(yè)務(wù)辦理情況,也可進(jìn)行條件查詢。
② 社會(huì)救助對(duì)象監(jiān)控,包括困難對(duì)象篩查監(jiān)控、養(yǎng)老機(jī)構(gòu)分布及服務(wù)能力評(píng)估監(jiān)控、死亡人員服務(wù)監(jiān)控、(社會(huì)救助享受信息監(jiān)控、居家養(yǎng)老服務(wù)信息監(jiān)控、優(yōu)撫服務(wù)信息監(jiān)控)婚姻狀態(tài)相關(guān)業(yè)務(wù)監(jiān)控等等。社會(huì)救助對(duì)象監(jiān)控可采用柱形圖、餅圖、折線圖等可視化顯示,更加直觀的了解當(dāng)前狀況。
其中困難對(duì)象篩查監(jiān)控主要是對(duì)目前享受民政相關(guān)社會(huì)救助業(yè)務(wù)的服務(wù)對(duì)象的困難程度進(jìn)行分級(jí)統(tǒng)計(jì)和展示,重點(diǎn)找出多重困難群體在整個(gè)社會(huì)救助群體中的分布、占比及其個(gè)體組成情況。
養(yǎng)老機(jī)構(gòu)分布及服務(wù)能力評(píng)估監(jiān)控主要依賴地圖系統(tǒng)進(jìn)行數(shù)據(jù)分析和結(jié)果展示,重點(diǎn)展示現(xiàn)有各類養(yǎng)老服務(wù)機(jī)構(gòu)的地圖位置分布,并能夠依照選定的市、區(qū)縣、街鎮(zhèn)進(jìn)行當(dāng)前養(yǎng)老服務(wù)能力的評(píng)估和監(jiān)控。在地圖上展示各個(gè)養(yǎng)老機(jī)構(gòu)分布情況,鼠標(biāo)放置在特定養(yǎng)老機(jī)構(gòu)位置上面,會(huì)自動(dòng)顯示該養(yǎng)老機(jī)構(gòu)的地址、聯(lián)系方式、設(shè)立時(shí)間、機(jī)構(gòu)性質(zhì)(養(yǎng)老院、居家養(yǎng)老服務(wù)中心、托老所、助餐中心等)、服務(wù)老人數(shù)量等信息。
死亡人員服務(wù)監(jiān)控主要是通過與公安人口數(shù)據(jù)庫(kù)對(duì)接,重點(diǎn)獲取死亡人口數(shù)據(jù),每月同步一次。社會(huì)救助享受信息監(jiān)控主要在各級(jí)各類社會(huì)救助信息中對(duì)死亡狀態(tài)人員進(jìn)行篩查,以監(jiān)控人員死亡之后還在享受社會(huì)救助服務(wù)的情況;居家養(yǎng)老服務(wù)信息監(jiān)控主要在居家養(yǎng)老服務(wù)信息中對(duì)死亡狀態(tài)人員進(jìn)行篩查,以監(jiān)控人員死亡之后還在享受居家養(yǎng)老服務(wù)或補(bǔ)貼的情況;優(yōu)撫服務(wù)信息監(jiān)控主要在優(yōu)撫信息中對(duì)死亡狀態(tài)人員進(jìn)行篩查,以監(jiān)控人員死亡之后還在享受優(yōu)撫服務(wù)的情況。
婚姻狀態(tài)相關(guān)業(yè)務(wù)監(jiān)控主要對(duì)與婚姻狀態(tài)相關(guān)性高業(yè)務(wù)申請(qǐng)和經(jīng)辦情況進(jìn)行篩查,以監(jiān)控這部分特定婚姻狀態(tài)人群(離婚狀態(tài)、復(fù)婚一次及以上狀態(tài)、喪偶狀態(tài))在享受社會(huì)救助、社會(huì)福利相關(guān)服務(wù)的情況。
5、結(jié)語
鑒于當(dāng)前民政業(yè)務(wù)現(xiàn)狀以及大數(shù)據(jù)背景,提出民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)。通過數(shù)據(jù)海的建設(shè),形成真正的、全面的、高質(zhì)量的民政業(yè)務(wù)與服務(wù)數(shù)據(jù)資源中心,該數(shù)據(jù)資源中心依靠對(duì)內(nèi)梳理整合、對(duì)外交換共享的更新與管理機(jī)制的保證,能夠確保持久的生命力,依靠數(shù)據(jù)海中心統(tǒng)一負(fù)責(zé)民政對(duì)內(nèi)、對(duì)外兩條線的信息提供服務(wù)。民政業(yè)務(wù)數(shù)據(jù)海平臺(tái)持續(xù)在急、難、熱點(diǎn)民政業(yè)務(wù)建立若干適用的數(shù)據(jù)模型,通過數(shù)據(jù)價(jià)值分析搭建信息化應(yīng)用,找出當(dāng)前民政部門工作的業(yè)務(wù)問題、服務(wù)缺陷和可能的業(yè)務(wù)創(chuàng)新點(diǎn),進(jìn)一步改進(jìn)工作。從而實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)價(jià)值的應(yīng)用,從信息整合共享層次向業(yè)務(wù)協(xié)同層次邁進(jìn),實(shí)現(xiàn)數(shù)據(jù)海信息化成果反補(bǔ)業(yè)務(wù),全方位提升民政業(yè)務(wù)經(jīng)辦和公共服務(wù)水平,促進(jìn)電子政務(wù)的進(jìn)一步發(fā)展。
本文由上海市民政局科研課題項(xiàng)目支持,特感謝。
參考文獻(xiàn):
[1] 陳國(guó)清.基于Hadoop民政大數(shù)據(jù)云架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)[J].福建電腦. 2017.33(03):111-113.
[2] 周天琦.基于民政大數(shù)據(jù)的動(dòng)態(tài)數(shù)據(jù)中心構(gòu)建[J].軟件導(dǎo)刊.2016. 15(01):141-143.
[3] 費(fèi)賢舉,王樹鋒,王文.一種海量大數(shù)據(jù)云存儲(chǔ)系統(tǒng)框架設(shè)計(jì)[J].常州工學(xué)院學(xué)報(bào). 2014(03):38-42.
[4] 陳世敏.大數(shù)據(jù)分析與高速數(shù)據(jù)更新.計(jì)算機(jī)研究與發(fā)展[J]. 2015(02):333-342.
[5] 張楠.公共衍生大數(shù)據(jù)分析與政府決策過程重構(gòu):理論演進(jìn)與研究展望.中國(guó)行政管理[J].2015(10):19-24.
作者簡(jiǎn)介:
徐佩,上海理工大學(xué)管理學(xué)院;黃愛國(guó),上海市民政局信息研究中心主任、高級(jí)工程師;陳震,上海市民政局信息研究中心副主任;熊紅林,上海理工大學(xué)管理學(xué)院博士研究生;沈儉,上海市民政局信息研究中心技術(shù)部主任、高級(jí)工程師;樊重俊,上海理工大學(xué)教授、博士生導(dǎo)師。