李 萍,吳善鵬
(江蘇省大數據管理中心,江蘇南京 210036)
隨著大數據時代的來臨,運用大數據技術和理念推動信用數據的共享和開放,創新信用數據加工處理方式,提高數據挖掘分析和融合應用水平,建立全面統一的信用信息數據大平臺,已成為當前社會信用體系的建設趨勢和研究熱點[1]。順應上述趨勢和熱點,本文以省級信用大數據應用建設為研究對象,在深入分析信用大數據的采集、治理和應用需求的基礎上,結合大數據技術特點,探索構建數據處理高效、挖掘充分、安全可靠的省級信用大數據應用平臺,為更好地滿足新時期社會信用體系建設的技術要求。
自我國正式啟動社會信用體系建設以來,歷經十余年,大部分省市信用信息應用平臺建設取得積極成效。以江蘇、浙江、廣東等地為例,已建起省級信用門戶網、社會法人信用基礎數據庫、自然人信用基礎數據庫和省公共信用信息服務平臺,依法開展社會法人和自然人公共信用信息的歸集[2],面向政府部門和社會公眾提供各類信用產品應用服務。
當前,省級信用信息應用平臺還存在一些尚待解決的問題,主要表現在以下方面。
(1)數據質量不高。因為數據標準不夠完善,導致數據歸集沒有有效解決源數據多源異構的問題,數據的全面性、連續性不足,從而導致數據質量較低,很難形成數據分析應用的各項主題庫和專題庫,支撐應用的效果不夠好。
(2)數據歸集不全。所歸集的信用數據覆蓋范圍不夠全,無法形成完整的信用畫像和圖譜,難以實現信用關聯關系網絡分析。
(3)應用時效低。由于目前數據處理的手段和方法,尤其是系統性科學性的數據分析尚未實現自動化、智能化,信用的應用還多數停留在靜態應用當中,還不能滿足應用的高時效性需求。
(4)應用不夠豐富。目前,部分行業尚未建立信用信息系統或者應用的程度還不夠深,導致信用在服務“放管服”改革中的作用未能充分發揮,信用數據融合應用水平較低。
1.3.1 總體需求
借助大數據技術,全方位、多渠道歸集信用數據,以信用強管理,以信用促發展,以信用優服務,以信用推創新,促進社會運用信用成果,發揮信用大數據的價值,推動經濟發展、完善社會治理、提升政府服務和監管能力,滿足領導決策、政府業務部門監管、社會信用應用服務等業務需求。
1.3.2 功能需求
(1)數據建設需求。在數據歸集上,需要滿足數據及時性、準確性的要求;在數據范圍上,需要外部數據及第三方數據提供輔助支撐;在數據治理上,需要滿足對數據處理高效率、數據質量校核、數據治理體系化等方面的要求。
(2)分析模型體系構建需求。數據分析模型是開展各類業務應用的基礎,需要構建信用評價模型體系,對重點領域、重點區域、重點群體加強監管,防范系統性風險。
(3)平臺功能建設需求。以提供信用數據產品和服務為目標,夯實信用大數據基礎應用平臺、信用大數據分析決策支撐平臺、信用大數據監管預警平臺、信用大數據接口服務平臺等建設工作,提升信用大數據資產管理軟實力。
(4)可視化需求。需提供豐富的可視化手段,滿足不同用戶、不同場景的展示需求。
(5)系統安全體系保障需求。從平臺實際使用需求出發,規劃好應用系統安全防護的架構,確保系統安全可靠性和業務連續性。
為易于規劃和管理,采用分層設計理念,結合用戶分析、需求分析,結合政府的職能定位,將省級信用大數據應用平臺整體分為“六橫兩縱”,總體框架體系設計如圖1所示。
(1)基礎設施體系由網絡、計算設備、存儲設備、安全防護設備和大數據基礎支撐套件等基礎設施組成。
(2)數據資源中心主要是匯聚融合信用基礎數據和主題數據,進行集中式數據治理,構建形成信用全景畫像融合主題數據庫和信用應用主題數據庫。數據資源中心組成如圖2所示。
(3)支撐體系主要提供信用大數據應用所需的平臺系統支撐功能,用于構建各類應用和服務的分析模型、畫像標簽管理、數據治理平臺、信息共享平臺、資源管控平臺等支持服務,支撐體系架構如圖3所示。
(4)信用應用體系主要面向各類用戶提供具體信用業務應用,由信用大數據業務應用系統、信用大數據分析決策支撐系統、信用大數據監管預警系統、信用大數據服務系統、信用大數據基礎應用系統、信用大數據服務總線和配置管理系統組成。
(5)信用服務體系主要面向各類用戶提供線上線下的各類服務,包括信用數據服務(接口)、信用產品服務、線下信用分析服務等。
(6)信用訪問入口包括信用門戶網站、APP、公眾號、可視化大屏等。
(7)標準規范體系和安全保障體系是指在國家、省已有的標準規范及安全管理體系下,引入大數據有關內容,構建符合大數據場景下的信用應用相關標準規范和安全保障體系。

圖1 總體架構

圖2 數據資源中心框架

圖3 支撐體系框架

圖4 大數據套件組成
如圖4所示,為更好支撐信用大數據的處理、挖掘和分析,平臺采用主流大數據技術、工具和套件,包括Hadoop、圖數據庫、分布式數據庫、圖計算、機器學習、深度分析等。
按照大數據環境下的一般數據治理流程[3],平臺的數據架構主要由原始庫、資源庫和主題應用庫組成,架構如圖5所示。
原始庫用來存放從各個渠道直接采集的有關數據,不做任何改動和處理。資源庫對采集的原始庫數據按照一定的治理規則進行數據清洗、比對、整合,一部分數據成為可以使用的有效數據,一部分成為無法使用的無效數據。主題應用庫是面向各類主題的應用數據集,用來為各應用系統提供數據支持。

圖5 數據架構
本文分析了省級信用信息平臺建設狀況和主要需求,按照大數據的架構理念,設計了建設信用大數據應用平臺的方案,本方案緊貼需求,目標明確,具有實踐指導意義。