閆佳銘
摘要:我國社會信用體系建設發展前景廣闊,基于數據共享打造信用產品,成為未來發展的重要趨勢。大數據時代,社會信用體系建設不斷深入的過程中面臨許多挑戰,如非格式化數據應用不足、信用應用場景少、數據分析挖掘能力不足等。充分利用大數據技術的高擴展性、數據處理能力和數據分析能力,可以促進社會信用體系更好更快發展。
關鍵詞:大數據技術;社會信用體系建設;信用應用
信用數據是推動社會信用體系發展的基礎力量,大數據技術既能夠改變信用數據分析和判斷方式,又能引起社會信用生產理念和應用產品設計發生變化。全面建成社會信用體系是一項長期性工作,需要深入研究和技術突破,社會信用平臺和應用要持續更新以適應新環境、新要求,發揮大數據的技術優勢用于信用建設勢在必行。
一、社會信用體系建設的發展趨勢
(一)信用數據海量增長,數據格式多樣化發展
信用數據是社會信用體系建設的重要組成部分,為提高信用監管的針對性和信用評價的準確性,信用評價指標和數據量將不斷豐富。海量數據由多種數據結構構成,既包含由二維表來表現的結構化數據,又包含圖片、視頻、報表等非結構化數據。豐富的信息資源為信用體系建設奠定了堅實的數據基礎樁,也為眾多機構參與建設創造了條件,數據量的豐富和數據結構的復雜給數據存儲、查詢、分析、清洗帶來更多挑戰。
(二)信用主體增加,系統覆蓋面更廣
國家和各省市區逐步建立橫向到邊、縱向到底的覆蓋全社會的公共信用網站,信用主體可以在網站上查詢或打印信用報告、查詢行政處罰或行政許可信息,失信主體可以申請信用修復或提出信用異議。隨著社會對信用建設的理解逐漸深入,信用元素所涉及領域將逐漸增多,更多的信用主體會在國家和地方信用網站中查詢信息和使用功能,信用網站的并發性壓力日益增大。
(三)數據分析能力提升,信用應用產品更加豐富
在獲取海量、多樣化信用數據基礎上,信用應用產品的設計與開發也將不斷深入,應用范圍逐漸拓寬。各省市區采用不同技術手段挖掘分析信用數據,鼓勵信用服務企業參與進來,獲取數據間的關聯特性,提取高質量的信用信息,支持更多信用應用需求落地。
二、社會信用體系建設的現實障礙
(一)信用數據來源不全,非格式化數據應用不足
現階段,公共信用數據的主要來源是各行政部門在工作過程中所產生的監管數據,包含雙公示信息、紅黑名單、基本登記信息等。在數據采集過程中,部分信息無需市場主體提供或者工作人員對某些數據項沒有足夠重視,導致出現數據字段缺失的情況,例如漏填法人或其他組織統一社會信用代碼,唯一識別碼缺失會影響信用評價的科學性和準確性。同時,公共信用數據由結構化數據和非結構化數據組成,但實際上以傳統的結構化數據為主,缺少對互聯網抓取數據、視頻音頻等非結構化數據的應用。
(二)信用應用場景偏少,信用產品落地難
從各地區信用應用推進情況看,信用應用場景普遍偏少。以聯合獎懲為例,國家已組織各行政部門簽署涉及多領域的備忘錄,但在實際執行過程中卻因獎懲措施不明確、針對性不強,導致陷入難以落地的窘境。除現有應用難以推動的情況外,基于大數據分析的應用產品明顯不足,在實際應用中以銀行信用貸款、法院對失信人核查監督和工程領域招投標等為主[1]。
(三)數據割裂,數據分析挖掘能力不足
信用數據的歸集是數據共享的前提,各省市采用獨立建設信用平臺的方式開展,產生信用信息割裂現象,信用主體的數據完整性難以保證,會出現同一主體可能具有不一樣的信用評價,影響評價結果的科學性。在數據存儲上看,傳統架構下的信用平臺建設多采用關系數據庫進行存儲,而這種數據庫中的二維表數據模型難以支撐對多維數據的處理,特別是當平臺數據朝著多樣化、高并發訪問交互發展的情況。
三、大數據技術在社會信用體系建設中的應用研究
相比于傳統架構,大數據技術具有高擴展性和強大的存儲、挖掘、分析、處理數據的能力,充分發揮大數據的技術優勢,向社會提供更加精準的信用服務和更加科學的信用監管。
(一)高擴展性解決信用信息歸集問題
大數據技術的高擴展性,能夠高質量實現信用信息歸集和共享機制。按照信用目錄需求,廣泛征集各領域、多種格式的信用數據進行統一歸集,在大數據架構下,系統可以實現兼容多種類型的數據格式。如果數據量龐大,可以通過添加服務器節點實現性能大幅度提升,而且服務器節點數量的變化不會影響已有的應用程序,而且多臺服務器可以實現相互間冗余備份,單個節點出現故障并不會對整個系統造成影響,系統仍能保持運行。
(二)分布式架構集群提升數據存儲和處理能力
傳統架構中數據具有關系特性,大數據架構能夠規避這一點,數據庫結構比較簡單,采用分布式集群架構或內存數據庫來滿足系統對龐大數據總量、高并發的需要,在用戶訪問壓力大、交互頻次高的情況下,不會出現響應遲緩或宕機的現象。傳統關系型數據庫在處理海量數據時,需要幾個小時或更長時間,這種效率是用戶無法接受的,用傳統數據查詢技術處理海量信用數據難以為繼。大數據時代下,這種強大的數據存儲和處理能力為信用體系建設的發展提供了技術保障,使信用平臺的服務范圍更廣泛、服務內容更豐富。
(三)挖掘分析信用數據關聯關系,創新應用產品
大數據和云計算技術能夠推動信用應用產品的設計與開發,通過深入挖掘信用數據,獲得數據之間的關聯關系,并分析其中蘊含的價值,產生內容豐富、適合推廣的信用產品。同時,預測是大數據的一個核心特性,在現有海量數據環境下,大數據技術可以通過垂直檢索、語義分析、機器學習等技術手段產生更高效、精準的協同過濾推薦方法。通過多維度實現信用數據分析,既可以改善信用評價的準確度,又可以更有針對性進行聯合獎懲,提升信用監管成效。大數據技術對結構化和非結構化信用數據進行分析,可以產生信用業務決策、風險評估、安全生產風險預警等應用產品,創新信用應用服務范圍,提供精準服務,提升產品多樣化和適應性。
參考文獻:
[1]陳海盛,白小虎,郭文波,吳淑君.大數據背景下信用監管機制構建研究[J].征信,2019(5):11-16.
[2]吳克文·大數據技術在社會信用體系建設中的應用研究[J].農家參謀,604(24):280.