文/鄧大松 范秋硯
當前中國正處于經濟轉型、社會轉軌的關鍵時期,社會結構快速變化、組織形態不斷更迭,涉及養老、醫療、貧困等民生保障的諸多復雜問題不斷涌現。大數據技術環境和信息化社會相互交織,為社會保障改革和發展提供了關鍵契機。當前社會保障大數據應用已取得一些成效,但總體來看仍處于初級探索階段,尚有無窮的潛力等待挖掘。未來社會保障研究及應用亟需由大數據分析思維和方法引領,推動社會保障研究轉型升級以及政府社會保障公共決策與服務水平的整體提升。
如今信息技術與經濟社會的交織融合引發了數據迅猛增長,以容量大、類型多、存取速度快、應用價值高為主要特征的大數據已成為國家基礎性戰略資源,更進一步上升為國家發展戰略,在經濟增長、結構調整、民生保障、政府治理等領域發揮著日益重要的作用。綜合來看,大數據已成為推動社會保障改革發展的內在需求和必然選擇。
在新時代背景下,我國社會主要矛盾已經轉化為人民日益增長的美好生活需要和不平衡不充分的發展之間的矛盾。民生安全風險及其保障呈現多樣化、多層次化的特征,傳統的識別機制和手段難以精準識別信息化時代高復雜性和高不確定性的社會風險和公共問題,亟待利用大數據識別和分析社會風險、洞察民生需求,從而防范和規避社會風險,優化資源配置,提高保障水平,縮小城鄉、區域差距,促進形成公平普惠、便捷高效的民生安全保障體系,不斷滿足人民群眾日益增長的個性化、多樣化需求。
在養老保障方面,充分利用養老保險基金征繳、管理、支出、轉移等方面的數據,通過管理與分析,為政策調整和完善提供依據,為管理監控確定方向和重點,評估和分析制度運行狀況,確保基金安全、高效運行。同時,將信息化建設作為提升經辦管理水平的有力載體,建立全國統一的社保信息化平臺,通過數據的互聯互通和充分共享,確保社保資源的合理利用,減少養老保障的運作成本,提高經辦管理服務效率,為基礎養老金全國統籌奠定技術基礎。
在醫療健康保障方面,面對實時生成的海量電子健康檔案、電子病歷數據庫,建設覆蓋公共衛生、醫療服務、醫療保障、藥品供應、計劃生育和綜合管理業務的醫療健康管理和服務大數據應用體系,助力探索預約掛號、分級診療、遠程醫療、檢查檢驗結果共享、防治結合、醫養結合、健康咨詢等服務,革新醫保基金監管模式,防范騙保等危害制度可持續的行為,進而推動構建更高水平、更高質量醫療保障體系。
在扶貧、救助與福利方面,借助大數據的動態支持和保障,有助于推動對扶助對象的定性認識到定量把握的科學轉變,對幫扶措施進行真實、精準的掌握和評估,進而動態調配資源,規劃部署工作,以便進一步實施更精準、更有針對性的幫扶舉措。
近年,人社系統為適應信息技術發展趨勢,先后提出并推動從“人社信息化”向“信息化人社”轉變,從“信息化人社”向“互聯網+人社”升級,人社大數據進入加速發展期。第三代社保卡、電子社保卡持卡人數已達12.41 億,聚合了公民身份、參保、就業、醫療、金融等豐富信息,為推動業務橫向整合與數據聯動奠定了堅實基礎;依托人社大數據的跨省異地就醫結算、跨省及省內異地待遇資格認證極大提升了便民服務效能;借助大數據分析比對的醫療服務智能監控系統全面應用、社會保險基金監管系統上線運行等。
大數據既向傳統的社會保障學科方法論范式提出挑戰,又為新的研究范式突破提供了條件。大數據時代,個人和群體的行為通過數據得以記錄,而通過抓取、存儲、分類、清洗、計算和分享等活動,實現數據分析、演示和實驗,能發現社會發展運行的規律。大數據驅動的數據密集型技術,實現海量數據資源和多元化大數據方法與社會保障特定領域的研究相結合,將研究對象和研究問題充分數字化、網絡化,有利于多學科協同發展和知識創新,日趨顯現出獨特魅力。
一方面,大數據將推動社會保障實證研究從樣本統計時代走向總體普查時代。傳統的實證研究大多借助抽樣調查的結構化數據庫,借助經驗分析、邏輯分析、統計計量分析等方法和手段,從微觀個體、數據量有限的結構化數據中探求普遍性、規律性,客觀上面臨時效性不足、數據質量堪憂、假設合理性存疑、結論準確性有限等諸多問題。而大數據極大地拓寬了信息來源、提高了獲取信息的時效性,拓展了對非結構化和半結構化數據的挖掘,擴展了樣本數據的規模和類型,從而包含了刻畫復雜整體的完整數據信息。可以說,大數據正促使社會保障研究方法發生變化,具體表現在從理論驅動向數據驅動轉型,從有限檢驗向全景仿真轉型,從“小數據”驗證向“大數據”發現轉型。
另一方面,數據驅動與算法驅動將是大數據時代社會保障學科研究的兩大重點和難點。首先是在何種程度上集聚了本領域產生的數據。人社領域作為資源“富礦”,擁有覆蓋廣泛的數據資源,無時無刻不在產生海量規模、時效性強、結構復雜的數據資源。數據是社會保障治理的基礎,社會保障細分領域相對于相關經濟社會生活領域的大小、數字化程度的高低、數據生成能力的大小和數據歸集共享程度的高低,將會顯著影響“數據驅動”程度。其次是在何種程度上發展了適合自身需要的算法和模型。人社大數據本身雜亂而混沌,在冗雜的大數據中挖掘可供分析和決策的信息才是大數據應用的目的和意義所在。這就必須利用數學算法建立復雜模型,依托“云計算”技術,挖掘、過濾和篩選出有價值的信息,作出具備邏輯關系的判斷。因此,前期發展所積累的量化知識總量、計算能力的高低,將會嚴重影響“算法驅動”的強度。
黨的十九大報告指出“按照兜底線、織密網、建機制的要求,全面建成覆蓋全民、城鄉統籌、權責清晰、保障適度、可持續的多層次社會保障體系”,要求“建立全國統一的社會保險公共服務平臺”。筆者認為,這既揭開了中國社會保障深化改革與完善的序幕,又為大數據在社會保障領域的研究和應用提出了新的更高要求。
推動數據整合、開發與開放共享。大數據的來源可靠、精準是前提和基礎。當前社會保障領域的數據分散在不同部門、機構和組織當中,因為部門壁壘“不愿”共享數據,缺乏法律、標準支撐,擔憂數據安全“不敢”共享數據,受技術限制“不會”共享數據等問題客觀存在,難以實現數據之間的有效關聯和匹配,制約了社會保障大數據的研究及應用。因此,亟需建設由城市延伸到農村的統一社會保險、社會救助、社會福利大數據平臺,加強與相關部門的數據對接和信息共享,加快建立數據共享和使用的評估審計機制,推動數據開發利用的技術研發,進而支撐大數據在勞動用工和社保基金監管、醫療保險對醫療服務行為監控、內控稽核等方面的應用,并逐步推動政府公共數據的開放共享,確保數據的真實、精準、合法、可用。
推動大數據在社會保障領域政策制定、評估、改進方面的科學應用。在大數據加持下,“用數據說話、用數據決策、用數據管理、用數據創新”已成為社會保障管理和決策的重點方向。沉睡的數據無法發揮價值,必須加以激活,彌補直覺盲區、經驗式管理的弊端。通過對相關領域長年累月形成的原始數據分析,可以對服務人群精準刻畫,挖掘出群體行為及需求的特點,提示社會保障現象的潛在規律,從而拓展業務模式,著重解決群眾難點、痛點問題,為政府制定政策提供技術支撐,還可以持續跟蹤評估社會保障相關政策制定和執行效果。
推動新技術工具在既有以及新出現的社會保障問題中的運用。社會保障治理存在著權益跟蹤、基金平衡、風險預警防范等諸多既有問題,同時大健康、養老服務等新問題不斷涌現,大數據作為新技術、新工具,如何有效切入社會保障的新老問題,已經成為技術驅動下的社會保障治理的一項重大課題。
注重實證分析與規范分析相結合。單一的實證分析或規范分析都難以詮釋高度復雜和不確定的信息化時代,缺乏實證分析支撐的規范分析是懸浮的空中樓閣,沒有規范質性分析作指導的實證研究則是盲目的計算游戲。不容忽視的是,社會保障具有準公共產品的屬性,權利與義務相對對等而非完全對等,因此在大數據社會保障研究中不能片面強調純而又純的實證分析,必須將實證與規范相結合,實現大數據新工具的推進與社會保障理論和規范的創新融合。
完善社會保障學科的研究方法和研究范式。總體普查、數據及算法雙輪驅動將推動社會保障學科研究從傳統抽樣調查下的相關—因果分析步入總體描述、診斷、預測及規劃。然而,個體行動者的個體特殊差異、相互交往和網絡關系的異常復雜,數據獲取和處理的困難,以及研究對象的數據隱私,大數據在社會保障研究中的應用仍處于起步階段,觀念滯后、學科分立、理論零散、方向模糊、綜合人才極度缺乏、原有學科框架知識制約,客觀上已經成為大數據在社會保障領域深入應用的障礙。因此,仍然需要實務部門與理論界長期不懈的努力,共同推動大數據在社會保障應用與研究中的深入融合。