潘安
【摘要】 隨著大數據技術的發展,大數據技術正在廣泛的應用于各行各業。隨著國家相關政策的出臺以及人民生活水平的提高,健康險的發展面臨著巨大的前景。健康險和大數據的結合能夠在健康險中數據的收集、處理、分析和應用起到巨大的作用。大數據技術在健康險的應用能夠促進健康險的發展,使得健康險能夠更好的服務人民。
【關鍵詞】 大數據 健康險 收集 處理 分析 應用
當今信息技術的快速發展帶動了各行各業的發展,催生了物聯網、互聯網、電子商務等新興產業的發展。各行各業的業務帶來的數據正在以幾何級的形式爆發,傳統的數據收集、存儲、分析和應用技術已經不能滿足要求,這點在互聯網行業尤為突出。互聯網行業面臨著海量的數據資源、快速的數據增長,現有的大數據技術已經在互聯網企業得到了探索和應用。
隨著新醫改的推出以及人民群眾的實際需求,健康險得到了迅猛的發展[1]。但是,健康險在發展過程中面臨著海量的數據資源,如何收集、處理、分析和應用這些數據資源更好的服務健康險成為亟待解決的問題。
一、當前現狀
傳統健康險當前得到了迅猛的發展,但是當前健康險面臨兩大問題:大部分健康險業務處在虧損狀態和健康險不能滿足用戶的要求。從健康險公司的角度,當前需要利用大數據技術[2]對醫療數據等數據進行分析降低醫療風險和經營風險。從用戶的角度,健康險公司能夠對用戶的行為和醫療數據進行分析,不僅做到理賠保障的作用,還能夠對用戶的健康狀況進行干預,減少用戶產生醫療風險的概率,使得健康險成為用戶的健康管家。
二、技術架構
全面的數據資源是大數據技術應用的基礎,數據的處理是大數據技術應用的關鍵,數據的分析是大數據技術應用的核心,歸根結底,大數據技術都是為應用服務的。本節將從健康險數據的收集、數據的處理、數據的分析和數據的應用四個方面進行展開介紹。
2.1數據的收集
傳統的保險數據存在數據量小、數據來源單一、數據收集慢的問題。現有包含的數據主要來源于客戶的保單信息以及發生理賠時的理賠信息。因此,首先,健康險公司要與外部醫療機構合作獲取客戶部分醫療信息;其次,需要借助物聯網中可穿戴設備等技術,實時并且全面的獲取客戶的血壓、心率等健康信息;最后,借助互聯網工具(APP、微信公眾號)獲取客戶的用戶社交信息、喜好信息等等。通過這些信息能夠建立全方位的客戶視圖,為數據分析做好基礎。
2.2數據的處理
數據的處理主要包括對收集的數據如何組織以及如何存儲。現有的數據資源不僅包含傳統的結構化數據,還包含實時產生的大量半結構化和非結構化的數據,因此需要借助現有的工具及方法(OCR技術等)把非結構化數據轉化為有價值的結構化數據。在數據的存儲上,傳統的集中式存儲已經不能滿足要求,需要借助HBase等適用于海量數據實時存儲的數據存儲技術。
2.3數據的分析
首先,數據的分析需要對各種健康險數據、醫療數據建立分析模型。用深度學習[3]等機器學習方法進行數據的挖掘。例如,利用無標定的醫療數據進行無監督訓練,分層訓練模型各層參數。
具體的,先用無標定數據訓練第一層,訓練時先學習第一層的參數,在學習得到第n-1層后,將n-1層的輸出作為第n層的輸入,訓練第n層,由此分別得到各層的參數;基于上一步得到的各層參數進行自頂向下的監督學習(就是通過帶標簽的數據去訓練,誤差自頂向下傳輸,對網絡進行微調),對學習到的各層參數進一步優化。
其次,數據分析需要借助強大的計算平臺實現分布式并發計算和實時計算。傳統的單服務器模式已經不能滿足處理海量數據的要求。在處理海量數據的時候借助Hadoop等計算平臺實現對大量數據的分布式并發計算。Hadoop通過數據分塊及自恢復機制,能支持PB級的分布式的數據存儲,以及基于MapReduce分布式處理模式對這些數據進行分析和處理。
MapReduce編程模型可以很容易的將多個通用批數據處理任務和操作在大規模集群上并行化,而且有自動化的故障轉移功能。Hadoop以一種可靠、高效、可伸縮的方式進行處理依靠橫向擴展,通過不斷增加廉價的商用服務器來提高計算和存儲能力。
除此之外,借助Spark等實時數據分析系統實現海量數據的實時計算。Spark不僅啟用內存分布數據集,提供交互式查詢,同時還可以優化迭代工作負載。利用Spark可以支持分布式數據集上的迭代作業,構建大型的、低延遲的數據分析應用程序。
2.4數據的應用
基于數據分析可以從以下方面的應用促進健康險的發展:
第一,通過建立慢病管理等疾病模型實現對用戶的健康狀況進行干預,減少用戶的發病幾率,做用戶的健康管家;
第二,通過建立醫療付費模型對用戶的醫療行為進行干預,一方面降低用戶過度醫療的可能性,另一方面減少用戶不必要的醫療費用支出;
第三,通過建立醫療風險以及經營風險模型,健康險公司能夠有效防止保險欺詐以及控制經營風險。
三、技術難點
大數據已經成為健康險公司發展的隱形資產。但是大數據在健康險的應用存在以下難點:
第一,數據的互聯互通與數據共享問題。現有的保險公司面臨的數據資源有限,多維度的數據資源是進行數據挖掘的關鍵,如何實現與醫療機構、社交網絡等數據的互聯互通是需要解決的問題;
第二,大數據模型的應用問題。以神經網絡等為代表的機器學習模型在各行各業掀起了學習的浪潮,但是如何結合醫療知識和大量歷史數據結合設計相對準確實用的模型是需要解決的問題;
第三,數據安全性問題。大數據技術在健康險中的應用涉及到用戶的醫療信息等敏感數據,如何保護數據的存儲安全以及用戶隱私是需要解決的問題。
四、結束語
健康險和大數據技術有機結合是健康險發展的必然趨勢。健康險和大數據技術有機結合能夠促進健康險的快速健康的發展。
大數據技術能夠助力健康險公司整合健康險的保險保障、健康管理等功能,進一步打造大健康生態圈,實現健康險更好的服務人民的目標。
參 考 文 獻
[1]劉彥欣. 我國商業健康保險發展機遇與挑戰[J]. 對外經貿, 2015(4):51-54.
[2]徐子偉, 張陳斌, 陳宗海. 大數據技術概述[C]. 系統仿真技術及其應用學術論文集. 2014.
[3]孫志軍, 薛磊, 許陽明,等. 深度學習研究綜述[J]. 計算機應用研究, 2012, 29(8):2806-2810.