崔凱
摘要:醫療保險基金屬于廣大參與保險人員的救命錢,對醫療保險基金建立完善的風險防控體系,保障醫療保險基金穩定有序的應用,同時也做好相應的風險基金管理,是對廣大人民進行生命健康保障,促進社會和諧發展與進步的重要內容。而在醫保基金風險防控體系構建的過程中最重要的是針對醫保基金管理過程中的各類風險進行有效識別和衡量,從而做到早發現早防范的效果和作用。這就需要相應的大數據挖掘技術,通過數據挖掘算法建立風險防控模型庫和方法庫,從而針對醫保基金風險管理過程中的政策風險運營風險供需矛盾風險等多項風險問題進行有效防控,是實現醫保基金風險管控的重要措施。
關鍵詞:醫保基金;風險防控;數據挖掘;數據準備
中圖分類號:R197.1?? 文獻標識碼:A?? 文章編號:1672-9129(2020)16-0138-01
1 醫院醫保基金風險防控體系現狀
現階段醫院的醫保基金防控體系對于數據的管理已經具有了一定的成果并在風險防控的過程中發揮了作用,因此醫院的醫保基金風險防控管理機制已經初步形成。而近幾年來隨著大數據、互聯網+、云計算以及云存儲等相關技術的廣泛應用,在醫院醫保基金風險防控數據挖掘與建設的過程中,基礎數據的標準化采集逐漸深入,它以控制環境、風險評估、控制活動、信息共享與溝通、監督等5大系統為主要要素共同組成了現階段的醫保基金風險防控數據支撐。然而現階段的醫保基金風險防控在數據準備方面也仍然存在著眾多的不足:
1.1首先就表現在數據的抽取轉換和加載及ETL過程較為復雜,在應用的過程中需要采用維護性交叉的腳本得以實現可用性不足,難于得到充分的理解和應用。而且現階段的ETL只能處理單一類型的Oracle數據源,這就需要程序員有較高的數據管理水平,而且在應用的過程中相應的程序也較難修改與維護,因此一旦ETL環節出現差錯,就會導致數據分析來源出現錯誤。
1.2表現在數據的清潔度不夠,現階段在進行醫療基金風險防控管理的過程中我所有的數據來源都是通過SQL函數獲得,該方法在數據存儲的過程中具有一定的局限性,使得數據的清潔度和一致性不能得到預期的效果。而如果在數據獲取過程中出現空缺職責采用不處理或者簡單方式填充的方法,這就會導致數據的質量顯著下降。
1.3在元數據管理的過程中由于使用的是純腳本進行數據抽取轉換和裝載,而且在相應的元數據保存的過程中也采用的是平面文檔的方式,這就使得元數據難以得到更充分的表示和存儲,在數據一致性的維護方面具有較大的困難。
1.4在醫保基金和相關數據獲取的過程中都是通過外不上網直接獲取,而原有的處理方式是通過專人定時手工錄入數據,這些方法都表現出了實效性不夠強,還會耗費大量的人力物力,降低了數據準備的效率。
2 基于數據準備技術開展醫保基金風險防控
數據準備技術是將知識發現與數據挖掘技術進行有效融合,通過對目標數據進行挖掘分析與處理,達到對數據進行管理,從而挖掘風險因素針對性的進行醫保基金風險防范,而基于數據準備技術進行醫保基金風險防控的過程中主要通過ETL技術數據清潔技術元數據管理技術等實現。
2.1通過ETL過程實現數據倉庫的決策分析。結合上述研究表明一就是對數據進行抽取轉換轉載的一個過程,在數據抽取階段可以通過對數據庫系統多個元數據進行抽取,以所在關系型數據庫平面文件或者網頁半結構數據中都可以抽取相應的數據,此外還能夠對信息管理系統產生的數據文件進行數據抽取而轉換成統一的格式。在轉換的過程中則按照一系列的轉換規則和轉換函數,結合業務目標和技術需求進行數據轉換,轉換的內容包括數據屬性、業務代碼、轉換代理生成、數據的過濾、排序、合并、集合、行列轉換等等。最后在轉載階段將所生成的數據存量和增量裝載到目標數據倉庫。結合裝載方式的不同相應的目標數據的組織形式也各不相同。
2.2應用數據清潔技術保證數據的有效性。通過ETL過程所形成的數據庫是從多個數據源中轉換裝載的,而且這些數據還在不斷的更新,因此有可能含有大量的“臟數據”。而所獲取的數據是為醫保基金的風險防控提供決策支持的,因此我們在數據獲取時應充分保證所用數據的準確性、有效性,防止數據錯誤非常關鍵,就需要對數據進行清潔,對于對重復的、缺失的、容易導致錯誤的數據進行清潔,這些數據長期存在就會影響到數據庫內數據的一致性以及數據規模,而基于數據清潔技術則有效提升了數據質量。而在具體操作的過程中,首先,在數據錄入環節就會做到對數據情節的控制,通過建立良好的數據庫模式設計和數據錄入應用程序,可以針對“臟數據”在錄入時進行有效排除,其次,在數據庫設計的過程中通過融入數據清潔程序也能夠有效的提高數據庫模式對于數據的約束程度,這兩者共同作用保障所獲取的數據擁有較高的質量。
2.3元數據處理。在完成了數據庫建立以后最后就是針對數據進行管理,即面向醫保基金的管理目標特定應用,對元數據進行管理描述數據的屬性,從而轉換為計算機可理解的信息。而在元數據處理的過程中其數據又分為業務元數據、技術元數據以及過程處理元數據,首先通過業務元數據微醫保基金風險防控相應的報表工具前端用戶進行數據分析,然后從技術角度對數據進行描述,例如數據類型、數據長度、數據概況,最后在過程處理元數據的階段,對數據進行轉換,觀察被加載拒絕接受的相關數據記錄,最終獲得元數據的處理結果。
3 結語
醫保基金從投資到該付的技術流動中,所參與到的主體較多而且一個主題行為各異,因此在進行醫保基金風險防控與管理的過程中其技術較為復雜。結合現階段信息技術的進步以及電子化經濟環境的不斷發展,使得醫療保險基金的風險因素更多。我們應該建立醫保基金風險防范的體系,對風險因素進行全面分析,從而制定出針對性的防控手段。因此應進一步發揮出數據準備技術在醫保基金風險防控體系中的應用價值和作用,全面提升醫保基金的風險防控效果。
參考文獻:
[1]支濟祥. 大數據背景下我國醫保基金風險防控研究[J]. 中國衛生產業,2017,14(08):12-13.
[2]高臻耀,張敬誼,林志杰,熊赟,朱揚勇. 一個醫保基金風險防控平臺中的數據挖掘技術[J]. 計算機應用與軟件,2011,28(08):120-122.
[3]王健宏. 醫保基金風險防控平臺建設與數據挖掘技術分析[J]. 中國新通信,2019,21(09):172.