張嫻靜 王愛榮 賈洸怡
(上海市醫(yī)療保險事務管理中心 上海 200040)
多卡就醫(yī)集聚性模型構想
張嫻靜 王愛榮 賈洸怡
(上海市醫(yī)療保險事務管理中心 上海 200040)
針對多卡虛假就醫(yī)開藥并非法出售牟利的騙保行為,建立多卡就醫(yī)聚集模型,搭建監(jiān)督系統(tǒng),有助于及時發(fā)現(xiàn)多卡異常使用情形,為冒用、盜用、收購醫(yī)保卡購藥販賣現(xiàn)象提供預警支持,提高監(jiān)督檢查的成效。
醫(yī)療保險卡;聚集性;模型;監(jiān)督
隨著醫(yī)保覆蓋面的擴大,醫(yī)保基金面臨的風險也隨之加大,尤其是道德風險,即醫(yī)療服務提供方和需求方利用其優(yōu)勢采取投機行為,導致醫(yī)療費用不合理增長。其中,需求方的道德風險表現(xiàn)為濫用或騙取醫(yī)療基金。多卡就醫(yī)聚集現(xiàn)象便是其中之一,指參保人使用多張醫(yī)保卡同時或同地頻繁就醫(yī)。其因:醫(yī)保僅從次數(shù)和費用兩方面進行監(jiān)控,某些參保人利用這一漏洞,多卡就醫(yī)開藥并出售牟利。其果:醫(yī)保基金的流失和浪費。需要盡早、盡快監(jiān)控和遏制,減少此類損失。
模型簡介:構建多卡就醫(yī)聚集性模型,并在試驗平臺上建立相應監(jiān)督系統(tǒng)。首先,從就醫(yī)信息中,抽象出多卡就醫(yī)聚集性行為模式,通常表現(xiàn)為一組醫(yī)保卡在一段時間內,總是同時出現(xiàn)在同一家或多家醫(yī)院。這組卡為特異群組卡,若一致性過于頻繁,則可認為異常。其次,將結果用于搭建試驗平臺的監(jiān)督系統(tǒng),展示相關信息,為監(jiān)管提供準備。
具備條件:多年信息化發(fā)展,醫(yī)保行業(yè)已積累了海量數(shù)據(jù),而數(shù)據(jù)挖掘技術的發(fā)展為模型構建提供了可能;與監(jiān)督所合作過程中,也積累了若干可疑違規(guī)數(shù)據(jù)篩選經驗。
預期效果:發(fā)現(xiàn)多張醫(yī)保卡同時在一家或多家醫(yī)院異常使用的情形,對冒用、盜用、收購醫(yī)保卡購藥販賣的現(xiàn)象提供預警支持,提高監(jiān)督檢查的效率和效果,減少醫(yī)保基金的流失和浪費。并考慮逐步將該系統(tǒng)向實際應用轉移。

表1 就醫(yī)交易數(shù)據(jù)庫

表2 垂直數(shù)據(jù)格式

表3 特異群組卡(即有違規(guī)嫌疑的人員)

圖1 一致性行為挖掘模型
采用水平格式存儲的交易數(shù)據(jù)庫(見表1),通過剪枝,再采用垂直數(shù)據(jù)格式挖掘,得到相應結果(見表2)。
定義維度為就診日期和就診醫(yī)院的組合。設就診日期為t,就診醫(yī)院為h,則每個維度記為di=
表3可見,卡組K1和 K3,共有5天同時出現(xiàn)在相同醫(yī)院就診,且同時就醫(yī)的次數(shù)最多。其次為K1、K2和K3卡組,共有4天同時出現(xiàn)在相同的醫(yī)院就診。
從醫(yī)保病人日常就醫(yī)刷卡信息中,通過數(shù)據(jù)提取處理,運用多卡就醫(yī)聚集挖掘模型,篩選出一段時間內,相當多的天數(shù)中,同時出現(xiàn)在同一家或多家醫(yī)院的特異群組卡,即有違規(guī)嫌疑的人員(見圖1)。

圖2 試驗平臺具體展示界面
基于數(shù)據(jù)模型,將篩選出的數(shù)據(jù)應用于多卡就醫(yī)聚集性監(jiān)督系統(tǒng)試驗平臺。該平臺能有效監(jiān)控就醫(yī)聚集性行為,可按不同時間段、不同就醫(yī)點的同時就醫(yī)次數(shù)進行查詢,包括卡組分析、醫(yī)院匯總分析、醫(yī)生匯總分析(見圖2),還將該行為與參保人費用記錄信息、藥品使用情況、醫(yī)院醫(yī)生信息等相關聯(lián),使平臺能夠區(qū)分特殊就醫(yī)人群與可疑違規(guī)人群,提供針對性管理和服務,提高監(jiān)督效率。
①卡組匯總分析:按同時就醫(yī)次數(shù)和卡數(shù)倒排序,即同時就醫(yī)次數(shù)最大的,先顯示;同一就醫(yī)次數(shù)里卡數(shù)最多的組先顯示。費用為這一組的就醫(yī)費用。點擊表中的組號(或卡數(shù)),跳出新頁面,顯示這一組的具體人員信息,以及每個人員的具體用藥明細。
②醫(yī)院匯總分析:可按費用、涉及組數(shù)、涉及卡數(shù)進行倒排序,費用最大的醫(yī)院先在表格中顯示。點擊醫(yī)院,跳出新頁面,顯示該醫(yī)院中的具體人員及用藥明細。
③醫(yī)生匯總分析:可按費用、涉及組數(shù)、涉及卡數(shù)進行倒排序,涉及費用最大的醫(yī)生先在表格中顯示。點擊醫(yī)生,跳出新頁面,顯示該醫(yī)生所看病人中的具體人員及用藥明細。
4.1 關于結果應用。通過此模型的計算,能夠從海量的醫(yī)保就診信息中提取可疑的卡組,得到同時到相同醫(yī)院頻繁就診的參保人信息,同時提供發(fā)生費用最大的醫(yī)院、涉及費用最大的醫(yī)生等詳細信息,從而為稽核監(jiān)督部門發(fā)現(xiàn)和查證利用多張醫(yī)保卡就醫(yī)賣藥的違規(guī)行為提供線索,提高工作效率。
4.2 關于運算效率。病人就診的海量信息,導致構建的多卡就醫(yī)聚集性模型運算速度較慢,如何進一步優(yōu)化挖掘算法,提高運算效率,是今后需要繼續(xù)研究的問題。
4.3 關于監(jiān)督效率。加強篩選結果的實際監(jiān)督應用,從中得到進一步驗證和反饋,有利于發(fā)現(xiàn)更多規(guī)則,優(yōu)化多卡就醫(yī)聚集性模型,增加違規(guī)數(shù)據(jù)篩查陽性率,提高監(jiān)督效率。
[1]鐘邃,汪凱.城鎮(zhèn)職工基本醫(yī)療保險統(tǒng)籌基金風險預警系統(tǒng)的探索性研究[D].四川:四川大學社會醫(yī)學與衛(wèi)生事業(yè)管理系,2006.
[2]孫永民.醫(yī)療保險基金流失的原因及對策淺析[J].中國醫(yī)藥指南,2006,11:70-71.
[3] Bertis B.Little, Walter L .Johnston, Ashley C. et a1. Collusion in the U.S. crop insurance program: applied data mining[C]. In Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining, 2002.
(本欄目責任編輯:江 鷗)
Constructing and Applying the Model of Multiple Insurance Cards to Deal with Fraud in Seeking Health Care
Zhang Xianjing, Wang Airong, Jia Guangyi (Shanghai Medical Insurance Affairs Management Center, Shanghai, 200040)
To deal with fraud in medical insurance, which means a insured patient uses multiple insurance cards to seek false medical service and make profits by selling the medicine, constructing a model of multiple insurance cards to build a monitor system is of signifi cant importance to detect the fraud in utilizing medical service, to prevent the risk of the fraud in using medical service and to improve the effi ciency of the supervision on insurance fund expenditure.
medical insurance card, consistence, model, supervision
F840.684 C913.7
A
1674-3830(2014)8-39-3
10.369/j.issn.1674-3830.2014.8.10
2014-3-12
張嫻靜,上海市醫(yī)療保險事務管理中心統(tǒng)計師,主要負責醫(yī)療保險統(tǒng)計分析工作。