999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在醫(yī)療保險信息化建設中應用大數(shù)據(jù)分析的研究

2020-06-06 06:56:40王為光
計算機測量與控制 2020年5期
關鍵詞:影響模型

王為光

(蘇州工業(yè)園區(qū)社會保險基金和公積金管理中心,江蘇 蘇州 215000)

0 引言

隨著信息技術的發(fā)展,大數(shù)據(jù)已經成為新時代的熱點,并被給予“未來新石油”的評價[1-3]。對大數(shù)據(jù)的開發(fā)利用已成為國際競爭及國家整體實力的重要體現(xiàn),世界各國先后制定和實施了大數(shù)據(jù)相關的戰(zhàn)略計劃,我國于2015年提出了大數(shù)據(jù)發(fā)展戰(zhàn)略[4-6],隨著信息技術的迅速發(fā)展,基于大數(shù)據(jù)技術的數(shù)據(jù)開發(fā)利用已經成為各個行業(yè)在市場競爭中的重要因素,甚至成為國家整體實力的重要體現(xiàn)。在醫(yī)療領域仍舊如此,各區(qū)域醫(yī)療保險信息系統(tǒng)內存在著大量的數(shù)據(jù),這些龐大的醫(yī)療保險數(shù)據(jù)在不經過梳理、分析、再整理、重構等處理的情況下,很難直接用于醫(yī)保管理,加大醫(yī)保工作人員的工作量,造成很大的資源浪費[7-10]。依據(jù)國家“大數(shù)據(jù)”發(fā)展戰(zhàn)略要求,利用大數(shù)據(jù)對醫(yī)保基金進行風險防控已經成為目前科技發(fā)展的重點,通過將大數(shù)據(jù)分析技術應用到醫(yī)療保險行業(yè),能夠有效降低醫(yī)保基金運行風險,有利于解決醫(yī)保險欺詐、過度醫(yī)療等問題,最終實現(xiàn)醫(yī)保基金的可持續(xù)發(fā)展[5,11-12]。

因此, 如何利用好這些醫(yī)保大數(shù)據(jù)、探究大數(shù)據(jù)在醫(yī)療保險信息化建設中的應用具有十分重要的意義[13-14]。本研究以蘇州工業(yè)園區(qū)醫(yī)療保險特病結算數(shù)據(jù)為基礎,對數(shù)據(jù)進行梳理、分析、清洗、重構,運用系統(tǒng)建模大數(shù)據(jù)技術,利用預測模型、數(shù)理模型進行數(shù)學建模,分析影響特病支出費用的發(fā)展趨勢以及影響支出的關鍵因素,提高了數(shù)據(jù)的處理能力。

1 大數(shù)據(jù)應用方案設計

本研究通過以文蘇州工業(yè)園區(qū)社會保險基金和公積金管理中心(以下簡稱“中心”)醫(yī)療保險特病支出數(shù)據(jù)為基礎,對大數(shù)據(jù)的應用進行說明、分析借助于大數(shù)據(jù)分析挖掘技術助力醫(yī)保平臺特病數(shù)據(jù)監(jiān)控與費用控制,為醫(yī)保基金的可持續(xù)發(fā)展及醫(yī)療保險政策的制定、執(zhí)行、完善提供依據(jù)。如圖1所示。

圖1 大數(shù)據(jù)應用框架結構示意圖

在本研究設計中,其總體思路是:選擇園區(qū)的12種特病樣本數(shù)據(jù),該疾病為尿毒癥、白內障、再生障礙性貧血、血友病、惡性腫瘤康復期、冠心病合并心肌梗死、癲癇、強直性脊柱炎、系統(tǒng)性紅斑狼瘡、類風濕性關節(jié)炎、惡性腫瘤放化療、重癥精神病等。首先將這些數(shù)據(jù)進行梳理、分析、清洗等處理,再利用大數(shù)據(jù)分析模型,進行數(shù)學建模,根據(jù)限額、限額以內的報銷比例,超限額報銷比例,申請人數(shù)四個影響維度,調整數(shù)理模型參數(shù),對下一年度的特病支出費用做出預測。

通常,醫(yī)療保險信息化平臺為分為不同層次的幾個平臺,比如數(shù)據(jù)庫、數(shù)據(jù)存儲平臺、大數(shù)據(jù)計算、處理平臺、業(yè)務應用平臺、展示層等。醫(yī)療大數(shù)據(jù)被存儲在數(shù)據(jù)庫中,在信息化平臺中,數(shù)據(jù)存儲中心為基于Hadoop平臺的大型Hbase數(shù)據(jù)庫,hadoop分布式大數(shù)據(jù)平臺能夠提供數(shù)據(jù)提取、存儲和計算服務,其具有結構化的數(shù)據(jù)和非結構化的數(shù)據(jù),非結構化的數(shù)據(jù)被存儲在Hadoop平臺中的HDFS文件系統(tǒng)中。在Hadoop平臺中的各種大數(shù)據(jù)可以實現(xiàn)分布式存儲、超融合VS分布式、刪重和壓縮以及整合分析等功能。

在數(shù)據(jù)計算之前通常要進行數(shù)據(jù)預處理,數(shù)據(jù)預處理主要包含數(shù)據(jù)梳理、數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉換和數(shù)據(jù)簡約等。在進行數(shù)據(jù)處理中,對已有的數(shù)據(jù)資源進行梳理,確定需要的有效的業(yè)務數(shù)據(jù)范圍,從核心業(yè)務數(shù)據(jù)庫oracle中抽取需要的原始目標業(yè)務數(shù)據(jù),然后對原始數(shù)據(jù)在抽取時進行第一次數(shù)據(jù)粗清洗工作,清洗后的數(shù)據(jù)存入大數(shù)據(jù)平臺的hive數(shù)據(jù)倉庫中,然后對hive倉庫中的數(shù)據(jù)進行二次清洗,形成滿足要求的有效的高質量數(shù)據(jù),二次清理后的數(shù)據(jù)存放在hive數(shù)據(jù)庫中,對第一次存儲的數(shù)據(jù)進行清除整理。數(shù)據(jù)清理之后,采用數(shù)據(jù)挖掘算法或者隨機矩陣模型對清洗后的數(shù)據(jù)進行計算、處理,然后通過展示頁面向用戶顯示數(shù)據(jù)。

2 關鍵技術設計

2.1 大數(shù)據(jù)處理技術

在諸如尿毒癥、白內障、再生障礙性貧血、血友病、惡性腫瘤康復期、冠心病合并心肌梗死、癲癇、強直性脊柱炎等多種醫(yī)療數(shù)據(jù)被輸入到信息化平臺時,需要對大數(shù)據(jù)進行預處理,在本研究設計中,采用移動平均模型(MA)或者指數(shù)平滑模型進行數(shù)據(jù)處理。

移動平均(MovingAverage)就是使用前N期的歷史數(shù)據(jù)進行序列的預測,即把前N期的歷史數(shù)據(jù)的平均值作為下一期的預測值,其基本原理是通過消除時間序列中的周期變動和不規(guī)則波動的影響,以便呈現(xiàn)出時間序列的總體發(fā)展趨勢(即趨勢線),然后根據(jù)趨勢線分析序列的長期趨勢,其原理示意圖如圖2所示。

圖2 移動平均大數(shù)據(jù)預處理原理示意圖

上述為一次移動平均計算值,利用上述理論的效果如圖3所示。

圖3 移動平均大數(shù)據(jù)預處理效果示意圖

通過該方法,可操作性、解釋性比較強,易于工程化的實現(xiàn),移動平均法能夠有效地消除預測中的隨機噪聲。

在使用指數(shù)平滑模型時,指數(shù)平均(exponential smoothing,也叫exponential weighted moving average),這種平均方法的重要特征就是,Yt與之前產生的所有信號有關,并且距離越近的信號所占權重越大。根據(jù)所選時間特征分為如下類型:一階指數(shù)平滑、二階指數(shù)平滑、Holt-Winters指數(shù)平滑模型等,采用該模型優(yōu)點:精度較高,易于工程化的實施,python,R均有相關包實現(xiàn),調用接口簡單易用,由數(shù)據(jù)異常導致的報錯較少。

2.2 數(shù)據(jù)處理方法

2.2.1 隨機矩陣理論處理方法

隨機矩陣理論是通過統(tǒng)計、分析醫(yī)療數(shù)據(jù)的能譜和本征態(tài),得出實際測量中的隨機程度,進而揭示不同醫(yī)療實際數(shù)據(jù)所蘊含的整體關聯(lián)的事件特征。下面構建隨機矩陣理論模型對醫(yī)療數(shù)據(jù)的相關性進行計算。

假設醫(yī)療保險相關性評估矩陣模型為:

(1)

其中:

(2)

(3)

在上式中,對人體的健康造成重大傷害的疾病(諸如尿毒癥、白內障、再生障礙性貧血、血友病、惡性腫瘤康復期、冠心病合并心肌梗死、癲癇、強直性脊柱炎等)有M種,數(shù)據(jù)集合為:{P1,P2,P3……PM},人體疾病的數(shù)據(jù)有N種,數(shù)據(jù)集合為:{Q1,Q2,Q3……QN}, 在評估時間窗區(qū)間范圍內,連續(xù)測試T次,其中將對人體健康造成重大傷害的影響的數(shù)據(jù)構建為矩陣D1,其中集合數(shù)據(jù)元素Pij為第i個疾病在j疾病等級下進行測量的疾病大數(shù)據(jù)。

在運算中,為了統(tǒng)一計算的方便,對評估矩陣模型D進行標準化。標準化公式為:

(4)

定義xi=(xi1,xi2,xi3……xiT), 假設標準化后的矩陣為D3,則D3=(yij)(M+N)*T,其中:

μ(yi)=0

(5)

σ2(yi)=1

(6)

其中:yi=(yi1,yi2,yi3……yiT)T, 1≤i≤M+N。

再次引入公式:

式(7)

其中:

Dstd=[w1,w1,w1……wM+N]T

(8)

該公式的運算過程為基于標準化后的矩陣D3而進行的,由于D3矩陣在計算中為非Hermitian矩陣,該矩陣的奇異值等同矩陣為:

(9)

在式(8)中,U為Haar酉矩陣,在運算中容易出現(xiàn)多個矩陣,假設有N個任意的非標準Hermitian矩陣D3,則存在N個奇異值等同矩陣。為了計算方便,按1個奇異值計算,這時Du可以表示為:

(10)

基于上述模型的建立,將上述建立的數(shù)據(jù)模型應用到引起人體疾病影響因素的評估上,觀察人體中隱藏的外在參數(shù)對人體健康影響情況。在本研究設計的方案中,忽略數(shù)據(jù)輸入的步驟,直接從醫(yī)療保險信息化平臺中的數(shù)據(jù)存儲中心中提取數(shù)據(jù),然后進行下一步的操作。即按照標準化后的標準化公式(見式4)來計算,根據(jù)式(9)求出奇異值等同矩陣,根據(jù)式(10)求出奇異值計算,最后根據(jù)式(8)求出Dstd的值。公式在此不做重復描述,根據(jù)上文列出的公式,分別輸入采樣數(shù)據(jù),求出各個公式的值。

然后利用隨機矩陣模型分析大數(shù)據(jù),當計算出標準化矩陣積Dstd的特征值分布時,便可評估疾病對人體健康造成的影響,Dstd越大,影響量越大。由于D1表示的醫(yī)療疾病數(shù)據(jù)集合為嚴重影響人體健康,數(shù)據(jù)集合{P1,P2,P3……PM}中表示不同的參數(shù),造成人體健康重大疾病的數(shù)據(jù)集合為{Q1,Q2,Q3……QN}中也表示不同的集合,因此在實際應用時,根據(jù)選擇數(shù)據(jù)類型而構建矩陣。

2.2.2 數(shù)據(jù)挖掘算法模型

在對大數(shù)據(jù)進行處理時,首先將數(shù)據(jù)按照一定的屬性分類,本研究基于數(shù)據(jù)挖掘算法實現(xiàn)智能大數(shù)據(jù)的分類。數(shù)據(jù)挖掘算法包含很多種算法,比如關聯(lián)算法、回歸分析、聚類算法、異常檢測等,其中每種算法又包括多個算法,比如分類算法包括諸如決策樹算法、貝葉斯算法、神經網絡、支持向量機等算法,聚類分析算法包括諸如k-means SOM神經網絡、FCM聚類算法等的算法。在本研究設計中,選擇使用決策樹算法中的ID3算法構建決策樹,實現(xiàn)對數(shù)據(jù)的分類。

假設表1為給定的數(shù)據(jù)集為D,根據(jù)最大信息增益選擇最優(yōu)特征生成極小熵決策樹,計算各特征A1、A2、A3、A4、A5對數(shù)據(jù)D的信息增益,如表1所示。表1中的D1和D2,D3分別表示在各個特征中取值為1、2和3的樣本子集,根據(jù)上文涉及的公式計算統(tǒng)計在表1中的數(shù)據(jù)可得:

H(D)=-8/15*log2(8/15)—7/15*log2(7/15)=0.996 8;

g(D,A1)=H(D)-[8/15*H(D1)+7/15*H(D2)]=0.288 0;

g(D,A2)=H(D)-[5/15*H(D1)+4/15*H(D2)+6/15*H(D3)]=0.139 8;

g(D,A3)=H(D)-[3/15*H(D1)+12/15*H(D2)]=0.029 2;

g(D,A4)=H(D)-[7/15*H(D1)+8/15*H(D2)]=0.288 0;

g(D,A5)=H(D)-[6/15*H(D1)+4/15*H(D2)+5/15*H(D3)]=0.413 1;

根據(jù)上面的計算結果,特征A5的信息增益最大,所以選擇A5為根節(jié)點。根據(jù)A5的取值將樣本分成3個結合,S1={2,3,6,8,12,13},S2={1,5,7,14},S3={4,9,10,11,15},其中集合S2已全部屬于同一個類,不需要再分,已成為葉子節(jié)點。采用類似的方法可確定其它根節(jié)點和葉子節(jié)點。

表1 樣本數(shù)據(jù)

利用上述數(shù)據(jù)集構建決策樹如圖4所示。

圖4 決策樹示意圖

通過數(shù)據(jù)挖掘算法建立分類模型,使得多個不同類型的醫(yī)療保險數(shù)據(jù)庫根據(jù)用戶需求輸出不同的目標數(shù)據(jù),縮短用戶利用數(shù)據(jù)的時間,提高了數(shù)據(jù)處理效率。

3 方案實驗及分析

本研究選擇了蘇州工業(yè)園區(qū)2012年度至2017年度醫(yī)療保險特病參保人員醫(yī)療結算數(shù)據(jù)作為研究對象,涉及12個病種,約5萬人員,1 400萬人次的結算數(shù)據(jù)。包括了特病人員的基本信息、就醫(yī)結算信息等。選取的數(shù)據(jù)樣本為12種特病分別為尿毒癥、白內障、再生障礙性貧血、血友病、惡性腫瘤康復期、冠心病合并心肌梗死、癲癇、強直性脊柱炎、系統(tǒng)性紅斑狼瘡、類風濕性關節(jié)炎、惡性腫瘤放化療、重癥精神病。在試驗時,將上述數(shù)據(jù)輸入到基于Matpower的IEEE-118節(jié)點的仿真系統(tǒng)系統(tǒng)中,假設矩陣D1=80*150,D2=400*500,根據(jù)公式Dstd=[w1,w1,w1……wM+N]T進行計算,其中D1分別為癲癇、強直性脊柱炎、系統(tǒng)性紅斑狼瘡等疾病數(shù)據(jù)構成的矩陣。在實施例時間,D1構成5個矩陣,D2為影響人體健康的參數(shù),其數(shù)據(jù)樣本見表2所示。

表2 數(shù)據(jù)試驗表

在該步驟中,主要將處理后的醫(yī)療數(shù)據(jù)輸入到建立好的數(shù)據(jù)模型中,輸出用戶需要的數(shù)據(jù)。對處理后的數(shù)據(jù)進行T次采樣,構建狀態(tài)數(shù)據(jù)矩陣。即構建以下數(shù)據(jù)以數(shù)值的方式表示,比如將:

轉換成:

同時將:

轉換成:

由于矩陣的規(guī)模和篇幅的限制,在此僅僅做示例性說明,不再將矩陣按其真實規(guī)模展開。根據(jù)上述數(shù)據(jù),應用上文提供的公式,將計算結果繪成曲線圖,如下文所述。

在圖5中,以尿毒癥對人體因素造成重大影響程度進行分析、判斷,其影響的曲線圖如圖5所示。

在圖6中,以白內障對人體因素造成重大影響程度進行分析、判斷,其影響的曲線圖如圖6所示。

在圖7中,以尿毒癥對人體因素造成重大影響程度進行分析、判斷,其影響的曲線圖如圖7所示。

在圖8中,以惡性腫瘤對人體因素造成重大影響程度進行分析、判斷,其影響的曲線圖如圖8所示。

圖5 影響人體病理參數(shù)為尿毒癥的曲線圖 圖6 影響人體病理參數(shù)為白內障的曲線圖

圖7 影響人體病理參數(shù)為血友病的曲線圖 圖8 影響人體病理參數(shù)為惡性腫瘤的曲線圖

因此,通過隨機矩陣理論都可以逼真地獲取醫(yī)療數(shù)據(jù)。通過隨機矩陣理論也可以對醫(yī)療數(shù)據(jù)進行關聯(lián)性評估。通過上述試驗,隨機矩陣理論在醫(yī)療保險信息化平臺大數(shù)據(jù)處理方面具有明顯的直觀顯示。

4 結束語

本研究通過在醫(yī)療保險信息化建設平臺中使用大數(shù)據(jù)處理算法,不僅有利于用戶從各種不同的數(shù)據(jù)庫中找到合適的最佳數(shù)據(jù),也將極大地影響醫(yī)療保險基金的收支平衡和可持續(xù)發(fā)展,大數(shù)據(jù)技術還可以輔助相關決策的制定,比如參保險群體分析、參保對象年齡分析、醫(yī)保基金收支分析、大病費用補助分析,有效降低醫(yī)療保險基金風險。大數(shù)據(jù)技術對醫(yī)療保險管理具有決策支持、便民服務、風險管控、商保拓展等重要意義。

猜你喜歡
影響模型
一半模型
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
沒錯,痛經有時也會影響懷孕
媽媽寶寶(2017年3期)2017-02-21 01:22:28
3D打印中的模型分割與打包
擴鏈劑聯(lián)用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
基于Simulink的跟蹤干擾對跳頻通信的影響
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 精品一区二区久久久久网站| 91在线视频福利| 国产成人精品亚洲日本对白优播| 久久99国产视频| 亚洲欧美综合精品久久成人网| 日韩中文字幕亚洲无线码| 国产在线观看人成激情视频| 熟女成人国产精品视频| 在线日本国产成人免费的| 无码人中文字幕| 青草视频久久| 久久人体视频| 久久99国产综合精品1| 综合色亚洲| 色悠久久综合| 黄网站欧美内射| 影音先锋丝袜制服| 国产精品自在在线午夜区app| 亚洲不卡网| 91福利一区二区三区| 亚洲大尺码专区影院| 97国产一区二区精品久久呦| 四虎综合网| 美女视频黄又黄又免费高清| 国产草草影院18成年视频| 国产一区二区三区日韩精品| 久久国产精品嫖妓| 欧美精品伊人久久| 日韩毛片在线播放| 久久永久免费人妻精品| 漂亮人妻被中出中文字幕久久| 91热爆在线| 麻豆国产精品一二三在线观看| 国产真实乱子伦视频播放| 国产在线精彩视频二区| 国产精品私拍99pans大尺度| 亚洲无线国产观看| 伊人国产无码高清视频| 久热99这里只有精品视频6| 青草91视频免费观看| 国产成年无码AⅤ片在线| 2021精品国产自在现线看| 99久久精品免费看国产免费软件| 亚洲第一页在线观看| 亚洲第一成网站| 日韩少妇激情一区二区| 国产免费高清无需播放器| 最新精品久久精品| 成人午夜免费视频| 欧洲亚洲欧美国产日本高清| 午夜视频www| 午夜福利在线观看入口| 日本不卡在线播放| 久久精品无码一区二区国产区| 日本妇乱子伦视频| 亚洲美女久久| 九色综合视频网| 激情六月丁香婷婷| 白丝美女办公室高潮喷水视频 | 狠狠色综合网| 久久亚洲黄色视频| 精品久久久久久成人AV| 高清欧美性猛交XXXX黑人猛交| 欧美成人一级| 啦啦啦网站在线观看a毛片| 亚洲欧美国产高清va在线播放| 91人妻在线视频| 欧美色伊人| 性色生活片在线观看| 国产 日韩 欧美 第二页| 久久精品人人做人人爽97| 日韩国产另类| 国产99视频精品免费观看9e| 国产男女免费完整版视频| 呦系列视频一区二区三区| 亚洲精品欧美重口| 午夜激情福利视频| 亚洲日韩精品综合在线一区二区| 欧美亚洲国产一区| 亚洲日韩高清无码| 亚洲国产AV无码综合原创| 免费久久一级欧美特大黄|