999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

病案統計分析數據倉庫的建立

2012-04-29 15:28:22魏忠琴
中國管理信息化 2012年6期
關鍵詞:數據挖掘

魏忠琴

[摘要] 本文以醫院病案統計分析中疾病的統計分析為例介紹了用MS Server 2003軟件,建立醫院病案統計分析數據倉庫的方法、步驟及其意義。

[關鍵詞] 數據倉庫; 病案統計分析; 數據挖掘; 聯機分析處理; 多維數據集

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 06. 026

[中圖分類號]F272.7[文獻標識碼]A[文章編號]1673 - 0194(2012)06- 0054- 03

隨著社會的發展和市場激烈競爭的需要,醫院管理已經逐步從傳統經驗型向科學量化管理的方向發展,而科學量化管理的信息資源,主要從病案的統計分析中獲得,特別是重大決策需要科學的數據分析作為依據,這就對醫院信息化提出更高的要求。傳統的數據庫系統只能完成數據統計分析中最簡單的動態原始數據以及日常數據報表,而在數據分析和輔助決策方面就顯得無能為力了,而數據分析和數據挖掘技術正是數據倉庫所具有的強大功能。

1明確數據倉庫的主題

需求分析之中心工作是提出主題,并明確主題。每個主題有一個主題域,對每個主題域確定其數據模型,并確定每個主題域的公共主碼。然后建立主題域之間的關聯,確定主題域數據模式與數據源之間的關系。

在我院病案統計分析的數據倉庫的實施過程中,確定的主要主題范圍如下:

(1) 病人費用構成分析:分析整個醫院、各個科室乃至某個醫生的病人費用構成,如發現藥品比例過高,可以層層分析是哪個環節導致比例過高,從而采取措施來控制;

(2) 同期費用對比分析:找出醫院收入增加或減少的原因;

(3) 單病種分析:對單病種的費用、住院天數、治療方案進行分析以便醫生能及時總結經驗,找出最佳的質量手段和方法,縮短就診時間,減輕病人負擔,增加醫院經濟效益;

(4) 成本效益分析:把各個不同系統如信息系統、財務系統等的數據匯總的數據倉庫,對成本效益進行全面分析,以便能真正把握醫院經營狀況,提高醫院經濟效益;

(5) 疾病的統計分析:分析不同疾病發病的病人結構(如年齡、職業、性別、地區等)以及輔助診療分類的分析。

2數據倉庫的源數據調查——數據采集

為了從病案首頁信息中分析以上主題,建立主題數據倉庫,源數據主要來自本院HIS系統中2002-2010年的住院病人數據資料,其中主要的數據關系表有(以下是以疾病的統計分析和病人費用構成分析為例):現行及歷史的病人住院主記錄表、診斷記錄表、疾病字典表、病人付費方式表治療結果表等,具體表結構略。

3數據倉庫的核心數據庫設計

在數據倉庫中,事實表數據模式是一個比較簡單易懂的數據模式。在本設計中就是采用事實表數據模式,主要有疾病的統計分析數據表、時間表、病人付費方式表、治療結果表、疾病分類表及年齡段表等。表1是疾病的統計分析數據表結構說明。

軟件實現環境:

操作系統:Windows 2003 Server

數據倉庫的產品:MS Server 2003企業版

多維數據庫的展現工具:Excel

4數據的抽取

本例的抽取程序是利用Sql Server 2003中的數據轉換服務DTS(Datastore Transmission Service)從數據源Oracle 7中抽取數據, 在數據的提取過程中,首先建立數據源與目標數據源,然后在目標數據源服務器中完成維表、事實表的創建;根據模型的建立,再生成SQL數據查詢語句的程序包,然后執行SQL程序包,將源數據庫的數據提取到目的數據庫中的維表和事實表中,數據的提取時間取決于源表的大小。

5多維數據集的建立

5.1維度的確定

在數據倉庫中,維度(Dimension)是指觀察數據的特定角度,作為識別數據的索引,不同的維度組合構成了訪問數據倉庫中數據的約束條件。在本例疾病的統計分析中我們采用了五維,即:時間維(年月);付費方式維(公費、自費、醫保等)、年齡段維(5歲以下、5~14歲、15~44歲、45~59歲、60歲以上)、治療結果維(治愈、好轉、未愈、死亡等)。

5.2數據集的建立

在本例疾病的統計分析中我們采用SQL Service 2003 Analysis Services中的多維數據集向導或多維數據集編輯器來生成多維數據集,其架構如圖1所示。

6OLAP數據多維分析

6.1OLAP模型結構

在本例疾病的統計分析的OLAP模型結構如圖2所示。

多維分析是指在OLAP多維結構上對以多維形式組織起來的數據采取多種操作,以便分析人員作實驗以驗證其主觀分析意圖,主要有鉆取、切片、切快、旋轉4種分析方法。

6.2客戶端數據分析

在基于微軟的數據倉庫框架中,客戶端應用可以通過MS Office、MS Query、MS Visual Studio等任何支持OLE DB的軟件開發工具開發。在本系統中。作者使用MS Office中的Microsoft Excel查詢數據倉庫中的多維數據集,因為對于客戶端用戶來說,Microsoft Excel是比較常用且簡單易懂的。

7創建OLAP數據挖掘模型及瀏覽決策樹

7.1創建OLAP數據挖掘模型

本文利用Microsoft 決策樹算法創建OLAP數據挖掘模型,以挖掘出不同疾病在不同年齡段的平均住院費用以及治愈時間等情況。

7.2瀏覽決策樹

在 OLAP 挖掘模型編輯器中,可以使用編輯器編輯模型屬性或者瀏覽其結果。在 Analysis Manager 樹視圖中,展開“挖掘模型集”文件夾,右擊“疾病分析模式”模型,選擇子菜單“瀏覽”命令,出現如圖3所示的決策樹。

7.3分析

(1) 在“內容詳情”窗格的決策樹區域中,顏色代表“事例”的密度(在本事例中為:病人年齡段的密度)。顏色越深則節點中包含的事例就越多。 單擊“全部”節點。該節點為黑色,因為它代表 (7733) 事例的 100%。7733 代表出院的病人數目(即 “疾病分析” 多維數據集中有事務記錄的病人)。

(2) 特性窗格顯示“全部”節點中,所有事例的 21.80%(或者說 1 686 個示例)的平均住院費用可能是1 610元;31.64%的平均住院費用可能是3 885元;21.74%的平均住院費用可能是4 664元;24.82%的平均住院費用可能是2 576元。如果沒有顯示百分比,則可以調整“特性”窗格中“合計”面板的“可能性”列的大小。

(3) 如果選擇了樹的不同節點,此百分比將會更改。讓我們調查一下哪些年齡段的病人平均住院費用在4 664元。若要執行此操作,則需要重新畫出樹以便勾畫出平均住院費用在4 664元的高密度區。在右下角的“樹顏色基于”字段中選擇“4664”。該樹顯示另一種顏色模式。可以看出年齡段在60歲以上,平均住院費用3 096元與5 980元之間的節點的密度高于其他任何節點。

(4) 可以查看樹的其他分支并調查對于某一種病,病人在不同年齡段平均住院費用的不同可能值。醫院可以使用此信息來確定針對該種病在不同年齡段的平均住院費用的高低,采取相應的措施來調整最佳治療方案,進而控制平均住院費用。

8總結

通過創建數據倉庫,數據不僅僅用于檢索,還可用來分析未來的發展趨勢,并為管理和決策提供支持,如:病人構成分析(分析醫院門診、住院病人的各種構成、如病人的來源、職業、身份、年齡等分布以便有針對性地采取一些措施來提高服務質量,從而增加門診量和住院收容量)、病人就診時間分析(從門診病人掛號到出院各環節就醫時間,分析病人的就醫瓶頸以減少排隊,提高就醫質量)、病人費用構成分析(分析整個醫院、各個科室乃至某個醫生的病人費用構成,如發現藥品比列過高,可以層層分析是哪個環節導致比列過高,從而采取措施來控制)、同期費用對比分析(找出醫院收入增加或減少的原因)、單病種分析(對單病種的費用、住院天數、治療方案進行分析以便醫生能及時總結經驗、找出最佳的質量手段和方法,縮短就診時間、減輕病人負擔、增加醫院經濟效益)、成本效益分析(把各個不同系統如信息系統、財務系統等的數據匯總的數據倉庫,對成本效益進行全面分析,以便能真正把握醫院經營狀況,提高醫院經濟效益)。

當然,數據倉庫是一個龐大的知識系統,其功能遠遠不止這些,像各類醫保病人分析、免費及各種優惠病人分析、醫院各種科學預測等分析功能。隨著醫院的發展,數據倉庫的這種決策支持功能將在醫院的管理和決策中起著越來越重要的作用,尤其醫院病案統計的分析對醫療研究著非常重要的作用。

主要參考文獻

[1] Jiawei Han,Micheline Kamber. 數據挖掘——概念與技術[M]. 范明,孟小峰,等,譯. 北京: 機械工業出版社,2001.

[2] 飛思科技產品研發中心. Oracle 9i 數據倉庫構建技術[M]. 北京:電子工業出版社,2003.

[3] 羅運模. SQL Server 2000數據倉庫應用與開發[M]. 北京:人民郵電出版社,2001.

[4] 徐潔磐. 數據倉庫與決策支持系統[M]. 北京:科學出版社,2005.

[5] 王珊,陳紅. 數據倉庫技術與聯機分析處理[M]. 北京:科學出版社,1998.

[6] 夏火松. 數據倉庫與數據挖掘技術[M]. 北京:科學出版社,2004.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 男女猛烈无遮挡午夜视频| 国模视频一区二区| 欧美亚洲国产精品久久蜜芽| 国模私拍一区二区| 伊人中文网| 欧美一区二区三区香蕉视| 91小视频在线观看| 精品黑人一区二区三区| 国内精品自在自线视频香蕉| 欧美一区二区三区国产精品| 国产日韩欧美黄色片免费观看| 免费国产高清精品一区在线| 亚洲一区二区三区中文字幕5566| 91原创视频在线| 久久永久视频| 在线播放91| 欧美一级99在线观看国产| 制服丝袜国产精品| 色综合日本| 国产成人av大片在线播放| 久久99精品久久久久久不卡| 免费精品一区二区h| 在线免费亚洲无码视频| 久久精品人人做人人| 久久特级毛片| 日韩不卡免费视频| 国产91导航| 综合色在线| 一区二区欧美日韩高清免费| 在线观看91香蕉国产免费| 成人av专区精品无码国产| 日韩黄色大片免费看| 免费aa毛片| 亚洲人成色77777在线观看| 老汉色老汉首页a亚洲| 免费a级毛片18以上观看精品| 国内熟女少妇一线天| 亚洲精品不卡午夜精品| 国产一区二区三区夜色| 免费a在线观看播放| 日韩免费视频播播| 国产美女91视频| 欧美精品成人| 精品夜恋影院亚洲欧洲| 久操线在视频在线观看| 一级毛片免费不卡在线视频| 亚洲一道AV无码午夜福利| 国产精品自拍露脸视频| 青青操国产| 亚洲欧美日韩天堂| 99尹人香蕉国产免费天天拍| 日本黄色a视频| 国产成人精品一区二区免费看京| 精品三级网站| 亚洲成a人在线播放www| 亚洲最大福利网站| 国产午夜福利片在线观看| 四虎成人免费毛片| 一本大道无码日韩精品影视| 亚洲不卡影院| 99热这里只有精品2| 亚洲一本大道在线| 亚洲日韩精品欧美中文字幕| 欧美日韩理论| 亚洲aⅴ天堂| 亚洲欧美精品日韩欧美| 99在线国产| 亚洲国产欧美国产综合久久| 久无码久无码av无码| 粉嫩国产白浆在线观看| 九色综合伊人久久富二代| 精品视频一区二区观看| 亚洲一区二区精品无码久久久| 国产免费怡红院视频| 色悠久久久| 噜噜噜综合亚洲| 无码免费的亚洲视频| 国产精品流白浆在线观看| 99久久精品美女高潮喷水| 亚洲熟女偷拍| 成人欧美在线观看| 国产精品福利尤物youwu|