999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

醫院信息數據挖掘及數據可視化

2014-02-02 19:17:04齊晨虹高生鵬
中國科技信息 2014年22期
關鍵詞:數據挖掘可視化數據庫

齊晨虹 高生鵬

蘭州交通大學電子與信息工程學院

概述

近些年來,信息技術快速發展,現代計算機信息應用技術在醫療領域發揮了前所未有的作用,大型醫院都已經建立了醫院信息系統(Hospital Information System,HIS)隨著HIS 的廣泛使用,數據庫中的醫院信息不斷累積增加。海量數據急劇增加,往往不能得到有效的應用;若沒有辦法深入理解數據庫里面的信息,則將會失去醫院信息的價值。所以,當前在醫院信息化的建設過程中需要處理的問題之一就是如何充分地利用HIS 數據庫中的寶貴信息資源來為臨床科研、醫院服務質量、醫院領導決策、衛生統計等提供科學的依據。

隨著各醫院的HIS 大范圍使用運行之后,其HIS 數據庫中存儲的數據不斷增加,數據庫中歷史數據日益增多。在這種背景情況下,把數據挖掘技術和數據可視化技術應用到處理醫院醫療數據上是一個大趨勢。數據挖掘技術對部分醫療數據進行了處理,但所得結果不便于理解因而無法為專業人員提供更好支持,而針對傳統數據挖掘技術所得到的各種模式能夠提供集成統一的接口及多種形式、多種角度、多種維度的直觀的可視化展現方式,可以為專業人員提供更強有力的支持。

國內外研究現狀

國外研究現狀

早在2002年IBM 華生研究中心對以色列的耶路撒冷和哈達薩醫院的病人病例,開發了Opal 工具包,對大量的骨髓移植數據進行了可視化顯示,這是一個在生物信息學領域的信息可視化技術方面的很好的實用性實例。Brant Chee 等人相繼于2008年和2009年提出了健康信息藥物治療方案的可視化和醫療衛生信息的社會可視化。進而實現了信息可視化在醫療領域的應用,并從中發現藥物和社會團體之間的關聯關系和環境對人的健康狀況的影響。美國卡內基梅隆大學的Christopher 等人于2009年提出基于初級保健糖尿病風險的分類和評估的可視化方法。本研究與醫學證據、統計降維技術和信息可視化相結合建立一個框架,從而開發信息可視化分類器用于糖尿病風險的評估患者群中。日本島根大學的Shusaku Tsumoto 等人于2011年。他們提出了包括決策樹、聚類分析、MDS和三維數據挖掘的時空數據挖掘過程。結果表明,大量存儲數據的復用為基于醫院臨床行為的分類表征時間趨勢提供有力的工具。葡萄牙的Pedro Pereira Rodrigues 做了預測基于虛擬病人記錄的訪問日志的生存分析的醫院臨床報告的可視化的研究。馬來西亞的Muhammad Sheraz Arshad Maik 等人從醫生的視角研究了電子病歷可視化系統在公立醫院的使用,用抽象有效的病人數據直觀顯示,以獲取有效信息進而改善病人的護理。美國NeuroMedical和Vysis 公司利用數據挖掘可視化技術,通過對其趨勢分析進行藥物篩選,為藥品的研發進行蛋白質的分析,對藥物副作用進行了探索,發現了藥物間的副作用。Marinovm 等人提出通過數據挖掘可視化技術對糖尿病及并發癥流行病學進行了研究。

國內研究現狀

在國內,對于醫院信息數據挖掘及數據可視化的發展相對較晚。北京大學袁曉如教授帶領的北大可視化研究小組在圖可視化、軌跡可視化,微博可視化等領域開展了相關的研究工作。浙江大學在醫院信息系統的數據挖掘技術、可視化領域開展了相關的研究工作。清華大學的唐澤圣教授是國內較早進行可視化研究的學者之一,其研究領域涵蓋了醫學、地質學和氣象學可視化分析。中科院軟件所的田捷教授等在醫學可視化領域取得了一些研究成果。浙江大學、北京大學也建立了可視化的國家重點實驗室,并在可視化方面做了很多的工作。近幾年我國對HIS 進行數據挖掘的研究相對國外較少,我們在銀行、移動通信、證券、聯通、保險、電信等相關行業雖然已經成功的應用數據挖掘技術,可是當前在HIS 中的應用還處于初始階段。據報道對HIS 所產生的數據進行挖掘研究的機構,目前在國內有北京協和醫院信息中心、解放軍福州總醫院信息中心等。

數據挖掘概述

數據挖掘及其在醫療研究中的應用

數據挖掘是在1989年提出來的,也稱為數據庫中的知識發現。挖掘的過程一般由確定挖掘的對象、數據準備、模型建立、數據挖掘、結果分析表述、挖掘應用等階段組成。

當前的醫療機構的數字化增大了醫院數據庫醫療數據數量。在疾病的診斷、治療和醫療研究方面都,這些寶貴的醫療信息提現的非常有價值。因此,怎樣自動提升和處理醫療數據庫,進而提供全局的、精準的保健措施和診斷決策,已經成為提高醫院服務質量和促進醫院長遠發展而必須解決的新問題。醫療數據挖掘就在這種背景下應運而生。

數據挖掘應用于醫療方面被提出來之后,生物醫療工程領域就將這一領域應用到其中,并取得了相當大的成果。從指定醫療數據中找到醫療模式類是這項技術的主要功能。在文獻中指出,在生物工程領域主要有兩類典型的研究方向:描述生理規律或現象;預測和診斷疾病發作。可以發現醫療知識模式主要有:孤立點分析、聚類分析、概念/類別描述、關聯分析、演變分析、分類和預測等。

所挖掘知識的類型

數據挖掘所挖掘的知識大致有幾種:事物各方面的特征知識、事物各方面的特征知識、反映同類事物共同性質的廣義知識、事物間依賴關聯的知識、不同事物間屬性差異的知識、一些事物中異常偏離知識等。HIS 在使用中,為了滿足不同用戶和不同層次決策的需要,可以根據類型的不同對針對一些隱藏的住院醫療主題和疾病數據,分別選擇不同的挖掘方法。

任何一種數據挖掘的算法,無論是統計分析方法,還是神經網絡、遺傳算法等,都要針對具體的情況,采用不同的算法解決,即使對于同一個問題,可能有表現不一的多種算法,這時,需要尋找最優的算法。

數據挖掘功能

從數據中發現模式或知識是數據挖掘的主要任務。模式按功能可分有兩大類:預測型(Predictive)模式和描述型(Descriptive)模式。分類為:時間序列模式、分類模式、回歸模式、關聯模式、聚類模式。以上受監督知識包含時間序列模式、分類模式、回歸模式,屬于預測型模式,由于在建立模式前數據的結果是已知的,可直接對模式的預測準確性進行檢測,模式的產生是在受監督的情況下進行的。非監督知識包含關聯模式、聚類模式,屬于描述型模式,因為在模式建立之前其結果是未知的,模式產生不受任何監督。

研究的相關方法

醫療信息系統的數據挖掘的方法與傳統的挖掘模式相似,即為數據的采集、預處理、類型轉換、挖掘、知識評價、知識利用等。

醫療信息系統所包含的數據既多元化又復雜化,所以根據醫學數據的特點使得醫學數據挖掘又與通用的數據挖掘之間存在差異。這里的工作主要體現在主要體現在數據預處理的階段。在這一階段,由于醫學數據的冗余性,需要在重要性和相關性檢驗的基礎上采樣以消減數據;又由于醫學數據的多樣性,須針對各種類型的數據采取相應的數據預處理方法。通過這個步驟的數據準備,將原始數據轉換為特定數據挖掘方法所需要的數據形式。這一步驟直接影響挖掘的效果,工作量占整個過程的50%以上。

可視化數據挖掘在醫院信息中的應用

可視化數據挖掘技術

使用圖形和圖像來表征數據是可視化的基本思想,以易于領會、相對直觀的圖形、圖像方式將隱藏在大量數據中的信息表達出來,進而加快用戶獲取知識的速度。數據可視化是數據分析過程中一個必不可少的過程,對大型數據庫的數據進行可視化。目前在數據可視化方面的研究方向主要是以不同的抽象層次將維度、屬性進行互聯之后將關系數據庫或數據倉庫中的數據,以展現給用戶不同的呈現形式,并將數據的各個屬性值以多維數據的形式表現出來,并可以以不同的維度觀察數據,從而更深層地分析和觀察數據。

可視化數據挖掘技術是數據挖掘技術發展的必然,它是數據挖掘技術和可視化技術結合的產物,是一種對挖掘大數據集既高效又新穎的方法。它所涉及的領域較廣,如計算機輔助設計,計算機圖形圖像處理,人機交互技術和計算機視覺等多個領域。由于醫療信息數據量的增加,進而影響醫院信息的數據的多元化和復雜化程度的增大,用戶就更加難以理解挖掘出來的結果和信息。因此,使相關用戶可以交互地查看數據、挖掘的過程等是可視化數據挖掘的最終目的,使得人們對識別不規則事物是一些圖形而不是一些數字和表格時的速度會較快,而且也容易接受。所以在對醫院信息系統的數據挖掘中,以用戶比較容易理解、接受的圖像、圖表、圖形等形式對中間過程結果或者最終的結果直觀地表現出來,對相關用戶意義重大。

醫院信息可視化目標

將進行數據挖掘后的數據集導入可視化平臺進行可視化呈現。用工具R、Python、D3 等開發工具開發可視化平臺,并通過基于圖形可視化技術,將數據集中的所用數據屬性各種關系使用直觀的圖形,進而顯示出數據中潛在的信息知識及其數據之間的關聯關系。在數據顯示上,以幾何畫法或幾何投影的方式來表示數據庫中的數據,運用基于查詢的方法將每一個數據項的數據值對應于一個帶顏色的屏幕像素,對于不同的數據屬性以不同的窗口分別表示,采用區域分組圖、中心爆炸圖、中心環圖、流圖、塊莖圖、輻狀會聚圖、比例大小圓形圖、分支圖等多種可視化圖形方式進行數據的展現。另外,為了提高可視化分析的針對性和靈活性,設計者應盡量設計具有互動效果的可視化呈現方式,使用者可以根據自己的需要變換所顯示的數據維數、顯示方式和色彩等內容。

舉例,針對婦幼保健院的醫院信息系統,可視化所涉及的數據類型大概可以包括:婦女主要病癥(主要是腫瘤類、炎癥類和不孕不育類)的可視化,在可視化中需要展現出這些病癥與地域、本人身體狀況、民族、教育程度、飲食狀況等之間的關系;嬰幼兒主要病癥(主要包括先天缺陷、炎癥、腹瀉、出血、溶血、黃疸)的可視化,尋找嬰幼兒的病癥與家庭、父母、營養、地域等因素之間的關系;同一病癥用藥的變化情況,包括用藥品種、用藥量、用藥周期;不同病癥用藥之間的關聯情況等。進而,以充分地利用HIS 數據庫中的寶貴信息資源來為臨床科研、醫院領導決策、衛生統計等提供科學的依據,將成為當前在醫院信息化的建設過程中需要處理的問題。

數據可視化技術的應用前景

對事物的變化過程和轉折點進行分析和研究,可以把握其將來的發展方向,無論是對自然科學、社會科學還是醫學都是永恒的話題。數據可視化的研究機構和學者們也在時空格局可視化方面做研究,這些學者在“把握事物發展脈絡、探測轉折點”等方面取得了優異的成果,也象征和預示著數據可視化技術對各個科學研究領域的應用價值。

總結與展望

醫院信息的數據挖掘和可視化應該積極參考醫生和相關工作人員的意見,進而可視化出對未來具有參考價值的信息。目前,國內有若干研究人員對醫院信息的數據挖掘的研究具有相當的進展,但是在醫院信息可視化方面的研究相對較少。在關注可視化的發展和信息有效利用的同時,也應該考慮對于相關用戶的直觀性、價值性和可操作性。

在今后的研究工作中,將數據挖掘和可視化工作有機的結合起來是我們工作的重點,并針對醫院信息,爭取在數據挖掘方面和可視化方面有所突破,進而能夠有效利用這些醫院的歷史數據和時態數據等,為臨床科研、醫院服務質量、醫院領導決策、衛生統計、提高醫院服務質量等方面提供科學的依據。

猜你喜歡
數據挖掘可視化數據庫
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
探討人工智能與數據挖掘發展趨勢
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 国产男人天堂| 色网在线视频| 自拍偷拍欧美日韩| 三级毛片在线播放| 国产办公室秘书无码精品| 亚洲福利片无码最新在线播放| 亚洲二区视频| 国产另类视频| 亚洲色婷婷一区二区| 亚洲天堂网站在线| 亚洲欧洲免费视频| 日韩午夜福利在线观看| 日韩视频免费| 日本午夜精品一本在线观看| 国产永久免费视频m3u8| 久久毛片网| 国产免费久久精品44| 亚洲小视频网站| 亚洲首页在线观看| 亚洲欧美日韩中文字幕一区二区三区| 国产成a人片在线播放| 女人毛片a级大学毛片免费| 理论片一区| 亚洲区一区| 国产成人免费视频精品一区二区| 亚洲最大福利视频网| 国产毛片不卡| 啦啦啦网站在线观看a毛片 | 欧美激情视频二区| 成人在线亚洲| 久久国产成人精品国产成人亚洲| 2021最新国产精品网站| 午夜国产大片免费观看| 内射人妻无码色AV天堂| 亚洲人精品亚洲人成在线| 欧美日本激情| 久久美女精品| 国产精品入口麻豆| 特黄日韩免费一区二区三区| 人妻中文字幕无码久久一区| 五月婷婷丁香综合| 亚洲国产精品无码久久一线| 国产视频一二三区| 欧美日韩国产综合视频在线观看| 1024你懂的国产精品| 亚洲毛片网站| 日韩国产无码一区| 国产精品国产三级国产专业不| 国产成人亚洲无吗淙合青草| 亚洲国产成人超福利久久精品| 久久综合伊人77777| 国产第一色| 91在线视频福利| 日韩欧美色综合| 手机精品福利在线观看| 日韩国产亚洲一区二区在线观看| 多人乱p欧美在线观看| 日韩精品成人网页视频在线| 中文成人在线视频| 日韩精品成人网页视频在线 | 国产乱子伦手机在线| 日韩AV无码免费一二三区| 国产精品久久精品| 日本91在线| 呦系列视频一区二区三区| 2018日日摸夜夜添狠狠躁| 国产欧美视频在线| 国产精品亚欧美一区二区三区| 日韩欧美中文| 在线观看的黄网| 国产精彩视频在线观看| 草草线在成年免费视频2| 精品无码一区二区三区在线视频| 精品午夜国产福利观看| 国产精品无码影视久久久久久久| 国产白浆视频| 毛片免费在线视频| 黄色网页在线播放| 亚洲男女在线| 高h视频在线| 天堂成人av| 中文字幕亚洲乱码熟女1区2区|