999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代下慢性病管理的前景

2019-10-14 03:56:20
福建質量管理 2019年18期
關鍵詞:數據挖掘關聯規則

(復旦大學附屬腫瘤醫院 上海 200032 )

隨著云時代的到來,大數據也吸引了越來越多的關注,在時下商界的流行語中,很難找出一個比“大數據”更吸引眼球的“百搭款”術語了。大數據的顛覆和創新作用幾乎在每個行業都有體現,醫療行業也不例外。大數據正在幫助我們走向精準醫學,我們可以提前了解衛生保健中的傳統指標。然而,和其他行業相比,大數據在醫療行業的應用顯得寥寥無幾,在慢性病上尤為顯著。利用“大數據+慢病管理”,不僅可以對慢病進行預警,還能為患者提供全過程的慢病管理服務,有利于破解社區慢病管理的困境。

一、慢性病目前的嚴峻形勢

近年來,一方面數據倉庫技術以及海量存儲設備的快速發展使得收集海量數 據的能力得到質的提升,預示著大數據的時代已經到來;另一方面,隨著各大醫院信息化建設進程的不斷推進,醫院中的各生產系統如 HIS、LIS、EMR等已經積累了規模龐大 的臨床數據。公共的醫療資源服務日漸緊張,如何利用好收集存儲的海量數據,成為數據手機存儲價值的重要標志。在此背景下,面向醫療大數據的數據分析與 挖掘技術也應運而生,并得到了快速的發展,智能醫療決策系統也因此應運而生。這種數據包含了許多隱藏的知識等待被挖掘,對于輔助診療、提升臨床醫療質量 具有很大的價值。

二、慢性病管理的大數據時代

隨著信息化的全面建設,數據呈現爆炸式增長,當傳統的數據分析能力及統計學分析方法跟不上數據的增長速度時,便產生了“大數據”的概念。在慢病管理領域,由于居民健康卡的普及各種可穿戴設備的開發以及區域醫療信息化的持續推進,慢病患者的健康數據采集和共享開始成為可能口,如廈門市衛生局建立的基于健康檔案的區域信息平臺。這些數據不僅包括常規診療過程中的醫療數據如電子病歷系統,也包括各種可穿戴設備及健康 APP 等上傳的個人健康數據以及一些臨床研究、生物信息工程等,幾乎涵蓋了患者整個的健康數據鏈。大數據通過對這些海量數據進行融合、分析與挖掘及可視化,可以得到準確的預測、推論和高效的決策支持避),為慢病防治流程中的各方面提供服務。

三、國內外研究現狀

基于當前高速發展的數據處理技術,以及硬件設備的迅速更新換代,使得我們越來越有條件收集數據量巨大的數據,做好數據存儲工作。面臨存儲的海量數 據,怎么使用這些數據成為了醫療大數據領域專家學者探索的熱點課題。現有的工作主要集中在使用醫療數據對患者進行聚類和分類研究[1-3]、疾病 復發與基本指標之間的關聯分析[4-6]以及一些中西藥常用的藥對組合,用藥規律等的發現。這對這些數據可以發現,目前的主要研究工作從以下幾個方面展開:

1.針對高風險人群的難以預測的問題,構建患者的分類模型,以及分析一 些影響發病的相關因素。

2.針對疾病之間可能存在的關系的關聯分析。

3.發現發病規律,并應于輔助診斷,生成決策樹 經過查閱相關資料和調研分析,得出目前主要的醫療大數據分析研究的方向和一些難點。

雖然目前也有很多的對醫療大數據分析的探索,但 很多只是局限在實驗室研究,難有真正的應用價值。要應用首選是分析的準確性,也需要根據醫療數據的特點對大數據分析算法進行改進,或者提出針對醫療數據 和具體分析問題的算法。

在多維分析方面,基于 OLAP 技術的醫療信息多維數據集設計與分析[8]一文中以醫療信息系統倉庫為基礎構建 OLAP 系統,運用多維分析方法和 MDX 查詢設計實現多維數據分析。在多維分析應用時,基于 SAP BW 的商務智能分析與 應用[9]文中提到使用基于 SAP BW(SAP 商務智能數據倉庫)來進行分析,同時 使用 SAP BO(BI 系統中業務對象)套件,對分析結果以及數據展現的形式進 行提升。總的來說,多維分析一般使用 OLAP[10-12]技術,然后配合一些可視化業 務層展現層如 SAP BO,使分析結果更加直觀、簡潔。在時序挖掘方面,時間序列數據挖掘在生物醫學中的應用研究[13]利用已知的時間序列、相關的理論和技術來對未知的時間序列做出預測。使用通配符的方式,提供靈活的間隔約束,從而特定的從序列中挖掘那些有研究價值的隱藏的模式。基于臨床數據的分析會有更好的現實意義,突破數據本身的局限性。在多維分析時可以更好的結合現實應用的場景,增加應用價值。使用時序挖掘分析時可以更好的針對某個特征進行細化的分析,從而發現數據背后深層次的信息,更好的為慢性病管理做出有效的指引。

四、數據挖掘技術的深層解析

(一)OLAP與數據挖掘

大數據常常是由結構復雜、數據量巨大、類型眾多的數據構成的數據集合。為了發掘這些數據背后隱藏的知識,常有多種方法,本節介紹 OLAP 技術和數據挖掘技術。

1.OLAP 技術

分析決策人員在分析決策過程中,往往都需要通過多角度、多層次的方式來觀察某些屬性之間的關系。如醫生想要知道今年年齡在 60-70 歲區間內,上海市各個區的男女慢性病患者的分布情況時,這個時候就要綜合考慮臨床診斷情況、地區、性別和年齡等多個維度的信息,這些供分析決策使用的數據都是多維數據。多維數據被具體的看成是一個立方體,包括維度信息(Dimension)和度量值 (Measure)。維度就是觀察數據的角度。度量值是指衡量數據的指標值。如慢性病患者基本信息,就包括性別、年齡、地區等維度,也可以從各年齡段占比,性別占比等度量方式具體觀察。因此,在多維分析時,對事實表、維度的層次、維度的成員、度量值等的概念的理解與掌握非常重要。

(1)事實表(Fact Table):事實表的設計一般有兩種形式,一種是星型結構 (Star-Schema),另一種是雪花結構(Snow-Flake Schema)。星型結構是由一個 事實表(如臨床診斷事實表)同多個維度表(年齡、性別、地區等)產生外鍵關 聯而雪花結構是在星型結構的基礎上有一些維度表需要有類別屬性的具體劃分,比如在地區維度上,可以有省、市、區、街道等不同層次,它實際上是星型結構 的拓展。

(2)維度(Dimension):是人們分析觀察問題的角度。通過把實體上的一些 重要屬性如(年齡、性別、地區等)定義成維,可以使用戶對不同維屬性上的數 據進行比較分析。

(3)維的層次(Level):針對某個特定的維度,可以有不同的細節程度來對 它進行各個層面上的詳細描述。如時間維度上的年、季度、月份等信息。

(4)維的成員:維度的某一個具體的取值,是一個具體的描述。如地區維中的上海、徐匯區等。

(5)度量(Measure):它也叫度量指標,是多維度量數組中的一組數值。如 2015 年 1 月**醫院確診糖尿病患者的人次是 2905 次。OLAP 是一種多維分析技術,有多種的操作如鉆取、切片和切塊以及旋轉等。

2.數據挖掘的概念

數據挖掘(Data Mining,DM)是從海量數據中獲取知識的過程。最早是在它最早是在 1989 年舉行的第 11 屆美國人工智能協會(AmericanAssociation for Artificial Intelligence,AAAI)學術會議上提出的。首先,數據挖掘中的數據源必須是真實的、大量的、含噪聲的,可以是關系數據庫中的結構化數據,也可以是文本、圖片等半結構化的數據。其次,數據挖掘是一種多學科集成的技術,是人工智能和數據庫技術領域的熱點課題。最后,針對具體應用,以大量真實的業務數據為基礎,采用適當算法,數據轉換和建模,從而為決策者提 供決策支持。數據挖掘的主要功能表 2-1:

表 2-1 數據挖掘的功能

針對分析問題的不同,選用的分析技術也常常不一樣,最常用數據挖掘技術有關聯規則分析、分類、聚類、回歸分析、神經網絡等。數據挖掘的一個流程圖如下:

圖2-1 數據挖掘流程

上圖2-1給出了一個數據挖掘分析的基本流程,主要有三塊,確定分析目標、數據挖掘和結果分析。確定目標是根據需求明確要做什么,然后就是根據目標獲取數據并搭建模型,選擇相應的挖掘技術,最后就是對挖掘的結果進行分析,不斷的修正實驗參數,并分析實驗結果,從而獲得一個穩定有效、準確而有意義的 模型,使得決策者在分析決策時提供建議。

(二)時序挖掘

頻繁模式的發現始于1993年Agrawal等學者提出的關聯規則的發現研究,也一直是數據挖掘分析領域中的一個重要的研究課題。自從 Agrawal 等學者提出 了關聯規則挖掘問題以來,諸多的學者對關聯規則挖掘課題進行了大量的研究,得出了很多高效的算法,然而大多數方法都未考慮時間因素的影響。但在現實世界中,時間是數據本身固有的因素,在數據中常常會發現時序語義問題。

1.時間規準

時序數據的出現使得有必要在數據挖掘中 考慮時間因素,在現實中,附加 上某種時序約束的規則將可以更好地描述客觀現實情況,因而也會更有價值,稱 這樣的規則為時序關聯規則。時序關聯規則挖掘研究[18]一文中提出了多時間粒度的時間規準,如年、月、日等多粒度時間維度表示的方法。非同步多時間序列 中頻繁模式的發現算法一文中,提出了針對多個序列之間時間不同步的問題,利用線性化分段表示和矢量形態聚類實現時間序列的特征分割與符號化轉換的 思想。另外在時序挖掘時,常常是對時間序列的某一個子序列進行挖掘,在時間序列相似性問題中滑動窗口的確定一文中,提出了滑動窗口在時間序列相似性降維技術的應用。

時序表達,在做時序挖掘時,常常需要先對事件做時序表達,構建事件序列。在構建事件序列時,就需要使用事件之間的相似性,進行時間規整,最常用的時間規整有兩種,歐氏距離和動態時間規整兩種方式。

圖2-2 時序規整

兩種距離計算的方式稍有不同,雖然 DTW 計算的相似性有更好的優勢,但在實際使用時,卻需要更多的時間,從而降低算法的效率,相比之下歐式距離有更好的算法效率。

2.關聯分析

關聯規則反映了一個變量與其他變量之間的相互依存性和關聯性;其中,關聯關系指的是在兩個或者兩個以上的變量取值相互之間所存在著的某種規律性 的關系。關聯規則挖掘則是為了發現變量之間這種依存性和關聯性的規則,并利用令人感興趣的規則來預測多個變量之間潛在的關聯或是通過其他變量來預測 一個變量的存在。

在醫療數據中,臨床診斷數據就有這樣特點。有了診斷事件序列,就可以對序列中的事件做關聯分析,進行頻繁模式的挖掘。關聯分析實質是從大量數據中找到出現條件概率較高的模式,理論基礎主要是支持度和置信度,理論上,支持度和置信度越高則表示模式出現的概率越高關聯規則的可信度也越高。

五、小結

目前的慢病管理模式已經難以滿足我國慢病管理的需要,大數據分析在對慢病高危患者。對慢病患者進行個體化治療及隨訪,不僅能有效降低慢病發病率,減少醫療費用,也有利于改善疾病的預后,提高患者的生活質量,適應了新醫改的發展方向,有利于解決醫療衛生資源分布不均的情況。大數據在慢病管理中的應用和發展無疑將成為未來慢病管理的新方向,為慢病患者帶來新的前景和希望。

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 亚洲精品男人天堂| 国产资源站| 亚洲精品免费网站| 91探花在线观看国产最新| 操操操综合网| 亚洲中文字幕国产av| 老司机午夜精品视频你懂的| 美女无遮挡免费视频网站| 狠狠操夜夜爽| 伊人久久综在合线亚洲2019| 久久综合伊人 六十路| 亚洲综合色吧| 青青极品在线| 免费高清毛片| 免费全部高H视频无码无遮掩| 国产精品久久久久鬼色| 久久先锋资源| 国产成人a在线观看视频| 久久九九热视频| 精品国产香蕉伊思人在线| 国内丰满少妇猛烈精品播| 国产99视频在线| 久操中文在线| 久久青青草原亚洲av无码| 亚洲精品国偷自产在线91正片| 欧美精品1区| 久久精品无码国产一区二区三区 | 国产综合另类小说色区色噜噜 | 日韩资源站| 国产成人免费高清AⅤ| 国产一区二区精品高清在线观看 | 99re精彩视频| 久久中文字幕av不卡一区二区| 亚洲成人在线免费观看| 国内老司机精品视频在线播出| 亚洲综合色吧| 国产一区二区三区免费观看| 无码网站免费观看| 亚洲男人在线天堂| A级全黄试看30分钟小视频| 五月激情婷婷综合| av在线手机播放| 91国内在线观看| 网友自拍视频精品区| 2020最新国产精品视频| a毛片免费在线观看| 亚洲大尺码专区影院| 国产精品深爱在线| www亚洲精品| 国产波多野结衣中文在线播放 | 午夜综合网| 视频国产精品丝袜第一页| 欧美午夜视频在线| 青青青国产视频| 国产成人综合亚洲欧美在| 67194成是人免费无码| 91黄色在线观看| 色综合热无码热国产| 亚洲免费福利视频| 成人在线不卡视频| 成·人免费午夜无码视频在线观看 | 日本一区高清| a级毛片在线免费| 亚洲一区网站| 69免费在线视频| 日韩欧美中文字幕在线韩免费| 欧美中文字幕一区| 92精品国产自产在线观看| 四虎成人在线视频| 在线看片中文字幕| 成人一区专区在线观看| 色综合天天综合中文网| 日本道中文字幕久久一区| 综1合AV在线播放| 手机成人午夜在线视频| 亚洲精品va| 国产偷倩视频| 99免费视频观看| 91亚瑟视频| 婷婷伊人久久| 啊嗯不日本网站| 激情综合网激情综合|