999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向臨床路徑的常用數據挖掘方法概述

2018-05-14 15:20:42李鵑
中國衛生產業 2018年27期
關鍵詞:數據挖掘大數據

李鵑

[摘要] 臨床路徑的制定必須應用循證醫學的最佳證據,臨床路徑一定要符合醫院實際情況以及疾病治療的客觀規律,由相關領域的專家基于該專業的最佳證據、以促進患者的快速康復為核心目標而制定。而數據挖掘方法對于臨床路徑制定和管理是至關重要的。該文總結了面向臨床路徑所常用的醫學數據挖掘方法的知識。重點介紹了決策樹分類、關聯規則分析、聚類分析和序列分析等方法。

[關鍵詞] 臨床路徑;數據挖掘;大數據

[中圖分類號] R19 [文獻標識碼] A [文章編號] 1672-5654(2018)09(c)-0193-02

數據挖掘方法在臨床路徑制定和管理中起著至關重要的作用,隨著各種關系數據庫技術的成熟和廣泛應用,數據挖掘技術促使人們在數據庫的基礎上建立數據倉庫,采用統計分析與機器學習相結合的方法對數據進行處理。

數據挖掘方法在臨床路徑制定與管理中的應用主要體現在臨床路徑制定過程中臨床行為模式、臨床診療流程的發現和臨床路徑變異的異常行為監測。如可以通過歷史病歷和歷史醫囑數據為依據,利用數據挖掘方法建立基于循證醫學的基線調查方法,提出了制定、實施、監控和持續改進的全過程學習型臨床路徑模型。還可以從醫院各應用系統的歷史數據庫中導出有價值的數據,建立數據倉庫,進行面向臨床路徑抽取主題的數據挖掘。

1 臨床路徑概述

臨床路徑(Clinical pathway)是指針對某一特定疾病或某種手術建立一套標準化治療模式與治療程序,是一個有關臨床治療的綜合模式,以循證醫學證據和指南為指導來促進治療組織和疾病管理的方法,最終起到降低平均住院日,控制醫療費用,規范診療行為,提高醫療服務質量的作用[1]。

2 臨床路徑的管理

臨床路徑的管理過程包括病種的選擇、臨床路徑文本的制定、臨床路徑的實施、臨床路徑實施的評價等階段。這些階段都與醫療數據的數據挖掘相關密切。

①病種的選擇。常見病、多發病;治療方案相對明確,技術相對成熟,診療費用相對穩定,疾病診療過程中變異相對較少;在結合醫療機構實際情況下,優先考慮衛生行政部門已經制定臨床路徑推薦參考文本的病種。

②臨床路徑文本的制定。臨床路徑是包含了患者從診斷入院到出院的各個時間節點上需要接受的診療項目,臨床路徑制定的主要任務就是要確定標準診療項目。臨床路徑診療項目包括醫囑類項目和非醫囑類項目。醫囑類項目包括飲食、護理、檢驗、檢查、處置、用藥、手術等。非醫囑類項目包括健康教育指導和心理支持等項目[2]。

③臨床路徑的實施。按照臨床路徑規定的內容進行執行和記錄,并進行實施過程的監控,包括變異監測和分析等。紙質的臨床路徑不便于執行,需要建設相關信息系統,即進行臨床路徑的電子化管理。

④臨床路徑實施的評價。臨床路徑的評價主要是根據一些主要指標對實施過程中的關鍵環節進行控制。主要指標包括兩大類,一類是對所有病種的評價都適用的,如平均住院日、死亡率、治愈率、好轉率、醫院感染發生率、31日非計劃再住院率、病種均次費用、病種抗菌藥物費用比例、病種檢查費用比例、變異率和出徑率等指標;另一類是反映病種特有的診療項目和診療效果,如關鍵的診療項目、主要并發癥和特有的病情判斷指標、病種醫療質量管理和控制的相關指標等。

3 數據挖掘的定義

數據挖掘是一種深入的數據分析,這些數據通常是大量的、不完整的、隨機的、雜亂的、模糊的實際應用數據,然后從過程中提取未知但有用的隱藏信息。其主要目標通常是大型數據庫,其主要目的是利用有效的算法從數據庫中查找隱藏的知識[3]。發現的知識可以用規則、決策樹、知識庫等來表示。大數據挖掘的核心是數據特征和屬性的提取,以及基于特征和屬性的進一步分類。為了對不同屬性的數據進行關聯分析,獲得有價值的信息[4]。

4 數據挖掘步驟

數據挖掘的過程應該是復雜的、多階段的.數據挖掘的關鍵步驟包括:①數據選擇。根據數據分析的要求、收集和選擇挖掘所需的數據源,使這些數據源多樣化。②數據預處理。數據預處理的任務是數據清洗、集成、轉換、規格說明和離散化。最后,得到了符合數據挖掘要求的相關數據。③建立數據挖掘模型。創建一個列,該列包含許多不同的數據類型,作為關系表,包括輸入列、可預測列和鍵列。④在現有數據和挖掘算法的基礎上,對挖掘模型進行訓練。模型的設置與數據挖掘算法有關,而挖掘模型的培育就是培育數據集發現的模式。⑤模型評價。利用一些評價工具對模型的質量進行評價,如升力圖、ROC曲線等。⑥知識表示。數據挖掘結果通常表示為模式,它是對包含信息的數據的抽象描述,可以是一組規則一簇決策樹或其他形式的知識。

5 數據挖掘方法

醫學數據是復雜數據的不斷增長,蘊含著豐富的信息價值,挖掘醫學數據的潛在價值,發現醫學知識,為醫學決策提供支持。傳統的數據挖掘應用可以移植到大數據環境[5]。大數據分析的常用方法有聚類、分類、預測、關聯規則、回歸分析、序列分析、偏差分析等。以下是幾種常用的數據挖掘方法。

5.1 分類分析

分類需要構造一個模型或分類器來預測類標記。一是學習階段,即構建分類模型或訓練階段,利用分類算法對訓練數據集進行分析,以分類規則的形式給出學習模型或分類器,第二階段是采用模型預測的分類階段。因此,給定數據的類標簽,用測試數據評估分類規則的準確性,如果精度在可接受的范圍內,則該規則將用于新的數據元組分類。常用的分類算法有決策樹算法、邏輯回歸算法、神經網絡算法和貝葉斯算法[6]。

與其他分類方法相比,決策樹具有易于理解、分類精度高的優點。決策樹算法是一種適用于預測建模的分類算法,用于連續屬性和離散屬性的預測建模。如果有多個可預測列,或者輸入數據包含可預測的嵌套表,則算法為每個可預測列生成一個單獨的決策樹。決策樹可以處理高維數據。決策樹的學習和分類步驟簡單、快速,所建立的分類模型直觀易懂,具有圖形化的樹結構,分析結果具有較好的精度[7]。

5.2 關聯分析

關聯規則挖掘能力巨大,目的是找出大量數據中項目之間的相關性,找出未知和潛在關聯的不同模式,并以關聯規則的形式表達出來。根據采集到的醫學數據,如檢查、測試、手術、醫學、護理等,采用關聯規則分析方法對關鍵時刻節點的相關數據進行挖掘。

關聯規則算法的原理是:首先在數據集中同時查找在一個案例中出現的項;然后根據參數指定的情況數,將最不頻繁的關聯項分組為項目集。該算法基于項集生成規則。關聯模型由一系列項目集和規則組成,它們描述了在這種情況下如何對這些項進行分組。可以使用這些規則根據算法確定的其他特定項的存在來預測數據庫中某個項的存在[8]。關聯規則可以有效地挖掘數據庫中各項屬性之間的關系。由于分析結果是基于大量的數據,充分利用了屬性之間的相關性,所以可以更充分地反映屬性之間的關系。

5.3 聚類分析

聚類是將數據對象劃分為組或簇的過程,它使集群中的對象高度相似,但與其他集群中的對象不同。聚類分析產生的一組數據稱為聚類。同一簇中數據變量的值相似,但不同簇間的數據變量值不同。聚類是搜索來自給定數據集的數據項之間的有價值關聯。

機器學習研究計算機如何根據數據學習,通常分為監督學習、無監督學習、半監督學習和主動學習。在機器學習中,聚類又稱無監督學習,沒有屬性來指導模型的構建,所有的輸入屬性都被平等對待。聚類和分類的區別在于,聚類的分類依賴于數據本身,而數據本身在聚類之前是未知的,分類是在分類之前預先定義的,以便進行下一步的分類。聚類算法主要包括層次法、劃分法、網格法、密度法和基于模型的聚類算法[9]。

5.4 序列分析

序列由一系列離散值(或狀態)組成,序列分析用于發現離散序列中的模式。序列數據和關聯數據都包含一個項集或一組狀態,區別是序列模型分析狀態的轉換,關聯分析中每個項集中的項是相等和獨立的。

序列是事件的有序列表。根據事件的特點,序列數據可分為生物序列數據、時間序列數據、符號序列數據等。時間序列數據由長序列數據值組成,這些數據值以相同的間隔記錄。符號序列數據由一長串事件或名義數據組成,記錄或未記錄一段特定時間,而且通常不以相同的間隔觀測。

將序列轉化為特征向量的分類方法稱為基于特征的分類.基于序列距離的分類質量是由度量序列間相似性的距離函數決定的。隱馬爾可夫模型(HMM)或其他統計模型可用于對基于模型的序列進行分類。

6 結語

醫學數據挖掘是人工智能、統計學和計算機技術、現代醫學等多種技術和知識的結合。醫學數據挖掘作為醫學決策支持系統的重要組成部分,隨著理論的發展和研究,將在疾病診斷和治療、醫學研究、教學和醫院管理等方面發揮越來越重要的作用。

[參考文獻]

[1] 于振華.臨床路徑系統的設計與實現[D].沈陽:東北大學,2012.

[2] 國家衛生計生委醫政醫管局.衛生部關于印發《臨床路徑管理指導原則(試行)》的通知[EB/OL].2009-10-16[2016-03-17].

[2] 阮瑩.基于流程挖掘的臨床路徑設計方法研究[D].上海:上海交通大學,2009.

[3] 田宗梅,王莉,肖琳.基于數據挖掘的臨床路徑抽取與應用[J].中國數字醫學,2015(6):2-4.

[4] 楊小寧.基于模糊聚類分析的臨床路徑優化決策研究[D].沈陽:沈陽理工大學,2013.

[5] 王道,黃新霆,李德就.聚類分析等算法在學習型臨床路徑中的應用[J].中國數字醫學,2012(7):99-101.

[6] 王玨.序列挖掘在臨床行為模式發現中的應用研究[D].無錫:江蘇大學,2008.

[7] 周建文.基于關聯規則挖掘的醫療智能輔助系統設計與實現[D].長沙:湖南大學,2013.

[8] 王寧.基于Hadoop平臺的海量醫療數據挖掘算法的研究與實現[D].北京:北京郵電大學,2014.

[9] 劉燕峰.數據挖掘及決策支持技術在醫院中的應用研究[D].杭州:浙江大學,2012.

(收稿日期:2018-06-21)

猜你喜歡
數據挖掘大數據
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 五月婷婷导航| 国产在线观看第二页| 伊人激情综合网| 国产成人一区二区| 无码免费的亚洲视频| A级毛片高清免费视频就| 91精品综合| 中日无码在线观看| 无码又爽又刺激的高潮视频| 中文无码精品A∨在线观看不卡| 亚洲日韩国产精品无码专区| 免费国产无遮挡又黄又爽| 欧美日本视频在线观看| 91色在线视频| 波多野结衣在线一区二区| 在线a网站| 日韩免费毛片视频| 国产免费羞羞视频| 亚洲午夜18| 中文字幕免费视频| 欧美亚洲第一页| 成人在线亚洲| 日韩天堂在线观看| 欧美色99| 亚洲黄色网站视频| 亚洲美女一区| 操操操综合网| 久久精品国产精品青草app| 精品丝袜美腿国产一区| 伊人福利视频| 久久精品中文无码资源站| 国产另类视频| 日本尹人综合香蕉在线观看| 中文字幕精品一区二区三区视频| 日韩精品高清自在线| 色婷婷成人| 亚洲成人在线网| 亚洲香蕉久久| 老司国产精品视频91| 手机在线看片不卡中文字幕| 国产丝袜啪啪| 天天色综网| 久久午夜夜伦鲁鲁片不卡| 日韩黄色大片免费看| 伊人久久久久久久久久| 亚洲无码一区在线观看| 精品无码视频在线观看| 91久久夜色精品| 综合色天天| 99久久99视频| 国产成人1024精品| 午夜毛片免费看| 国内精品自在自线视频香蕉| 国产网站免费观看| 国产特级毛片| 国产精品蜜芽在线观看| 精品无码一区二区三区电影| 国产在线麻豆波多野结衣| 国产精品一区二区不卡的视频| 在线观看精品自拍视频| 亚洲欧美日韩成人高清在线一区| 亚洲中久无码永久在线观看软件| 婷婷伊人久久| 先锋资源久久| 三上悠亚一区二区| 亚洲嫩模喷白浆| 久一在线视频| 四虎国产精品永久一区| 欧美亚洲欧美| 成色7777精品在线| 天堂网国产| 欧美日韩亚洲综合在线观看| 日本精品视频一区二区 | 中文字幕亚洲精品2页| 国产丝袜91| 伊人激情综合网| 亚洲AV无码精品无码久久蜜桃| 国产精品妖精视频| www.youjizz.com久久| 欧美精品一区二区三区中文字幕| av无码久久精品| 九色综合伊人久久富二代|