999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的醫學影像檢索與分析

2016-02-09 06:28:54蔣友好高彩蘭
中國醫療器械雜志 2016年4期
關鍵詞:數據挖掘區域

蔣友好,喬 非,高彩蘭

1 同濟大學電子與信息工程學院控制科學與工程系,上海市,201804 2 上海市中醫藥大學附屬普陀醫院,上海市,200062

基于數據挖掘的醫學影像檢索與分析

【作者】蔣友好1,2,喬 非1,高彩蘭2

1 同濟大學電子與信息工程學院控制科學與工程系,上海市,201804 2 上海市中醫藥大學附屬普陀醫院,上海市,200062

通過了解數據挖掘的一些基本知識,運用關聯規則、粗糙集理論等用于醫學影像檢索并進行分析。通過這些手段,從龐大的數據倉庫中,挖掘更加精確、更為有用的數據并加以分析,為醫學影像的診斷提高可信度,以及為醫學影像檢索提供方便。

關聯規則;粗糙集理論;醫學影像

0 引言

醫學影像是醫院進行病例分析的重要依據。通過采集醫院信息系統,各類影像數據可實現數字化存儲,并可通過服務器訪問、調用和處理。醫學影像數據的存儲量極為龐大,但是其用于病情分析的利用率還偏低。當前對于跨院區、跨部門、跨系統的影像數據分析利用還比較困難,難以支持醫療和管理決策,因此急需對這些數據進行整合并分析。

數據倉庫是面向主題的、集成的且隨時間不斷變化的數據集合。醫學影像數據倉庫是數據倉庫技術面向醫學領域數據的具體表現之一。與其他數據倉庫相比,醫學影像數據倉庫的數據來源、數據類型和數據特征都有其不確定性之處。建立醫學數據倉庫是醫學數據分析處理的基礎,是醫學信息技術發展的必然,對于醫學、醫療衛生、生物學和醫療管理等領域的研究與應用都有巨大的推動作用[1]。

數據挖掘(Data Mining,DM)是從大量數據中提取出可信的、新穎的、有效率的并最終能被人理解的信息處理技術。涉及數據庫、人工智能、統計學、模式識別、可視化技術、并行計算等眾多領域知識。醫學影像數據挖掘是一門涉及面廣、技術難度大的新興交叉學科,將數據挖掘技術應用到醫學影像信息數據倉庫中,可以發現其中的醫學診斷規則和模式,從而輔助醫生進行疾病診斷[1]。

本文以普陀區中心醫院的醫學影像數據為依據,研究基于數據挖掘的醫學影像檢索與分析方法,并對方法進行驗證。

1 醫學影像檢索關聯規則的應用

1.1 關聯規則

在醫學影像中,通過醫院HIS、RIS以及PACS系統數據庫檢查信息表和項目信息表中,獲取患者基本信息、患者病情的報告,以及患者之前的病情數據。通過關聯規則的判斷,對患者進行初步的評估再進行有目的的檢查,從而有效避免了重復檢查和不完整檢查,可以對患者的檢查項目進行統一規范化處理。

關聯規則X→Y的信任度是一個條件概率P(Y|X),即,Support(X→Y)=P(XUY),Confdence(X→Y)=P(Y|X)。

1.2 發現頻繁項集與生成關聯規則

通過發現頻繁項,了解患者檢查的各個單個項目或檢查內容,算出支持度與信任度,可發現患者就診過程中檢測項目的關聯度,進一步結合患者疾病類型,為醫學影像研究提供依據,提高醫院臨床管理質量。

1.3 Apriori算法步驟

Apriori算法的中心思想是首先對數據庫進行掃描,找出支持度不小于最小支持度的所有項目,即頻繁1- 項集;接下來是循環操作,每次循環分3步進行:連接、減枝、對數據庫進行掃描并計算候選項的支持度。具體過程如圖1所示。

圖1 Apriori算法示意圖Fig.1 Apriori algorithm schematic

1.4 醫學影像檢索

采集我院100例肝癌病人的臨床資料,通過CT圖像的檢查,根據關聯規則公式,主要對腫瘤生長方式和主瘤旁有小灶兩種情況進行關聯規則的計算,計算結果如表1所示。

表1 計算結果Tab.1 Calculation results

通過簡單的關聯規則,算出支持度與信任度,能對病人肝癌復發的概率進行判斷,對日后的治療起到一定的幫助,也對研究者的判斷提供一定的數據支持。通過分析這些數據,可判斷疾病發病的因素。

2 粗糙集應用于醫學影像檢索

在醫學影像學中,各式各樣的數據經常因數量龐大而不夠精確。例如每一份CT圖像分辨率極高,所包含的信息也極多:如病例數據、CT值、窗寬等。這些數據包羅萬象,其模糊性和不確定性讓人摸不著頭腦。而粗糙集理論的優勢在于它不需要關于數據的任何準備或額外的信息,更容易從醫學影像數據中進行數據挖掘。

2.1 粗糙集規則提取的一般步驟

粗糙集規則提取的目的一般有兩個:一是用于建立分類系統,從數據倉庫中導出規則,再用導出的規則去預測或分類新的實例;二是用于實現知識發現的任務,從數據中尋找出潛在的信息模式,更好地了解并認識數據。

一般步驟為:屬性約簡、消除重復的行、值簡約、整理規則[2]。

2.2 粗糙集理論的圖像處理

在醫學診斷中最有可能的問題便是影像資料清晰度沒有達到標準值,使得醫生在診斷時產生偏差,容易導致病情延誤,嚴重的可能誤診。因此使用醫學圖像處理技術,對醫學診斷的提高有很大價值,更為以后的研究創造前提條件。

醫學影像處理技術主要是突出了醫學影像特征(感興趣)區域的信息,并減弱或除去不必要的信息,從而使得感興趣區域的分辨率,清晰度得到提高,將信息的傳遞精確化。圖像處理的過程有兩步,首先是采用一系列技術改善圖像的視覺效果(如色階,灰度,噪聲等),將圖像的分辨率和清晰度提高。其次是將圖像轉化為一種信息或數據,更加容易讓人或者計算機進行解釋和分析[3]。

結合粗糙集理論,在醫學圖像處理后,依據各種圖像成像后的原理以及相應基本的病例特征分析,提出基于粗糙集理論的醫學影像的算法,將醫學影像看成是一個知識系統,利用粗糙集理論中的不可辨關系,根據醫學影像中的“知識”(人體器官之間的密度差異)來定義等價關系,將醫學圖像劃分為特征(目標)區域、背景區域,分別對各個區域進行相應的圖像處理,最后將各個區域處理后的結果進行疊加,得到基于粗糙集的醫學影像處理結果。

2.2.1 粗糙集理論不可辨關系

給定一個論域U≠Ф,X是U的一個子集,R是U的等價關系且U/R={X1, X2, …, Xn}滿足以下條件:(1)Xi

∪U,Xi≠Ф,對于任何i; (2) Xi∩Xj=Φ,對于任何i和j; (3)Ui=1, 2, …, n, Xi=U。在子集Xi代表了等價類R,x∈U用[x]R表示,不可辨關系IND(R)被定義為:[4]

我們定義子集X關于R的下近似和上近似分別為:

同時將P O S R(X)=R(X)稱為X的R正域;NEGR(X)=U-R(X)稱為X的R負域;BNR(X)= RX-RX稱為X的R邊界域。

圖2 等價關系R下的分類模式圖Fig.2 Classification schematic diagram under the equivalence relation R

2.2.2 粗糙集中不可辨關系的分析及應用

在最簡單的情況下,在感興趣區域中我們只有關于強度的閾值,在這種情況下,強度的閾值是獲取給定圖像中的體素。我們用ThL和ThH來表示下部閾值和上部閾值,感興趣區域ROI為上下部閾值中間值。

x(p)表示體素的所在位置為p,I(x(p))表示體素x(p)的強度。為簡單起見,將l(x(p))以l(p)表示。

我們用Ci定義強度的分布,d(Ci)為Ci的評價函數,輸出d(Ci)=1時,為感興趣區域。d(Ci)可表示為:

其中Ci為其區域平均強度。我們使用粗糙集,其近似的概念,代表一個不確定的邊界區域。在一個體積圖像,一個類別X是建立為一組相鄰像素點的屬性值,例如在同一強度或同一位置。離散化聚類方法和分類器等工具可以用來建立基本類別與正確的粒度級別。

為了確定感興趣區域的上、下近似強度,定義包含滿足閾值條件的體素的感興趣區域的理想形狀。然而,這樣的感興趣區域可能不完全是由圖像的基本集表示。換句話說,感興趣區域的邊界并不適合于圖像低層特征。為了表示這種不一致,我們把圖像分成以下三個區域:

正域:包括在感興趣區域的體素。

負域:排除在感興趣區域的體素。

邊界區域:可能包括在感興趣區域的體素。

基本類別表示為U/IND(R)={C1,C2,… ,CN},同時設定XROI'為ROI的一組理想體素。然后,上述三個區域可以表示為:

圖像中的感興趣區域可表示為:

圖3表示了通過上述公式對感興趣區域進行區分。左邊的圖像為原始圖像,感興趣區域為黑色圓形區域,即ROI1,ROI2,ROI3。設XROI’為理想感興趣區域。

將圖像強度分為幾個層次。在這種情況下,我們得到了10個區域C1~C10在圖3所顯示圖像的中心。根據前面的定義,正域、負域以及邊界區域可以得到如下公式:

即因此得出結論,對于給定的圖像特征,感興趣區域為C5~C10,以及可能的邊界區域為C4。

圖3 圖像中感興趣區域強度分布Fig.3 The intensity distribution of the image region of interest

2.3 基于粗糙集理論圖像處理后的例子

通過我院GE LightSpeed 64排容積VCT及Xtream FX系統處理。

通過CT所得圖像,突出區域如病灶、腫瘤、陰影等部位,進行體素化,再由上述公式ROI=POSR(XROI’)+BNR(XROI’)等區分感興趣區域,抑制一些無用的圖像數據,提高圖像利用價值。如圖4所示。

圖4 感興趣區域的對比圖Fig.4 Contrast figure for ROI

圖5為一例多排螺旋CT上腹部位置拍攝下的圖像,通過對圖像感興趣區域進行處理后,左右對比能清晰看到特征區域內的亮度與清晰度有了提高,原本黯淡的目標區域變得紋理清晰,器官分泌的液體體積也一目了然,而其余區域(如背景區域等)并沒有太大變化。

圖5 圖像處理前后的圖像的對比(上腹部)Fig.5 Contrast (upper abdomen) image before and after image processing

圖6為我院另一例多排螺旋CT拍攝肺癌轉移至肺門和縱隔淋巴結的病例,經過圖像處理后能清晰可見肺部的信息,出現明顯的肺癌轉移。

圖6 處理后的圖像(肺癌轉移至肺門和縱隔淋巴結)Fig.6 The image after processing (lung cancer metastasis to the hilar and mediastinal lymph nodes)

通過圖5、圖6可見數字圖像處理技術的引入主要是為了改善醫學影像質量,而目前對X光圖像、CT圖像、MRI圖像、超聲圖像、以及內窺鏡圖像等醫學圖像的處理,己成為輔助醫學診斷的重要手段之一。

經過改善的醫學影像,對感興趣區域的圖像積累,便能得到一系列相應病癥的圖像信息例如紋理、形狀等。通過關聯規則進行分析及存儲,便能進行圖像檢索。

2.4 粗糙集理論的圖像檢索應用

醫學影像中的圖像存儲是龐大的,不僅是圖像的數量上,在圖片的屬性上也是如此。在龐大的數據中找到更為精確的數據,對于提高醫學圖像資料的可靠度必不可少。在上文提到的依靠關聯規則進行項目檢索的方法,因為醫學圖像的模糊性不能很好地檢索圖像,而粗糙集理論,一種研究不精確、不確定性知識的數學工具則更為合適。基于圖像檢索的基本框架見圖7。

圖7 基于圖像檢索的基本框架Fig.7 The basic framework based on image retrieval

通過之前介紹的圖像處理技術,使圖像質量得到改善,將醫學影像拆分為各個區域后處理也使得圖像更容易被解釋和分析處理,為相應圖像檢索提供了方便。用于圖像檢索的主要特征有顏色、紋理、草圖、形狀等,其中圖像中顏色、形狀、紋理應用較為廣泛。粗糙集理論直接從給定集合的描述出發,通過不可辨關系和不可辨類確定給定問題的近似域,從而找出圖像的內在規律。在圖像信息不完整、不確定的前提下,仍能進行認識、分析、推理和決策[5]。

3 結論

隨著各種先進技術的產生,大量醫學影像資料將快速增長,數據挖掘技術將成為輔助醫學診斷的主要手段之一,可用于研究人類各種疾病發病機制的主要方法。

總之,數據挖掘的各項技術和方法均顯示出其獨有的優越性,都在醫學數據挖掘中取得了成功的應用,其應用的潛力巨大。在這個大數據時代,數據挖掘技術必將為臨床、醫學診斷及研究帶來極大的方便。

[1] 李雄飛, 杜欽生, 吳昊. 數據倉庫與數據挖掘[M]. 北京: 機械工業出版社, 2013.

[2] 張文修, 吳偉志. 粗糙集理論介紹和研究綜述[J]. 模糊系統與數學, 2000, 15(4): 1-12.

[3] Mitchell T M. 機器學習[M]. 北京: 機械工業出版社, 2003.

[4] 吳毅民. 基于不可分辨和優勢關系的知識約簡算法研究及其應用[D]. 福州: 福州大學, 2004.

[5] 強邦紅, 劉冬, 朱向明. 數據挖掘技術在醫學影像領域中的應用進展[J]. 臨床超聲醫學雜志, 2013, 15(4): 287-288.

Retrieval and Analysis Based on Data Mining in Medical lmaging

【Writers】JIANG Youhao1,2, QIAO Fei1, GAO Cailan2

1 Department of Control Science and Engineering, School of Electronic and Information Engineering, Tongji University, Shanghai, 201804
2 Putuo Hospital Affiliated to Shanghai University of Traditional Chinese Medicine, Shanghai, 200062

By the understanding of some basic knowledge of data mining, we use the association rule and rough set to the medical image retrieval. By these means, from large data warehouse, we dig more accurate, more useful information and analyze data to improve the diagnosis reliability of the medical image and propose the convenience for the medical image retrieval.

association rules, rough set theory, medical imaging

TP311.13

A

10.3969/j.issn.1671-7104.2016.04.018

1671-7104(2016)04-0297-04

2016-03-29

蔣友好,E-mail: jyouh_0416@163.com

猜你喜歡
數據挖掘區域
永久基本農田集中區域“禁廢”
今日農業(2021年9期)2021-11-26 07:41:24
分割區域
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
關于四色猜想
分區域
一種基于Hadoop的大數據挖掘云服務及應用
基于嚴重區域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 一区二区三区四区精品视频| 九色综合伊人久久富二代| 国产一区免费在线观看| 亚洲娇小与黑人巨大交| 亚洲一区网站| 天天色综网| 亚洲av色吊丝无码| 国产96在线 | 中文字幕啪啪| 精品91在线| 成人在线综合| 国模粉嫩小泬视频在线观看 | 中文字幕永久视频| 欧美有码在线观看| 浮力影院国产第一页| 在线观看亚洲天堂| 青青草一区| 亚洲六月丁香六月婷婷蜜芽| 亚洲黄色片免费看| 国产亚洲精久久久久久无码AV| 97视频免费在线观看| 免费高清a毛片| 婷婷色一区二区三区| 欧美日韩久久综合| 国产精品七七在线播放| 114级毛片免费观看| 国产黄色片在线看| 日韩在线欧美在线| 精品综合久久久久久97| 97在线碰| 日本成人一区| 久久精品中文字幕免费| 国产福利小视频在线播放观看| 日韩无码精品人妻| 国产精品手机在线播放| 大香伊人久久| 久久精品免费国产大片| 国产福利在线免费观看| 青青草原国产免费av观看| 亚洲无码不卡网| 久久综合丝袜日本网| www.99在线观看| 日本亚洲欧美在线| 国产成人久久综合777777麻豆| h视频在线观看网站| 亚洲日韩AV无码精品| 亚洲无码精品在线播放| 日本亚洲成高清一区二区三区| 91成人试看福利体验区| 亚洲日韩精品伊甸| 在线精品亚洲一区二区古装| 国产99在线观看| 热这里只有精品国产热门精品| 国产精品亚欧美一区二区 | 国产福利小视频高清在线观看| 国产成人亚洲综合A∨在线播放| 久热99这里只有精品视频6| a级毛片在线免费观看| 亚洲欧州色色免费AV| 国产亚洲欧美日韩在线观看一区二区 | 2018日日摸夜夜添狠狠躁| 亚洲国产AV无码综合原创| 国产欧美高清| 国产精品第一区| 精品91在线| 久久这里只有精品66| 伊人久久大香线蕉综合影视| 国产SUV精品一区二区6| 欧美日韩在线观看一区二区三区| 国产精品一区二区久久精品无码| 国产精品亚洲一区二区三区在线观看| 91久草视频| 国产小视频a在线观看| 欧美精品1区| 东京热高清无码精品| 伊人久久青草青青综合| 亚洲一级毛片在线观播放| 亚洲综合片| 久青草免费在线视频| 67194成是人免费无码| 欧美日韩一区二区三区在线视频| 波多野结衣久久高清免费|