999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

糖尿病線性判別診斷模型的建立

2011-09-20 03:20:18魏玉輝傅松波武新安
衛(wèi)生職業(yè)教育 2011年17期
關(guān)鍵詞:糖尿病

李 雯,魏玉輝,傅松波,武新安

(蘭州大學(xué)第一醫(yī)院,甘肅 蘭州 730000)

近年來(lái),糖尿病發(fā)病率呈逐年上升趨勢(shì),已成為發(fā)達(dá)國(guó)家繼心血管病和腫瘤之后的第三大非傳染性疾病。流行病調(diào)查顯示,我國(guó)目前大約有4000萬(wàn)糖尿病患者,預(yù)計(jì)到2025年,我國(guó)糖尿病患者將達(dá)到1 億。因而對(duì)糖尿病進(jìn)行早期診斷及分類研究非常重要[1]。分類體系在醫(yī)學(xué)診斷中的應(yīng)用日趨廣泛,從患者臨床檢驗(yàn)數(shù)據(jù)到專家決策,均是臨床評(píng)價(jià)的重要過(guò)程。機(jī)器學(xué)習(xí)算法可以通過(guò)大量臨床檢驗(yàn)數(shù)據(jù)和專家決策進(jìn)行學(xué)習(xí),尋找數(shù)據(jù)中存在的規(guī)律及影響疾病診斷的主要因素。目前,機(jī)器學(xué)習(xí)算法在疾病輔助診斷中的應(yīng)用越來(lái)越廣泛,使用的算法涉及人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量基(SVM)、遺傳算法(GA)、線性判別分析(LDA)等[2~8]。LDA 是用于判別個(gè)體所屬群體的一種統(tǒng)計(jì)方法,是多元統(tǒng)計(jì)分析中判別樣品所屬類型的一種重要方法,特別適合多變量的兩分類或多分類研究。目前,機(jī)器學(xué)習(xí)算法用于糖尿病診斷的研究少有報(bào)道[3]。本文采用臨床常規(guī)檢查指標(biāo)(血常規(guī)、生化)與LDA 相結(jié)合的方法建立計(jì)算機(jī)輔助糖尿病診斷模型,取得了較為滿意的結(jié)果。

1 研究資料

1.1 資料來(lái)源

研究病例來(lái)自蘭州大學(xué)第一醫(yī)院病歷庫(kù),所收集的資料均為醫(yī)院內(nèi)分泌科、普外科2007年全年出院患者。

1.2 研究對(duì)象

均由有經(jīng)驗(yàn)的內(nèi)分泌科醫(yī)師診斷。糖尿病病例352例,非糖尿病病例389例;男性428例,女性313例;年齡8~84歲,平均年齡(58 ±14)歲。錄入信息包括患者基本情況(年齡、性別、入院日期、出院日期等)、血常規(guī)檢查指標(biāo)(白細(xì)胞、紅細(xì)胞等)、生化檢查指標(biāo)(天冬氨酸氨基轉(zhuǎn)移酶、丙氨酸氨基轉(zhuǎn)移酶等)。

1.3 納入及排除

分別以1型、2型糖尿病,其他特異性糖尿病及妊娠期糖尿病的臨床診斷標(biāo)準(zhǔn)為納入標(biāo)準(zhǔn)收集病例。由有經(jīng)驗(yàn)的內(nèi)分泌科醫(yī)師診斷為糖尿病的出院患者、普外科出院患者,排除其中基本情況、血常規(guī)檢查、生化檢查指標(biāo)不齊全者,其余均納入研究。

2 研究方法

2.1 線性判別分析

判別分析是用于幫助研究者尋找區(qū)別各組差異的變量,將對(duì)象較準(zhǔn)確地判入各組的方法[4]。判別分析最常見的應(yīng)用是為了判定哪些變量具有組間判別效力而對(duì)研究對(duì)象中多個(gè)測(cè)量變量進(jìn)行選擇[3]。經(jīng)過(guò)判別分析之后就會(huì)得到判別函數(shù)。判別分析適用于2組以上,且每個(gè)病例必須有2個(gè)以上變量的分類分析。

一般說(shuō)來(lái),我們可對(duì)2組間的判別擬合一個(gè)線性方程:Y=a+b1X1+b2X2+...+bnXn式中a 為常數(shù),b1 到 bn 為回歸系數(shù)。判別函數(shù)對(duì)2組判別問(wèn)題的解釋較直接,具有最大相關(guān)系數(shù)的變量對(duì)預(yù)測(cè)組別的貢獻(xiàn)最大[3]。本實(shí)驗(yàn)為了研究方便,定義糖尿病病例為1,而非糖尿病病例為-1。

2.2 逐步判別原理

逐步判別分析是根據(jù)多元方差分析中的wilk′s 統(tǒng)計(jì)量及F 值進(jìn)行變量的篩選。每一步選一個(gè)判別能力最大的指標(biāo)進(jìn)入判別函數(shù),直到被引入模型的變量沒(méi)有一個(gè)符合進(jìn)入模型的條件時(shí),變量引入過(guò)程結(jié)束。逐步判別分析以wilk′s 統(tǒng)計(jì)量最小者入選,本研究中模型引入變量的最小F 值為10,剔除變量的最大F 值為2.71。這樣得到的判別函數(shù)所包含的指標(biāo)都很重要。

2.3 病例收集與分類

按上述納入與排除標(biāo)準(zhǔn)收集病例,結(jié)合臨床檢驗(yàn)結(jié)果與有經(jīng)驗(yàn)臨床醫(yī)生的診斷對(duì)所收集病例進(jìn)行分類,同時(shí)建立相應(yīng)數(shù)據(jù)庫(kù)。

2.4 訓(xùn)練集和測(cè)試集的選擇

研究對(duì)象共741例,所有收集的病例以4∶1 比例分為訓(xùn)練集樣本和測(cè)試集樣本。為使計(jì)算機(jī)能更合理地從資料中獲取信息,訓(xùn)練集樣本應(yīng)能很好地代表患者真實(shí)情況,因此,運(yùn)用數(shù)據(jù)庫(kù)中已知其類別的樣本作為訓(xùn)練集,從741例樣本中選擇594例(糖尿病病例281例,非糖尿病病例313例)樣本組成訓(xùn)練集。為了檢驗(yàn)從訓(xùn)練集中得到識(shí)別函數(shù)的可靠程度,可利用一些未包括在訓(xùn)練集中的樣本構(gòu)成測(cè)試集,以檢驗(yàn)其識(shí)別的可靠性,因此,將剩余147例(糖尿病病例71例,非糖尿病病例76例)樣本構(gòu)成測(cè)試集,以驗(yàn)證模型的預(yù)測(cè)能力。

2.5 判別函數(shù)的建立

通過(guò)訓(xùn)練集獲得判別函數(shù)建立模型。將訓(xùn)練集患者的基本情況、血常規(guī)檢查及生化檢查信息從Microsoft-Excel 數(shù)據(jù)庫(kù)導(dǎo)入SPSS 數(shù)據(jù)庫(kù)。然后用SPSS 統(tǒng)計(jì)軟件提供的判別分析方法對(duì)這些數(shù)據(jù)進(jìn)行判別分析,選出對(duì)預(yù)測(cè)組別貢獻(xiàn)較大的變量,建立判別函數(shù)。

2.6 模型的評(píng)價(jià)

用訓(xùn)練集與測(cè)試集的誤判率對(duì)模型進(jìn)行判別效果評(píng)價(jià),并引入特異性和敏感性指標(biāo)進(jìn)一步判斷LDA 的預(yù)測(cè)能力。

3 結(jié)果與討論

3.1 特征變量及判別函數(shù)

經(jīng)LDA 法進(jìn)行判別分析后,逐步選出8項(xiàng)對(duì)區(qū)別各組貢獻(xiàn)較大的變量。判別函數(shù)的變量及Wilk′s 值,見表1。

表1 逐步判別分析篩選出的特征變量

在疾病診斷中常需根據(jù)就診者的檢查指標(biāo)、體征等的分析,作出是否患有某種疾病的診斷,這種問(wèn)題就可用判別分析解決[5]。逐步判別分析可以篩選出對(duì)于鑒別2類具有不同屬性的人群有較大貢獻(xiàn)的變量,從而使其結(jié)果具有較好的區(qū)分度。表中F 的絕對(duì)值越大就意味著該變量對(duì)模型的貢獻(xiàn)越大。由表1 中的F 值可知,變量總膽固醇比其他變量相對(duì)重要,這些變量所代表的臨床意義與診斷模型之間的關(guān)系有待進(jìn)一步研究。由8個(gè)特征變量相對(duì)應(yīng)的判別函數(shù)系數(shù)建立的糖尿病與非糖尿病分類判別函數(shù)如下。

糖尿病判別函數(shù):Y=-55.570+0.168X1+3.610X2+0.413X3+0.004X4-0.030X5+2.278X6+0.083X7+1.405X8

非糖尿病判別函數(shù):Y=-42.9820+0.115X1+2.849X2+0.372X3+0.008X4-0.010X5+2.149X6+0.071X7+0.871X8

3.2 判別結(jié)果及判別正確率

將741例合格病例以4∶1 比例分為訓(xùn)練集樣本和測(cè)試集樣本,經(jīng)交互檢驗(yàn)法驗(yàn)證可得訓(xùn)練集的預(yù)測(cè)情況,見表2。

由表2可知,訓(xùn)練集和測(cè)試集的預(yù)測(cè)準(zhǔn)確率分別是85.7%和81.6%,模型總判別準(zhǔn)確率為84.9%。

表2 LDA 判別模型預(yù)測(cè)準(zhǔn)確率

3.3 特異性和敏感性

LDA 對(duì)于糖尿病和非糖尿病的判別效果較好,為了進(jìn)一步判斷LDA 的預(yù)測(cè)能力,實(shí)驗(yàn)引入了特異性(Specificity)和敏感性(Sensitivity)指標(biāo)。

其中TP 指真陽(yáng)性數(shù),F(xiàn)N 指假陰性數(shù),TN 指真陰性數(shù),F(xiàn)P指假陽(yáng)性數(shù)。在LDA 法判斷結(jié)果中,測(cè)試集的假陽(yáng)性病例是31例,假陰性病例是54例。由此求得測(cè)試集樣本的敏感性是0.75,特異性是 0.88。

4 結(jié)論

本文是首次源于臨床常規(guī)檢查指標(biāo)(血常規(guī)、生化)與機(jī)器學(xué)習(xí)算法相結(jié)合建立計(jì)算機(jī)輔助糖尿病診斷模型。逐步判別分析的總判別準(zhǔn)確率達(dá)到84.9%,雖然判別效果較好,但還可通過(guò)進(jìn)一步擴(kuò)大樣本量,或采用更加適合的機(jī)器學(xué)習(xí)算法提高判別能力。

[1]陳文彬.診斷學(xué)[M].第5版.北京:人民衛(wèi)生出版社,2004.

[2]Kemal Polat,Salih Gunes,Ahmet Arslan.A cascade learning system for classification of diabetes disease:Generalized Discriminant Analysis and Least Square Support Vector Machine[J].Expert Systems with Applications,2008(34):482~487.

[3]J Liang,R Du.Model-based Fault Detection and Diagnosis of HVAC systems using Support Vector Machine method[J].International Journal of Refrigeration,2007(30):1104~1114.

[4]Kemal Polat,Salih Gune.Breast cancer diagnosis using least square support vector machine[J].Digital Signal Processing,2007(17):694~701.

[5]Tim W,Nattkemper,Bert Arnrich,et al.Evaluation of radiological features for breast tumour classification in clinical screening with machine learning methods[J].Artificial Intelligence in Medicine,2005(34):129~139.

[6]Weida Tong,Qian Xie.Using Decision Forest to Clissify Prostate Cancer Samples on Basis of SELDI-TOF MS Data:Assessing Chance Correlation and Prediction Confidence[J].Environmental Health Perspectives,2004(112):1622~1627.

[7]Kemal Polat,Salih Gunes.Computer aided medical diagnosis systerm based on principal component analysis and artificial immune recognition systerm classifier algorithm[J].Expert Systems with Applications,2008(34):773~779.

[8]Marco A,M énde z,Christian Hodar,et al.Discriminant analysis to evaluate clustering of gene expression data[J].FEBS Letters,2002(522):24~28.

猜你喜歡
糖尿病
糖尿病知識(shí)問(wèn)答
中老年保健(2022年5期)2022-08-24 02:35:42
糖尿病知識(shí)問(wèn)答
中老年保健(2022年1期)2022-08-17 06:14:56
糖尿病知識(shí)問(wèn)答
中老年保健(2021年5期)2021-08-24 07:07:20
糖尿病知識(shí)問(wèn)答
中老年保健(2021年9期)2021-08-24 03:51:04
糖尿病知識(shí)問(wèn)答
中老年保健(2021年7期)2021-08-22 07:42:16
糖尿病知識(shí)問(wèn)答
中老年保健(2021年3期)2021-08-22 06:49:56
糖尿病知識(shí)問(wèn)答
糖尿病離你真的很遙遠(yuǎn)嗎
糖尿病離你真的很遠(yuǎn)嗎
得了糖尿病,應(yīng)該怎么吃
主站蜘蛛池模板: 日韩区欧美区| 国产香蕉国产精品偷在线观看| 免费视频在线2021入口| 人妻精品全国免费视频| 婷婷六月激情综合一区| 5555国产在线观看| 国产精品va| 婷婷综合亚洲| 日本成人精品视频| www精品久久| 91小视频版在线观看www| 四虎成人在线视频| 四虎综合网| 欧美日在线观看| 国产成人精品第一区二区| 欧美午夜在线播放| 91在线精品麻豆欧美在线| 日本黄色a视频| 国产精品无码制服丝袜| 亚洲AⅤ波多系列中文字幕| 美女一区二区在线观看| 激情综合图区| а∨天堂一区中文字幕| 91国内视频在线观看| 超清无码熟妇人妻AV在线绿巨人| 40岁成熟女人牲交片免费| 亚洲一本大道在线| 毛片a级毛片免费观看免下载| 波多野衣结在线精品二区| 国产偷国产偷在线高清| 影音先锋亚洲无码| 国产粉嫩粉嫩的18在线播放91| 欧美专区在线观看| 亚洲日韩国产精品综合在线观看| 国产成人亚洲精品色欲AV | 成年片色大黄全免费网站久久| 无码 在线 在线| 日韩A∨精品日韩精品无码| 操美女免费网站| 亚洲日本一本dvd高清| 2021国产精品自拍| 欧美午夜在线观看| 无码精品福利一区二区三区| 一级毛片在线播放免费| 大乳丰满人妻中文字幕日本| 久久国产高潮流白浆免费观看| 999国产精品永久免费视频精品久久| 国产精品爽爽va在线无码观看| 国产大片喷水在线在线视频| 欧美福利在线观看| 成人日韩欧美| 国产综合亚洲欧洲区精品无码| 国模私拍一区二区| 国产凹凸视频在线观看| 亚洲精品成人7777在线观看| 福利在线不卡| 欧美一区二区三区国产精品| 美女无遮挡免费网站| 国产成人精品在线1区| 97av视频在线观看| 亚洲一区二区三区在线视频| 国产综合无码一区二区色蜜蜜| 亚洲AV人人澡人人双人| 国产超薄肉色丝袜网站| 天天操天天噜| 2020国产精品视频| 成人国产精品一级毛片天堂| 国产精品永久不卡免费视频| 色视频久久| 久久毛片基地| 91精品在线视频观看| 亚洲国产91人成在线| 久久精品午夜视频| 免费国产一级 片内射老| 国产一区二区在线视频观看| 欧美精品亚洲精品日韩专区| 国精品91人妻无码一区二区三区| 欧美综合成人| 丝袜亚洲综合| 亚洲一区波多野结衣二区三区| 国产精品无码一区二区桃花视频| 91av成人日本不卡三区|