999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

使用K近鄰算法診斷乳腺癌

2020-10-21 12:24:09趙宇
大東方 2020年3期
關鍵詞:數據挖掘標準化乳腺癌

趙宇

摘 要:隨著信息技術的不斷發展,醫療大數據的概念也逐漸被人類所熟知。通過對數據挖掘技術在乳腺癌各領域的研究現狀(乳腺癌基因研究、乳腺癌早期輔助檢查、力學藥物靶點識別、乳腺癌新中醫治療方法)的分析,展望數據挖掘技術應用于乳腺癌領域的前景,為數據挖掘技術在乳腺癌疾病的研究提供新思路。

關鍵詞:數據挖掘;乳腺癌

一、前言

乳腺癌已成為當前社會的重大公共衛生問題。全球乳腺癌發病率自20世紀70年代末開始一直呈上升趨勢。美國8名婦女一生中就會有1人患乳腺癌。中國不是乳腺癌的高發國家,但不宜樂觀,近年我國乳腺癌發病率的增長速度卻高出高發國家1~2個百分點。

二、數據源

我們將使用來自UCI的乳腺癌診斷數據集,該乳腺癌數據包括569例乳腺細胞活檢樣本,每個樣本包含32個變量。其中id變量是樣本識別ID,diagnosis變量是目標變量(M代表惡性,B代表良性)。其他30個變量都是由10個數字化細胞核的10個不同特征的均值、標準差和最大值構成。這10個基本特征為:

三、數據探索和預處理

.3.1 ?數據的探索

首先,搜集數據集如下圖所示,由于數量問題,只顯示其中部分,共計569個樣本,32個變量。

將整個數據集導入SPSS軟件中。

第一個變量為ID,無法為實際的模型構建提供有用的信息,所以需要將其刪除。diagnosis變量是我們的目標變量,我們首先統計一下其取值分布。觀察在我們的數據集中,惡性(M)和良性樣本(B)的分布情況。在正式建模之前需要將其進行整數編碼,將良性(B)編碼為0,將惡性(M)編碼為1。

通過統計我們的569個樣本中,良性樣本(B)和陰性樣本分別有212個,占比分別為62.7%和37.3%。其中作為示例,我們主要選取所有變量中的三個:radius_mean,area_mean和smoothness_mean。

通過SPSS軟件生成圖形對三個變量進行分析:觀察這三個變量的統計信息,發現它們的取值范圍不大一致。radius_mean取值范圍為6.981~28.110,area_mean取值范圍為143.5~2501.0,smoothness_mean取值范圍為0.05263~0.16340。不同變量的測量尺度不一致會影響K近鄰算法中的樣本距離計算。例如,如果上述三個變量直接參與距離計算,則area_mean變量將會對距離計算影響最大,從而會導致我們構建的分類模型過分依賴于area_mean變量。在應用K近鄰等涉及距離計算的算法構建預測模型之前,需要對變量取值進行標準化。常見的標準化方法有min-max標準化和Z-score標準化等。

3.2數據的標準化:

為了將自變量進行min-max標準化,使用min_max_normalize函數。該函數輸入為數值型向量x,對于x中的每一個取值,減去x的最小值,再除以x中數值的取值范圍。結果如下可見所有的變量都已經正確地標準化到0和1之間:

四、模型性能提升

4.1 測試不同k取值對模型效果的影響

我們將分別測試 k = 1,5,9,11時模型的效果。由于模型整體預測準確率已經很高。我們通過觀察假陰性(False Negative)和假陽性(False Positive)的數目和正確率(Accuracy)來對比不同k取值下模型的效果。

可見,當 k = 5 時,假陽性數量最少,且假陰性數量僅為1,正確率達到最高。當然,這也只是在171個測試樣本上的結果。

參考文獻

[1]MOURADC,LOPEZMA G.An evaluation of imagedescriptors combined with clinical data for breast cancer diagnosis [J].Intemational Joumal of computer Assisted Radiology and Surgery,2013,8(4):561-57.

[2]張旭東,孫圣力,王洪超.基于數據挖掘的觸診成像乳腺癌智能診斷模型和方法[J].大數據,2019,5(01):68-76.

[3]侯公楷.中醫藥防治乳腺癌進展[J].遼寧中醫藥大學學報,2016,18(05):249-253.

(作者單位:河北大學 生命科學學院)

猜你喜歡
數據挖掘標準化乳腺癌
絕經了,是否就離乳腺癌越來越遠呢?
中老年保健(2022年6期)2022-08-19 01:41:48
標準化簡述
探討人工智能與數據挖掘發展趨勢
乳腺癌是吃出來的嗎
胸大更容易得乳腺癌嗎
別逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
標準化是綜合交通運輸的保障——解讀《交通運輸標準化體系》
中國公路(2017年9期)2017-07-25 13:26:38
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數據挖掘云服務及應用
論汽車維修診斷標準化(上)
主站蜘蛛池模板: 东京热av无码电影一区二区| 女人18毛片一级毛片在线 | 欧美久久网| 国产精品观看视频免费完整版| 国产手机在线ΑⅤ片无码观看| 99久久国产综合精品2023| 三上悠亚一区二区| 国产成人乱码一区二区三区在线| 久久毛片免费基地| 亚洲精品免费网站| 国产女主播一区| 亚洲伦理一区二区| 在线无码九区| 亚洲精品中文字幕午夜| 99视频在线观看免费| 欧美a在线看| 粉嫩国产白浆在线观看| 国内精品视频区在线2021| 亚洲无码91视频| 亚洲日韩在线满18点击进入| 国产91视频免费| 天天干天天色综合网| 国国产a国产片免费麻豆| 99草精品视频| 视频二区亚洲精品| 第九色区aⅴ天堂久久香| 亚洲综合久久一本伊一区| 日韩a在线观看免费观看| 高潮毛片免费观看| 高清欧美性猛交XXXX黑人猛交| 久久香蕉国产线看观看亚洲片| 不卡午夜视频| 婷婷六月综合网| 国产日韩欧美精品区性色| 日韩成人在线视频| yjizz国产在线视频网| 四虎影视无码永久免费观看| 色香蕉网站| 国产91av在线| 欧美日韩成人在线观看| 色色中文字幕| 亚洲婷婷在线视频| 欧类av怡春院| 亚洲一区二区精品无码久久久| 波多野结衣AV无码久久一区| 丁香五月激情图片| 国产情精品嫩草影院88av| 亚洲天堂精品视频| 亚洲黄色成人| 国内精品手机在线观看视频| 香蕉综合在线视频91| 久久大香伊蕉在人线观看热2| 国产一区二区精品福利| 91视频区| 国产美女自慰在线观看| 欧美一区二区三区国产精品| www.99在线观看| 五月婷婷精品| www.99在线观看| 亚洲黄网在线| 超碰aⅴ人人做人人爽欧美| 91国内视频在线观看| 国产精品yjizz视频网一二区| 国产网站一区二区三区| 无码在线激情片| 午夜精品区| 国产精品自在线拍国产电影| 97久久人人超碰国产精品| 日本人妻一区二区三区不卡影院| 国产内射一区亚洲| 久久无码av一区二区三区| 无码高潮喷水专区久久| 怡春院欧美一区二区三区免费| 一级毛片免费的| 亚洲精品欧美日本中文字幕| 免费看av在线网站网址| 在线观看热码亚洲av每日更新| 国产xx在线观看| 国产成人精品男人的天堂下载| 国产视频a| 国产一区二区三区精品久久呦| 在线精品视频成人网|