999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于偏最小二乘法的乳腺細胞異常檢測

2016-04-29 00:00:00朱雨晨
山東工業技術 2016年17期

摘 要:乳腺癌是女性發病率較高的惡性腫瘤之一,20世紀以來乳腺癌的發病率在世界各地均有上升的趨勢,但其病因目前尚未完全明確,所以對乳腺細胞的檢測顯得尤為重要。本文通過偏最小二乘回歸的方法,利用SIMCA-P 13.0軟件對乳腺細胞進行建模和預測,能夠較好的驗證一個乳腺細胞是否有癌變的情況。

關鍵詞:偏最小二乘法;多元分析;乳腺癌;預測

DOI:10.16640/j.cnki.37-1222/t.2016.17.260

1 引言

乳腺癌是發生在乳腺腺上皮組織的惡性腫瘤,女性乳腺是由皮膚、纖維組織、乳腺腺體和脂肪組成的乳腺并不是維持人體生命活動的重要器官,原位乳腺癌并不致命;但由于乳腺癌細胞喪失了正常細胞的特性,細胞之間連接松散,容易脫落。早期乳腺癌往往不具備典型的癥狀和體征,不易引起重視,常通過體檢或乳腺癌篩查發現。80%的乳腺癌患者以乳腺腫塊首診。患者常無意中發現乳腺腫塊,多為單發,質硬,邊緣不規則,表面欠光滑。大多數乳腺癌為無痛性腫塊,僅少數伴有不同程度的隱痛或刺痛[1]。因此對于乳腺細胞的檢查是發現乳腺癌細胞存在以及預防乳腺癌細胞擴散的一種重要手段。本文選取了良性與惡性乳腺細胞的測量值,利用偏最小二乘法對一半的數據進行建模,對另一半的數據進行預測檢驗,并選擇了一個合適的閾值來判斷其結果為良性或是惡性細胞。

2 偏最小二乘回歸

偏最小二乘回歸算法。偏最小二乘回歸偏最小二乘回歸(Partial Least-Squares Regression,PLS回歸)是一種先進的多元分析方法[2],其計算步驟如下:

(1)對自變量和因變量進行標準化處理:

(2)提取主成分,逐步回歸。記是的第一個成分,,是的第一個軸,它是一個單位向量。記是的第一個成分,,是的第一個軸,它是一個單位向量。要使得 與的相關程度到最大,則根據主成分分析,應有:,。另一方面,由于回歸建模的需求,又要求對有最大的解釋能力,根據典型相關分析,即要求和的協方差達到最大值,從而轉為求解下列優化問題,即:

由文獻[2],即求矩陣的最大特征值所對應的特征向量,然后求成分和殘差矩陣:,。其中,

。同理可求矩陣的最大特征值所對應的特征向量,如此計算下去,如果X的秩是A,則最終得到:。

3 實驗驗證

3.1 數據集介紹

本次實驗的數據集來自Wisconsin Diagnostic Breast Cancer (WDBC) [4]。該數據有569例細胞活檢案例,每個案例有32個屬性,其中包含有病人的編號和癌癥診斷結果,其他30個屬性是真實測量值。在癌癥診斷屬性中,“B”代表良性,“M”代表惡性,其他的30個屬性是由細胞核的10個特征的均值、標準差、最大值構成。

3.2 數據處理

本次實驗將良性規定為值0,將惡性規定為值1作為因變量,十個特征屬性作為自變量,選擇一半的數據(284個樣本)作為模型的建立,剩余一半(285個樣本)用來驗證,并且對數據分為兩組,良性組和惡性組,將處理好的數據導入到SIMCA-P 13中,設置好后,點擊完成。

對數據進行主成分分析,得到三個主成分。R2X代表的是從X變量中提取的主成分對X的累計解釋能力,R2Y代表的是從Y變量中提取的主成分對Y的累計解釋能力,Q2代表交叉有效性。我們以這3個主成分,繪制它的橢圓圖,可以看出所建模型使良性組和惡性組有較好的區分。另外樣本中有許多異常點,我們需要將它們去除,再次進行模型的擬合。經過多次異常點去除后,得到的點均在橢圓中。此時,R2X=0.744,R2Y=0.757,Q2=0.75。得到標準化的回歸方程為:

在VIP圖中可以看出細胞凹點、周長、半徑、面積和凹度對解釋是否癌變有著重要的作用。在數據處理完成后則可查看預測結果。在這里我們以0.5為閾值,若預測值大于0.5,則為惡性細胞,若預測值小于0.5,則為良性細胞。從而計算出在357個良性細胞中,預測出有339個良性;在212個惡性細胞中,預測出194個惡性細胞,則預測的正確率達到93.67%,能夠較好的預測出細胞是否癌變。

4 結果分析

本文利用偏最小二乘法,對多變量的乳腺細胞進行了回歸建模,較好的預測出了細胞是否癌變。從實驗數據中可以看出,細胞的半徑、質地、凹點以及周長和面積等與細胞是否癌變呈正相關,而分形維數呈負相關;有數可看出,凹點、周長、半徑、面積和凹度對預測值的貢獻度最大,而細胞的對稱性、光滑度和分形維數對預測值的貢獻度相對較小,我們在進行回歸變量的選擇時,有時可以舍棄貢獻度較小的自變量。但有關指標分析的結論基本還是定性的,只能說這些自變量的作用更大一些,并且VIP方法還有一些局限性,當自變量的貢獻度非常大時,不能說這幾個自變量就是最好的變量選擇,有時還要考慮變量之間的相關性來取舍[5]。在閾值的選擇中,我們選擇了一個較為中間的值,說服力不算太強,需要再進行多次的實驗和擬

(下轉第281頁)(上接第297頁)

合進行改進。

參考文獻:

[1]互動百科.乳腺癌. http://www.baike.com/wiki/乳腺癌. [EB/OL].2016,05(28).

[2]王惠文,吳載斌,孟潔.偏最小二乘回歸的線性與非線性方法[M].北京:國防工業出版社,2006.

[3]薛艷.偏最小二乘法在顧客滿意度評價中的運用.合作經濟與科技[J].2006(07):28-29.

[4]http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Diagnostic).

[5]周強,歐陽一鳴,胡學鋼,王浩.數據挖掘中應用偏最小二乘法發現異常值[J].微電子學與計算,2005,22(01):25-27.

作者簡介:朱雨晨(1994-),女,湖北十堰人,本科。

主站蜘蛛池模板: 国产资源免费观看| 一级毛片免费不卡在线| 国产99视频免费精品是看6| 国产午夜福利在线小视频| 在线观看视频一区二区| 天天干伊人| 嫩草国产在线| 国产精品七七在线播放| 亚洲二区视频| 亚洲国产精品美女| 在线播放国产一区| 色久综合在线| 亚洲青涩在线| 欧美三级不卡在线观看视频| 亚洲综合色婷婷| 国产精品播放| 精品91自产拍在线| 国产成人一区免费观看| 久久精品aⅴ无码中文字幕| 一区二区无码在线视频| 国产成人免费| 国产全黄a一级毛片| 亚洲第一极品精品无码| 国产成人精品亚洲日本对白优播| 91口爆吞精国产对白第三集| 国产成人免费视频精品一区二区| 找国产毛片看| 亚洲AV无码乱码在线观看裸奔| 日本手机在线视频| 91精品视频网站| 青青草一区二区免费精品| 一级一级一片免费| 尤物精品国产福利网站| 不卡无码h在线观看| 高清免费毛片| 欧美性精品| 亚洲一区精品视频在线 | 天天摸天天操免费播放小视频| 久久6免费视频| 青青青国产免费线在| 国产Av无码精品色午夜| 青青草原国产| 波多野结衣第一页| 久久精品国产电影| 亚洲无线视频| 国产精品夜夜嗨视频免费视频| 成年人福利视频| 91亚洲免费| 97视频在线观看免费视频| 99爱视频精品免视看| 国产欧美自拍视频| 中文字幕无码制服中字| 天堂岛国av无码免费无禁网站| 四虎精品黑人视频| 在线永久免费观看的毛片| 日韩av手机在线| 青草娱乐极品免费视频| 午夜天堂视频| 亚洲—日韩aV在线| 欧美一级色视频| 一级毛片网| 国产黄在线观看| 国产在线一区视频| 91丝袜美腿高跟国产极品老师| 国产理论精品| www.亚洲一区| 亚洲激情区| 爱爱影院18禁免费| 亚洲精品在线影院| 久草视频精品| 91人妻日韩人妻无码专区精品| 在线观看视频一区二区| 女人18毛片水真多国产| 无码一区18禁| 国产精品妖精视频| 尤物在线观看乱码| www.狠狠| 国产精品偷伦视频免费观看国产| 久久精品视频亚洲| 久久一本精品久久久ー99| 国产你懂得| 精品乱码久久久久久久|