999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的乳腺癌化療預后狀態(tài)預測

2015-07-24 19:01:21賀立強王玉娟林和平
網絡安全與數據管理 2015年23期
關鍵詞:乳腺癌分類

賀立強,王玉娟,林和平

(東北師范大學 計算機科學與信息技術學院,吉林 長春 130117)

基于支持向量機的乳腺癌化療預后狀態(tài)預測

賀立強,王玉娟,林和平

(東北師范大學 計算機科學與信息技術學院,吉林 長春 130117)

乳腺癌是危害女性生命的一種惡性腫瘤。目前,在乳腺癌治療方面,新輔助化療獲得了良好的成果,使眾多女性恢復了健康。支持向量機在實際應用中有著良好的泛化和學習能力,并在商業(yè)、經濟以及醫(yī)療等領域有所應用。采用決策樹分類器和支持向量機分類器,結合乳腺癌新輔助化療隨訪記錄數據,預測乳腺癌患者新輔助化療的預后狀態(tài),實驗結果表明使用支持向量機的效果好于使用決策樹的效果,在支持向量機中使用徑向基核函數時獲得了最高的準確率,達到了84.08%,由此可見,該分類方法可能成為一種乳腺癌新輔助化療的預后狀態(tài)的有效預測工具。

乳腺癌;新輔助化療;預后;支持向量機;分類

0 引言

女性的乳房是其美麗的代言,是母性的傳承,同時也是疾病的侵擾對象。乳腺癌是女性最常見的惡性腫瘤之一,發(fā)病率正在逐年上升,且趨于年輕化,是危害女性健康的主要殺手[1]。我國乳腺癌疾病也有著不好的趨勢,其發(fā)病率和死亡率正在逐年攀升。由于受中國傳統因素的影響,婦女很少去醫(yī)院定期檢查,羞于關注乳房的健康,女性一旦發(fā)現患有乳腺腫瘤,多數已經開始轉移。由于患者的體質不同,各項指標亦不相同,如何在患者進行新輔助化療之前預測到患者的化療療效,使能進行化療的患者得到最大的受益,就變得尤為重要。本文將依據患者隨訪記錄信息,通過數據挖掘技術,對患者化療療效進行預測,為乳腺癌患者的治療提供可靠的幫助。

1 研究現狀

伴隨著社會經濟水平的逐漸提高,乳腺癌逐漸被人們重視起來,國內外學者和醫(yī)療工作者對計算機輔助治療做了大量的研究工作,并取得了一定的研究成果。然而伴隨著研究人員對乳腺癌的深入鉆研,大量的研究數據不斷涌現,臨床病例每一位患者都有著大量的檢測、治療和預后數據。患者的醫(yī)療數據信息量很大,相互之間聯系復雜,想要提取有用的信息數據,進而從信息中提取出有用的知識更是難上加難。目前我國人民思想比較傳統,乳腺癌治療與預測相對落后,計算機醫(yī)療輔助治療遠遠不如發(fā)達國家,為此,需要進一步提升我國的醫(yī)療水平。

2 支持向量機原理

支持向量機是一個被大量使用的分類技術。其具有堅實的統計學理論基礎,在商業(yè)領域、經濟領域以及醫(yī)療領域等具有很好的應用效果。支持向量機分為兩種模型,第一種是線性可分,第二種是線性不可分,第一種模型其實是第二種模型的特例[2]。

提高線性分類器的學習能力是通過核函數實現的。采用將數據映射高維空間的辦法,使線性不可分變?yōu)榭煞帧3S玫暮撕瘮涤幸韵聨追N:

(1)線性核函數

(2)徑向基核函數

(3)多項式核函數

(4)Sigmoid核函數

在實際應用中,核函數的選擇尤為重要,對于同一數據,不同的核函數所得到的分類準確率大不相同,所以核函數的優(yōu)選在支持向量機分類中顯得尤為重要。

3 應用實例

3.1 數據預處理

本文所用數據來源于吉林大學附屬醫(yī)院,該數據集是依據乳腺癌化療隨訪記錄表所獲,包含 2009年~2013年所有數據。經過與醫(yī)生的共同探討,從眾多數據中選取了 245名患者隨訪記錄,其中 180個是具有良好治療效果的記錄,65個是治療效果不理想的記錄。在新輔助化療治療下有良好效果的乳腺癌患者被定義為正樣本,在新輔助化療治療下效果不理想的患者,則定義為負樣本。所屬的分類標簽分別制定為+1和-1。每個樣本對應一個患者的醫(yī)療特征,其中每一維的特征都是根據有經驗的醫(yī)生從中提取,是能夠表現出其病情的重要特征。

考慮到支持向量機處理的數據都是實數,本文對非數值屬性進行了轉換。轉換后的數據同樣適用于本文將要對比的決策樹算法。比如患者特征中 Echogenic Halo特征包含的特征值為3個,分別為Yes,No,Unknown,則對應的數值分別為 1,2,3,但是為了防止較大數值獲得最大權重,采取了如下所示的編碼機制:

Yes(1,0,0)

No(0,1,0)

Unknown(0,0,1)

3.2 分類結果

為了使分類效果得到更好的評估,引入靈敏度(Sen)、特異度(Spe)和準確率(Q)來評價本文所使用分類器的性能,分別給出評價指標的公式如式(5)~式(7)[3]。

其中 TP是指在工作集中實際是正樣本,預測結果為正樣本的數目;FN是指在工作集中實際是正樣本,預測結果為負樣本的數目;TN是指在工作集中實際是負樣本,預測結果為負樣本的數目;FP是在工作集中實際是負樣本,預測結果為正樣本的數目[4]。

本文中所使用的數據均來自醫(yī)院真實數據,正負樣本不均衡,為了更好地評價分類器的性能,故而引入Matthews相關系數MCC。計算公式如下:

MCC的取值范圍在[-1,1]之間,取值越小說明該分類器性能越不好,反之則分類效果越好。

本文使用決策樹 C4.5算法和支持向量機算法,并結合五次交叉驗證方法來進行乳腺癌新輔助化療預后狀態(tài)的預測。預測效果如表1所示。由表1得知,使用支持向量機比使用 C4.5分類效果要好。本文還分別對比了支持向量機的三種核函數,所體現的準確率均高于決策樹的 73.47%。從中可以看出,對于本數據來說,支持向量機分類效果要明顯好于決策樹。據表中數據顯示,靈敏度明顯高于特異度,說明正樣本學習效果比負樣本學習效果要好。

本文分別對比了支持向量機的三種核函數,對于本實驗中所使用的該乳腺癌患者數據,其準確率均高于75%。支持向量機的最佳準確率為84.08%,是使用徑向基核函數得到的,明顯高于其他兩種。由此得知,對于同一數據集而言,核函數不一樣,其準確率也不一樣。想要得到高效的分類效果,必須選擇合適的核函數[5]。

本文所使用的數據集,數目有限,眾多數據中能夠起到支持向量的數據不夠充分。通過增加訓練數據,可找到更多的支持向量,進而提高分類的準確率,所以本文所采用的支持向量機方法有望成為新輔助乳腺癌患者預后預測的有效工具。

4 結論

本文使用兩種分類算法,并對其結果進行了對比,從實驗結果中可以看到,支持向量機在處理乳腺癌新輔助化療預后狀態(tài)預測方面的分類效果好于決策樹分類效果。分別比較了支持向量機三種核函數,從結果數據中可以看出,使用徑向基核函數可使分類器獲得最佳分類效果。所以在使用支持向量機進行分類的同時,選擇哪一種核函數是至關重要的。支持向量機應用于乳腺癌治療,會給乳腺癌患者帶來很大的幫助,使乳腺癌的治療越來越高效,降低死亡率,增加保乳機會,使患者早日脫離疾病的折磨,恢復健康。

表1 決策樹與支持向量機五次交叉驗證結果

[1]臧丹丹,崔穎,師建國,等.中國西部地區(qū)乳腺癌診斷年齡的抽樣分析及中美對比研究 [J].現代腫瘤醫(yī)學,2010,18(3):571-573.

[2]王平,王文劍.基于時序核函數的支持向量回歸機[J].計算機輔助工程,2006,15(3):35-38.

[3]袁前飛,蔡從中,肖漢光,等.基于支持向量機的乳腺癌預后狀態(tài)預測和療效評估 [J].北京生物醫(yī)學工程,2007,26(4):372-376.

[4]馬勝祥,馬建慶,楊明.基于核函數擬合的非平衡數據分類方法[J].計算機應用與軟件,2010,27(4):177-179.

[5]崔炳德.支持向量機分類器遙感圖像分類研究[J].計算機工程與應用,2011,47(27):189-191.

Prediction of prognosis for breast cancer based on support vector machine

He Liqiang,Wang Yujuan,Lin Heping
(School of Computer Science and Information Technology,Northeast Normal University,Changchun 130117,China)

Mammary cancer is a malignant tumor of the harm of women′s life.At present,in the treatment of mammary cancer,neo-adjuvant chemotherapy achieved good results,so that many women back to health.Support vector machine has a good generalization and learning ability in practical application,and has been applied in the commercial,economic,medical and other fields.According to Neo-adjuvant chemotherapy in mammary cancer follow-up record data,using decision tree classifier and SVM classifier,predict the prognosis of neo-adjuvant chemotherapy for mammary cancer patients,the experimental results show that the use of support vector machine is better than the effect of using decision tree,using RBF kernel function in support vector machines have the highest accuracy,reached 84.08%。Thus,the classification method,may be an effective tool to predict prognosis for mammary cancer neo-adjuvant chemotherapy.

breast cancer;neo-adjuvant chemotherapy;prognosis;support vector machine;classification

TP399

A

1674-7720(2015)23-0048-03

賀立強,王玉娟,林和平.基于支持向量機的乳腺癌化療預后狀態(tài)預測[J].微型機與應用,2015,34(23):48-50.

2015-07-15)

賀立強(1992-),男,碩士研究生,主要研究方向:人工智能、數據挖掘。

王玉娟(1987-),女,碩士研究生,主要研究方向:信息技術教學論。

林和平(1956-),男,碩士,教授,主要研究方向:人工智能、數據挖掘。

猜你喜歡
乳腺癌分類
絕經了,是否就離乳腺癌越來越遠呢?
中老年保健(2022年6期)2022-08-19 01:41:48
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
乳腺癌是吃出來的嗎
分類討論求坐標
胸大更容易得乳腺癌嗎
男人也得乳腺癌
數據分析中的分類討論
別逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
教你一招:數的分類
主站蜘蛛池模板: 在线观看亚洲成人| 午夜国产大片免费观看| 无码日韩人妻精品久久蜜桃| 本亚洲精品网站| 国产福利不卡视频| 亚洲AV一二三区无码AV蜜桃| 国产AV无码专区亚洲A∨毛片| 欧美激情第一欧美在线| 亚洲香蕉伊综合在人在线| 国产午夜福利亚洲第一| 真人免费一级毛片一区二区| 亚洲成a人片| 亚洲国产欧美目韩成人综合| 午夜啪啪福利| 丰满人妻久久中文字幕| 永久天堂网Av| 五月婷婷综合网| 精品一区二区三区无码视频无码| 精品国产美女福到在线不卡f| 思思99思思久久最新精品| 国产精品成人一区二区| 丁香婷婷综合激情| 又黄又爽视频好爽视频| 日本黄色不卡视频| 国产精品人成在线播放| 国产91全国探花系列在线播放| 久久人搡人人玩人妻精品一| 日本人妻丰满熟妇区| 精品国产香蕉伊思人在线| 欧美自慰一级看片免费| 一本无码在线观看| 人妻丰满熟妇AV无码区| 在线永久免费观看的毛片| 五月综合色婷婷| 麻豆国产精品视频| 这里只有精品在线播放| 夜色爽爽影院18禁妓女影院| 久久久久国产一区二区| 国产精品19p| 国产福利观看| 精品国产www| 国产真实乱了在线播放| 污网站免费在线观看| 亚洲成av人无码综合在线观看| 亚洲精品亚洲人成在线| 日日噜噜夜夜狠狠视频| 亚洲一区黄色| 91丝袜在线观看| 国产精品任我爽爆在线播放6080| 中文字幕永久在线看| 亚洲AV永久无码精品古装片| vvvv98国产成人综合青青| 日韩中文无码av超清| AV在线麻免费观看网站| 亚洲欧美日韩久久精品| 国产成人精品高清不卡在线| 伊人蕉久影院| 久青草免费视频| 欧美性色综合网| 夜精品a一区二区三区| 国产精品自在线拍国产电影| 中文字幕在线播放不卡| 久久综合五月婷婷| 亚洲精品在线观看91| 亚洲香蕉久久| 91破解版在线亚洲| 国产美女在线观看| 国产不卡一级毛片视频| 久久人妻系列无码一区| 国产欧美专区在线观看| 免费一级毛片完整版在线看| 久草视频福利在线观看| 国产精品天干天干在线观看 | 亚洲综合片| 欧美成人看片一区二区三区 | 91久久偷偷做嫩草影院| 在线无码九区| 国产精品无码AⅤ在线观看播放| 成人午夜在线播放| 欧美国产日韩在线观看| 九九热免费在线视频| 欧美人人干|