999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于乳腺X線圖像紋理特征建立機器學習模型在鑒別良惡性乳腺腫塊中的價值

2021-04-26 01:43:42黃櫟有高先聰尤傳文
放射學實踐 2021年4期
關鍵詞:特征模型研究

黃櫟有, 高先聰, 尤傳文

圖1 女,80歲,右乳乳頭狀癌。a)右側(cè)乳腺CC位X線圖像,顯示乳腺內(nèi)橢圓形病灶,大部分邊界較清晰;b)手動勾畫ROI(紅色區(qū)域)后的圖像。 圖2 女,52歲,左乳纖維腺瘤。a)左側(cè)乳腺CC位X線圖像,顯示乳腺內(nèi)不規(guī)則形病灶,部分邊界欠清晰;b)手動勾畫ROI(紅色區(qū)域)后的圖像。

乳腺癌作為發(fā)病率最高的女性惡性腫瘤,目前已成為我國45歲以下女性死亡率最高的惡性腫瘤之一[1]。盡早發(fā)現(xiàn)和診斷可以有效提高乳腺癌患者的生存率[2]。目前,乳腺X線檢查在良惡性乳腺腫塊的鑒別診斷中已得到廣泛的臨床應用,但僅憑對形態(tài)學特征的主觀分析來鑒別腫塊良惡性仍存在較大困難。紋理分析能夠提取并定量分析圖像中的紋理特征參數(shù),提供圖像中肉眼無法觀察到的潛在信息[3]。而機器學習作為一種人工智能算法,可以利用紋理分析提供的紋理特征參數(shù)建立疾病的分類模型。目前基于機器學習的紋理分析的相關研究已越來越多[4-6]。本研究擬探討基于乳腺X線圖像紋理特征所建立的機器學習模型在鑒別乳腺腫塊良惡性中的應用價值。

材料與方法

1.研究對象

回顧性搜集2017年1月-2019年12月在本院行乳腺X線檢查且經(jīng)病理證實的243例乳腺腫塊患者(263個病灶)的病例資料。所有患者為女性,年齡21~82歲,平均(50.4±15.41)歲。良性腫塊患者106例共腫塊124個,包括纖維腺瘤77例(95個腫塊)、乳腺病29例(29個腫塊);惡性腫塊患者137例共139個腫塊,包括浸潤性導管癌122例(124個腫塊)、導管內(nèi)癌7例(7個腫塊)、乳頭狀癌4例(4個腫塊)、黏液腺癌4例(4個腫塊)。納入標準:①有明確的病理和臨床診斷結果;②腫塊內(nèi)無明顯鈣化或空洞;③腫塊直徑0.5~3.0 cm。

2.檢查方法

使用HoLogic Inc. Lorad公司Selenia新型數(shù)字化乳腺X光機。常規(guī)攝取內(nèi)外側(cè)斜位(mediolateral oblique,MLO)和頭尾位(cranial caudal,CC)X光片。選用Auto-Filter曝光模式,25~30 kV,75~95 mAs,圖像大小24 cm×29 cm。

3.建立機器學習模型

選擇圖像:由2位具有5年以上乳腺X線診斷經(jīng)驗的放射科醫(yī)師采用盲法對每例患者的MLO及CC圖像進行比較,選取腫塊顯示較清晰的圖像用于紋理分析。當兩位醫(yī)師的意見不同時,經(jīng)商議達成一致。將選定的圖像以bmp格式保存至電腦。

圖像分割及特征提取:采用MaZda軟件對圖像進行后處理。為降低對比度和亮度對圖像灰度值可能帶來的影響,在軟件中選擇μ±3σ選項對每幀圖像進行灰度歸一化處理。由一位診斷醫(yī)師在每個腫塊灶內(nèi)進勾畫ROI(圖1、2)。MaZda軟件提供6種紋理分析方法:①灰度直方圖;②灰度絕對梯度;③游程矩陣;④灰度共生矩陣;⑤自回歸模型;⑥小波變換。每個病灶共提取133個紋理特征,詳見表1。

圖3 RF模型中紋理特征重要性排序的線條圖。

表1 紋理特征列表

機器學習模型的建立及驗證:利用R語言(V3.5.1)的caret軟件包對數(shù)據(jù)進行處理和建模。首先,對提取到的紋理特參數(shù)進行初步降維,然后利用遞歸特征刪減法進行特征選擇,得到最終用于訓練模型的紋理特征參數(shù)。將處理后的所有數(shù)據(jù)分為訓練集和驗證集兩組,按照7﹕3的比例進行隨機分配。利用訓練集數(shù)據(jù)分別訓練獲得線性判別分析(linear discriminant analysis,LDA)、Logistic回歸(logistic regression,LR)、隨機森林(random forest,RF)和支持向量機(support vector machine,SVM)四種模型。其中LDA模型的k值為7時模型的精度最高,RF模型在決策樹為500、2叉樹變量樹為2時模型的精度最高。將訓練集獲得的4種模型分別在驗證集中進行驗證。

本研究分別通過符合率、Kappa系數(shù)以及ROC曲線下面積(area under the curve,AUC)對模型在訓練集和驗證集中的診斷效能進行評價,其中訓練集采用10折交叉驗證后所獲得的符合率、Kappa系數(shù)和AUC。通過Delong法比較驗證集中不同模型之間AUC的差異。以P<0.05為差異有統(tǒng)計學意義。

結 果

1.紋理特征的選擇結果

通過對133個紋理參數(shù)進行降維處理,篩選得到33個紋理特征。然后通過特征選擇,最終將22個紋理特征分別納入4個模型中進行建模,其中預測精度最高的5個自變量為梯度峰度、高高頻小波轉(zhuǎn)換系數(shù)S6、偏斜度、長游程補償和梯度偏斜度。

2.機器學習模型效能的評價

四種機器學習模型在訓練集和驗證集中的符合率、Kappa系數(shù)和AUC值見表2。訓練集中以RF模型的診斷效能最好,診斷符合率、Kappa系數(shù)和AUC值均高于其它3種模型;SVM模型的診斷效能次之。驗證集中以RF模型的符合率、Kappa系數(shù)和AUC值最高。

表2 機器學習模型ROC分析結果

通過Delong法比較4種模型間AUC的差異,結果見表3。RF模型與LDA、LR模型的AUC的差異有統(tǒng)計學意義(P<0.05),與SVM模型的AUC的差異無統(tǒng)計學意義(P>0.05)。其余各模型間AUC的差異無統(tǒng)計學意義(P>0.05)。RF模型中各項自變量的重要性排序見圖3,其中重要性排名前5的紋理特征為長游程補償、梯度峰度、偏斜度、高高頻小波轉(zhuǎn)換系數(shù)S6和峰度。

表3 四個模型間AUC的比較

討 論

乳腺X線攝影作為乳腺癌首選的檢查方法之一,對鈣化灶具有很強的分辨力。但對于軟組織結節(jié)和腫塊,其診斷能力有限。目前,已有研究結果顯示通過提取乳腺X線圖像的紋理特征建立預測模型,可以輔助并提高對乳腺病灶良惡性診斷的準確性[7-8]。但上述研究采用的模型算法并不統(tǒng)一,且未對不同建模算法的準確性進行對比分析。

本研究探討了乳腺X線圖紋理像特征建立機器學習模型在鑒別乳腺腫塊良惡性中的價值。研究發(fā)現(xiàn)4種預測模型的準確率均超過74%,AUC值均大于0.79,表現(xiàn)出良好的準確率和診斷效能。該結果與既往研究相符。在此基礎上本研究通過準確率、Kappa值以及AUC值分別對4種不同模型算法的表現(xiàn)進行比較。其中準確率是指樣本中正確分類的樣本數(shù)的百分比。Kappa值反映了分類精度的一致性。AUC值反應了模型的診斷效能。研究發(fā)現(xiàn)RF模型在訓練集與驗證集中準確率、Kappa值和AUC均高于其它模型。其中RF模型在驗證集中的準確率為94.8%,Kappa系數(shù)為0.896,AUC值為0.946。其與LDA模型、LR模型間AUC值差異具有統(tǒng)計學意義。RF模型在本研究中表現(xiàn)出高準確性、高度的分類一致性和顯著的診斷效能,提示RF模型在鑒別乳腺腫塊良惡性中最具潛力。RF模型作為一種用隨機方式建立的包含多個決策樹的分類器,具有可以處理高緯數(shù)據(jù)、模型泛化能力強、抗過擬合能力強以及魯棒性等優(yōu)點[9]。因此,RF模型可以基于圖像紋理特征參數(shù)訓練出較為穩(wěn)定的模型。

SVM模型的符合率和Kappa系數(shù)僅次于RF模型,驗證集中AUC值高于LDA和Logistic回歸模型,但差異不具有統(tǒng)計學意義。SVM模型通過尋找對空間劃分的最優(yōu)超平面,對特征空間進行分類。其具有不依賴數(shù)據(jù)維度、要求樣本量小和分類思想簡單等特點[10]。本研究中,LDA和Logistic回歸模型的表現(xiàn)要遜于RF和SVM模型。LDA模型本質(zhì)是將初始樣本映射到維度更低的樣本空間中進行類別輸出。LDA模型對非高斯分布的樣本及在樣本分類信息依賴方差時表現(xiàn)較差,且容易出現(xiàn)過擬合。Logistic回歸模型作為被廣泛應用的一種廣義線性回歸模型,存在對連續(xù)變量異常值較敏感的問題,其預測結果嚴重依賴數(shù)據(jù)質(zhì)量[4]。但相比屬于黑箱算法可解釋性差的RF和SVM模型,Logistic回歸模型的結果具有較強的可解釋性。因此,在疾病診斷中仍具有重要價值。近年來,利用機器學習模型預測疾病類型以及預后的研究越來越多。彭濤等[5]發(fā)現(xiàn)RF模型在多參數(shù)MRI診斷前列腺癌中表現(xiàn)最好,SVM模型次之;李琳等[11]研究發(fā)現(xiàn)RF與SVM模型對原發(fā)性肝癌的預后預測中優(yōu)于Logistic回歸模型。本研究結果與之相似。

RF模型支持對參數(shù)重要性的排序。結果顯示重要性排在前5位的紋理參數(shù)分別為長游程補償、梯度峰度、偏斜度、高高頻小波轉(zhuǎn)換系數(shù)S6以及峰度。游程矩陣反映了具有特定灰度值的像素在既定方向上出現(xiàn)的頻數(shù),長游程補償值越小表明圖像紋理越不均勻。峰度表示的是直方圖的銳度。偏斜度為直方圖的不對稱性的度量方法。高高頻小波轉(zhuǎn)換系數(shù)反應了圖像的細節(jié)及清晰度。以上紋理特征均被研究證明在對鑒別腫瘤的良惡性中存在價值[12-13]。

本研究的局限性:①本研究為回顧性單中心研究,且樣本量相對較少,研究結果可能存在一定偏倚;②ROI為人工勾畫,因此紋理特征的提取結果可能受到人為因素的影響;③本研究僅討論了4種模型算法,需對更多的模型算法做進一步的對比研究。

綜上所述,基于乳腺X線圖像紋理特征的機器學習模型在鑒別乳腺腫塊的良惡性中具有一定優(yōu)勢,其中RF模型表現(xiàn)出較好的分類性能,SVM模型的表現(xiàn)僅次于RF模型。

猜你喜歡
特征模型研究
一半模型
FMS與YBT相關性的實證研究
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
EMA伺服控制系統(tǒng)研究
抓住特征巧觀察
主站蜘蛛池模板: 91亚洲影院| 伊人国产无码高清视频| 国产高清又黄又嫩的免费视频网站| 在线国产欧美| 国产精品yjizz视频网一二区| 精品国产成人三级在线观看| 青青青草国产| 亚洲成人免费在线| 国产成人禁片在线观看| 国产福利小视频在线播放观看| 国产熟女一级毛片| 99精品视频九九精品| 日日噜噜夜夜狠狠视频| 亚洲第一福利视频导航| 黄片一区二区三区| 国产第一色| 亚洲人成影院在线观看| AV网站中文| 亚洲AⅤ波多系列中文字幕| 免费无码AV片在线观看国产| 人妻免费无码不卡视频| 亚州AV秘 一区二区三区| 无码精品国产dvd在线观看9久| 国产精品自在拍首页视频8| 国产无码精品在线| 日韩在线播放中文字幕| 六月婷婷激情综合| 亚洲无码精品在线播放| 青青青亚洲精品国产| 欧洲免费精品视频在线| 美女亚洲一区| 亚洲欧洲自拍拍偷午夜色| 麻豆精品在线| 992tv国产人成在线观看| 国产美女精品人人做人人爽| 91免费片| 亚洲香蕉久久| 青青热久免费精品视频6| 久久黄色视频影| 四虎成人精品| 国产精品亚洲欧美日韩久久| 亚洲国产综合精品一区| 国产玖玖视频| 亚洲成人高清在线观看| 福利在线免费视频| 国产第八页| 国产日韩精品欧美一区灰| 国产情侣一区二区三区| 欧美国产综合色视频| 国产乱子伦精品视频| 青青青国产视频手机| 综合人妻久久一区二区精品| 久久动漫精品| 九色91在线视频| 9966国产精品视频| 亚州AV秘 一区二区三区| 久久一级电影| 青青国产视频| 丰满人妻久久中文字幕| 中文字幕亚洲第一| 婷婷六月综合网| 欧洲欧美人成免费全部视频| 99久视频| 99精品在线看| 欧美亚洲国产视频| 91欧美在线| 国产日本视频91| 激情亚洲天堂| 天堂亚洲网| 亚洲福利视频网址| 亚洲一级毛片免费观看| 国产在线八区| 青青热久麻豆精品视频在线观看| 天堂成人在线| 成人中文字幕在线| 国产白浆视频| 亚洲av色吊丝无码| 国产91精品久久| 欧美69视频在线| 日本欧美精品| 国产精品99在线观看| 亚洲高清在线天堂精品|