999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

病理圖像紋理分析在胃癌MSI預測中的應用研究

2021-12-21 13:54:32安衛超
計算機工程與應用 2021年24期
關鍵詞:胃癌特征模型

安衛超,閻 婷,張 楠,張 杉,相 潔,曹 銳,王 彬

1.太原理工大學 信息與計算機學院,山西 晉中030600

2.山西醫科大學 轉化醫學研究中心,山西 晉中030600

胃癌是全球最常見的惡性腫瘤之一,2018年全球胃癌新發病例1 033 701例,占全球癌癥新發病例的5.7%,死亡782 685例,占全球癌癥死亡病例的8.2%,在全球癌癥發病率中位居第五,死亡率位居第三,且死亡率和發病率均無下降趨勢[1]。由于癌癥的異質性,胃癌的表型復雜多樣,使得癌癥的診斷和治療更為困難。

微衛星不穩定性是由DNA錯配修復受損而導致的一種特殊癌癥表型,是基因組中短重復序列超變異性的一種形式,其特征是由于DNA聚合酶滑移和單核苷酸變異(SNVs)頻率的升高而導致微衛星重復的廣泛長度多態性[2],研究表明,MSI型胃癌約占胃癌患者的15%,這些患者更容易從免疫療法中獲益[3]。MSI型胃癌患者有其獨特的臨床特征,例如:彌散型癌組織基因組更不穩定、發病部位常見于腫瘤組織遠端、腫瘤類型多為Borrmann3型等;MSI型胃癌患者通常具有良好的總體長期預后,與同期的MSS型胃癌患者相比,MSI型胃癌患者生存率較高;且從癌前到發病,MSI逐漸累積增加[4-7]。因此,MSI檢測對胃癌的早期診斷和篩查,延長胃癌患者的預后,輔助胃癌治療的臨床決策有重要意義。主流的MSI檢測方法主要有兩種:免疫組織化學(Immunohistochemistry,IHC)和聚合酶鏈式反應(PCR)[8];IHC是通過檢測錯配修復基因的表達情況來反應MSI狀態,PCR則是通過特定的單核苷酸位點的基因標記進行遺傳分析;但無論是IHC還是PCR檢測手段均需要在大容量的三級醫療中心進行,且需要較高的經濟和時間成本,在臨床實踐中難以推廣至每一個患者[9]。因此,無法為大量潛在的免疫療法敏感者提供及時的免疫檢查點抑制劑治療,從而喪失了控制疾病的機會。

病理組織學是癌癥診斷和預測的重要工具,它的表型信息反應了分子改變對癌細胞行為的綜合影響,并為評估疾病的進展情況提供了直接的可視化的工具。組織病理學家可以通過評估細胞密度、組織結構、有絲分裂狀態等組織學特征來對病變進行分類和分級。隨著顯微鏡成像技術和計算機技術的進步,基于病理圖片的輔助診斷模型發展迅速。其中,圖像紋理分析用于病理圖像的紋理特征提取,用于癌癥的分級[10-11]、分類[12-15]和預測。例如,Belsare等人[16]通過提取乳腺癌患者組織病理圖像的灰度共生矩陣(GLCM)、圖游程長度矩陣(GRLM)和歐拉數等紋理特征,使用線性判別分類器(LDA)對圖像組織學圖像進行分類,對惡性和非惡性如下組織病理圖像的分類準確率分別為80%和100%;Hamidreza等人[17]通過提取軟組織肉瘤的三組紋理特征:灰度共生矩陣(GLCM)、灰度游程長度矩陣(GLRLM)和局部二值模式(LBP)進行紋理分析,實現了軟組織肉瘤的轉移和壞死預測。Nicolas等人[18]訓練了一個深層卷積神經網絡,可以通過組織病理圖像準確地區分肺癌的兩種亞型:腺癌(LUAD)和鱗狀細胞癌(LUSC),還能確定細胞中與肺癌相關的六種基因的突變情況。Andrew等人[19]建立了融合多個殘差網絡的統計模型,可以從標準蘇木精和曙紅染色后的組織病理圖像中精準預測前列腺癌患者Speckle-type POZ基因的突變狀態。

本文提出一種基于組織病理圖像紋理特征的胃癌MSI預測方法,針對腫瘤的異質性,從胃癌組織病理圖像中提取定量的圖像特征,使用Lasso回歸構建預測標簽,將預測標簽作為獨立的預測因子,結合患者的臨床特征,通過logistics回歸進行多變量分析構建預測模型,繪制個性的列線圖,為胃癌患者MSI預測提供了有力工具。方法流程如圖1所示。

圖1 胃癌MSI預測模型構建過程Fig.1 Construction process of MSI prediction model for gastric cancer

1 數據和方法

1.1 病人數據

本文所用胃癌組織病理圖像均來自TCGA數據庫。為有效利用所得數據對胃癌患者的MSI狀態進行預測,本研究對收集到的數據制定了三個納入標準:(1)病理圖像染色均勻、成像清晰、無組織粘連;(2)具有統一完整的個人基本信息及臨床特征;(3)具有明確的MSI狀態信息。經篩選,共有277個病例樣本符合入組標準。

1.2 數據預處理

為保證實驗的有效性,得到有價值的結果,需要解決樣本不均衡問題。采用上采樣的方式擴充少數類樣本:對于MSI型的病例,針對每例患者的組織病理圖像選取多個ROI,每個ROI作為獨立的樣本,上采樣后的數據集共有442例樣本。

將所得樣本按照3∶1的比例隨機劃分為訓練集和驗證集:訓練集共有樣本313例,其中MSI型156例,MSS型157例;驗證集共有129例樣本,其中MSI型64例,MSS型65例。

1.3 圖像分割

為了確保所得圖像特征的準確性并降低計算復雜度,在進行圖像特征提取之前需要對組織病理圖像進行分割。為得到最具代表性的病灶區域,在一名具有豐富組織病理圖像檢測經驗的主任醫師指導下對腫瘤區域進行標注,并通過另一名專家對標記的病灶區域進行驗證,最終分割得到全部組織病理圖像的ROI。

1.4 特征提取

本研究從分割所得ROI的原始圖像和經過wavelet濾波后的圖像中共提取到445個圖像特征,可以分為兩類,每類6組:一階統計量(First order statistics)、灰度共生矩陣(GLCM)、灰度大小區域矩陣(GLSZM)、灰度游程長度矩陣(GLRLM)、相鄰灰度色調差異矩陣(NGTDM)、灰度依賴矩陣(GLDM)。

First order statistics通過常用統計指標來描述感興趣區域內的像素強度分布。GLCM是描述圖像灰度的空間相關特性的二階聯合概率函數,通過計算GLCM得到矩陣的部分特征值,用以表示圖像的紋理特征,能夠反應圖像灰度關于方向、相鄰間隔、變化幅度的綜合信息。GLSZM用于量化圖像中的灰度級區域,灰度級區域定義為共享相同灰度級強度的已連接像素的數量。GLRLM用于量化灰度游程,灰度游程被定義為具有相同灰度值的連續像素的長度。NGTDM通過灰度等級的絕對差之和反應相鄰像素的平均灰度值之間的差異。GLDM可以量化圖像中的灰度依賴性,灰度依賴性定義為距離δ內依賴于中心像素的連通體像素的數量。

本研究從First order statistics中提取了18種特征,主要包括熵、總能量、平均絕對偏差、偏度等;從GLCM中提取了22種特征,主要包括自相關、聯合海損、群集陰影、群集傾向等;從GLSZM中提取了16種特征,主要包括灰度不均勻歸一化、區域大小不均勻、區域百分比、尺寸區域非均勻性標準化等;從GLRLM中提取了16種特征,主要包括游程熵、游程差異、灰度方差、游程非均勻標準化等;從NGTDM中提取了5種特征,主要包括粗糙度、對比度、復雜度、強度;從GLDM中提取了14種特征,主要包括依賴熵、依賴非均勻性、依賴非均勻性標準化、依賴方差等。

1.5 特征選擇

為降低模型復雜度,防止過擬合,在建模之前本文使用Lasso方法對特征進行選擇。Lasso為改進傳統的線性回歸方法提供了新的視角,在普通線性回歸算法的基礎上加入L1懲罰項,使線性回歸參數具有稀疏性,從而使得到的模型具有良好的預估性,所選擇的特征與預測標簽更相關。

對于給定樣本的特征向量xi(i=1,2,…,N),xi∈Rn,Lasso回歸的目標函數為:

其中,y是樣本的標簽,α={aj}是回歸參數。為獲得最佳回歸參數,將目標函數最小化問題轉化為以下子問題:

其中:

使用近端梯度下降(Proximal Gradient Descent)[20]算法對式(3)進行迭代求解;使用軟域函數對式(2)求解,最終求解方法如下:

通過上述算法,最終獲得稀疏后的特征矩陣,用于構建分類模型。

1.6 預測標簽構建

本研究應用稀疏后的特征值及其回歸系數構建樣本的預測標簽,公式如下:

其中,Featurei為樣本特征向量的第i個特征值,αi為該特征值對應的回歸系數。

將Risk-score作為獨立的預測指標,與樣本的臨床特征相結合,構建logistics回歸模型,繪制個性化列線圖。并通過C指數、AUC值、校準曲線和決策曲線評價模型的預測性能。

2 實驗結果分析

2.1 臨床特征

本研究所用組織病理圖像來自277例胃癌患者,包括55例MSI型胃癌患者和222例MSS型胃癌患者,其中,男性患者188例,女性患者89例,中位年齡67.64歲(33~90歲),MSI型患病率為19.85%(55/277)。根據MSI狀態將胃癌患者分為兩組,經過T檢驗,MSI型患者與MSS型患者在性別、年齡、TNM分期方面的差異有顯著統計學意義,患者的臨床特征如表1所示。

表1 患者的臨床特征Table 1 Clinical features of patient

2.2 圖像特征篩選和預測標簽構建

基于MSI狀態,應用Lasso回歸在訓練集上對圖像特征進行篩選,圖2(a)顯示了二項式誤差分類點與logλ的關系,其中最小二項式誤差分類點表示保留的最佳特征數量適合模型?;谧钚蕜t和1個標準誤差標準,通過10倍交叉驗證,以最佳λ值繪制虛線垂直線。圖2(b)顯示了圖像特征的Lasso系數曲線。

圖2 Lasso回歸過程Fig.2 Lasso regression process

Lasso回歸的結果如表2所示,最終篩選得到9個系數不為零的特征,包括基于原始圖像4個圖像特征,和基于小波濾波后的5個圖像特征。通過式(6)計算出樣本的Risk-score。將9個圖像特征與MSI狀態進行單因素方差分析,P值均小于0.001,表明篩選所得特征與胃癌患者的MSI狀態顯著相關。

表2 Lasso回歸結果Table 2 Result of Lasso regression

2.3 預測準確性驗證

基于所選圖像紋理特征和Logistics回歸,使用訓練集構建了MSI預測性分類模型。如圖3所示,在ROC曲線分析中,AUC值為0.75。然后將該模型應用于驗證集,可以有效預測MSI狀態,在ROC曲線分析中,AUC值為0.74。因此,構成模型的9個特征被證明是與胃癌患者MSI狀態相關的組織病理圖像特征。表3給出了分類模型各項評價指標的結果。

表3 模型評價結果Table 3 Evaluation results of model

圖3 訓練集和測試集的ROC曲線Fig.3 ROC curves for training sets and test sets

2.4 列線圖的構建和評價

為體現預測模型的臨床價值,本研究在全部數據集上分別構建了基于臨床特征的列線圖和加入Risk-score后的列線圖用于預測胃癌患者的MSI狀態。如圖4所示。

圖4 列線圖對比Fig.4 Nomogram comparison

該列線圖包括性別、年齡、TNM分期和Risk-score,允許用戶獲得對應于患者協變量組合的MSI狀態預測概率。例如,定位患者的TNM分期軸,在該軸上畫一條垂線,以確定與該TNM分期對應的預測分數。對每個變量重復此過程,并將每個協變量的得分相加,將總分對應得到預測概率,以此來實現胃癌患者的MSI狀態預測。

分別應用一致性指數(index of concordance,C-index),AUC和校準曲線來評估列線圖的預測性能。AUC值在加入Risk-score前后分別為0.696和0.802;一致性指數如表4所示,在加入Risk-score后,C-index的值由0.69提升至0.80;校準曲線如圖5所示,虛線表示理想的預測狀態,結果表明加入本研究構建的預測標簽后校準曲線擬合更優。

表4 預測模型C-index評價Table 4 C-index evaluation of prediction model

圖5 校準曲線對比Fig.5 Calibration curve comparison

為進一步驗證預測模型的臨床實用性,通過決策曲線分析,量化凈收益來評估基于病理圖像紋理特征的列線圖的臨床應用價值。如圖6所示,在整個風險閾值區間內,加入Risk-score后的預測模型獲得了更大的凈收益。該結果表明加入Risk-score的列線圖具有更大的臨床應用潛力。

圖6 決策曲線對比Fig.6 Decision curve comparison

2.5 與其他MSI預測研究的對比

為了進一步驗證模型的性能,對比了其他關于MSI預測的研究,對比結果如表5所示。Fan[21]通過提取CT圖像的形態、紋理、Gabor小波等放射組學特征,結合臨床特征,使用Lasso和樸素貝葉斯分類器開發了三個預測模型用于MSI的預測,單獨使用臨床特征的模型AUC值為0.598,單獨使用放射組學特征的模型AUC值為0.688,聯合放射組學和臨床特征的模型AUC值為0.752,與提出的MSI預測模型的分類性能有較大差距。Wang[22]通過組織病理圖像的切片訓練了一個ResNet-18網絡,得到患者MSI狀態的似然分布,生成斑塊似然直方圖特征,使用XGboost分類器對患者的MSI狀態進行預測,得到的模型在訓練集上AUC值為0.93,測試集為0.73,存在較明顯的過擬合現象。

3 討論

本文提出了一種基于胃癌組織病理圖像紋理特征的MSI預測方法,提取原始圖像的GLCM、GLSZM、GLRLM等紋理特征,以及經過wavelet變換后的紋理特征。使用Lasso回歸進行特征選擇,得到9個與胃癌患者MSI狀態最相關的紋理特征,基于這些紋理特征構建了胃癌的MSI預測標簽,并在訓練集和驗證集上對預測標簽分類性能進行驗證,AUC值分別為0.75和0.74,該結果表明提出的預測標簽對胃癌患者的MSI狀態有較好的區分度。

結合臨床特征與本文提出的預測標簽構建了胃癌MSI預測模型,與基于臨床特征的預測模型相比,在加入本文提出的預測標簽后,模型的AUC值從0.696提升至0.802。為了進一步驗證本文提出的預測標簽的有效性和預測模型的臨床價值,分別對加入預測標簽前后的預測模型進行校準曲線,C-index值和決策曲線評價,結果顯示在加入本文提出的預測標簽后,C-index值和校準曲線表現有明顯提升,決策曲線分析也顯示出更大的凈收益。

與傳統的MSI檢測方法相比,利用機器學習技術基于容易獲得的組織病理圖像直接預測胃癌患者的MSI狀態,無需額外的實驗室進行基因檢測和免疫組織化學分析,可以以較低的成本實現MSI狀態的預測。

與基于CT圖像的計算機輔助MSI預測方法相比,考慮到不同掃描儀和成像方案在放射學特征可重復性方面的潛在差異[23],而H&E染色的組織病理圖像的成像更為穩定[24],這可能是本文提出的MSI預測模型性能優于Fan[21]的原因。與Wang[22]提出的方法相比,本文方法在基于組織病理圖像紋理特征的預測模型上展現出了相近的性能,但Wang[22]在模型構建過程存在較為明顯的過擬合,且沒有充分利用患者的臨床數據,而將患者的組織病理圖像特征與臨床特征相結合構建的列線圖預測模型可以實現個性化的MSI狀態預測。

4 結束語

本研究提出并驗證了基于組織病理圖像的胃癌MSI預測方法,能夠有效預測胃癌患者的MSI狀態,為MSI的普遍篩查提供了可能,有潛力使更多的胃腫瘤患者在免疫治療中獲益。

猜你喜歡
胃癌特征模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
P53及Ki67在胃癌中的表達及其臨床意義
胃癌組織中LKB1和VEGF-C的表達及其意義
胃癌組織中VEGF和ILK的表達及意義
主站蜘蛛池模板: 麻豆精品视频在线原创| 91丝袜乱伦| 亚洲欧美精品在线| 国产主播喷水| 一级看片免费视频| 国产精品无码制服丝袜| 色妺妺在线视频喷水| 美女视频黄又黄又免费高清| 婷婷色中文| 精品人妻一区无码视频| 亚洲AV无码久久天堂| 久久国产毛片| 亚洲无码日韩一区| 国产小视频a在线观看| 国产av无码日韩av无码网站| 2048国产精品原创综合在线| 国产一区二区三区精品欧美日韩| 久久精品国产精品青草app| 人妻无码中文字幕第一区| 国产精品无码AⅤ在线观看播放| 日韩福利在线观看| 伊人色综合久久天天| a毛片免费看| 日韩午夜伦| 又黄又爽视频好爽视频| 久久这里只精品热免费99| 国产一区二区三区免费观看| 99视频只有精品| 色135综合网| 亚洲福利视频网址| 久久一日本道色综合久久| 欧美日韩资源| 日韩精品无码免费一区二区三区| 国国产a国产片免费麻豆| 中文字幕日韩久久综合影院| 亚洲成人网在线播放| 国产成人啪视频一区二区三区| 精品国产自在在线在线观看| 久久精品国产999大香线焦| 无码免费试看| 99re这里只有国产中文精品国产精品| 国产精品lululu在线观看| 国产网站在线看| 自拍亚洲欧美精品| 亚洲成人77777| 欧洲高清无码在线| 欧美有码在线观看| 欧美在线三级| 久久久久国色AV免费观看性色| 国产www网站| 熟女成人国产精品视频| 亚洲午夜福利精品无码不卡| 亚洲欧洲日韩久久狠狠爱| 欧美亚洲国产视频| 999在线免费视频| 白丝美女办公室高潮喷水视频| 粉嫩国产白浆在线观看| 中文字幕不卡免费高清视频| 538国产视频| 无码专区第一页| 亚洲Aⅴ无码专区在线观看q| 成人国产精品网站在线看| 依依成人精品无v国产| 久久一日本道色综合久久| 国产精品视频观看裸模 | 午夜视频www| 亚洲无码91视频| 狠狠干综合| 国产一区二区三区在线无码| 亚洲色图欧美激情| 国产熟女一级毛片| 国产91特黄特色A级毛片| 免费啪啪网址| 五月天婷婷网亚洲综合在线| 国产系列在线| 91娇喘视频| 色香蕉影院| 国产高清毛片| 国产不卡在线看| 伊人精品成人久久综合| 久久久久久国产精品mv| 在线观看欧美国产|