999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于胸部CT影像組學的列線圖對非小細胞肺癌表皮生長因子受體基因突變的預測價值

2021-11-01 06:46:48甄濤王羅羽沈起鈞
浙江醫學 2021年19期
關鍵詞:基因突變特征模型

甄濤 王羅羽 沈起鈞

肺癌為我國常見的惡性腫瘤之一,其中非小細胞肺癌(non-small cell lung cancer,NSCLC)約占所有肺癌的85%[1-2]。目前研究發現表皮生長因子受體(epidermal growth factor receptor,EGFR)基因是驅動NSCLC發病的最常見突變基因[3]。它是一種酪氨酸激酶受體,部分靶向藥物能有效抑制其活性,例如對于EGFR基因突變相關腫瘤,吉非替尼治療有效率高達80%以上[4]。因此在靶向治療前明確腫瘤的基因型至關重要,然而并不是所有病灶都適合通過活檢來獲得有代表性的組織學標本。而且由于腫瘤的異質性,穿刺組織標本也不能完全反映病灶的表型和遺傳變異。雖然,體液檢測可以獲得血漿中的突變基因,但當腫瘤較小,沒有足夠量的DNA脫落到循環血液中時,突變基因常會被遺漏[5]。目前一些國內外研究顯示,基于胸部CT的影像組學對于EGFR基因突變狀態有一定的預測價值[5-8]。因此,筆者通過CT影像組學、圖像語義特征及臨床資料的列線圖對NSCLC EGFR基因突變狀態進行鑒別及預測,旨在為臨床診斷及治療提供更為便捷、有效的方法,現報道如下。

1 對象和方法

1.1 對象 回顧2019年1月至2020年8月杭州市第一人民醫院經手術病理檢查證實為NSCLC患者235例。納入標準:(1)術前有胸部CT檢查資料;(2)術后病理證實為NSCLC,且有EGFR基因檢查結果;(3)其他臨床資料齊全;(4)結節直徑≥0.5 cm。排除標準:(1)術前接受過放化療及靶向治療;(2)既往有肺癌病史的復發患者;(3)圖像質量不佳,影響病灶勾畫;(4)病灶貼近縱隔大血管,影響勾畫。排除無EGFR基因檢測結果52例,結節直徑<0.5 cm 5例,術前接受過治療3例,腫瘤復發5例,CT圖像質量不佳9例,結節靠近縱隔大血管8例,最終納入153例,其中男48例,女105例,年齡 29~79(59.2±10.4)歲。收集患者的年齡、性別、吸煙史、肺癌相關腫瘤指標等臨床資料。本研究經本院醫學倫理委員會批準,所有患者均簽署知情同意書。

1.2 CT檢查方法 采用美國GE Lightspeed VCT 16排螺旋CT掃描儀進行胸部掃描,準直器0.625 mm,FOV 350 mm ×350 mm,管電壓120 kV,管電流160 mAs,層厚1.25 mm。掃描圖像以DICOM格式導出。

1.3 相關圖像語義特征的定義 由2位具有5年以上呼吸系統影像診斷經驗的放射科主治以上職稱醫生分別對所有結節進行分型,包括:(1)實性結節;(2)純磨玻璃結節;(3)部分實性結節。同時描述結節是否有以下征像:(1)空氣支氣管征;(2)胸膜牽拉;(3)血管聚集;(4)毛刺征。

1.4 圖像勾畫、特征提取及篩選 先由2位具有5年以上呼吸系統影像診斷經驗的放射科主治以上職稱醫生使用軟件ITK-SNAP(Version 3.6)分別手動對術前胸部CT圖像上相應病灶進行勾畫,沿著腫瘤邊緣逐層勾畫其感興趣區域(region of interest,ROI),盡量避免周圍正常組織勾畫其中,當結節靠近胸膜時,要求勾畫距離胸膜超過1 mm,避免將胸膜勾畫其中,保存勾畫病灶的ROI。將勾畫完成的圖像導入美國GE Analysis Kit(AK)軟件進行特征提取,共提取396個特征。對2位醫生所提取的特征進行一致性分析,保留組內相關系數(intraclass correlation coefficients,ICC)≥0.75的特征,使用最小冗余最大相關算法(minimum redundancy maximum relevance,mRMR)降低之前所保留特征集的冗余度,通過最小絕對緊縮與選擇算子(least absolute shrinkage and selection operator,LASSO)回歸對各個特征進行降維,得到差異有統計學意義的影像組學特征參數,利用特征參數進行多因素二元logistic回歸分析建模,同時計算影像組學特征參數分數(Rad-score)。在訓練組中對每個潛在預測變量包括性別、年齡、吸煙史、肺癌相關腫瘤指標[包括神經元特異性烯醇化酶(NSE)、細胞角蛋白 19片段(YFRA21-1)、癌胚抗原(CEA)、糖類抗原 19-9(CA19-9)、CA125、CA242]、結節分型、空氣支氣管征、胸膜牽拉、血管聚集、毛刺征等進行單因素二元logistic回歸分析,篩選出P<0.1的特征,再對這些篩選出的特征進行多因素二元logistic回歸分析,最終篩選出獨立預測因子。

1.5 模型建立與驗證 用篩選出的獨立預測因子建立臨床-語義特征模型。之后將聯合篩選出的獨立預測因子和Rad-score構建聯合模型,并制作列線圖。模型建立之后,使用Hosmer-Lemeshow檢驗分析擬合度。繪制ROC曲線,采用AUC評價各個模型對NSCLC基因突變狀態的預測效能。使用決策曲線評估各個模型的凈效益。

1.6 統計學處理 采用R Studio3.6.1統計軟件。正態分布的計量資料以表示,組間比較采用獨立樣本t檢驗;非正態分布的計量資料以 M(P25,P75)表示,組間比較采用秩和檢驗;計數資料組間比較采用χ2檢驗。采用ICC評價2位測量者的測量一致性及對腫瘤的語義特征的定義一致性,ICC≥0.75為一致性較好。訓練組及驗證組構建的Rad-score對EGFR基因狀態預測的比較采用Wilcoxon秩和檢驗。采用Hosmer-Lemeshow檢驗分析擬合度,P>0.05提示模型擬合較好。繪制決策曲線分析凈效益。采用Delong檢驗進行模型間AUC的比較。P<0.05為差異有統計學意義。

2 結果

2.1 臨床特征選擇 根據7∶3的比例進行分層抽樣將153例患者隨機分成訓練組108例和驗證組45例。根據EGFR基因檢測結果將所有患者分為突變組90例及野生組63例,兩組患者的臨床特征比較見表1。通過單因素logistic回歸共篩選出3個獨立預測因子,包括吸煙史、結節分型和血管聚集。對這些篩選出的獨立預測因子繼續采用多因素二元logistic回歸進行篩選,最終篩選出的獨立預測因子分別是吸煙史(OR=2.65,P=0.056)和結節分型(OR=1.74,P=0.034)。基于這兩個獨立預測因子建立臨床-語義特征模型。

表1 EGFR基因突變組及野生組臨床特征比較

2.2 一致性評價 2位測量者獲得的影像組學特征參數的ICC范圍為0.553~0.864,其中>0.75的特征355個,一致性較好。2位測量者對腫瘤語義特征定義的ICC為0.72~0.95,其中血管聚集的ICC為0.72,其余特征的ICC均>0.75。因此采用高年資醫生的勾畫及評閱數據進行特征選擇及建模。

2.3 影像組學特征篩選和模型建立 Hosmer-Lemeshow檢驗顯示在訓練組和驗證組中各個臨床特征差異均無統計學意義(均P>0.05),見表2,表明擬合無偏差。通過mRMR算法降低ICC>0.75特征集的冗余度,保留了排名前20個特征,采用LASSO回歸進一步降維,共得到13個影像組學特征,包括Correlation_AllDirection_offset7_SD(CA_o7_SD)、GLCMEnergy_angle135_offset7(Ga135_o7)、GLCMEnergy_angle90_offset7(Ga90_o7)、Cluster Shade_angle45_offset7(CSa45_o7)、kurtosis、High-GreyLevelRunEmphasis_AllDirection_offset4_SD(HA_o4_SD)、GLCMEntropy_AllDirection_offset7_SD(GA o7 SD)、GLCMEntropy_AllDirection_offset4_SD(GA o4 SD)、Clus-terShade_AllDirection_offset1_SD(CA_o1_SD)、Haralick-Correlation_AllDirection_offset1_SD(HA_o1_SD)、GLCM Energy_angle90_offset4(Ga90_o4)、InverseDifferenceMoment_AllDirection_offset7_SD(IA_o7_SD)、Inertia_angle45_offset7(Ia45_o7)。各個特征的相關系數見圖1。將選定的13個特征按相關系數加權求和得到Rad-score,最終公式為:Rad-score=0.672*(CA_o7_SD)+-0.482*(Ga135_o7)+0.635*(Ga90_o7)+-0.271*(CSa45_o7)+-0.342*kurtosis+-0.162*(HA_o4_SD)+0.109*(GA o7 SD)+-0.159*(GA o4 SD)+0.141*(CA_o1_SD)+-0.497* (HA_o1_SD)+-0.981* (Ga90_o4)+-0.512*(IA_o7_SD)+0.642*(Ia45_o7)+0.078。基于 Rad-score建立影像組學特征模型。訓練組與驗證組患者EGFR基因突變狀態預測Rad-score的比較,差異均有統計學意義(均P<0.05),見圖2。因此,Rad-score為獨立預測因子。

圖1 最優影像組學特征組合及其相關系數

圖2 訓練組與驗證組構建的影像組學特征參數分數對表皮生長因子受體(EGFR)基因狀態的預測比較

表2 訓練組和驗證組臨床特征比較

將Rad-score、吸煙史、結節分型共3個特征作為EGFR基因突變的獨立預測因子進行聯合模型建立,并獲取聯合模型的列線圖見圖3。通過該列線圖可以實現NSCLC EGFR基因突變的個體化預測,計算得出的數值越高,患者基因突變的可能性越高。分別繪制3個模型的ROC曲線,見圖4。結果發現,聯合模型的AUC在訓練組及驗證組均為最高,明顯高于臨床-語義特征模型(Z=2.9441、2.1306,均 P<0.05)。影像組學特征模型的AUC高于臨床-語義特征模型,略低于聯合模型,差異無統計學意義(P>0.05)。決策曲線顯示,聯合模型較另外兩種模型有更好的凈效益,見表3、4及圖5。

圖3 基于訓練組構建聯合模型的列線圖

圖4 訓練組和驗證組的各個模型的ROC曲線圖(a:訓練組;b:驗證組)

圖5 3種模型的決策曲線圖

表3 訓練組模型間的比較

3 討論

本研究建立了一種用于預測NSCLC EGFR基因突變的臨床-影像組學聯合模型,結果發現聯合模型是預測NSCLC EGFR基因突變的最優模型,并且通過構建列線圖實現了模型可視化。本研究結果表明,該聯合模型構建的列線圖可以作為預測NSCLC EGFR基因突變的臨床工具。該結果與Mei等[9]的研究成果一致,然而本研究聯合模型AUC要明顯高于文獻結果(0.77比0.664),因此本研究模型具有更高的診斷效能,更方便臨床的實際應用。

表4 驗證組模型間的比較

大量流行病學研究表明,EGFR基因突變在亞洲人群、女性、非吸煙、腺癌的患者中發生率較高[10]。本研究結果與以往報道相符[11]。本研究還發現含有磨玻璃成分的腫瘤EGFR突變率63.2%(60/95)高于實性腫瘤51.7%(30/58),與以往多項研究結果[12-14]相符。有研究表明,腫瘤含磨玻璃成分比例越高,發生EGFR突變的概率越高,提示高比例的磨玻璃可以預測EGFR基因突變,這也表明結節分型是EGFR基因突變的重要預測因子[13,15]。因此,本研究經過單因素及多因素二元logistic回歸分析后,得到一個由吸煙史及結節分型構成的臨床-語義特征模型,模型的AUC在訓練組及驗證組的分別為0.64和0.58,然而該模型的診斷效能較低,并沒有達到臨床診斷要求。

以往研究已經證明了CT影像的形態學特征有預測腫瘤突變狀態的潛力[16-21]。Chen等[17]研究表明常規CT特征包括肺氣腫、原發腫瘤的分葉程度、淋巴結大小和狀態有助于預測晚期肺腺癌EGFR突變狀態。另外,有研究對CT形態和臨床特征進行Meta分析,證實有磨玻璃成分、空氣支氣管征、胸膜牽拉和血管集聚是NSCLC EGFR基因突變的危險因素[19]。因此本研究也同時納入了這些語義特征進行危險因素分析,結果發現除了磨玻璃成分,其他特征對預測結果沒有貢獻。這一結果表明,這些特征對NSCLC EGFR基因突變的預測結果不穩定。顯然,這些研究只著眼于定性特征與NSCLC中EGFR突變的關系。這些定性特征基于觀察者的主觀判斷,觀察者之間存在差異,例如血管聚集這個特征,2位觀察者間的ICC只有0.72,而且這些特征不能對腫瘤異質性進行量化。因此筆者便引入了影像組學這種對傳統影像進行量化的方法。

與傳統的影像學方法相比,影像組學的優勢在于通過高通量提取圖像中的定量特征,發掘出更多信息,從而反映病變的內在異質性,目前已被廣泛應用于疾病鑒別、預后評估、療效評估等多個方面。有較多研究顯示了影像組學對NSCLC基因表型有潛在預測價值。雖然這些研究的預測價值低于標準的分子生物學,但是也顯示了較好的靈敏度和特異度[9,22]。以往的研究認為熵值(Entropy)和峰度值(kurtosis)是鑒別EGFR 突變狀態的兩個最重要的影像組學特征[5]。本研究發現除了熵值和峰度值,還有能量(Energy)、聚類陰影(Cluster Shade)灰度游程長度矩陣(GreyLevelRunEmphasis)、哈拉利克相關(HaralickCorrelation)等特征也對鑒別EGFR基因突變狀態有貢獻。另有研究表明,影像組學模型在鑒別EGFR基因突變狀態方面要優于傳統影像學與臨床特征的聯合模型[7]。因此筆者通過納入以上這些特征計算出Rad-score,同時結合臨床特征建立聯合模型,使模型的預測效能有所提高。同時聯合模型也獲得了理想的靈敏度、特異度、準確度、陽性預測值及陰性預測值,因此筆者認為基于胸部CT影像組學特征和圖像語義特征及臨床特征的聯合模型確有預測NSCLC是否發生EGFR基因突變的潛力。通過繪制列線圖實現了模型的可視化。列線圖是醫學中常用的預后評估工具,在腫瘤評估方面尤為突出。它可以通過整合各種預后及決策變量,實現對個體臨床事件的預測,滿足建立生物學和臨床綜合模型及對個性化醫療的需求。與傳統分期相比,它的數字界面能夠實現快速計算,同時具有更高的準確度,能更容易了解疾病的預后,以幫助臨床作出決策[23]。

本研究仍存在不足之處:本研究所提取的影像學數據都是手工半自動勾畫,工作量較大,隨著各種分割軟件的發展,自動分割精度的提高,不僅可以較大程度減少工作量,同時可以減少人工誤差。本研究樣本量較小,且來自于單一醫療機構,未來樣本量的擴大及多中心的合作,會使得該研究成果有更普遍的適用性。

綜上所述,本研究發現聯合臨床危險因素和影像組學特征的臨床-影像組學列線圖,可以作為NSCLC EGFR基因突變預測的臨床工具,輔助臨床做好治療決策,實現個體化精準醫療。

猜你喜歡
基因突變特征模型
一半模型
大狗,小狗——基因突變解釋體型大小
英語世界(2023年6期)2023-06-30 06:29:10
管家基因突變導致面部特異性出生缺陷的原因
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
基因突變的“新物種”
抓住特征巧觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产真实自在自线免费精品| 国产视频你懂得| 第一区免费在线观看| 免费国产黄线在线观看| 国产麻豆精品手机在线观看| 99久久亚洲综合精品TS| 精品小视频在线观看| 激情在线网| 青青热久免费精品视频6| 国产在线自乱拍播放| 人妻中文久热无码丝袜| 亚亚洲乱码一二三四区| 久久婷婷人人澡人人爱91| 久视频免费精品6| 91精品网站| 原味小视频在线www国产| 亚洲九九视频| 一级毛片无毒不卡直接观看| 成年人国产视频| 无码福利视频| 亚洲女同一区二区| 青青操国产| 婷婷六月综合网| 伊人国产无码高清视频| 婷婷色中文网| 国产毛片网站| 婷婷丁香色| 欧美全免费aaaaaa特黄在线| 97在线公开视频| 欧美成人综合视频| 扒开粉嫩的小缝隙喷白浆视频| 国产人成在线视频| 操国产美女| 成人午夜在线播放| 欧洲精品视频在线观看| 亚洲欧美综合另类图片小说区| 在线观看91精品国产剧情免费| 露脸真实国语乱在线观看| 欧美亚洲激情| 久久久久久高潮白浆| 欧美中文字幕一区| 黑人巨大精品欧美一区二区区| 亚洲日本在线免费观看| 久久精品国产亚洲麻豆| jijzzizz老师出水喷水喷出| 日本精品αv中文字幕| 国产日韩欧美在线视频免费观看| 88av在线| a毛片免费在线观看| 亚洲三级成人| 亚洲手机在线| 亚洲中文字幕av无码区| 国产精品成人一区二区不卡| 日韩毛片基地| 亚洲中文无码av永久伊人| 欧美第二区| 中文字幕人成乱码熟女免费| 欧美色综合久久| AV无码国产在线看岛国岛| 国产一二三区视频| 欧美成a人片在线观看| 沈阳少妇高潮在线| 国产精品久久自在自线观看| 国产一级做美女做受视频| 中文字幕精品一区二区三区视频| 国产亚洲欧美日韩在线一区| 久996视频精品免费观看| 亚洲三级电影在线播放| 全色黄大色大片免费久久老太| 丁香婷婷久久| 亚洲精品视频免费看| 国产欧美日韩资源在线观看| 日韩欧美中文字幕在线韩免费| 成人永久免费A∨一级在线播放| 亚洲一区二区约美女探花| 91精品国产福利| 超清无码一区二区三区| 欧美在线精品一区二区三区| 欧美性猛交xxxx乱大交极品| 欧美一级视频免费| 欧美精品成人一区二区视频一| 综合色88|