王顯棋,羅浩然,李 可,楊 靖,敬 洋,陳 偉
1.陸軍軍醫大學第一附屬醫院放射科,重慶 400030;
2.武警四川省總隊醫院醫學影像科,四川 樂山 614000;
3.慧影醫療科技(北京)股份有限公司,北京 100089
目前肺癌仍是全球癌癥相關死亡的主要原因,非小細胞肺癌(non-small cell lung cancer,NSCLC)是其最常見的類型。根據中國國家癌癥中心發布的《2022年全國癌癥報告》,2016年度全國肺癌總體發病率和死亡率均居全國首位,其中新發病例約82.8萬,死亡病例約65.7萬,男性多于女性[1]。多數患者出現癥狀時已屬晚期,晚期患者的總體5年生存率不高,其預后隨腫瘤分期的不同而有顯著差異,是否發生遠處轉移對預后有重要影響[2]。早期預測發現NSCLC遠處轉移,有希望實現臨床對患者進行個體化精準治療。
影像組學是近10年來快速發展的新技術,影像組學采用高通量計算機技術從各種醫學影像中提取海量定量特征,將其轉換為可挖掘的數據,通過機器學習方法從中提取關鍵信息,從而全面、無創地觀察腫瘤的時間、空間異質性[3-5]。影像組學目前已廣泛應用于肺癌、乳腺癌、肝癌、消化道腫瘤等,對腫瘤的預測、分型、分期及預后分析均有一定作用[6-11]。之前的研究主要集中在對腫瘤本身的影像組學特征進行分析,而對于腫瘤周圍微浸潤的影像組學特征分析相對較少。腫瘤微浸潤擴散到周圍組織是影響腫瘤復發、轉移及患者生存率的主要原因[12]。有研究[13]顯示,結合瘤周影像組學特征和腫瘤影像組學特征可提高預測肺腺癌淋巴結轉移的準確度。另有研究者[14-15]利用治療前計算機體層成像(computed tomography,CT)上腫瘤周圍3 mm組織和正電子發射體層成像(positron emission tomography,PET)上腫瘤周圍組織的影像組學特征分別預測局部晚期和早期NSCLC患者的遠處轉移。瘤周影像組學特征具有潛在價值,本文主要對含瘤周影像組學特征、腫瘤影像組學特征及其分別聯合臨床特征建立的綜合模型進行對比分析,并探討其對NSCLC遠處轉移的預測價值。
回顧并分析2014—2019年陸軍軍醫大學第一附屬醫院經病理學檢查證實為NSCLC的患者資料。納入標準:① 病理學類型為NSCLC;② 治療方案為非手術治療;③ 治療前無轉移;④ 治療前1個月內進行過胸部CT檢查[16]。排除標準:① 臨床病理學隨訪資料不完整;② 合并其他系統腫瘤;③ CT圖像質量不佳或腫瘤邊界無法識別。遠處轉移的定義是腫瘤轉移到胸部以外,胸部內的轉移如肺內轉移、胸膜轉移、心包轉移等歸為無遠處轉移組[14]。遠處轉移的時間被定義為從確診開始到第1次發現轉移性病變的時間;在無遠處轉移的患者中,最后1次陰性掃描的間隔時間認定為遠處轉移的時間[14,17-18]。
根據納入、排除標準最終納入140例患者,其中男性83例,女性57例;腺癌110例,鱗癌21例,其他病理學檢查無法準確分型NSCLC 9例;無遠處轉移組74例,遠處轉移組66例。所有入選患者病理學檢查結果均為穿刺活檢所得,部分患者因為嚴重的心、肝、腎疾病或嚴重傳染病不能耐受手術,多數患者因為疾病晚期失去手術機會,因此采取的治療措施均為非手術治療,如放化療、靶向治療、免疫治療等。本研究得到陸軍軍醫大學第一附屬醫院倫理委員會的批準(批件號:KY2020216)。
采用德國Siemens公司的Sensation 16、Somatom Definition AS 64排螺旋CT機或Somatom Definition Flash雙源螺旋CT機掃描。掃描前有語音提示患者屏氣配合,以抑制呼吸運動偽影。掃描參數:管電壓100~120 kV,管電流為自動設置,螺距為1.2~1.5。增強掃描采用非離子型對比劑碘海醇(含碘300 mg/mL),注射劑量80~100 mL,注射速度3.5~4.0 mL/s,于升主動脈內取約1 cm2大小的圓形感興趣區(region of interest,ROI),對比劑開始注射10 s后進行連續軸向掃描,在實時重建圖像上當其CT值達到觸發閾值(120 HU)后延遲5 s進行動脈期掃描,順延15~20 s進行靜脈期掃描。重建參數:卷積核=I70 f,肺窗窗位-450~-600 HU,窗寬1 200~1 500 HU,層間距2 mm,層厚2 mm,部分圖像加做冠狀位、矢狀位。
將數據上傳至慧影醫療科技(北京)股份有限公司的大數據人工智能科研平臺,采用半自動的方法,在肺窗薄層圖像上勾畫出原發腫瘤的輪廓(記為tumor,圖1A),腫瘤涉及的每個層面均需要勾畫,然后均勻向外擴展10 mm[19-20],勾畫出腫瘤的微浸潤區域(記為ME),在此區域中手動排除支氣管、大血管、骨骼和縱隔等非肺組織區域[21](圖1B)。在圖像勾畫過程中,當腫瘤邊界不容易識別時,使用增強圖像盡可能明確腫瘤邊界,但勾畫工作的完成全部在薄層肺窗圖像上進行。所有的勾畫工作由具有3年胸部CT影像學診斷經驗的醫師完成(放射科醫師1),然后,從整個樣本中隨機選擇30例患者,由1名具有10年胸部CT影像學診斷經驗的醫師(放射科醫師2)獨立重新分割,以評估2名醫師之間的一致性。
圖1 典型患者ROI勾畫
對于每個人工標注的ROI(ME、tumor),使用Radcloud平臺(http://mics.radcloud.cn/#/project)提取1 409個影像組學特征。1 409個特征可分為4類:一階統計特征、形狀特征、紋理特征和高階統計特征。一階統計量描述了CT圖像ROI的強度信息,如均值、標準差、方差、最大值、中值等特征。形狀特征反映了區域的形狀和大小,如體積、表面積、密實度、最大直徑等特征。紋理特征可以量化區域異質性差異。高階統計特征包括從原始圖像的小波變換中得到的一階統計特征和紋理特征,包括指數、平方、平方根、對數和小波等特征。
使用計算機生成的隨機數據集將70%的數據集分配給訓練隊列,30%的數據集分配到驗證隊列。我們從訓練隊列中選擇最優特征。在進行特征選擇之前,對所有的影像組學特征進行標準化處理,去除均值,除以其標準差,將每組特征值轉換為均值為0,方差為1。當我們比較2名放射科醫師的診斷結果時,通過計算組內相關系數(intra-class correlation coefficient,ICC)來檢驗特征勾畫的一致性,保留了影像組學特征重現性較高(ICC≥0.8)的特征,刪除了不令人滿意的特征(ICC<0.8)。
雖然去掉了ICC<0.8的放射組學特征,但仍有大量特征存在,為了避免模型過擬合和多重共線性的問題,采用以下3種方法對提取的CT影像組學特征進行降維:首先,采用方差閾值法進行特征降維,ICC≥0.8的特征被篩選下來;其次,利用單變量選擇法,篩選不顯著的特征(P>0.05則刪除);最后,通過最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸,選出與遠處轉移最相關的指標,并得到這些指標的權重。使用以下公式⑴計算每例患者的放射評分,放射評分作為影像組學特征的綜合體現,納入后續模型構建。
公式⑴中feature_1-n為經過特征篩選出來的最優特征;coefficient_1-n為對應特征由LASSO回歸擬合得到的特征系數;Intercept為LASSO回歸擬合得到的截距項。通過最優特征的組學提取值(feature_n)和擬合得到的特征系數(cofficient_n)結合截距可以算出每例患者的放射評分。
在遠處轉移的預測中,選取與遠處轉移顯著相關的特征和臨床因素作為構建NSCLC遠處轉移鑒別診斷模型的輸入。采用logistic回歸方法建立模型,分別包括腫瘤(tumor)影像組學模型、含瘤周(tumor+ME)影像組學模型及其分別聯合臨床特征的綜合模型。所有模型性能通過受試者工作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under curve,AUC)量化,同時構建含瘤周(tumor+ME)影像組學聯合臨床特征綜合模型的諾模圖,并評價諾模圖的校準和鑒別能力。
采用R語言軟件3.6.5對放射組學特征進行統計學分析。在臨床因素的有無轉移分組統計中,連續性變量采用正態分布檢驗和獨立t檢驗,分類變量采用χ2檢驗或Fisher精確概率檢驗。采用ROC曲線分析計算AUC、靈敏度、特異度及準確度等指標,評價模型的診斷性能。采用DeLong檢驗對不同模型的診斷能力進行顯著性檢驗。P<0.05為差異有統計學意義。
本次研究共納入140例患者,其中男性83例,女性57例;腺癌110例,鱗癌21例,其他病理學檢查無法準確分型NSCLC 9例;無轉移組74例,轉移組66例,遠處轉移多發生在腦、肝、骨、腎上腺器官,其他器官的轉移少見。將患者數據按照7∶3分成訓練組(無轉移組vs轉移組為52例vs46例)和驗證組(無轉移組vs轉移組為22例vs20例),NSCLC遠處轉移和無遠處轉移患者的癌胚抗原(carcinoembryonic antigen,CEA)差異有統計學意義(P<0.05),而年齡、性別、吸煙史、神經元特異性烯醇化酶(neuron specific enolase,NSE)、組織學亞型、T分期、N分期、M分期及臨床分期差異無統計學意義(P>0.05,表1)。將差異有統計學意義的臨床因素納入高危臨床影響因素,進入后續模型構建。
表1 NSCLC遠處轉移和無遠處轉移患者的臨床特征n(%)
在特征提取中,從每例患者的tumor和ME上各提取1 409個定量放射組學特征,包括270個一階特征、14個形狀特征、360個灰度共生矩陣特征、210個灰度相關矩陣特征、240個灰度游程矩陣特征、75個鄰域灰度差矩陣特征和240個灰度大小區域矩陣特征。對提取的特征進行ICC,刪除ICC<0.8的特征。采用方差閾值法、單變量選擇法和LASSO對影像組學特征進行降維,在單獨的腫瘤(tumor)影像組學模型中篩選出9個組學特征,在含瘤周(tumor+ME)影像組學模型中篩選出13個組學特征。特征選擇采用的LASSO方法見圖2、3。
圖2 腫瘤(tumor)影像組學特征提取LASSO回歸圖
圖3 含瘤周(tumor+ME)影像組學特征提取LASSO回歸圖
基于篩選得到的兩個ROI的組學特征以及臨床高危因素建立多個邏輯回歸模型,分別為腫瘤(tumor)影像組學模型、含瘤周(tumor+ME)影像組學模型及其分別聯合臨床特征的綜合模型。利用含瘤周(tumor+ME)影像組學特征聯合臨床高危因素構建多因素邏輯回歸模型,并繪制諾模圖(圖4)。結果顯示,腫瘤(tumor)影像組學模型在訓練集中的AUC為0.779(95%CI 0.693~0.849),在驗證集中的AUC為0.648(95% CI 0.578~0.800,圖5A);腫瘤(tumor)影像組學聯合臨床模型在訓練集中的AUC為0.795(95% CI 0.709~0.865),在驗證集中的AUC為0.674(95% CI 0.556~0.823,圖5B);含瘤周(tumor+ME)影像組學模型在訓練集中的AUC為0.854(95% CI 0.787~0.906),在驗證集中的AUC為0.804(95% CI 0.685~0.919,圖5C);含瘤周(tumor+ME)影像組學聯合臨床綜合模型在訓練集中的AUC為0.858(95% CI 0.793~0.908),在驗證集中的AUC為0.828(95% CI 0.720~0.939,圖5D)。多個模型結果比較見表2。結果表明,含瘤周的模型在NSCLC遠處轉移的預測中具有較好的診斷性能,同時,含瘤周(tumor+ME)影像組學特征聯合臨床高危因素的多因素邏輯回歸模型在NSCLC遠處轉移的預測中具有最優的診斷性能。含瘤周(tumor+ME)影像組學聯合臨床綜合模型與其他3個模型的DeLong檢驗結果如表3所示,檢驗結果顯示,含瘤周的模型與不含瘤周的模型在訓練集和驗證集上差異均有統計學意義(P<0.0 5),這進一步說明了含瘤周(tumor+ME)影像組學模型可以提高NSCLC遠處轉移的預測能力。
表2 多個模型分析結果比較
表3 多個模型診斷能力顯著性檢驗結果
圖4 多因素邏輯回歸構建的諾模圖
圖5 4個邏輯回歸模型的ROC曲線
對模型繪制校準曲線,校準曲線可以反映模型的預測結果與實際結果的具體情況。本研究校準曲線(圖6)表明模型用于預測NSCLC遠處轉移與臨床實際符合度高,準確度及可靠性較好。
圖6 預測模型的校準曲線
影像組學是一種利用醫學圖像分析和數據挖掘方法的新型非侵入性技術,近年來已被應用于癌癥診治領域。通過高通量提取量化特征的方法,提供肉眼無法辨識的圖像信息,將圖像信息轉換為可挖掘的數據,然后對數據進行分析,與患者臨床信息相結合,建立可能提高診斷、預測和預后分析準確度的模型,助力臨床的個性化精準醫療[22-24]。
目前影像組學在胸部疾病的診斷中應用廣泛,從肺結節的良惡性判斷,到肺癌的分型、分期、基因表達均有相關研究[25-27],但這些研究基本都是針對腫瘤原發病灶進行分析,對于腫瘤周圍的微浸潤研究甚少。有學者[14]定義了腫瘤邊緣與腫瘤外部的肺組織,通過原發腫瘤邊緣向內外均擴張3 mm構成的區域定義為腫瘤邊緣,而腫瘤外部定義為原發腫瘤邊緣3~9 mm的區域。Wang等[21]通過提取肺腺癌周圍15 mm肺組織的影像組學特征來預測T1期肺腺癌的淋巴結轉移。而有研究[28]根據臨床安全的手術切緣為距腫瘤組織20 mm,提取包含腫瘤周圍20 mm肺組織的影像組學特征預測NSCLC術后復發風險。Wu等[29]通過分別勾畫腫瘤邊緣5、10、15 mm來檢驗瘤周影像組學特征對小于2 cm肺部實性結節惡性程度的預測能力。這些研究都證實隨著腫瘤邊緣外擴距離的增大,模型的預測效能會降低,這可能是由于越往外包含的正常肺組織越多。Grills等[20]為了盡可能地覆蓋病理學上的腫瘤體積,而又減少對正常肺組織的傷害,研究了影像學上可見的腫瘤大小與病理學微浸潤之間的關系,他們認為在90%的情況下,覆蓋病理學微浸潤所需要的距離為9 mm。所以本文在對腫瘤周圍微浸潤的研究中,提取的是原發腫瘤邊緣向外擴展10 mm的影像組學特征。
癌癥生物學研究為腫瘤如何通過與周圍正常組織的相互作用而擴散提供了新的見解,腫瘤侵襲周圍正常組織的細胞可以轉化為組織形態的變化,這反過來可能告訴我們轉移活動的水平[30-32]。腫瘤周邊有多種腫瘤侵襲和轉移活動,如上皮-間質轉化[33]、腫瘤相關巨噬細胞[34]和血管淋巴管侵犯[35]等,這些活動具有重要的生物學意義,腫瘤周圍微環境的改變對臨床評估腫瘤侵襲性生物學行為具有一定的價值[36-37]。然而,這些改變在目前常規CT圖像上只能觀察到極少一部分,如腫瘤周圍毛刺、血管增生等,這些征象對于腫瘤周圍微浸潤的識別及預警作用有限,傳統的影像學方法觀察到的腫瘤周圍的正常肺組織,由于腫瘤的侵襲性生物學行為,可能已經受到腫瘤細胞的浸潤[19-20]。因此,在分析腫瘤本身的影像組學特征的基礎上,本研究著重關注了瘤周影像組學特征的診斷價值。
本研究結果表明,含瘤周(tumor+ME)影像組學特征相對腫瘤(tumor)影像組學特征而言,明顯提高了對NSCLC遠處轉移的預測能力,而當兩種模型分別聯合臨床高危因素后,其預測效能分別高于單純影像組學模型。關于局部晚期NSCLC遠處轉移的預測,有研究[14]定義了腫瘤邊緣與腫瘤外部的肺組織,通過原發腫瘤邊緣向內外均擴張3 mm構成的區域定義為腫瘤邊緣,而腫瘤外部定義為原發腫瘤邊緣3~9 mm的區域,研究結果證實腫瘤邊緣影像組學聯合臨床特征模型預測效能高于腫瘤外部影像組學聯合臨床特征模型,說明越往外其腫瘤微浸潤的趨勢越弱。也有學者[27]利用瘤周影像組學研究了NSCLC的組織學分型,得到了含瘤周影像組學的預測效能明顯高于腫瘤本身的結論。Wang等[21]通過比較腫瘤及瘤周(腫瘤外擴15 mm)肺組織的影像組學特征來預測T1期肺腺癌的淋巴結轉移,證實瘤周影像組學特征聯合臨床參數的綜合特征預測效能更好。這些研究都證實了腫瘤周圍影像組學特征的潛在作用,對腫瘤周圍微浸潤提供了一種可能的預測指標。本研究結果證明了腫瘤周圍微浸潤與NSCLC患者的遠處轉移有一定的關系,含瘤周影像組學特征有可能是一種無創的獨立預測因子。這一研究成果有望輔助臨床對NSCLC患者的治療、隨訪及預后分析,幫助臨床實現患者的個體化精準醫療。
本研究存在一定的局限性:首先,作為回顧性研究存在選擇偏倚;其次,本研究的數據量偏少;最后,我們的樣本數據都來自單中心醫療機構,對模型的泛化性有一定的影響。在以后的科研工作中,需要開展前瞻性、大樣本、多中心的研究,以提高模型的準確度及泛化性。
總之,本研究結果證實影像組學模型對于NSCLC患者遠處轉移有一定的預測作用,并且含瘤周(tumor+ME)影像組學特征模型明顯優于腫瘤(tumor)影像組學特征模型。本研究將引起臨床醫師對腫瘤微浸潤的重視,含瘤周影像組學特征有望成為NSCLC患者遠處轉移的早期無創性預測指標,對NSCLC患者的預后預測、臨床治療有一定的參考意義。