李小英 楊朝鳳 李楊
肺癌是全球最常見的惡性腫瘤之一,盡管低劑量螺旋CT(low-dose computed tomography,LDCT)篩查肺癌高危人群可使死亡率下降20%,但仍然是全球癌癥相關死亡的首要原因[1]。最新統計數據顯示,2020年全球新增肺癌患者約220萬例,由肺癌導致的死亡人數約180萬例,非小細胞肺癌(non-small cell lung cancer,NSCLC)約占其中的85%[2]。根治性手術切除是NSCLC的首選治療方式,但大多數患者在確診時處于疾病晚期,錯過手術切除的最佳時機[3]。近年來,靶向治療及免疫治療在惡性腫瘤治療領域取得重大突破,與傳統放化療相比,前者治療安全性更高、毒副作用更小、療效更確切,能顯著控制腫瘤進展、延長患者生存時間并改善患者生活質量。
靶向治療及免疫治療發揮治療作用的前提和關鍵在于腫瘤的分子分型及其微環境改變。活組織檢查是識別腫瘤分子分型及其微環境改變的金標準。然而,活組織檢查具有侵入性、高成本、重復性差、轉移等缺點,同時由于腫瘤內部存在異質性注定活組織檢查無法全面、準確反映病灶的完整信息,以致在臨床應用中受到一定限制。影像組學作為一種無創、可重復且節約成本的方法,通過深度挖掘醫學圖像信息并將其轉化為定量數據,可以全面反映腫瘤內部的異質性,進而預測腫瘤的分子特性及其微環境改變,對NSCLC靶向治療及免疫治療方案制定意義重大。本文就CT影像組學在NSCLC靶向治療及免疫治療的研究進展進行綜述。
影像組學最早在2012年由荷蘭學者Lambin等[4]提出,指從醫學圖像中高通量地提取定量影像特征,并將其轉換為高維數據,最終用于疾病診療及預后預測。影像組學的研究流程一般分為5個步驟:①高質量醫學圖像的獲取,高質量的醫學圖像是影像組學數據準確和穩定的前提。依據研究目的獲取原始醫學圖像,并對其進行預處理,如配準、標準化等,以確保圖像質量和一致性。②圖像分割:指將二維感興趣區域(region of interest,ROI)或三維感興趣體積(volume of interest,VOI)從背景中分割出來的過程。精準的圖像分割是影像組學研究的重要步驟,一般有人工、半自動或全自動3種分割方式,其中手動分割精度最高,但效率低,主觀性強,半自動或全自動分割效率高、可重復性高, 但對邊界勾畫可能存在誤差[5]。③特征提取:影像組學特征包括形狀特征、一階特征、二階特征和高階特征。形狀特征是感興趣區域的幾何屬性;一階特征是單個像素值/體素值的分布,不涉及空間關系;二階特征又稱紋理特征,反映相鄰像素值/體素值的空間關系;高階特征是應用濾波器或數學變換后生成。常用的特征提取軟件如PyRadiomics、LIFEx、3D Slicer Radiomics、ITK、Definiens Developer、MaZda、MATLAB Radiomics、IBEX等[6]。④特征篩選:從感興趣區域/體積提取的組學特征之間高度相關且存在大量冗余信息,常導致模型出現過擬合,影響其泛化能力,因此需要對提取的特征進行篩選及降維處理。常用的特征篩選方法有ICC相關性分析、Pearson/Spearman相關性分析、最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)、最大相關最小冗余(maximum relevance minimum redundancy,MRMR)和主成分分析(principal component analysis,PCA)等[7]。⑤模型建立與評估:穩定性和可重復性是模型建立的關鍵。常用的模型有邏輯回歸(logistic regression,LR)、支持向量機(support vector machine,SVM)、隨機森林(radom forest,RF)、決策樹(decision tree)和卷積神經網絡(convolutional neural network,CNN)等,可從受試者工作特征(receiver characteristic operating curve,ROC)曲線的曲線下面積 (area under the curve,AUC)、精確度、靈敏度、特異度、校準度及臨床效用等方面評估模型性能,并對模型進行測試和驗證[8]。目前,影像組學廣泛應用于NSCLC的早期診斷、病理分級、表型分析及預后預測等[9-12]。
隨著對肺癌驅動基因研究的不斷深入,肺癌進入了靶向治療時代。靶向治療是在細胞分子水平上,針對已經明確的致癌位點,設計相應的靶向藥物特異性殺傷腫瘤細胞而不損傷周圍正常組織的治療新方式。影像組學近年來發展迅速,使無創、精準預測肺癌驅動基因狀態成為可能。
2.1 表皮生長因子受體 表皮生長因子受體(epidermal growth factor receptor,EGFR)是一種跨膜受體酪氨酸激酶,與特異性配體結合后發生自磷酸化,隨后激活下游信號傳導通路,參與調控細胞增殖、分化和凋亡,調控失調與肺癌形成、侵襲、遠處轉移和血管生成有關。目前EGFR是研究最深入且具有明確治療效果的肺癌分子靶點之一[13]。與EGFR野生型相比,EGFR突變型對酪氨酸激酶抑制(EGFR-tyrosine kinase inhibitors,EGFRTKIs)治療敏感、反應率高,患者生存狀況明顯改善[14]。研究表明,影像組學可準確預測NSCLC患者EGFR突變狀態[15-16]。此外,影像組學在鑒別EGFR突變亞型方面也取得了重大進展。一項多中心研究旨在預測EGFR最常見的兩種突變亞型(Del-19突變與L858R突變),結果顯示CT組學模型可以有效鑒別Del-19突變與L858R突變、Del-19突變型與野生型及L858R突變型與野生型[17]。NSCLC患者EGFR-TKIs治療期間T790M突變是多數患者獲得性耐藥的主要原因,常常導致治療失敗。Rossi等[18]及Yang等[19]研究表明,增強CT影像組學模型可以準確預測肺腺癌患者在接受第一代或第二代EGFR-TKIs治療后腫瘤進展是否發生獲得性T790M突變,且加入臨床因素構建的諾莫圖預測T790M突變性能更高同時對患者的生存情況具有一定的評估價值。以上表明,無創影像組學在預測EGFR突變及突變亞型、監測疾病進展方面具有重要價值。
2.2 間變性淋巴瘤激酶 由于2號染色體短臂的微小倒置,間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)基因與棘皮動物微管相關蛋白樣4(echinodern micro-tubule-associated protein-like 4,EML4)基因發生重排,形成EML4-ALK融合基因,其編碼的EML4-ALK融合蛋白可以在不接受配體及組織信號的情況下,異常激活下游信號傳導通路如RAS-RAF-MEKERK,最終導致癌癥形成[20]。NSCLC中ALK重排發生率僅2%~7%,但其已成為繼EGFR突變的又一重要突變基因,針對ALK重排的靶向治療藥物克唑替尼較標準化療可明顯延長晚期NSCLC患者的無進展生存期[21]。影像組學為預測ALK重排及對ALK-TKIs治療后反應提供了一種新的定量分析方法[22]。Song等[23]回顧性分析335例肺腺癌患者,篩選出3個(Original_Firstorder_90Percentile、Original_Firstorder_Maximum和Wavelet-LHH_GLDM_ LDHGLE)與ALK重排顯著相關的組學特征,所構建的CT組學模型可以有效區分ALK重排與ALK野生型肺腺癌,且上述特征還進一步提示ALK重排的腫瘤更易表現為實性腫塊。Hao 等[24]評估了支持向量機、極限梯度提升樹、自適應增強、決策樹和邏輯回歸5種機器學習模型,以尋找預測ALK重排NSCLC患者的最佳預測模型,其中基于支持向量機算法的機器學習模型性能最高,表明影像組學模型可以作為傳統、有創ALK重排狀態檢測實用且經濟的替代方法。除此以外,ALK重排的NSCLC患者腦轉移發生率較高,同時也是治療失敗最常見的原因。研究表明,影像組學模型和基于影像組學的諾莫圖是預測ALK重排的晚期NSCLC患者發生腦轉移風險的重要手段[25-26]。
2.3 Kirsten大鼠肉瘤病毒癌基因 大鼠肉瘤病毒癌基因(rat sarcoma viral oncogene,RAS)是第一個被發現的人類腫瘤基因,RAS蛋白是一類鳥嘌呤核苷酸結合蛋白,當其與GTP結合時處于活化狀態,與GDP結合時處于失活狀態。當RAS蛋白發生突變后,機體失去GTP水解酶活性,將持續激活下游信號傳導通路,導致腫瘤發生。Kirsten大鼠肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)是RAS家族中最重要的基因類型[27]。多年來,針對KRAS突變的藥物研發一直是研究難點,突變的KRAS蛋白有“不可成藥靶點”之稱,且與NSCLC患者EGFR-TKIs耐藥相關,常提示預后不良。在KRAS G12C突變的局部晚期或轉移性NSCLC患者中,索托雷塞顯示出較好的抗癌作用,并成為全球首個靶向KRAS蛋白的抗腫瘤藥物[28]。目前,基于CT影像組學預測KRAS突變的研究較少,這可能與長期缺乏相應的靶向藥物有關。Weiss 等[29]認為精細紋理的正偏度和粗糙紋理的較低峰度與KRAS突變相關,且較低的峰度值與NSCLC患者較短的生存時間相關。Rios Velazquez等[30]基于CT影像組學的一項多中心研究顯示,影像組學模型可以預測KRAS突變狀態但效能有限,且結合臨床因素并不能提高KRAS突變的預測準確性,但影像組學模型以及聯合模型在區分EGFR突變和KRAS突變方面具有較高價值。總的來說,影像組學特征對預測肺腺癌KRAS突變仍有價值。
2.4 鼠類肉瘤病毒癌基因同源物B1 鼠類肉瘤病毒癌基因同源物B1(v-raf murine sarcoma viral oncogene homolog B1,BRAF)基因位于7號染色體上,負責編碼RAF激酶家族中的絲氨酸/蘇氨酸蛋白激酶。BRAF突變后RAS-RAF-MEK-ERK信號通路(即MAPK/ERK信號通路)傳導異常,ERK被持續激活,繼而發生腫瘤細胞增殖和轉移[31]。V600E突變是NSCLC中BRAF最常見的突變類型,達拉非尼聯合曲美替尼已作為晚期NSCLC患者BRAF V600E突變的一線治療方案寫入NCCN指南[32]。Shao等[33]基于1096例NSCLC患者的CT圖像開發出一個多標簽多任務深度學習模型,該模型在評估BRAF在內的8個基因突變狀態方面均表現優異,其中識別BRAF突變的曲線下面積(area under the curve,AUC)在訓練集及驗證集分別為0.834、0.793。Padole等[34]對62例存在BRAF突變的NSCLC患者分析發現,影像組學特征在TNM各期間存在差異,其中IV期和I期差異最為顯著,表明影像組學有望成為肺癌患者TNM分期的無創替代工具,以減少患者活檢的痛苦。
2.5 其他罕見突變 由于突變率低或缺乏相應的靶向藥物,RET (rearranged during transfection)重排、C-ROS原癌基因1(cros oncogene 1,ROS1)重排、間質上皮細胞轉化因子(mesenchymal epithelial transition factor,MET)擴增及人表皮生長因子受體2(human epidermal growth factor receptor 2,HER2)突變等影像組學研究較少。Yoon等[35]從539例肺腺癌患者CT和正電子發射斷層掃描(positron emission tomography,PET)圖像上提取組學特征并結合傳統影像學特征、臨床特征,所構建的模型能夠準確區分RET重排與RET野生型以及ROS1重排與ROS1野生型肺腺癌。Shao等[33]開發的多標簽多任務深度學習模型在識別RET重排、ROS1重排、MET基因擴增及HER2突變方面表現優異(AUC分別為0.85、0.91、0.92、0.89)。
免疫治療是指通過激活自身免疫系統、解除免疫細胞抑制狀態、加強免疫應答反應從而發揮抗腫瘤作用。免疫檢查點抑制劑可特異性阻斷抑制性受體如程序性死亡1(programmed cell death-1,PD-1)/程序性死亡配體1(programmed cell death-ligand 1, PD-L1)以及細胞毒性T淋巴細胞相關抗原4(cytotoxic T lymphocyte-associated antigen-4,CTLA-4),以恢復抗腫瘤反應。影像組學可以對NSCLC免疫檢查點表達情況及腫瘤微環境組成情況進行準確預測并實時監測免疫治療效果,是一種簡單、省時的無創檢查方法。
3.1 程序性死亡1/程序性死亡配體1 PD-1作為一種免疫抑制分子,表達于活化的T細胞、B細胞、自然殺傷細胞、單核細胞等細胞表面;PD-L1是PD-1的主要配體,在腫瘤細胞中廣泛表達;兩者特異性結合致使T細胞受體信號轉導和CD28共刺激下調,降低CD8+T細胞增殖能力,從而抑制免疫應答反應,是腫瘤細胞免疫逃逸的重要機制[36]。PD-L1高表達與腫瘤侵襲性行為及預后不良顯著相關,PD-1/PD-L1抑制劑單藥或聯合化療、靶向治療等治療方案可使肺癌患者生存獲益[37-38]。相繼有研究報道影像組學無創、動態評估PD-L1在NSCLC中的表達情況同時預測免疫治療效果的可行性[39-41]。Bracci等[39]研究表明,基于CT紋理分析的影像組學評分可用于預測局部晚期或轉移性NSCLC患者的PD-L1表達。Wang等[40]及Tian等[41]訓練的深度學習模型較紋理分析可以更好區分NSCLC中 PD-L1表達 <1%、1%~49%以及≥50%的患者并能準確評估患者對免疫治療后的反應。此外,深度學習模型聯合臨床模型對NSCLC患者有更好的分層能力,以指導治療方案的選擇。
3.2 細胞毒性T淋巴細胞相關抗原4 CTLA-4是免疫球蛋白超家族成員,主要表達在活化T細胞表面。CTLA-4 通過與共刺激性受體CD28競爭性結合抗原呈遞細胞上的B7配體,向活化T細胞傳遞抑制信號,促進腫瘤免疫逃逸。此外,T 調節細胞上的組成型 CTLA-4 表達可進一步降低B7配體的水平,抑制免疫反應[42]。CTLA-4已被證實是多種腫瘤預后不良的獨立預測因子,針對CTLA-4的抗體-伊匹單抗可顯著提高包括肺癌在內的癌癥患者的總生存期及無進展生存期[43]。已有研究表明PET-CT可對64CU-DOTA-伊匹單抗進行成像以無創監測NSCLC中CTLA-4表達情況[44]。影像組學可以預測腫瘤CTLA-4表達及生存情況,但在肺癌中鮮有報道[45-46]。 CTLA-4作為肺癌重要免疫檢查點之一,值得進一步探索影像組學特征與其之間的關系以更好地指導臨床。
3.3 白細胞分化抗原8 CD8是部分T細胞表面的一種跨膜糖蛋白,主要作用是輔助T細胞受體與MHC I類分子所提呈的抗原特異性結合并參與T細胞活化。活化的CD8+T細胞又名細胞毒性T細胞(cytotoxic T lymphocyte,CTL)釋放大量細胞毒素或介導免疫發揮抗腫瘤作用。免疫治療的主要機制之一就是通過促進CTL增殖并向腫瘤部位浸潤從而達到殺傷腫瘤細胞的目的。因此,CD8+腫瘤浸潤淋巴細胞(CD8+tumour-infiltrating lymphocytes,CD8+TILs)的浸潤程度成為了評價免疫治療效果、患者預后的可靠指標[47]。Chen 等[48]研究顯示術前CT影像組學評分與NSCLC中CD8+TILs豐度高度相關,其中灰度共生矩陣中的依賴非均勻性歸一化對預測NSCLC中CD8+TILs豐度貢獻最大。放療是肺癌的常見治療方式之一,不僅可以直接殺傷腫瘤細胞,還能增強免疫治療的抗腫瘤反應。Sun等[49]通過建立影像組學特征與CD8+TILs浸潤程度之間的關系,準確評估了免疫治療聯合放療的肺癌患者預后情況,為NSCLC免疫治療及聯合治療選擇治療優勢人群提供了有力證據。
明確NSCLC驅動基因突變狀態、免疫檢查點表達情況以及腫瘤微環境組成情況顯然已成為NSCLC精準化、個體化治療的關鍵。影像組學可以無創、全面地反映腫瘤分子表型及其微環境改變,有利于選擇NSCLC靶向治療及免疫治療優勢人群、制定個性化治療方案以及評估患者預后。但目前影像組學在臨床并未得到有效利用,主要存在以下問題:①大多數研究為回顧性、單中心研究,且樣本量較小,模型的泛化能力與穩定性不佳;②現有的特征選擇方法眾多,最優處理方法仍不清楚;③不同設備之間采集參數的差異影響特征值的穩定和再現;④影像組學特征與腫瘤表型之間的關系缺乏共識,給醫師對特征的解讀帶來挑戰。但影像組學仍然顯示出光明的前景,未來可開展多中心、大樣本的研究,并建立可重復、標準的影像組學特征以實現對肺癌患者的分層管理,最終實現精準醫療。