田晉捷,馬新偉,許建銘,龐洪權,朱建兵
蘇州科技城醫院 影像科,江蘇 蘇州 215000
隨著探討腫瘤基因組學與腫瘤微環境重塑之間相互作用的研究越來越多[1-2],包括 Von Hippel-Lindau(VHL)、SETD2、PBRM1和BAP1等基因的突變,可能會造成基因組不穩定,并促發DNA修復途徑缺陷。由這些缺陷引起的分子特征驅動腎透明細胞癌(Clear Cell Renal Cell Carcinoma,ccRCC)個體發育,產生與臨床診斷和治療相關的亞型分類。對這些亞型與腫瘤微環境相互作用機制的研究表明特定突變可以調節ccRCC腫瘤中的免疫細胞群[3];并且一項多中心研究結果顯示,大多數亞型的影像特征與VHL基因突變顯著相關[4]。因此,本研究將從VHL基因表達量層面對ccRCC進行CT組學特征提取,并利用CT組學特征構建預測ccRCC高低分級的診斷模型。
ccRCC患者基因表達譜及臨床記錄均下載自Cancer Genome Atlas-Kidney Renal Clear Cell Carcinoma(TCGAKIRC),利用 TCGA GDC Data Portal(https://portal.gdc.cancer.gov/)官方下載工具進行TCGA數據下載。TCGAKIRC的圖像來自美國的7個中心,使用了GE、SIEMENS和Philips等多臺掃描儀,掃描層厚范圍為1.25~7.5 mm。共下載數據203例,符合入組條件163例,訓練組入組病例120例,測試組入組病例43例。執行入組標準:① 入組病例CT平掃及增強圖像完整(至少包括皮髓質期及靜脈期);② 病理Fuhrman分級、免疫組化、基因表達譜資料完整;③ 檢查前未進行放化療及手術等干預措施;④ CT檢查與取材病理時間不超過30 d。排除標準:① CT各期圖像不完整;② 臨床資料缺失;③ 有腹腔其他臟器轉移。該研究遵循TCGA的出版指南和數據訪問政策[5]。所有患者病理分級參照Fuhrman四分級系統[6],根據Fuhrman分級結果,將ccRCC入組病例采用Fuhrman 2級簡化版分級進行分組,Fuhrman低級別(F-low)包括Fuhrman Ⅰ、Ⅱ級,Fuhrman高級別(F-high)包括Fuhrman Ⅲ、Ⅳ級,其中,Fuhrman 2級簡化版較Fuhrman分級系統在預測癌癥特異性死亡率方面差異無統計學意義[7]。
首先由2名具有豐富臨床工作經驗的影像科醫生采用雙盲法在CT皮髓質期DICOM格式圖像上勾畫感興趣區(Region Of Interest,ROI),采用 Kappa 檢驗驗證兩者勾畫區域一致性。采用皮髓質期的主要原因為ccRCC強化呈“快進快出”模式,皮髓質期實性部分明顯強化,瘤體的異質性表現更明顯。另外,采用輪廓法[8]進行瘤體勾畫,包括腫瘤內實性成分及壞死、出血、鈣化等所有組織。ROI示例如圖 1 所示。瘤體體積(Tumor Mass Volume,TMV)由計算機融合每層腫瘤的ROI構建而成,從每例ccRCC癌灶的TMV中提取588個影像組學特征,包括18個一階灰度特征,215個三維形狀特征,355個小波特征[9]。所有特征的計算方法均符合圖像生物標志物標準化倡議[5]。特征提取完成后,將得到的有效特征子集輸入學習分類器(LASSO分類器)進行交叉訓練及驗證,構建以組學特征和學習分類器為主要組成的影像組學診斷模型。

圖1 CT皮髓質期圖像ROI示例
共下載數據203例,符合入組條件163例,訓練組入組病例120例,測試組入組病例43例,組內、組間年齡均無統計學差異(P>0.05),組內性別無統計學差異(P>0.05),組間性別存在統計學差異(P=0.01)。兩組醫生分別在CT皮髓質期勾畫瘤體ROI,計算機融合得到TMV,對其進行Kappa檢驗,一致性高(Kappa值=0.81)。患者臨床特征如表1所示。

表1 入組患者臨床特征
VHL基因表達在ccRCC Fuhrman高低分組間分布存在統計學差異(P=0.037)。莖葉圖如圖2所示。

圖2 VHL基因表達在ccRCC Fuhrman高低級分組分布圖
在訓練組120例中,將VHL基因表達與CT組學特征進行秩相關性分析。多項多中心研究[4]已經證明大多數ccRCC的影像特征與VHL突變顯著相關,本研究在此基礎上進一步分析,共得到25個具有統計學意義的CT組學特征(簡稱有效CT組學特征),包括一階灰度特征1個、三維形狀特征11個、小波特征13個。采用ROC曲線檢驗有效CT組學特征對ccRCC高低分級預測的診斷效能。訓練組有效CT組學特征對ccRCC Fuhrman高低級分組的ROC曲線如圖 3所示,AUC(95%CI)為 0.742(0.654~0.817),敏感性79.0%,特異性61.4%,P<0.001。

圖3 訓練組有效CT組學特征對ccRCC高低分級的ROC曲線
在測試集43例中,采用ROC曲線檢驗有效CT組學特征對ccRCC Fuhrman高低級分組診斷效能,AUC(95%CI)為 0.816(0.668~0.918),敏感性 90.9%,特異性 61.9%,P<0.001,見圖 4。

圖4 測試組有效CT組學特征對ccRCC高低級分組的ROC曲線
VHL是一種重要的腫瘤抑制因子,在大多數ccRCC中表達缺失,其缺失或突變通常被認為是ccRCC發展的必然步驟之一。Fuhrman分級與腫瘤的分期和轉移能力有關,分級越高表明腫瘤生物攻擊性越強,也代表腫瘤侵襲性越強。STRING數據庫(https://www.string-db.org)檢索發現VHL基因與522種蛋白質之間存在互作網絡關系(更新截至2021年6月),其中僅有少量的(40%左右)蛋白互作網絡機制及其作用的結構域被研究證實[10]。血管內皮生長因子(VEGF)、缺氧誘導因子(HIF)、促紅細胞生成素(EPO)等多條通路在腎癌發生發展過程中具有重要意義:VEGF可以引起腫瘤血管生成,VEGF受HIF調控,研究證實缺氧可以誘導VEGF及堿性成纖維生長因子等基因轉錄[11],以提高血管滲透性和促進血管內皮生長;EPO在細胞的氧穩態中也起到重要作用,其受體促紅細胞生成素可以被HIF-2α反式激活,并介導EPO誘導的紅細胞增殖和分化[12];VHL介導的包括HIF、VEGF在內的促血管生成因子的轉錄,被證明可以促進人腫瘤細胞小鼠異種移植模型中的新血管生成[13]。VHL突變通過以上這些通路相關蛋白靶點導致腎細胞癌高度血管化特征形成,而VHL突變導致的腎癌高度血管化特征是尋找腫瘤生成共同節點和相應靶向藥物精準治療方案的主要方向。而影像診斷學作為臨床輔助手段,如果可以在術前通過圖像紋理特征關聯腫瘤血管化特征,提高對該腫瘤的分級診斷,對指導臨床手術方式的選擇或靶向治療方案的確定具有重要意義。
VHL突變導致的ccRCC高度血管化特征被認為是腫瘤侵襲性的重要提示,不同腫瘤或是同種腫瘤不同級別的血管化程度存在一定的鑒別意義[13-14]。Li等[4]通過多中心研究結果探索了影像組學特征與ccRCC關鍵驅動基因VHL突變之間的關系,發現皮髓質期CT的所有相關特征均可用于鑒別ccRCC與非ccRCC,大多數影像特征與VHL突變顯著相關,這奠定了影像組學的分子基礎。Zhou等[15]研究發現CT組學特征在預測ccRCC的惡性程度方面具有較高的診斷效能,其中高階紋理特征在影像組學特征構建中發揮了重要作用,其中的“區域熵”和“最小依賴強度”與Fuhrman分級的相關性最高,一階灰度特征“能量”也排名靠前。本研究中,一階灰度特征“區域熵”和“能量”也是排名靠前的特征。熵是描述腫瘤異質性的有效組學特征,熵值越高表明紋理圖案的異質性更強,同時Liu等[16]的研究也指出熵與腫瘤侵襲性密切相關。能量特征代表圖像的均勻性,其中更大的能量值意味著圖像中有更多的實性高密度成分,并且他們在較高頻率上彼此相鄰。結合本研究來看,血管化特征在皮髓質期表現明顯強化,與周圍壞死成分形成鮮明對比,異質特性強。
ccRCC較其他腎癌亞型,預后最差,目前其病理分級應用最廣泛的是Fuhrman分級系統[17]。Fuhrman分級與腫瘤的分期和轉移能力有關,分級越高表明腫瘤生物攻擊性越強,生存率越低,也代表腫瘤侵襲性越強,而腫瘤的侵襲性與其血管化密切相關。所以依據VHL突變導致的血管化特征匹配的有效CT組學特征,預測ccRCC高低分級是合理的。
在影像診斷領域,隨著高通量計算機算法與影像基因組學飛速發展,組學特征通過紋理灰度特征分析,可以得到更加細致入微的圖像特征,更貼切地反映腫瘤微環境的變化[18-20]。本研究通過CT組學特征定量描述VHL表達量導致的腎癌高度血管化特征,定量分析VHL表達量在ccRCC Fuhrman高低組間的分布。研究結果發現隨著腫瘤級別的升高,VHL表達分布顯著降低,組間差異存在統計學意義(P=0.037);進一步將病例分為訓練組及測試組,在訓練組中,將VHL表達與CT組學特征進行相關性分析,發現25個有效CT組學特征(P<0.05),采用有效CT組學特征對ccRCC高低分級進行ROC曲線效能檢驗,AUC(95%CI)值為0.724(0.654~0.817)(>0.7為具有較好診斷效能),在測試組中采用有效CT組學特征對ccRCC高低分級進行ROC曲線效能檢驗,AUC(95%CI)值為 0.816(0.668~0.918)。所以,本研究基于VHL基因表達構建的CT組學特征預測ccRCC Fuhrman分級的模型具有較高的診斷效能。
本項研究存在以下局限性:① 本研究采用TCGA數據庫,多中心研究圖像掃描期相及層厚存在一定差異,雖然在特征提取前進行了歸一化預處理,但是圖像還存在一定影響;② ROI選擇在皮髓質期勾畫,未使用其他期相,待進一步行多期相數據分析;③ 本研究樣本例數因為匹配特定基因的原因,入組例數較少,待進一步擴大病例數,對預測模型進一步訓練,不斷提高診斷效能。
本研究通過CT組學特征定量描述VHL表達導致的腎癌高度血管化特征,采用影像特征形式將基因表達可視化。通過相關性分析篩選出與VHL表達相關的CT組學特征,并利用其構建模型對ccRCC高低分級進行預測,結果顯示本研究基于VHL基因表達構建的CT組學特征預測ccRCC Fuhrman分級的模型具有較高的診斷效能。人工智能預測模型將對ccRCC術前分級提供一定的臨床指導意義,本模型為單基因初級模型,還需進一步擴大樣本例數及基因種類,不斷對其進行特征訓練,提高診斷效能及臨床使用價值。