陳緒珠,馬軍
影像組學是指從醫學圖像中提取高通量定量特征從而實現對腫瘤表型的綜合量化,也就是用量化的影像學特征反映腫瘤的表型[1-4]。本文就影像組學在醫學影像數據的應用原理和在腦膠質瘤的應用現狀、存在的問題及發展前景進行綜述。
作為放射學、計算機視覺和機器學習等多學科交叉的產物,影像組學的產生既有現實的主觀需求,也有客觀條件為基礎。主觀上,影像學的現狀是量化的數據非常有限,對圖像的解讀主要依靠專業人員的視覺評價,結果往往是描述性、主觀和非定量的。因此,客觀、定量評價醫學圖像具有迫切的現實需求。客觀上,醫學成像設備硬件和軟件的改進、醫院數字化的發展、電子病歷的使用、圖像存儲與傳輸系統(picture archiving and communication system,PACS)的便捷和數學算法的進步以及計算機能力的提高,使得高通量提取數字信息成為可能,這為影像組學的產生提供了現實基礎和硬件支撐。另一方面,在大數據時代,醫學研究和臨床數據科學的新領域正在形成,多學科交叉的應用使得多種數據資源的融合以實現個體化診斷和治療成為可能,這為影像組學提供了具體的應用前景。
影像組學處理的數據盡可能標準化,這就要求獲取數據的機器型號盡量統一,掃描所用的參數要有較好的一致性。影像組學的工作流程大體分4步:圖像的獲取、感興趣區(region of interest,ROI)分割、特征提取、建模及有效性驗證(圖1)。圖像的獲取和ROI分割為影像檢查和診斷領域,特征提取牽涉到計算機視覺,提取前可有圖像預處理和濾過,但不是必須的[5]。模型的建立和驗證涉及機器學習或人工智能,因此影像組學為多學科交叉的產物。圖像可來自超聲、CT、MRI及正電子發射計算機斷層顯像(positron emission tomography,PET),其中CT和PET的應用較MRI廣泛。ROI分割分為手動分割、半自動分割及自動分割3種,以高水平的閱片者進行手動分割最準確,但是耗時且有個體差異,用軟件進行自動分割減輕了人力負擔,但是不能用于病理狀態下,尤其是腫瘤邊界不清時[1,5-8]。特征提取是借助計算機視覺,在像素水平上將圖像轉化為大量量化的數據再進行分類和分析。這些特征分為不同的類型:形狀特征、一階統計、二階統計及高階統計輸出[1]。形狀特征主要依賴所用的分割方法,指標包括大小、形狀等;一階統計來自圖像像素強度的柱狀圖,主要體現像素值的分布而不考慮它們的空間關系,常以直方圖為基礎,產生的指標有平均值、標準差、熵、偏態峰及正態峰等;二階統計即紋理或灰度變量特征,主要體現分割的區域內相同灰度或強度像素間的空間關系,反映病變的異質性[5,8],多用于模式識別中;高階統計是利用過濾網格提取圖像的重復性或非重復性模型,常用的濾過有拉普拉斯算法的高斯濾過、Gabor濾過、小波變換及分形維數。影像組學模型的建立和驗證需要足夠量的數據才能完成,采用的方法有無監督ML分析(采用熱點圖或聚類分析,從數據中尋找自然結構特征,不預設數據標簽);監督ML分類器,如通用線性模型、隨機森林法、支持向量機和神經網絡等;介于兩者之間的半監督學習[5,9]。半監督學習為特定任務設計,用于類別標簽不明確時。正則化法用于控制模型的復雜度,避免過度擬合(為遷就樣本而使用多度復雜的函數)。交叉驗證常用于內部驗證,多使用受試者操作特征曲線下的面積進行準確性評價。
影像組學特征提取用的軟件有免費的開放軟件和商業化軟件兩大類,各種不同軟件的具體情況見表1。
神經腫瘤的影像組學通過從影像陣列中提取定量信息,以加深對腦腫瘤的生物學行為和治療的理解,它的分析是以這樣的假說為前提:腫瘤影像反映了腫瘤的形態學和微小尺度的生物學動態變化,包括基因表達、瘤細胞增生和血管形成等。不同的組學量化標簽具有不同的應用價值(表2)。
影像組學特別適于評價高級別膠質瘤,主要用于病變的診斷、預后判斷和療效評估等方面。在膠質瘤的診斷方面,可細分為鑒別診斷、腫瘤基因表達狀態的判斷等。具體地說,膠母的影像組學特征可區分放射性壞死和腫瘤復發,預測患者生存期的長短等。Wu等[10]借助于影像組學方法實現了膠質母細胞瘤和原發性中樞神經系統淋巴瘤的鑒別。Li等[11]利用影像組學方法對膠質母細胞瘤的MGMT甲基化進行了預測,準確率高達80%。Rathore等[12]對膠質母細胞瘤瘤周水腫區進行影像組學分析后發現,該方法能有效判斷腫瘤復發。以Li等[13]為首的研究團隊和德國的Kickingereder等[14]研究小組借助于影像組學分析,各自實現了對膠質母細胞瘤患者的預后判斷。

表1 影像組學分析軟件包(截至2016年8月)Tab. 1 Currently available software packages for radiomics analysis (August 2016)

表2 腦腫瘤影像組學的量化特征及其臨床意義Tab. 2 Examples of quantitative features with their potential clinical relevance
對膠母的影像組學研究,圖像采集多為MRI常規序列:T2WI、FLAIR及增強掃描T1WI。增強圖像能顯示腫瘤的大體邊界,及早發現小的轉移灶,且自增強掃描T1WI圖像提取的特征對膠質瘤患者預后判斷價值高于平掃的T2WI圖像數據,因此影像組學分析常集中在增強圖像上[9]。
截至2018年4月8日,在pubmed上輸入關鍵詞“radiomics AND glioma”檢索到19篇文獻,輸入關鍵詞“radiomics AND glioblastoma”得到26篇文獻,去掉重疊部分,共40篇文獻。這些文獻的研究內容依次是:基因(蛋白)表達的預測(32.5%,13/40)、患者的預后判斷(20%,8/40)、綜述(15%,6/40)、組學方法的改進(12.5%,5/40)、病變的診斷(10%,4/40)、病理分級(5%,2/40)和療效評估(5%,2/40)。從文章所在雜志的層次上看,按照2017年度的MedSci (http://www.medsci.cn/sci/)查詢結果,除了5篇文獻為非Science Citation Index (SCI)雜志外,SCI影響因子3~4.9分的文獻有17篇,影響因子<3分的有12篇,≥5分的文獻有6篇。從文章發表年份上看,2015年1篇,2016年6篇,2017年22篇,2018年(1月至4月8日)11篇。上述文獻的第一作者所在地分別為中國(40%,16/40)、美國(30%,12/40)、歐洲(20%,8/40)和韓國(10%,4/40)。
對上述文獻進一步分析表明,腦膠質瘤的影像組學研究特點是起步較晚,發展迅速;研究內容相對集中(基因或蛋白表達的判斷、預后判斷、診斷與鑒別診斷3個方向占比62.5%);高水平的研究較少(雜志影響因子≥5分僅占15%)[6-7,9,15-18]及研究者群體相對集中(中國、美國、歐洲占90%)。對中國學者而言,對膠質瘤的影像組學研究特點是跟蹤應用能力較強(40%的比率,位居第一);研究的科學問題仍在國外同行的研究范圍內(膠質瘤分級1篇,基因表達9篇,方法改進1篇,診斷3篇,預后判斷2篇),有待創新;投稿的目標雜志相對集中(Journal of Magnetic Resonance Imaging 3篇[19-21],European Radiology 4篇[11,22-24],2種雜志占比43.7%);研究水平有待提高(論文發表的雜志影響因子3~4.9分11篇,占68.8%,≥5分 0篇)。
目前的研究多為回顧性的,無前瞻性研究。當前影像數據以像素為基礎的分析需要對腫瘤進行整體分割,這是該方法研究和臨床應用的瓶頸。此外,機器學習的發展和驗證需要大量的、注釋完好的數據庫,因此,多學科的努力和多中心的合作是必要的。對影像數據的質量評價是非常重要的,因為這直接影響影像組學結果的準確性。多種數據來源(如不同的醫療機構)、不同的數據類型(如多種成像參數的數據)使得分享和集中管理這些數據成為復雜的問題。另外,影像組學的結果難以比較,因為缺乏標準化的方法來引導圖像的定量分析。因此,將不同成像方案和參數的數據標準化是必要的。影像組學臨床應用的挑戰在于圖像采集方案的標準化、準確的圖像配準和腫瘤分割。
總之,影像組學為腦膠質瘤的影像學研究提供了全新的方法,該方法能從現有的影像資料中提取大量的量化信息,極大提升了現有成像模式的價值。未來隨著自身的進一步完善,影像組學將在膠質瘤的研究中發揮更大作用。