周小焙 周海軍
南華大學附屬郴州第一人民醫院放射科,湖南省郴州市 423000
膠質母細胞瘤(Glioblastoma, GBM)是星形細胞瘤中最常見、惡性程度最高的腫瘤[1],組織病理學中明顯的壞死和內皮增生是最顯著的特征,根據WHO(2016)CNS腫瘤(Central nervous system tumors)[2]分類,將其分為Ⅳ級。GBM侵襲性強,治療效果差,手術切除后極易復發,需進行輔助放化療。目前MRI仍是GBM診斷和監測地首選成像方式[3],但由于不同醫生對于圖像的主觀評價有所差異,最終的臨床評估結果存在潛在偏差。
影像組學是2012年荷蘭學者Lambin[4]提出的新興概念,可以深度挖掘醫學影像中人眼無法識別的影像特征,并通過統計學或者深度學習的方法來剔除冗余特征,使用相關特征來分析相關臨床信息。近年來,隨著個體化治療及精準醫學的推進,影像組學得到了全面的發展,廣泛應用多種成像技術,如PET、CT、MR圖像、超聲[5]等。影像學檢查對于膠質母細胞瘤的鑒別診斷、預后、生存期預測都具有重要的參考價值。
通過影像組學分析的研究內容主要包括以下4個關鍵步驟:圖像采集、圖像分割、特征提取和篩選、建立數據庫對信息分析建模。
1.1 圖像采集 足量病例的標準化采集是保證后續分析的基礎。為了保證分析質量, 除了對病人進行篩選及在采集過程嚴格標準化掃描外,也應注意幾個方面: (1) 盡可能使用高分辨率圖像; (2) 按標準化流程采集數據; (3) 盡可能擴大樣本量。目前不同機構之間的檢查,并無共識及指南,后續提取特征必然存在差異,所以難以共用。
1.2 圖像分割 圖像的感興趣區(Region of interest,ROI)的分割,根據提取的方法的不同,大致有以下幾種常見方法:(1)手工分割方法。(2)閾值分割方法。(3)水平分割方法。(4)區域生長法。(5)人工神經網絡等。各種方法各有優劣,如手工分割腫瘤的精度高,但操作時間長,且可重復性差。
1.3 特征提取 提取可靠、穩定并且全面的特征十分重要,目前可以通過Python、Matlab等軟件,或通過放射組云平臺、飛利浦星云工作站等云平臺提取。目前一般特征包括如下:(1)一階特征:一階統計數據描述圖像區域內體素強度的分布,包括熵、平均值、中位數、標準差、偏度等。(2)形狀特征(2D、3D):描述ROI的三維或二維大小和形狀的特征,如腫瘤的體素體積、表面積、表面積與體積比等。(3)紋理特征:常用灰度共生矩陣(Gray level co-occurrence matrix,GLCM):描述兩個位置的像素的聯合概率密度;灰度大小區域矩陣(Gray level size zone matrix,GLSZM):量化圖像中的具有相同灰度強度的連接體素的數目;灰度游程矩陣(Gray level run length matrix,GLRLM):表示具有相同灰度值的連續像素的長度;鄰近灰度差矩陣(Neighbouring gray tone difference matrix,NGTDM):表示一定距離內的灰度值與其鄰域的平均灰度值之間的差值;特征灰度依賴矩陣(Gray level dependence matrix,GLDM):量化圖像中距離內的連接體素數。包括基于過濾器的特征:如經拉普拉斯高斯濾波、平方值、平方根、小波特征等。最后并非所有提取出的特征對預測結果有所幫助,為了消除冗余特征并減小數據過擬合對模型的泛化能力造成的影響。還需對提取出的特征值進行篩選,目前常用篩選特征值的方法,如最小絕對收斂和選擇算子(Least absolute shrinkage and selection operator,LASSO)、方差分析、最小冗余最大相關等。
1.4 建立模型 模型構建各種不同的算法包括:支持向量機(Support vector machine,SVM),如Lin CJ等[6]建立的LIBSVM、邏輯回歸(Logistic regression,LR)、隨機森林(Random forest, RF)、K鄰近(K-nearest neighbor, KNN)、決策樹(Decision tree,DT)、貝斯葉算法、深度學習(Deep learning,DL)等,最終需根據研究目的將臨床數據、基因、蛋白等特征納入模型。
2.1 鑒別診斷 GBM、原發性中樞神經系統淋巴瘤(Primary central nervous system lymphoma ,PCNSL)、轉移瘤作為顱內常見的惡性腫瘤[7],其表現不盡相同,現有不少研究就通過影像組學獲得更多診斷信息。Suh HB等[8]通過54例PCNSL患者和23例非壞死性不典型GBM患者。從多參數和多區域圖像中提取了6 366個放射學特征,包括形狀、體積、一階、紋理和小波變換特征。通過交叉驗證,對這些特征進行遞歸特征消除和RF分析。采用ROC分析評價基于影像組學的機器學習分類器、ADC值和使用三種基于常規MR序列的三位放射科醫師對腫瘤的診斷能力。最終基于影像組學的機器學習算法在鑒別PCNSL和非典型GBM分類結果的AUC值(0.921),高于腫瘤ADC值的AUC值(0.684)和三位放射科醫師的AUC值(分別為0.707、0.759、0.695)。Wu G等[9]提出了一種基于稀疏表示的PCNSL和GBM自動分類系統,回顧27例PCNSL患者及28例GBM患者的TIWI圖像,利用十折法對數據集進行交叉驗證,鑒別診斷結果的準確率為96.36%,敏感度為96.30%,特異性為96.43%,以上研究均表明影像組學在鑒別PCNSL和GBM取得了不錯的結果。Artzi M[10]等通過212例GBM患者和227例腦轉移患者(乳腺、肺等)用1.5T和3.0T MR獲T1WI圖像,通過多種臨床信息、腫瘤部位、圖像中的一階特征、形態特征、小波特征。在降維后,采用各種機器學習算法進行分類,包括SVM、KNN、DT和集成分類器,最終SVM分類器對GBM和腦轉移瘤進行鑒別的AUC達到0.96,可以看出影像組學對GBM和腦轉移瘤有較大的診斷價值。以上研究表明影像組學作為一種反應腫瘤異質性的技術,可以對鑒別GBM有較好的診斷效能。
2.2 基因表達 2016年WHO發布的《中樞神經系統腫瘤分類》是基于2007年版本的修訂版,其中納入了用分子學特點定義的一些新的分類,使得影像組學未來研究方向朝著基因及分子特點上的預測發展。近期的研究已經對異檸檬酸脫氫酶(Isocitrate dehydrogenase 1,IDH1)突變[11]、O6-甲基鳥嘌呤DNA甲基轉移酶[O(6)-methylguanine-DNA methyltransferase,MGMT]甲基化[12]和地中海貧血/智力低下綜合征基因(X-linked alpha thalassemia mental retardation syndrome,ATRX)突變[13]的影像組學特征進行探索。Chang P等[14]回顧259例LGG或者HGG的MRI,并使用主成分分析法提取組學特征,其中發現突變型IDH1較野生型IDH1腫瘤相對呈弱強化。而Yamashita K等[15]對55例野生型IDH1和11例突變型IDH1的GBM進行回顧性研究,分析其血流量及壞死程度,證實腫瘤血管與突變型IDH1狀態之間可能存在相關性。Li ZC等[16]回顧133例GBM患者,從多參數MRI中自動提取了1 705個多區域放射學特征,使用R語言中Boruta包篩選相關特征并構建模型,結果使用6個相關特征的影像組學模型對獨立的60例驗證組GBM中MGMT甲基化狀態預測,AUC可達0.88,準確度可達0.80,證實影像組學特征有助于診斷和預測GBM基因突變狀態。而魏煒等[17]回顧137例GBM患者術前MR圖像并人工勾畫ROI,隨后在T1WI增強序列上提取620個高維3D影像組學特征,并采用Pearson相關和LASSO回歸進行特征的選擇,最后用Logistic回歸建立對MGMT甲基化狀態分類的預測模型,AUC可達0.974,符合率達0.912。該研究也表明影像組學是可以作為預測GBM中MGMT甲基化的一種潛在的、非侵入性的影像生物標志物。
2.3 預后研究 近年來,GBM患者的3年生存率從過去1999—2000年的約4%上升到2009—2010年的10%[18],如何更加準確地預測患者預后情況及早期復發和轉移可能性,以及時調整每一位患者個性化治療方法仍是一個考驗。不正確的腫瘤進展診斷可能導致錯誤的治療方案,并對生存率產生負面影響,并會導致不適當的患者被納入臨床試驗。而影像組學的理念認為影響疾病的各種預后因素是能通過圖像特征表現出來。Zhang X等[19]收集105例的GBM患者(57例為長期存活組,48例為短期存活組,以12個月的總生存期分組)的多參數MRI圖像,共提取了4 000個影像組學特征。運用LASSO方法篩選出25個特征,結合臨床危險因素,構建出基于LR模型的影像組學列線圖。通過校準度、區分度和臨床實用性來評估該影像組學列線圖的效能。結果在生存分層中比臨床危險因素(如年齡、Karnofsky功能狀態評分和治療策略)表現更好。當影像組學和臨床危險因素相結合時,其影像組學列線圖在訓練集(C指數,0.971)和驗證集(C指數,0.974)中顯示出良好的區分度。表明影像組學列線圖作為無創性預測工具表現出良好的預測準確性,并可提供GBM病人生存分層的個體化概率。
在預測GBM復發方面。Kim JY等[20]回顧性分析83例膠質母細胞瘤患者術前磁共振成像(MRI)表現,從中提取6 472個放射特征。用AUC檢驗6個月進展的診斷模型,并與FA和CBV的單個參數進行了比較。采用Harrell C指數進行生存模型的檢驗,并與年齡、性別、Karnofsky表現評分、手術切除程度等臨床模型進行比較。最終聯合應用FA和CBV放射組學對局部進展(AUC 0.79;95%CI 0.67~0.90)的預測價值優于單影像學放射組學(AUC 0.70~0.76)和單項影像學參數(AUC 0.51~0.54),結果表明影像組學對于假性進展具有一定的診斷效能,有助于為患者調整和改進下一步的治療計劃。
影像組學有很大的臨床應用潛力,能夠充分挖掘和分析肉眼無法觀察的影像特征,提供臨床提供量化的非侵入性工具,幫助腫瘤的精確診斷、分型及靶向基因檢測,實現臨床的提前干預、提高患者的生存質量。目前,影像組學內許多步驟仍處于發展階段,未來將多種信息整合到一個人工智能模型中將是推進個體化醫療的重要方向。隨著計算機水平及影像學的發展,影像組學必將使影像學和臨床產生巨大革新。