王安然,李泉江,黃鐘馨,谷金銘,彭娟,羅天友,呂發金
作者單位:重慶醫科大學附屬第一醫院放射科,重慶400016
“影像組學”(radiomics)術語在2012 年由荷蘭學者Lambin等[1]首次提出,指從醫學圖像中提取高通量特征,利用自動或半自動分析方法將影像信息進行更深層次的數據挖掘,并與其他臨床數據相關聯,用于基于證據的臨床診療決策支持。基于影像組學的判讀較傳統人工判讀更客觀、信息利用度及判讀重復性更高、定量分析及知識經驗傳承更容易。隨著世界范圍內精準醫療的興起,影像組學為放射科醫師提供了新工具和新手段,以實現對病人更精確的個性化診斷和治療。本文著重介紹影像組學的方法框架及技術進展,在頭及頸部疾病診療中的應用現狀,現存問題和未來發展。
影像組學是計算機輔助診斷和檢測系統的自然擴展[2],但兩者有一定區別,計算機輔助診斷和檢測系統旨在檢測和診斷病灶,而影像組學明確地側重從數字圖像中提取大量定量特征,將這些數據放置在共享數據庫中并隨后進行處理,旨在開發決策支持工具。影像組學的方法步驟包括[2]:(1)獲取影像數據;(2)識別感興趣的區域;(3)進行圖像的分割;(4)特征提取和選擇;(5)使用這些特征建立數據庫;(6)利用這些數據,同時可以結合其他信息如人口統計學、臨床信息、伴隨疾病、基因組數據來開發分類器以預測結果。
近年來影像組學利用機器學習或統計方法進行特征的分類[2],機器學習的算法有很多,包括支持向量機(support vector machines)、隨 機 森 林(random forest)、k 最 近 鄰(knearest neighbors)等,其中深度學習[3](deep learning)是目前機器學習中最活躍的領域之一,因為它能更好地利用高維數據集,通過培訓和多層復雜網絡,抓住數據的內部結構,卷積神經網絡(convolutional neural network)是圖像分析中最常見的網絡架構。
影像組學通過計算機技術,對醫學影像圖像中的大量生物學信息進行深度挖掘,并進一步的判斷分析,可用于頭頸部疾病診斷及鑒別診斷、治療方案的選擇、療效監測和評估預后等多方面。
Wu等[4]收集了206例頭頸部鱗狀細胞癌患者的CT增強圖像,通過核主成分分析法和隨機森林方法提取了670 個放射學特征,用以區分高分化、中分化和低分化的頭頸部鱗狀細胞癌,結果受試者工作特征曲線下的面積(the area under the receiver operating characteristic curve,AUC)為0.96,準確度達到了92%。van den Burg等[5]對梅尼埃病患者和特發性不對稱感音神經性聽力損失患者內耳進行了高分辨率T2WI MRI 掃描,定量分析了兩者的影像組學特征,結果顯示具有統計學差異的圖像特征存在于內耳迷路的所有子結構中。Seidler 等[6]將紋理分析用于雙能CT 多能量虛擬單色圖像數據集,區分頭頸部鱗癌轉移性淋巴結、淋巴瘤、炎癥性或正常淋巴結,將淋巴結分為惡性(即頭頸部鱗癌轉移或淋巴瘤)和良性的準確度、敏感度和特異度均超過91%。Brown 等[7]前瞻性地利用紋理分析對甲狀腺良惡性結節分類,將26 例患者的術前DWI 圖像作為訓練數據,篩選出21 個紋理特征建立模型,分類準確度為94.7%,敏感度92%,特異度96%。Fruehwald-Pallamar 等[8]從標準MRI 序列的圖像中提取紋理特征,發現增強的T1WI 包含最相關的紋理信息,可用于腮腺多形性腺瘤及腺淋巴瘤之間的鑒別,以及腮腺的良性腫塊和惡性腫塊之間的鑒別。Park 等[9]從21 例口咽鱗狀細胞癌患者和6 例惡性淋巴瘤患者的動態對比增強MRI 圖像中提取直方圖特征,在ROC分析中血管外細胞外間隙容積比(Ve)的峰度對判別兩種癌癥價值最高。已有研究表明影像組學對頭及頸部疾病的診斷及鑒別診斷有重要臨床應用價值,可以提高診斷準確率。
Zhang 等[10]采集了113 例晚期鼻咽癌患者的T2WI 及T1 增強數據,提取出970 個特征,選用LASSO 方法選擇了8 個與晚期鼻咽癌進展顯著相關的特征,探索了影像組學在預測晚期鼻咽癌患者進展的潛在可能性。Zhai 等[11]試圖建立并驗證一種基于影像組學的治療前預測模型,以識別頭頸部鱗癌患者的病理淋巴結在放療后是否有殘留或者復發,結果顯示三個臨床特征和兩個放射學特征是獨立的預后因素,并將定量放射學特征與臨床常用特征相結合建立預測模型,可以在治療前識別出具有高失敗風險的淋巴結以期進行強化治療。Bologna 等[12]建立并測試了幾種基于放射學的鼻竇癌誘導化療反應預測模型,從患者的T1WI、T2WI、ADC 圖像中分別提取了放射學特征并訓練模型,結果發現基于ADC 圖像特征的預測模型表現更好。Sheikh等[13]采集了266例頭頸癌放療患者的腮腺和下頜下腺CT和MRI T1WI增強圖像,結果發現利用影像組學方法可以預測放射性口腔干燥癥的發生。Bogowicz等[14]定量分析放化療后的頭頸部鱗狀細胞癌CT 圖像,計算出包括基于形狀,強度,紋理和小波變換的17種CT放射特征,分別建立Cox和Logistic回歸模型預測其局部控制情況和人乳頭狀瘤病毒水平,認為CT 圖像密度不均勻可能表明放化療后腫瘤的局部控制性能降低,而HPV陽性的腫瘤較HPV陰性的腫瘤CT 圖像上密度分布更均勻。Bogowicz 等[15]另一項研究運用接受放化療的頭頸部鱗狀細胞癌患者的CT 和18F-FDG PET圖像數據,分別訓練了CT,PET 和PET-CT 組合三種放射學模型,結果表明CT 密度更均一的腫瘤和FDG 攝取高的集中區域預后較好,但基于CT 的預測高估了不良預后驗證隊列中的局部控制率,因此建議基于18F-FDG PET 圖像數據建立局部控制模型。Mo 等[16]從113 例下咽癌患者CT 平掃和增強圖像中提取特征,建立了一個基于放射學的模型來預測進行放化療的下咽癌患者的進展風險,該模型在訓練組和驗證組中均表現良好。以上研究表明,影像組學包含的疾病信息可用于選擇臨床治療方式及監測臨床療效,有助于對不同癌癥的患者制訂更為精準的治療方案。
腫瘤的發生通常與遺傳物質的改變有關,這些改變常對分子表達產物和編碼的蛋白質產生一定影響,影像組學認為微觀的改變將造成影像圖像包含的特征發生改變?;诨蚪M學和影像表型之間的關系,近期的癌癥研究出現了一個新興的研究方向—影像基因組學(radiogenomics)[17],其價值在于提供附加的定量診斷信息以支持組織病理學發現,可為患者制訂更完善的治療方案。在磁共振成像中,膠質母細胞瘤表現出強烈的表型特征,如壞死、水腫、對比增強和腫瘤體積,Grossmann 等[18]利用影像基因組學分析腫瘤表型特征與分子通路之間的內在聯系,結果發現壞死和腫瘤體積與免疫反應途徑和細胞凋亡有關,對比增強則與信號轉導和蛋白質折疊過程有關,水腫主要用于體內平衡和細胞循環途徑,同時也是膠質母細胞瘤亞型的最強預測因子。異檸檬酸脫氫酶(isocitrate dehydrogenase 1,IDH1)的狀態與神經膠質瘤的發生、治療和預后密切相關,Yu等[19]從110例腦膠質瘤患者的T2-FLAIR 圖像中提取并量化了671 個特征,通過改進的遺傳算法選擇了110 個特征,分類IDH1 準確度為80%,敏感度為83%,特異度為74%,認為影像組學是利用傳統MRI 圖像非侵入性地估計IDH1 突變狀態的潛在有用方法。Dang 等[20]從16 例口咽鱗狀細胞癌患者的MRI 圖像中提取篩選了7 個重要紋理特征,創建預測模型評估腫瘤抑制蛋白p53 狀態,準確度達到81.3%,表明通過影像組學確立腫瘤生物標志物,來指導治療和了解預后的良好前景。目前,影像基因組學對于腦膠質瘤研究較多,而對其余的頭頸部腫瘤研究較少,在今后工作中,應增加影像基因組學在頭頸部腫瘤中的應用,為種類繁多的頭頸部疾病提供更多相關的指導性建議。
深度學習是機器學習的一個分支,利用多層網絡對原始圖像輸入數據形成的復雜模式進行評估。近年來使用最廣泛的深度學習是卷積神經網絡(convolutional neural network,CNN),仿生人類大腦神經元連接,從原始輸入開始將信息依次層層傳遞到更高、更抽象的級別,自動分析學習信息。目前深度學習在醫學影像領域中取得的進展相當引人注目,在圖像采集和重建、圖像區域識別、圖像分割、圖像特征提取等方面都變現出優越的性能和巨大的潛力。
Pereira等[21]基于CNN探索了腦膠質瘤的自動分割方法,考慮到網絡中的權重較小,采用小的3×3 卷積核,不僅可以防止過度擬合,還可以設計更深的體系結構,該團隊還研究了強度歸一化作為預處理步驟,結果Dice 系數腫瘤及瘤周水腫、瘤體、增強區域的分別為0.88、0.83、0.77。Diamant 等[22]通過基于頭頸部鱗癌患者治療前的CT 圖像,訓練一個CNN 來預測其治療效果,與應用于同一患者隊列的傳統放射學框架相比,該方法在預測遠處轉移方面的AUC 為0.88,將基于CNN的模型與之前的模型相結合時,AUC 提高到了0.92。Lu 等[23]探索了一個新的基于深度學習的框架來幫助阿爾茨海默病(Alzheimer's disease,AD)的早期診斷,從MRI 和FDG-PET 圖像中獲得大腦的結構和功能測量數據,利用多模態和多尺度的深度神經網絡來分類AD患者,對臨床疑似AD的患者分類敏感度為94.23%,對非癡呆人群分類的特異度為86.3%,在1~3年內和3 年轉化成AD 的輕度認知障礙患者分類準確度分別達86.4%、82.4%。Hazlett 等[24]基于深度學習網絡對具有家族性高自閉癥風險的嬰兒進行前瞻性MRI 腦成像研究,發現在2歲時被診斷為自閉癥的高危嬰兒中,在6~12個月時皮質表層區域的過度擴張先于12~24 個月時的腦容量過度增長,這些結果表明自閉癥患兒早期的大腦變化發生在自閉癥行為首次出現之前,利用深度學習算法預測2 歲時高危兒童的自閉癥診斷敏感度為88%。Hosseini-Asl 等[25]利用三維深度監督自適應CNN 方法進行阿爾茨海默病的預測,該神經網絡可以顯示從大腦圖像中捕捉的阿爾茨海默病生物標志物的一般特征,適應不同的領域數據集,并通過改進的微調方法對受試者進行準確分類。
深度學習強大的計算能力可以處理復雜的多模態數據,在高維度醫學影像數據中自動提取和學習特征,不需要人為干預。相較于傳統機器學習方法,深度學習不需要對輸入的數據進行太多的處理,可以自動分析提取信息,但是需要大樣本量來進行數據訓練,目前深度學習在神經系統疾病應用較多,而在頭頸疾病的應用較少。
影像組學通過計算機技術,可以對超聲、CT、PET-CT、MRI圖像進行非侵入性定量信息挖掘,在頭及頸部常見疾病的診斷、治療和預后方面取得了部分成果。查閱國內外文獻,影像組學在頭及頸部疾病的研究相對較少,主要集中在胸部、腹部疾病,國外影像組學研究主要基于MR 成像,而國內影像組學在頭及頸部疾病的研究更少。上述研究存在一些不足之處,如:(1)MRI 掃描儀器、掃描參數不盡相同,導致結論不盡一致;MRI 掃描費時,價格較貴,各級醫院不能常規掃描,不易推廣。(2)研究樣本量相對較小,所得結果可能會有一定偏倚。(3)國內應用CT 影像組學研究,主要采用紋理分析的方法,該方法提取影像組學特征較少;基于深度學習的計算方法將是影像組學的發展方向之一。頭頸部解剖結構復雜,CT、MRI 分辨率有限,以及同病異影、異病同影的困擾,對于頭頸部諸多疾病早期診斷、鑒別診斷明顯不足,而不同腫瘤在表型、生理和基因組水平上具有高度異質性,在圖像上可表現出數千數萬個可測量特征,影像組學能對圖像信息進行深層次挖掘,為頭頸部疾病的診斷、治療、預后提供更多指導性建議。作為一種新興的研究方法,經過多中心、大樣本地反復檢驗和提煉,找到經過驗證的、可靠的生物標志物,是未來影像組學發展的重要方向,為精準醫療打下堅實的基礎。
作者利益沖突聲明:全體作者均聲明無利益沖突。