梁 田,謝 晟
(中日友好醫院 放射診斷科,北京 100029)
自從1895 年倫琴發現X 射線再到后來分子影像的出現,數字化醫學影像學已經成為現代醫學重要的手段和組成部分。 在過去十年中,隨著模式識別工具數量的增加和數據集大小的增加,醫學圖像分析領域呈指數發展[1]。影像組學作為定量成像中新興的領域,近年來越來越受到人們的關注,本文主要探討總結了影像組學的基本概念及其在肺部疾病中的應用。
影像組學的概念最早由荷蘭學者Kumar 在2012 年提出[2],其含義是指通過計算機斷層攝影、正電子發射斷層攝影或磁共振成像獲得的醫學圖像中提取和分析大量高通量的高級定量成像特征,從而產生非常大的潛在對象領域。 影像組學數據呈現為可挖掘的形式,可用于建立描述性和預測性模型,將圖像特征與表型或基因-蛋白質特征相關聯。 影像組學的核心假設是這些模型,包括生物學或醫學數據,可以提供有價值的診斷、預后或預測信息,從而實現腫瘤分割、特征提取與模型建立,憑借對大量影像數據信息進行進一步的挖掘、預測和分析來輔助醫師做出最準確的診斷[3]。相較于傳統影像學而言,影像組學是一種多學科交叉、多種影像技術相互結合的技術。 與基因組學和蛋白組學相比,其使用非侵入式的影像模式進行分析腫瘤的綜合特征信息,無需進行活檢或介入手術進行提取腫瘤組織特征信息,同時能解決腫瘤存在的異質性問題。 影像組學的影像特征必須具備3 個特性:可重復性、非冗余性、信息量豐富。只有可重復性較高的穩定特征才可用于后續研究,在建模分析時才能獲得較為精確的結果。
通過高通量計算,現在可以從斷層圖像(計算機斷層成像、磁共振或正電子發射斷層成像)中快速提取大量的定量特征。影像組學是將數字醫學圖像轉換為可挖掘的高維數據,其原理為生物醫學圖像中包含反映潛在病理生理學的信息,并且這些關系可以通過定量圖像分析來揭示。影像組學的工作流程包括:①圖像采集和重建;②圖像分割和繪制;③特征提取和量化;④數據庫建立和數據共享;⑤個體化數據分析[4]。
在常規的臨床圖像采集中,由于每個掃描儀供應商是不同的,許多成像參數,如圖像分辨率(像素大小或矩陣大小或切片厚度)、 正電子發射斷層成像 (positron emission tomography,PET)、 患者位置以及不同的重建算法和切片厚度的引入等,當比較來自不同掃描儀和患者群體時,這些簡單的成像問題也會對所得結果造成很大的影響。 此外,識別和處理大量具有類似臨床參數的圖像數據也是一項挑戰。 只有建立優質的數據庫,才有利于進行醫學圖像的大數據分析,為臨床診治帶來精確的預期數據資料。
圖像分割是指把圖像分成若干個具有特定性質的區域,并提取感興趣區(volume-of-interest,VOI)的過程。分割是影像組學中最關鍵、最具挑戰性和爭議性的部分。 這是至關重要的,因為隨后的特征數據是從分段卷積中生成的。這是具有挑戰性的,因為許多腫瘤的邊界很模糊。這是有爭議的,因為關于是尋求基本真理還是再現性以及如何依靠手動或自動分割一直存在爭論。然而最新的研究表明真相是難以捉摸的,并且通過計算機輔助的邊緣檢測以及隨后的手動處理可以實現最佳的可再現的分割。正常結構的分割現在可以實現完全自動化,如骨骼單元和器官。 然而,任何疾病,尤其是癌癥,由于在初次檢查時受試者之間和受試者內的形態和對比度的不均勻性,需要操作者手動輸入。
圖形特征是用于描述圖像內容的最基本屬性,從廣義上來說特征提取就是一種變換,即通過變換的方法用低維空間表示高維的圖像樣本空間。影像組學的核心就是提取VOI 內的高維度特征數據,并定量描述該容積的屬性。 但是醫學圖像涉及人體各類組織器官,其數據具有海量性、灰度模糊性、結構復雜性、噪聲顯著性等特點,導致醫學圖像的特征提取挑戰性極大。 因此,怎樣在復雜的醫學圖像中選取合理的特征,并且對其屬性進行最恰當、最合理的描述,是進行影像組學研究的關鍵問題。
影像組學的目標是將圖像特征與表型或分子特征聯系起來,這需要開發一個集成數據庫,其中圖像和提取的特征與臨床和分子數據聯系在一起。它的使用還必須集成到從圖像檢索和圖像特征的計算到圖像特征、臨床數據和分子數據的聯合分析的工作流程中。數據共享是所有生物醫學研究中的共同挑戰,它必須克服文化、行政、法規和個人問題等。 數據庫的建立和共享,需要各個專業人員相互配合,才能將醫學圖像中提取的特征數據與表型數據、分子數據相聯系,實現以上數據的存儲、檢索、分析及應用。
放射組學中的分析必須進一步優化出合適的方法來確定可靠的、可重復的結果才可能在臨床采用。 影像組學的具體分析問題將在任何領域存在,因此在達成適當的分析和評價技術共識中的重要步驟需要可用的現實世界數據。 由于圖像數據庫內的數據繁多,只有應用大數據分析方法才能較為有效地分析影像組學相關數據[5]。 如Huang等[6]研究發現影像組學標記是早期非小細胞肺癌 (nonsmall cell lung cancer,NSCLC)患者無病生存(disease-free survival,DFS)的獨立生物標志物。 結合影像組學特征、傳統分期系統和其他臨床病理危險因素能更好地進行早期NSCLC 患者的個體化DFS 估計[3]。
實性腫瘤在基因、蛋白質、細胞、微環境、組織和器官等不同水平上具有明顯的空間和時間異質性[7]。 這限制了侵入性活檢的分子分析的使用,但是卻為以非侵入方式獲取腫瘤內異質性能力的醫學成像提供了巨大的發展空間。在過去的幾十年中,醫學成像的發展與新的技術、新的成像劑以及計劃和草案,使得該技術向定量成像發展。因此,也需要為了從圖像的特征中提取更多的信息開發自動化和可再現的分析方法。為從常規影像學檢查中挖掘更多的臨床意義,影像組學這一新興影像學方法應運而生。 它是通過從各種醫學影像圖像中高通量提取大量的定量影像特征進行定量分析的一種方法。影像組學可通過上百個定量的特征數據整體分析腫瘤的異質性,還可分析腫瘤生物學特征和影像學特征之間的定量關系,從而構建腫瘤的診斷、療效評價以及預測等模型,為腫瘤的臨床診療提供有價值的參考依據[8]。應用影像組學對臨床醫生的幫助巨大,使用這種方法已經在多種腫瘤類型中顯示出獨立的預后和預測能力,包括頭頸部、肺部、睪丸和肝臟腫瘤等[9~11]。
隨著胸部高分辨率CT 及低劑量螺旋CT 廣泛地應用于肺癌的早期篩查,肺部結節檢出率越來越高,診斷肺結節的良惡性非常重要。 影像組學是一種有效的方法,可以實現肺癌的準確診斷和分析。 Huynh 等[12,13]均使用影像組學方法定量評估肺癌放療療效。Huynh 等研究調查了影像學特征作為立體定向放射治療 (stereotactic body radiation therapy,SBRT)治療的早期NSCLC 患者臨床預后指標的潛力,并將其性能與源于醫學圖像和臨床參數的臨床指標進行比較。研究表明通過開發用于臨床結果的預后成像生物標志物,影像組學在早期NSCLC SBRT 患者的精準醫學中可能具有重要意義。 Hunter 等[13]建立定量影像特征模型,研究表明從現有的治療前CT 圖像中提取的定量圖像特征能夠成功地預測腫瘤的收縮,并為臨床決策提供關于患者風險分層、治療和預后的額外信息。
目前,多項研究發現影像組學可以增加肺部結節的診斷準確性,能夠明顯降低有創檢查的應用率[14~20]。Kido 等[14]發現應用分形方法分析周圍型小結節薄層CT (high resolution computerized tomography,HRCT)圖像可將支氣管肺癌與錯構瘤、肺炎及肺結核等良性結節相區分。 He 等[16]研究發現,對比劑增強、重建層厚和卷積內核等影像組學特征對孤立性肺結節的診斷有影響,其中非對比度、薄層和標準卷積內核的CT 成像參數更為理想。 此外,CT 測定的形態復雜度結合PET 測定的異質性FDG 攝取提高了診斷準確性。 Hawkins 等[18]研究發現,肺癌篩查的低劑量CT 的定量分析可預測惡性結節,進而評估肺癌進展的風險。Xue等[21]研究發現結合純或混合密度結節和分形維數特征的放射組學諾模圖能夠區分非浸潤性腺癌與浸潤性腺癌。此外,Yoon 等[22]研究發現ALK/ROS1/RET 融合陽性肺癌具有一定的臨床和影像特征,對于融合陽性和融合陰性肺腺癌可以很好的鑒別。
準確的基因診斷可有效指導腫瘤的靶向藥物治療。目前臨床上多以侵入性方法獲取腫瘤基因突變的相關信息,而影像組學作為無創的檢測方法,可對腫瘤整體定量分析,獲取腫瘤之間不同的表型差異。 多項研究表明影像組學特征與基因表達及基因突變有關,可反映不同的生物機制,如基因表達模式或細胞循環途徑[9,22]。 Yoon 等[22]發現了以影像組學為基礎的融合陽性腫瘤預測因子。使用影像組學的定量成像可以獲取腫瘤之間的不同表型差異,并且根據特定的基因突變對某些表型具有預測能力。
由于基因組分析現在對于肺癌的靶向治療是很重要的,因此已經多次嘗試將影像組學應用于這一分析當中。很多研究已經能夠通過應用影像組學特征來預測放射治療后反應。 Cunliffe 等[23]評估了輻射劑量與肺組織紋理特征變化之間的關系,并確定紋理分析識別發生放射性肺炎的能力,結果顯示影像組學可提供定量、個體化測量和評估肺癌患者放療后放射性肺炎的發生及發展。放射組學在改善個體化治療方案方面提供了巨大潛力。Zhou 等[24]研究發現基于對比CT 圖像的放射學特征,包括逆方差、短軸和延伸,可以作為肺癌患者Ki-67 狀態的無創性預測因子。逆方差可以優于其他放射學特征,以確定高Ki-67 狀態。Colen 等[25]發現在NSCLC 中,放射學特征可以對那些隨后將發展為免疫治療誘導的肺炎患者進行分類和預測。
影像組學在肺癌中存在一些局限性,其中最重要的是缺乏從這些研究中識別的生物標志物可重復性。解決這一問題的辦法是標準化與劑量給藥有關的成像方案、相同的采集參數以及使用具有較低噪聲水平的離子核重建。 其次,在產生放射特征的方式上存在顯著的變異性。因此,在研究方法中需要一致性來解釋這種限制。影像組學研究經常使用自動和半自動的方法進行分割,但由于這一過程在不同研究組之間沒有標準化,因此可能影響重現性。
使用放射基因組學預測肺癌患者的治療反應仍處于早期階段,還需要大量的數據研究來驗證這一概念。 值得一提的是,目前放射基因組學只是確定相關性,并不能取代使用組織的基因組分析。 然而,在不久的將來這種額外的分析可以補充組織病理學發現,減少由于采樣或觀察者原因造成的誤差。