隋赫,莫展豪,孫旭,李雪佳,劉景鑫
1. 吉林大學中日聯誼醫院 放射科,吉林 長春 130000;2. 吉林大學第二醫院 放射線科,吉林 長春 130000
影像組學是在最初為分子生物學學科創建的組學(Omics)基礎上產生的。組學是指從研究目標整體中提取大量參數,假設這些參數和臨床數據的適當組合可以表達顯著的組織學特性,將這些參數在先驗統計方法的基礎上進行數學處理,那么對每一個患者的治療診斷或預后就具有一定的個性化意義[1-2]。
影像組學可以通過提取形態學及功能學影像中的定量信息,反映組織的潛在病理及生理學特征,在病變組織及正常的人體組織中均可應用[2]。影像組學的分析過程包括圖像采集和重建、圖像分割、特征值定義及提取、特征值分析和模型構建等。基于臨床病理學信息及影像圖像所構建的影像組學模型,可應用于疾病檢測、腫瘤分型分期、評估疾病預后、評價療效等方向。影像組學特征可以通過多種數學軟件進行特征值提取、計算,并選取最佳參數以保證輸出結果的穩定可靠。
本文著重對CT、MR的成像特征,影像組學特征(形狀、一階、二階、高階特征)進行了介紹,并簡要討論了影像組學參數的選擇方法,包括聚類分析、主成分分析、隨機森林、線性/邏輯回歸等。參數的再現性以及臨床價值應首先通過內部交叉驗證進行測試,然后在獨立的外部群體中進行驗證。圖像的采集、后處理以及圖像的分割方式等都會影響影像特征值的質量及其與臨床數據的相關性,同時對模型的構建也產生影響。
常規臨床成像技術涉及圖像分辨率、造影劑應用情況、超聲波頻率及增益、PET晶體材料與尺寸、CT的kVp和mAs、MRI序列類型、回波時間、重復時間、激發次數等諸多數據采集。在數據采集的過程中,即使是同一影像學檢查,也會因為設備的重建算法、影像中心的重建參數、掃描參數等各方面差異干擾圖像的噪聲和紋理特征,最終影響影像組學特征值的提取結果。因此,對于同一臨床問題所構建的影像組學模型,需評價圖像采集及重建因素對預測結果穩定性、可靠性的影響。
通過整合每種成像模式的特性及來自文獻和其他實驗測量的信息,排除受采集及重建參數影響的特征,以克服影像組學在圖像采集及重建方面的某些局限。現以CT及MRI的成像特征為例。
在CT掃描過程中,減小掃描層厚會減少斷層內的光子統計數據(除非相應地增加mAs或kVp),從而增加圖像噪聲。同時,重建矩陣大小會決定像素尺寸并由此確定平面中的空間采樣,這會對圖像的異質性產生影響;當其他參數保持不變時,像素尺寸減小會增加圖像噪聲,但空間分辨率會有所增加。當采用螺旋CT采集時,螺距是影響圖像噪聲的變量,這就增加了不同設備廠商掃描儀之間的比較難度。在臨床中,金屬假體所引起的偽影也可能會影響圖像質量,并有礙于定量分析[3]。此外,Houns field單位(HU)值也可能隨重建算法的變更或掃描儀校準情況而發生變化[4]。
因此,為了詳細研究圖像采集設置和重建算法對影像學特征的影響,需采用更為復雜、貼近臨床實際的模型。一種是Credence Cartridge Radiomics體模,它包括多個不同紋理特征的墨盒,用于測試不同掃描儀之間、多中心之間的差異[5],并測試在不同采集和重建條件下所得的數據特征的穩定性[6]。另一種是模擬感興趣區的特制CT模型[7],在不同位置嵌入具有不同大小和紋理特征的組織插入物,以模擬真實臨床條件下的測試方案。許多研究者通過進行反復測量研究,或者比較用不同成像設置和處理算法獲得的結果,對臨床圖像的穩定性特征進行了統計[8-9]。通過這些研究,我們發現仍需納入足夠大的樣本量來增加患者內部的可重復性,并降低對CT圖像采集及重建方案的敏感程度[10]。
MR圖像中的信號強度源于內在組織特性之間的復雜相互作用(弛豫時間等),且與MR設備磁體屬性、采集設置、圖像處理等相關參數有關。對于T1或T2加權序列,體素強度值也并非一成不變。即使在相同的位置使用相同的掃描儀掃描同一名患者,信號強度也可能因掃描時段的不同而變化。但組織間的對比度仍保持不變[11]。如果不對這種效應加以校正,患者間的影像學特征比較就會失去意義。一種方法是將圖像影像組學特征提取和分析集中在量化體素強度比上,而不是依賴于單個的體素強度值;另一種方法是在進行定量圖像分析之前,先進行圖像補償(也就是歸一化)[11]。
Depeursinge等[12]與John等[13]的研究對比了不同MRI掃描參數對影像組學特征穩定性的影響,有數據顯示,影像組學中的紋理特征對圖像采集參數的變化十分敏感;圖像空間分辨率越高,則紋理特征的靈敏度越高。所以在不同MR設備、不同掃描參數情況下所獲得的影像學特征,應謹慎比較[14]。
影像組學研究的特征數據均提取于“分割區域”,因此圖像分割是此項研究中最重要的環節。在實際研究過程中圖像分割具有很大的難度,大部分病變邊界不清導致無法對所分割的區域進行實體對比或實體再現,因此分割方式尚無共識[15]。
手工勾畫是大部分研究者所采用的圖像分割方法,但在影像組學分析需要以大量數據為基礎的情況下,這種耗時耗力的方式并不實用[16-17]。
自動和半自動分割方法已在多種成像模式和不同解剖結構中得以應用。常見的分割要求包括:最大程度的自動化、最小程度的人為操作干預、較高的時間效率、準確性和病變范圍的可重復性。一些分割算法依賴于區域生長法,需要操作員在感興趣區域(Region of Interest, ROI)內選擇種子點[18]。這些方法比較適用于相對均勻的病變,在不均質的病變中需進行密集的人工糾錯。例如,大多數早期肺腫瘤在低密度肺實質的背景下凸顯為均勻的高密度病變,因此可以采用自動分割,并且這種方法具有較高的重復性和準確性[19-20]。然而,對于部分實性結節、磨玻璃密度結節及附著在血管和胸膜表面的結節,這種自動分割方法的可重復性及準確性就會明顯降低[20]。
此外還有一些方法如:圖割算法(Graph-Cut Methods),把圖像分割問題與圖的最小割(Min-Cut)問題相關聯,構建了基于圖像的多個圖形,并實現了能量最小化函數的全局最優解[21]。但這種方式計算成本高[22],并可能導致過度分割[23]。水平集法(Level-Set Methods),它將病變輪廓表示為更高維度函數的零級集(水平集函數),將低維度曲線嵌入高維度曲面中[24]。活動輪廓算法(Active Contour Algorithms),是指起點圍繞病灶進行繪制,像伸展的松緊帶一樣的連續曲線來表達目標邊緣,然后通過迭代過程移動到具有最低能量函數值的點,一般可通過求解函數對應的歐拉方程(Euler.Lagrange)來實現,能量達到最小時的曲線位置就是目標的輪廓所在[25]。由于依賴最佳起始點并且對噪聲很敏感,所以這種算法在某些情況下也可能會導致較大偏差[26]。半自動分割算法通過局部活動輪廓分析進行圖形搜索,同時使用動態編程使其成本函數最小化。現階段的半自動化分割過程仍然需要人類的參與[16]。因此,目前仍沒有針對所有圖像的通用分割算法,研究者也正在評估新的算法來克服這些局限[27]。
臨床圖像可以提取出不同類型的影像組學特征。在影像學中,定性特征通常用于描述病變[28],而定量特征則是通過利用數學算法的軟件從圖像中提取的描述值[29]。它們呈現出不同程度的復雜性,首先表現出的是病變形狀和體素強度直方圖,其次是體素水平強度值的空間排列(紋理)。幾十年前,人們就通過濾波器和數學變換來處理信號,發現紋理特征可以量化圖像屬性[30]。在影像組學中,紋理特征可以直接從原始圖像中提取,或者在應用不同的濾波器或變換(例如:小波變換)之后提取。定量特征通常分為以下幾類:
形狀特征:描述的是ROI的形狀及其幾何特性,例如ROI的體積、沿不同正交方向的最大直徑、最大表面積、腫瘤緊湊度和類球形度等。例如,表面呈多毛刺狀的腫瘤與相似體積的球形腫瘤相比,其表面-體積比更高。
一階統計特征:描述了各個體素值的分布,但不涉及體素的空間排列。這些是基于直方圖的屬性,包括體素強度的平均值、中間值、最大值、最小值以及它們的偏度(不對稱性),峰度(平直度),均勻性和隨機性(熵)。
二階統計特征:包括所謂的紋理特征[31],它們是通過計算相鄰體素之間的統計相互關系而獲得的,反映了空間排列的體素強度,提示了病變的異質性[5,32]。這些特征可以從灰度共生矩陣法(Gray-Level Co-Occurrence Matrix,GLCM)導出,量化沿固定方向在預定距離處具有相同強度的體素的發生率,或者從灰度游程矩陣(Gray-Level Run-Length Matrix,GLRLM)量化,量化沿固定方向具有相同強度的連續體素[33]。
高階統計特征:是在對圖像應用濾波器或數學變換之后,通過統計學方法所獲得。這些變換旨在識別重復或非重復模式、抑制噪聲或突出細節。包括碎片分析、Minkowski函數、小波變換以及高斯濾波圖像的拉普拉斯變換等。單個圖像中可以生成千余個參數變量。
即使影像組學充分利用了其他組學學科開發的數據分析方法以及大數據分析經驗,組學參數的選取仍較為困難。目前常用的兩種方法,一種是從計算工具提供的所有特征開始,執行初步分析以選擇最可重復和可再現的參數,隨后通過相關分析和冗余分析來進行縮減[34];另一種是基于它們的數學定義對特征進行先驗選擇,集中選擇在視覺外觀方面易于解釋的參數,或者與組織直接相關的一些生物特性。計算機可以從以往的例子中進行學習,并在大量復雜的數據中檢測出難以識別的關聯模式,以此為基礎的機器學習方法可成為特征優選的有效工具[35-36]。
因此,最初的工作應集中于確定具有潛在臨床意義的特征上,以選擇對特定目的有用的信息。影像組學的分析通常包括兩個主要步驟:一是降低維度和特征選擇,通常通過無監督學習方法獲得;二是通過監督學習方法對一個或多個特定結果之間進行關聯分析。
人們已經對不同的降維(特征)選擇分類方法進行了對比[37]。兩種最常用的無監督學習方法是聚類分析(Cluster Analysis)[38]和主成分分析(Principle Component Analysis,PCA)[39]。聚類分析旨在創建具有高群集內冗余和低群集間相關性的類似功能(群集)組。這種類型的分析通常由聚類熱圖描述,可以從每個聚類中選擇單個特征作為代表,并用于以下關聯分析[40]。PCA的目的是從一大組相關變量中創建一組較小的最大不相關變量,并盡可能地用最少的主成分解釋數據集中的總變量。從圖形上看,PCA的輸出由得分圖組成,指出了數據集中的相似性。可以將所有被視為可重現、具有信息性和非冗余的選定特征用于關聯性分析。單變量分析的一個重要因素是多重測試,克服多重測試問題的最常見方法是使用Bonferroni校正或不太保守的錯誤發現率校正[41]。通過多變量分析建立數學模型,以預測結果或響應變量。不同的分析方法取決于研究的目的和結果類別,主要的機器學習分類方法包括:隨機森林(Random Forest,RF)[42],鄰近算法(K-Nearest Neighbor,KNN)[43],支持向量機(Support Vector Machine,SVM)[44],XGBOOST算法[45],決策樹(Decision Tree,DT)[46]等。Zhang 等[37]的研究比較了不同的模型構建方法,發現隨機森林分類方法具有最高的預后性能。
影像組學模型建立之后,需通過驗證的方法評估模型的穩定性和可重復性。模型驗證可分為內部驗證與外部獨立隊列數據驗證,而評估模型潛在臨床價值的最佳方法是使用前瞻性收集的獨立隊列數據進行驗證。因此,多影像中心共同建立的具有標準化影像檢查與質量控制的共享數據庫將發揮巨大作用,可以為組學模型的驗證,提供良好的獨立隊列數據。
影像組學作為一種新興研究方法,可以提供多種疾病的豐富信息。從標準臨床試驗、組織病理學、遺傳學以及最終放射學結果中獲取的數據將為個性化治療方案的實施提供條件。與具有非侵入性特征的放射學相結合,通過發現圖像的編碼規則和模式,可以更好地識別癌癥等疾病的病理生理學,有助于疾病的早期發現,提高治療效率。
數學算法與計算機技術的飛速發展,為影像組學提供了理論基礎和技術支持,使其可以通過從醫學影像中提取和挖掘的大量特征,分析隱含在圖像背后的問題,為臨床診斷提供更多思路,并已在癌癥、血液學及自身免疫疾病等高發疾病的診斷、治療和預后方面取得了可靠結果,有助于早期相關診斷,調整最佳治療方案,并提高患者的生活質量。標準化方案的實施是獲取具代表性、可靠、可重復結果的前提。目前,來自不同機構的數據仍缺乏一致性,面臨著圖像標準化不足、缺乏質量控制等問題,導致成果轉化難度較大。創建共同的、連貫的數據庫是當代醫學所面臨的最大挑戰之一。相信隨著醫學影像學數據的不斷積累和標準化,以及各類圖像分割、特征提取、特征選擇和模式識別方法的迅速發展,影像組學將會對臨床醫學產生深遠的影響。