朱逸峰,王紹武
軟組織腫瘤(soft tissue tumors,STTs)是一組起源于中胚層間充質組織(如黏液、纖維、脂肪、平滑肌、滑膜、橫紋肌、血管和淋巴管等)中多能干細胞的腫瘤,成分復雜且種類繁多,臨床、影像及病理表現各異[1]。軟組織腫瘤的治療以手術切除為主,對于軟組織肉瘤必要時還需輔以放化療及靶向治療,準確的影像學診斷是臨床制定治療方案的重要依據,手術前運用影像學檢查對腫瘤進行全面評估具有重要意義[2]。MRI檢查具有較高的軟組織分辨力,其憑借多序列、多參數成像的特點可以更清晰地顯示腫瘤的大小、形態、內部信號、邊界以及腫瘤對周圍組織侵犯情況,已經成為軟組織腫瘤病變檢出、確定起源、良惡性鑒別診斷、侵襲范圍評價和判斷有無復發等方面最重要的臨床檢查方法和術前診斷依據[3]。
人工智能是一項用于研究并模擬人類思維與能力的新技術[4]。醫學影像與人工智能的結合始于上世紀60年代,自上世紀80年代以來,隨著基于人工智能的計算機輔助診斷軟件的使用,人工智能開始逐漸整合到影像科的日常工作流程中,如肺結節和肺癌篩查、乳腺結節和乳腺癌篩查等[5]。影像組學(Radiomics)方法即是人工智能技術在醫學影像學領域應用的成果,Radiomics的前綴Radio意為影像,而后綴Omics則源于分子生物學,用于描述生物大分子的詳細特征,如基因組學和蛋白質組學等;2012年,該后綴Omics被Lambin等[6]首次用于醫學影像學研究領域,Radiomics一詞便應運而生,后由Kumar等[7]于同年進行了補充和完善,定義為“高通量地從醫學影像中提取并分析高級、定量的影像特征來深層次反映腫瘤組織的空間異質性特征”。
影像組學方法是醫學影像學、計算機視覺和機器學習等多學科交叉的產物,能在宏觀影像水平間接反映腫瘤微觀水平基因或蛋白質的變化,并且不完全依賴于影像醫師的專業技能、臨床經驗及主觀因素,所提供的是醫學影像相對客觀的定量信息,具有傳統影像方法難以做到的獨特優勢[8]。對于軟組織腫瘤而言,肉眼從影像上獲取的信息十分有限,明確診斷非常困難,這時就需要使用影像組學方法來輔助影像醫生對其進行診斷,進而幫助影像醫生和臨床醫生更全面、更深入、更透徹地認識和理解軟組織腫瘤。本文就目前影像組學方法在軟組織腫瘤中應用研究的進展進行綜述。
影像組學方法在軟組織腫瘤中應用的流程分為5個步驟:確定研究目標、軟組織腫瘤影像的獲取、軟組織腫瘤病灶的分割、軟組織腫瘤影像特征值的提取與降維、軟組織腫瘤影像組學模型的建立[9]。
1.確定軟組織腫瘤研究目標
準確地尋找并確定研究目標是軟組織腫瘤影像組學研究的關鍵,在確定研究目標后才能借助影像組學方法從軟組織腫瘤影像中提取多維度特征以探索其與軟組織肉瘤分級、軟組織腫瘤良惡性、軟組織肉瘤治療及預后的相關性[10-12],因此軟組織腫瘤影像組學研究需要緊密的醫工交叉與結合來設計合理的研究方案。
2.軟組織腫瘤影像的獲取
在軟組織腫瘤影像組學研究的過程中,影像特征的可重復性、穩定性是十分重要的,掃描設備、掃描參數以及重建方式等都會對軟組織腫瘤影像特征的穩定性造成影響,因此在獲取軟組織腫瘤影像前需要建立影像檢查與處理的標準流程,保證掃描設備、掃描參數的一致性,減少外界因素對結果帶來的誤差,使影像組學特征更加穩定,從而獲得精準的特征值分析與建模結果[13]。目前,大部分軟組織腫瘤影像組學研究使用的均為同一檢查機器及固定的檢查參數[9-10,14-18],但也有部分研究使用了不同機器及不同檢查參數[12,19-21]。
3.軟組織腫瘤病灶的分割
準確地對軟組織腫瘤病灶進行識別與分割在軟組織腫瘤影像組學研究中至關重要。在采集了大量標準化的軟組織腫瘤影像數據后,需使用手動、半自動或全自動圖像分割方法對軟組織腫瘤病灶進行分割,其中手動分割具有主觀性,準確性較高,但可重復性較差,建模結果會受到不同醫生對影像解讀方式的影響[22]。在半自動和全自動分割領域,ITK-SNAP、3D Slicer和Image J等軟件的應用較為廣泛,ITK-SNAP由賓夕法尼亞大學開發,其提供了基于主動輪廓的半自動分割方法[23],在軟組織腫瘤影像的半自動分割中已經得到應用[14,24];3D Slicer由美國國家衛生研究院開發,提供了多種分割方法,如基于區域生長、基于模板、基于交互和基于統計等,在軟組織腫瘤影像的半自動分割中也已得到了應用[17]。另有研究表明,基于3D Slicer的半自動分割方法與手動分割方法相比具有更佳的可重復性[25-26];Image J是一款基于JAVA的圖像處理軟件,已被應用于影像組學鑒別脂肪瘤與脂肪肉瘤的研究之中[20]。半自動及自動分割方法的優點是高效且重復性高,但使用其分割的興趣區相對于手動分割的興趣區精確度會有偏差,對于邊界不清晰的軟組織腫瘤可采用手動分割方法;而對于邊界清晰且形態規則的軟組織腫瘤,半自動或全自動分割方法高效且重復性高,能夠滿足海量數據分割的要求[27]。病灶影像的精準分割是軟組織腫瘤影像組學分析的前提,但影像的偽影及軟組織腫瘤對周圍正常組織的浸潤會導致病灶邊緣顯示不清,致使病灶影像的分割存在一定難度。目前,分割精確度高且重復性好的病灶影像分割算法還有待開發與研究。
4.軟組織腫瘤影像特征值的提取與降維
軟組織腫瘤影像特征值的提取是使用計算機算法在像素水平上將軟組織軟組織腫瘤影像數據轉化為大量量化的影像特征值數據再進行分析,是軟組織腫瘤影像組學研究的核心步驟[9]。不同軟件或平臺計算特征值的方法各不相同,特征值可以分為如下幾類,即一階統計形態學特征、二階統計特征、高階統計特征、基于模型和基于變換的特征。
一階統計形態學特征主要包括病灶的大小、形狀等,也稱為語義特征,主要量化像素值的分布規律而不考慮其空間分布關系,其指標包括平均灰度值、標準差、熵值等[28]。二階特征即紋理特征,主要量化興趣區內相同灰度或像素強度間的空間關系,指標有灰度級共生矩陣、灰度級長度矩陣、灰度區域大小矩陣等,間接反映病變的異質性,相當于二維直方圖,多用于模式識別中[28]。
高階特征是利用鄰域灰度差矩陣計算高階統計量,研究三個或更多體素間的空間關系,包括鄰域灰度差值矩陣和灰度區域大小矩陣灰度級形狀矩陣等。基于模型和基于變換的特征是將提取的圖像特征進行濾過,常用的濾過包括基于拉普拉斯算法的高斯濾過、Gabor濾過、小波變換及分形維數變換等[29]。
勾畫的軟組織腫瘤興趣區經過特征值提取后可獲得成千上萬的特征,這與原始數據的樣本量相差懸殊,會導致模型的過擬合,因此模型的建立有賴于病變主要特征值的降維分析。目前,常用的降維算法包括方差選擇法、單變量選擇法及最小絕對收縮和選擇算子等[22]。
5.軟組織腫瘤影像組學模型的建立
軟組織腫瘤影像組學模型的建立需要通過大數據的機器學習來完成,機器學習是使用程序代碼讓計算機模擬或實現人類的學習行為,達到獲取新知識或技能的目的。需要指出的是,機器學習的概念在上世紀60年代就已經被計算機科學家提出[30],但機器學習技術于近十年才開始被應用于醫學影像領域。機器學習的方法包括:無監督機器學習、半監督機器學習及監督機器學習[29]。
無監督機器學習是對數據采用熱點圖分析或聚類分析,挖掘數據的自然結構特征,不預設數據標簽。
監督機器學習則需要設置數據標簽來訓練模型,常用的監督機器學習算法包括支持向量機(support vector machine,SVM)、隨機森林(random forests,RF)、決策樹(decision tree,DT)和邏輯回歸(logistic regression,LR)等,其中SVM由Cortes等[31]于1995年提出,一般應用于二分類問題當中,具有相對優良的性能指標,是建立在統計學理論基礎上的機器學習方法,能夠尋找出區分度較高的支持向量,可以最大化類與類的間隔,因此具有較好的適應能力和鑒別能力,在軟組織腫瘤影像組學研究中得到了廣泛的應用[9,11-12,14,19]。SVM只需由各類域邊界樣本的類別來決定最后的分類結果,其優點是不依賴全部樣本數據就可以解決高維度問題,缺點是核函數的確定有一定難度,且核函數的選擇會影響分類結果[30]。RF是由Breiman[32]于2001年提出的一種利用多個樹分類器進行分類和預測的方法,其輸出類別由單個樹輸出類別的眾數而定,通過隨機方法建立一個由很多棵無關聯決策樹組成的森林,在輸入新樣本時森林中的每一棵決策樹會對其分別進行判斷,最終根據相對多數投票法即該樣本被選擇最多的分類給出其分組,RF在軟組織腫瘤影像組學研究中也有應用[9,11-12],該算法以能夠降低過擬合現象為優點,但其不能較好地預測超越訓練集外的數據[30]。DT因其輸出結果類似一顆倒置的樹而得名“決策樹”,本質上可看作一個樹狀預測模型,通過將實例從根節點排列到某個葉子節點完成分類。DT在軟組織腫瘤影像組學研究中也有應用[19],其優點是計算省時,缺點是易出現過擬合現象[30]。LR的基本原理是將標記好的數據通過機器學習總結歸納得出分類模型或分類決策函數,通過輸入離散或連續變量對輸出結果進行分類,其缺點是當特征維度很大時該模型的準確性不佳[33]。LR在軟組織腫瘤影像組學研究中亦有應用[12,14,20]。
半監督機器學習則介于無監督機器學習和監督機器學習之間,通過使用大量未標記的數據和少量標記的數據來對模型進行訓練,主要用于類別標簽不明確的數據[34]。
不論使用何種機器學習方法,均需對比訓練集及驗證集的受試者操作特征曲線(receiver operating characteristic,ROC)的曲線下面積(area under curve,AUC)、敏感度、特異度、符合率、召回率及和F1-Score等指標來評價機器學習模型的診斷效能及穩定性。
作為一種新興的醫工結合手段,影像組學方法用于軟組織腫瘤的研究與傳統軟組織腫瘤影像研究的不同之處主要體現在傳統影像手段僅能通過興趣區測值的方法來間接反映軟組織腫瘤的局部信息,無法反映軟組織腫瘤的整體情況,而影像組學方法則能提取軟組織腫瘤病灶多個層面乃至全部層面的影像特征,從而對軟組織腫瘤的異質性進行全面評估。
目前,影像組學方法在軟組織腫瘤良惡性鑒別、術前預測軟組織肉瘤分級、評價軟組織肉瘤治療及預后等方面都有應用研究。
1.影像組學方法在軟組織腫瘤良、惡性鑒別中應用研究的進展
軟組織腫瘤的良、惡性鑒別一直是臨床關注的重要問題,相比于良性軟組織腫瘤,惡性軟組織腫瘤內部的異質性更明顯,因而可以借助影像組學方法來鑒別軟組織腫瘤的良惡性。
Mayerhoefer等[10]通過對經過病理證實的58例軟組織腫瘤患者(良性30例,惡性28例)的T1WI、T2WI及FS-T2WI圖像進行紋理分析,分別比較了K最近鄰算法和人工神經網絡算法的診斷效能,其中基于FS-T2WI序列的人工神經網絡算法取得了90.5%的符合率,故作者指出良惡性軟組織腫瘤在常規MRI圖像信號特征上只有很小的差異,機器學習算法可能有助于鑒別軟組織腫瘤的良惡性,但是需要更多數據來證明其臨床價值。Wang等[14]通過使用91例軟組織腫瘤患者(良性55例,惡性36例)的FS-T2WI圖像進行影像組學諾模圖和決策曲線分析,得出影像諾模圖能夠將惡性與良性軟組織腫瘤區分開(AUC為0.94),且諾模圖的診斷效能優于單一的影像組學模型和臨床模型,由此指出結合了影像組學特征和臨床特征的諾模圖是一種無創且低成本的術前預測軟組織腫瘤良惡性的方法。Juntu等[19]通過對135例軟組織腫瘤患者(良性86例,惡性49例)患者的T1WI圖像進行紋理分析,并將三種機器學習模型(支持向量機、人工神經網絡、C4.5)的診斷效能與影像科醫師進行比較,得出支持向量機分類器的符合率為93%,優于影像科醫師(90%),經過紋理分析訓練的機器學習分類器對于在T1WI圖像中檢測惡性腫瘤具有潛在的價值,對分類器的學習曲線分析表明小于100個T1WI圖像的訓練數據量足以訓練出診斷效能和影像科專家一樣的機器學習分類器。Kim等[15]通過對40例含有粘液成分的軟組織腫瘤患者(良性23例,惡性17例)的ADC圖進行紋理分析,發現惡性組的峰度、能量、相關性和均質性均明顯高于良性組,但對比度和方差均低于良性組,因此認為基于ADC圖的紋理分析有助于鑒別良惡性含黏液成分的軟組織腫瘤。Chen等[35]通過對114例軟組織腫瘤患者(良性73例,惡性41例)的超聲圖像進行紋理分析,通過使用10個形態學特征和6個灰度共生矩陣特征來鑒別良惡性軟組織腫瘤,并將紋理分析的診斷效能與四位診斷醫師進行比較,發現紋理分析的診斷符合率(89.5%)高于診斷醫師(74%~86%),這表明在超聲檢查中使用紋理分析進行輔助診斷可成功地區分良性和惡性軟組織腫瘤,以避免不必要的穿刺活檢。Xu等[16]通過對103例軟組織腫瘤患者(良性44例,惡性59例)的PET/CT圖像進行紋理分析,分別對CT圖像上計算的紋理參數、PET圖像上計算的紋理參數以及PET和CT組合的紋理參數進行計算,將它們的診斷效能與標準化攝取值方法進行比較,發現僅使用PET(或CT)紋理參數的符合率為74.76%(72.82%),與SUV方法沒有顯著差異,但將PET和CT最佳紋理參數(PET:熵和粗糙度,CT:熵和相關性)進行聯合紋理分析的方法表現出更好的診斷效能(符合率為82.52%),因此得出使用紋理分析的方法能夠顯著提升18F-FDG PET/CT對軟組織腫瘤良惡性的鑒別診斷能力。Thornhill等[20]通過回顧分析24例脂肪瘤和20例脂肪肉瘤患者的T1WI、T2WI、FS-T2WI及T1WI增強圖像,在T1WI上對病灶進行勾畫并提取灰度級共生矩陣特征、灰度級長度矩陣特征及形態學特征,將紋理特征的組合用于訓練多個線性判別分類器,最終使用10折交叉驗證評估每種分類器鑒別脂肪瘤和脂肪肉瘤的診斷效能,并和兩位影像科醫師的診斷效能進行比較,發現影像組學模型的診斷效能(91%)高于兩位影像科醫師(80%、77%),因此指出計算機輔助診斷模型有助于影像科醫師鑒別脂肪瘤與脂肪肉瘤。
2.影像組學方法在預測軟組織肉瘤組織病理學分級中應用研究的進展
軟組織肉瘤(soft tissue sarcomas,STSs)的組織病理學分級關系到患者的預后及臨床治療方案的制定[36],如果能在術前通過影像組學方法建立精度逼近病理的軟組織肉瘤組織病理學分級預測模型,那么對其臨床治療方案的制定有重要的指導意義。影像組學特征能間接反映軟組織肉瘤內部的異質性,而軟組織肉瘤的異質性越高則其組織病理學分級越高。因此,影像組學特征與軟組織肉瘤的組織病理學分級相關。
Zhang等[9]通過對35例STS患者(Ⅰ級9例,Ⅱ、Ⅲ級共26例)的磁共振FS-T2WI圖像研究發現,基于FS-T2WI的隨機森林、K最近鄰、支持向量機的機器學習模型均可在術前預測STSs的組織病理學分級,且這些模型的診斷效能均比術前穿刺活檢更高。Corino等[24]通過對19例軟組織肉瘤患者(Ⅱ級5例,Ⅲ級14例)的ADC圖采用合成少數過采樣技術進行了影像組學分析,指出基于ADC圖的影像組學模型能夠鑒別Ⅱ級與Ⅲ級STSs,且該模型僅需使用兩個一階統計形態學特征。Wang等[11]通過使用113例STSs患者(Ⅰ級25例,Ⅱ、Ⅲ級共88例)的術前T1WI和FS-T2WI建立隨機森林機器學習模型,指出基于影像組學特征的機器學習模型對于區分STSs的分級非常有意義。
3.影像組學方法在評價軟組織腫瘤治療及預后的應用研究進展
軟組織腫瘤的治療和預后情況亦是臨床關注的重要問題,研究表明影像組學特征與軟組織腫瘤的治療及預后存在相關性。
Spraker等[21]通過對來自兩個中心的Ⅱ、Ⅲ級STSs患者共226例的T1WI增強圖像圖像提取30個影像組學特征值進行分析,并分別構建了臨床模型、影像組學模型、臨床-影像組學模型,使用Harrell一致性指數評估模型的診斷效能。結論為在考慮年齡和分級時,從MRI圖像中提取的影像組學特征與STSs的總生存期獨立相關,使用臨床-影像組學模型可以改善STSs患者的個性化治療選擇方案。Crombe等[12]通過對65名成年高級別STSs患者新輔助化療前后的T1WI、T2WI和T1WI增強圖像進行影像組學分析,提取了33個紋理特征和形態學特征來研究Delta影像組學預測接受新輔助化療的STSs患者早期反應的價值。在訓練集中,RF算法的符合率為88.1%,而在驗證集中,該模型的符合率達到了74.6%,由此作者指出基于T2WI的Delta影像組學模型可以憑借有限的特征值來評估STSs患者對早期新輔助化療的反應情況。Tagliafico等[17]通過對11例軟組織肉瘤患者進行了33次隨訪,對其T1WI、T2WI和T1WI增強圖像進行了影像組學分析,指出影像組學特征可在監測STSs局部復發時將正常組織與病理組織區分開來,影像組學不僅可以用于檢測STSs,而且可用于病灶表征的量化分析。Tian等[18]對20例STSs患者進行了研究,所有患者均單獨接受貝伐單抗治療2周,然后在手術前接受貝伐單抗治療加放療6周,并且均在治療后2周和8周均接受了CT灌注檢查,并測量了腫瘤血流流速,另使用紋理分析軟件測量了增強CT動脈峰值時的圖像正像素的平均值作為紋理參數,并測量了腫瘤的大小和密度,將這些參數的百分比變化與病例結果進行對照,結果表明8周后圖像正像素平均值的百分比變化與手術標本中的腫瘤壞死有顯著相關性,而大小、密度和腫瘤血流流速的差異則無統計學意義,因此作者指出圖像正像素平均值的改變是評價STSs新輔助化療療效的最佳生物標志物。
作為影像科醫生的得力助手,影像組學方法雖然在軟組織腫瘤中的應用已取得一定的成果,但我們必須認識到該方法目前尚處于起步階段,并且與普通圖像識別與分割相比,醫學影像診斷學具有其獨特的復雜性,在相關成果轉化為臨床應用前還有很多問題亟待解決,例如不同掃描參數和重建算法缺乏統一標準、缺乏統一規范的影像組學研究流程和具有可解釋的專家共識、現有的影像組學診斷模型缺乏大樣本多中心的前瞻性研究檢驗以及各種診斷模型的魯棒性問題等[37]。另外,現有診斷模型假陽性率過高的問題也必須引起我們的重視,如何降低假陽性率而不漏診疾病是一個重要議題[38]。并且,各種診斷模型的適用性還有待更大規模數據的檢驗,然而由于發病率較低,軟組織腫瘤的病例數通常較少,數據的收集需要耗費大量的時間,這都是影像組學在軟組織腫瘤進一步應用所需要攻克的問題??傊?,影像組學在軟組織腫瘤中應用的前景廣闊,它會在軟組織腫瘤的精準醫療中發揮越來越重要的作用,影像科醫生必須與時俱進,理解并掌握影像組學這個利器才能在將來的臨床工作中游刃有余、事半功倍[39]。