王 敏,宋 彬
四川大學華西醫院放射科,四川 成都 610041
肝細胞癌(hepatocellular carcinoma,HCC)是最常見的肝臟原發性惡性腫瘤,在世界范圍癌癥死亡相關疾病中位列第2[1]。截至2015年,中國HCC發病率位列第4,死亡率位列第3。早期復發是影響患者術后生存率至關重要的因素,大肝癌術后5年復發率達80%,小肝癌為40%~50%,復發高峰在術后1~2年。因此,準確預測術后早期復發是改善患者總體生存的基礎。
目前用于評估HCC患者術后早期復發的研究多為單因素研究,HCC術后早期復發是腫瘤因素、背景肝臟因素及全身狀態綜合作用的結果,因此僅將某一獨立危險因素作為評估預后的指標,結果通常不準確。而將三者聯合起來應用于HCC預后評估的預測模型較少,臨床普遍應用的是巴塞羅那臨床肝癌分期(Barcelona Clinical Liver Cancer,BCLC)系統,其優勢在于將背景肝功能儲備、腫瘤因素及全身狀態等綜合起來進行評估,預測效能較高。但對于我國多數HCC患者而言,BCLC分期尚存在一些不足:首先,患者就診時已屬中晚期,且腫瘤多>5 cm,BCLC分期并不適用于此類患者,然而此類患者接受手術切除后同樣獲益。此外,BCLC分期中盡管提到了腫瘤對大血管的侵犯,但是腫瘤微血管侵犯是導致HCC術后早期復發的另一獨立危險因素,只有依賴術后病理顯微鏡檢查才能做出診斷,BCLC分期會低估此類患者術后早期復發的風險。因此,有必要在BCLC分期的基礎上進一步建立更加適合我國HCC患者預后的預測模型。
影像組學旨在通過包含疾病病理生理信息的高維度影像組學特征,最大限度地挖掘醫學影像對疾病診斷的潛力[2]。目前已廣泛應用于乳腺癌、肺癌等患者的預后評估,但是針對HCC預后的研究較少。Zhou等[3]和Akai等[4]發現,HCC的CT紋理特征可以作為預測HCC術后早期復發的預測指標,表明這些不可見的紋理特征中確實包含腫瘤的預后信息。Zhou等[3]同時發現,紋理特征結合臨床特征預測腫瘤術后早期復發的準確性顯著高于單獨使用紋理特征。以上兩項研究均采用基于腫瘤單獨層面的二維CT紋理特征,而相比于CT,磁共振成像(magnetic resonance imaging,MRI)有更好的軟組織分辨率。本研究采用了基于腫瘤整體的三維紋理(threedimensional texture,3D-texture)特征,更能全面、客觀地反映腫瘤的異質性。本研究旨在通過機器學習的方法,將腫瘤的MRI 3D-texture特征與臨床參數結合起來構建預測模型,對術后早期復發進行初步探討。
將納入的患者按照建立預測模型的要求分為回顧性與前瞻性兩部分,納入標準見圖1。首先,回顧性地從2013年12月—2015年7月213例術后病理診斷為HCC的患者中納入98例,用于構建模型和訓練模型;其次,前瞻性地選取2015年12月—2017年12月215例臨床診斷為HCC的患者,最終納入83例,術后病理為HCC,前瞻性患者用于驗證預測模型的診斷效能。
與HCC術后早期復發有關的臨床參數有患者年齡、性別、慢性乙型肝炎、肝硬化、血小板計數(blood platelet count,PLT)、淋巴細胞絕對值(LYMPH)、PLT/LYMPH、天門冬氨酸氨基轉移酶(aspartate transaminase,AST)、丙氨酸氨基轉移酶(alanine transaminase,ALT)、谷氨酰轉肽酶(glutamyl-transpeptidase,GGT)、總膽紅素(total bilirubin,TBL)、血清白蛋白(albumin,ALB)、腫瘤大小、病理分化程度和微血管侵犯(micro-vascular invasion,MVI);MRI圖像包括腫瘤邊緣、包膜、腫瘤內脂肪、腫瘤外周強化、腫瘤內動脈、肝動脈期快速強化、門靜脈期廓清和門靜脈大分支侵犯。
采用西門子Trio平掃:掃描范圍由膈頂至肝臟消失層面。檢查序列包括:① FSPGR同反相位T1WI,重復時間(repetition time,TR)為81.0 ms,回波時間(echo time,TE)為1.4 ms/2.42 ms,層厚/層間距為6.0 mm/2.7 mm,激勵次數(number of excitation,NEX)為1,視野(field of view,FOV)為400 mm×325 mm,采集矩陣為286×352,反轉角70°;② FSEFS序列常規軸位T2WI,采用呼吸促發技術,并于軸位T2WI施加預飽和脂肪抑制技術獲得軸位抑脂T2WI,TR/TE為2 160 ms/100 ms,層厚/層間距為6.0 mm/2.7 mm,NEX為1,FOV為433 mm×325 mm,采集矩陣為320×216。
增強掃描:三維容積式內插值法屏氣檢查序列(volumetric interpolated breath hold examination,VIBE),簡稱3D VIBE序列,并于軸位VIBE T1WI施加預飽和脂肪抑制技術獲得軸位抑脂T1WI。TR/TE為4.0 ms/1.9 ms,層厚/層間距為2.0 mm/0.4 mm,NEX為1,FOV為400 mm×296 mm,反轉角9°。掃描范圍與平掃一致,采用高壓注射器注射對比劑,運用腹帶減少呼吸干擾,對比劑注射劑量0.1 mmol/kg,速率2 mL/s。注射對比劑后15、55 s分別行VIBE雙期掃描,分別獲得動脈期(arterial phase,AP)和門靜脈期(portal venous phase,PVP)圖像,16 s掃完1次肝臟。

圖 1 回顧性和前瞻性患者入組流程圖
首先,基于全腫瘤的圖像分割,將AP、PVP圖像導入ITK-SNAP軟件,手動逐層勾畫腫瘤,腫瘤的邊界參照T2WI脂肪抑制序列,盡可能避開出血和壞死區域。腫瘤邊界、出血和壞死區域由放射科2位腹部診斷醫師按照LI-RADS 2017版指南[5]達成共識后,由第3位醫師勾畫。然后,將分割好的圖像導入AK軟件進行紋理特征的提取。
1.5.1 預測模型特征篩選
按照多變量回歸的要求,樣本量至少應是自變量的10倍左右[6],對患者臨床參數和腫瘤MRI 3D-texture特征均采用數據去冗余和Lasso回歸進行特征的選擇。數據去冗余對納入特征的相關性進行分析,當兩特征間相關系數(Pearson系數)≥0.7時,特征之間為高相關,然后遞歸地對其中一個特征進行剔除。再將去冗余后的數據進一步納入Lasso回歸模型中,用向前(LR)法進行多變量分析。通過設定調整參數λ,3折交叉驗證時,誤差最小的log(λ)值即Lasso回歸最優λ值,此時對應的非零系數特征即用于建立預測模型的有意義的特征。
1.5.2 構建預測模型
將篩選出的臨床參數特征和3D-texture特征分別用于建立臨床參數預測模型、影像組學模型和臨床參數結合影像組學的綜合模型。以患者實際復發狀態為參考標準,經受試者工作特征(receiver operating characteristic,ROC)曲線計算3個模型預測HCC術后早期復發的準確率(accuracy,ACC)、靈敏度及特異度。統計學分析軟件為R軟件3.4.2。
98例回顧性患者中,男性88例,平均年齡(53.8±10.7)歲,女性10例,平均年齡(48.2±15.4)歲,其中早期復發患者45例(45.9%);83例前瞻性患者中,男性66例,平均年齡(51.4±9.6)歲,女性17例,平均年齡(47.2±12.9)歲,其中早期復發患者43例(51.8%)。全部HCC患者均于MRI檢查后3~5 d在四川大學華西醫院接受手術切除治療,病理學檢查于術后1周證實為HCC。回顧性患者與前瞻性患者臨床實驗室檢查結果見表1,影像征象見表2。
臨床參數特征包括實驗室檢查結果和MRI征象共計23項特征,數據去冗余后LYMPH、PLB/LYMPH及腫瘤內動脈3項參數被剔除,剩余20項特征,進而經Lasso回歸后剩余的8項特征為意義顯著的特征(圖2)。每例患者AP和PVP序列各提取出的紋理特征為385項,經數據去冗余和Lasso回歸后最終篩選出的特征分別為6項和2項。
AP-3D-texture Radiomics signature=-3.81×10-1GLCM Entropy_angle90_offset1+2.81×10-4Inertia_angle135_offset4-1.07×104correlation_All Direction_offset7_SD+2.57×10-9HaralickCorrelation_AllDirection_offset7_SD-16.6 HaraEntroy-4.72×10-4Long Run High Grey Level Emphasis_AllDirection_offset4_SD+17.6。訓練集中AP-3D-texture模型預測早期復發的ACC為0.735,ROC曲線的曲線下面積(area under curve,AUC)為0.759;驗證集中ACC為0.735,AUC為0.769;測試集中ACC為0.651,AUC為0.669(圖3)。
訓練集中PVP-3D-texture模型預測早期復發的ACC為0.721,AUC為0.591;驗證集中ACC為0.367,AUC為0.498;測試集中ACC為0.402,AUC為0.560。結果表明,PVP-3D-texture模型對HCC切除術后早期復發無預測價值(圖4)。
將臨床參數與AP-3D-texture相結合,在訓練集中評估HCC術后早期復發的ACC為0.838,AUC為0.876;驗證集中ACC為0.833,AUC為0.864;測試集中ACC為0.663,AUC為0.656(圖5)。3D-texture與臨床參數綜合后的模型為:Radiomics signature combined=-0.053 3+0.961 5×Rad_score_AP+1.138 7 clinical signature。其中clinical signature=-20.126+1.596×MVI+0.222×腫瘤大小+病理分化程度+0.766×肝硬化-0.111×肝邊緣狀態-1.175×肝包膜完整狀態+17.013×動脈期快速強化-1.103×門靜脈期廓清。

表 1 回顧性、前瞻性HCC患者臨床基線資料[n(%)]

表 2 回顧性與前瞻性HCC患者MRI影像特征[n(%)]

圖 2 訓練集患者lasso法決定最優調整參數λ和特征篩選過程

圖 3 AP-3D-texture模型在訓練集、驗證集、測試集中評估HCC術后早期復發的預測效能

圖 4 PVP-3D-texture模型在訓練集、驗證集、測試集中評估HCC術后早期復發的預測效能

圖 5 臨床參數結合肝動脈期紋理特征綜合評估HCC術后早期復發的預測效能
導致HCC術后早期復發的因素眾多,主要歸納為患者相關因素、背景肝臟因素及腫瘤異質性因素3個方面,應將這些因素綜合起來對HCC術后早期復發進行預測。而且當預測變量的個數顯著高于樣本量時已超出傳統醫學統計學的范疇,而機器學習可以對回顧性數據特征學習后對前瞻性數據中與之類似的特征進行預測。本研究采用監督學習算法對術后早期復發的HCC患者MRI紋理特征、臨床參數進行學習,進而前瞻性地預測HCC患者術后的早期復發。
紋理是一種視覺感知的圖像局部特征的綜合,圖像某一位置的紋理特征與這一位置周圍的灰度變化規律密切相關[7],而紋理分析則是對每個像素強度和空間分布的特點進行數學分析與運算以量化評估圖像異質性的一種工具。惡性腫瘤的生物學異質性與紋理異質性有一定的相關性[8]。基于此相關性,有研究發現腫瘤內部的CT紋理特征可用于評估腫瘤的異質性[9-10]。本研究中,PVP-3D-texture對HCC術后早期復發無預測價值,確切機制尚不清楚。AP-3D-texture模型在訓練集和驗證集的預測效能如下,AUC分別為0.759和0.769,ACC均為0.735,低于Zhou等[3]報道的研究結果,可能是由于本研究用于建模的樣本例數(45例)少于文獻中的建模例數(102例)。其次,不同圖像模式的紋理特征的預測效能是否存在差異尚未見文獻報道,但表明一個趨勢,即MRI AP-3D-texture模型同樣具有預測HCC患者術后早期復發的價值。在AP-3D-texture模型的6個紋理特征中,entropy是熵,為基于灰度共生矩陣提取出的特征,描述了共生矩陣的復雜性,其值越大則表示共生矩陣越復雜,提示病灶越復雜,異質性越大。Inertia是慣性,描述病灶部位的差異性大小,差異越大,則其值也越大。Correlation是相關性,它度量空間灰度共生矩陣元素在行或列方向上的相似程度,其值大小反映圖像中局部灰度相關性,即反映圖像紋理的一致性。如果圖像中有水平方向紋理,則水平方向共生矩陣correlation值大于其余方向共生矩陣correlation值。當矩陣元素值均勻相等時,correlation值大;相反,如果矩陣像元值相差很大,則correlation值小[11]。Long run high grey level emphasis描述的是病灶局部的明暗程度和復雜程度,基于游程矩陣提取。游程矩陣反映的不再是圖像內每一對像素間的空間和像素灰度的相關性,而可以表征圖像中感興趣區(region of interest,ROI)內一組像素間的灰度相關性,進而評估ROI的紋理異質性[12-13]。Inertia和correlation這兩個紋理特征反映病灶局部像素灰度差異性的大小,不同的是Inertia值越大,局部差異越大,correlation值越大,局部差異越小。本研究中inertia與術后早期復發具有正相關性,而correlation則相反,表明復發患者腫瘤MRI肝動脈期圖像局部像素相差很大,圖像異質性大,強化不均勻,符合分化程度低的HCC的肝動脈期強化方式。然而,本研究并不能解釋entropy值與術后早期復發負相關的機制。盡管Kiryu等[14]通過平掃CT紋理特征評估HCC患者預后時,同樣發現entropy值與患者的總體生存期和無瘤生存期呈負相關,但并未就此機制給予闡述。另外,本研究是注射對比劑后強化圖像,與平掃CT圖像的entropy應有很大不同,有關entropy與術后復發的機制有待進一步深入研究。
將AP-3D-texture與臨床參數綜合后,在訓練集與驗證集中的預測效能明顯提高,符合HCC術后早期復發是患者相關因素、背景肝臟因素及腫瘤異質性因素綜合作用的假設。當肝硬化患者腫瘤存在MVI、直徑較大、腫瘤邊緣分葉、邊界不清及病理分化程度較低時,術后更容易早期復發。MVI占有更大的權重,因為MVI陽性會導致切緣不足,于癌旁肝組織殘留微小轉移灶是導致術后早期復發的原因[15]。Hanazaki等[16]也認為,肝硬化程度、Child分級和靛氰綠代謝率等背景肝臟因素,以及病理分型、血管浸潤等腫瘤因素等均可影響HCC術后復發。
此外,為了驗證模型預測效能的可靠性,在施加內部驗證的同時進行了外部驗證。該模型在外部驗證的前瞻性患者中效能低下,主要是由于回顧性和前瞻性的樣本量偏少,兩個數據集中具有共性的特征偏少,使得訓練集生成的模型在前瞻性患者中的預測效能減低。
本研究存在以下不足:首先,訓練集樣本量偏少,會影響機器學習模型預測的效能,在后續的研究中會進一步增加訓練集樣本量,改善模型在測試集中的效能;其次,對回顧性和前瞻性HCC患者的腫瘤直徑未進行分層分析,但腫瘤直徑是影響HCC患者術后早期復發的因素之一。盡管存在上述不足,本研究首次采用3D-texture,更加客觀地反映了腫瘤異質性,結合臨床參數,可以作為術前預測HCC早期復發的一種有效方法。