陳建, 黃海霞, 盧超, 王霄霄, 丁奕, 單秀紅
(1. 江蘇大學醫學院, 江蘇 鎮江 212013; 2. 鎮江市第五人民醫院放射科, 江蘇 鎮江 212004; 3. 江蘇大學附屬人民醫院放射科, 江蘇 鎮江 212002)
胃癌患者不同個體的預后有很大的差別,是由于不同的個體胃癌發生的原因不同,發展的途徑也不一樣,所呈現的組織類型及分子表型差異較大,即所謂的“腫瘤異質性”[1]。有文獻報道[2]胃癌根治術后復發轉移的危險因素包括腫瘤病理組織學類型、腫瘤大小、腫瘤分化程度、腫瘤部位等,其中組織學類型是預后的一個重要因素。Degiuli等[3]研究發現,低分化腺癌、黏液腺癌和印戒細胞癌淋巴結轉移率高,預后差;高、中分化腺癌淋巴結轉移率低,預后較好。Liu等[4]進行了一項針對11 073例胃癌病例的病理組織學類型與患者預后相關性的Meta分析,結果發現分化不良型胃癌術后5年死亡風險顯著高于分化型胃癌(P<0.001),分化不良型胃癌包括低分化腺癌、黏液腺癌和印戒細胞癌,而分化型胃癌包括乳頭狀腺癌、高/中分化管狀腺癌。Lai等[5]研究報道通過單因素和多因素分析顯示性別、腫瘤大小、大體形態、浸潤深度和WHO組織分型與淋巴結轉移顯著相關。有學者研究發現[6],胃黏液腺癌易出現淋巴結轉移和漿膜侵犯,臨床預后比非黏液腺癌差。因此,術前獲取胃癌WHO組織學分型的信息對于治療方案的合理制定以及患者的預后改善具有重要價值。
目前胃癌組織學分型的信息是靠術后病理獲得的,胃鏡活檢雖然能提供腫瘤的組織學分型,但是只代表局部腫瘤組織,因此術前很難獲得胃癌組織學分型的可靠信息。影像組學是一種深度挖掘影像信息、高通量提取影像特征的技術,可以提高腫瘤學中診斷和預后的準確性[7-10]。近幾年基于CT的影像組學在胃癌方面的研究已經顯示出了較好的前景,Ma等[11]采用CT影像組學模型來區分Borrmann IV型胃癌與原發性胃淋巴瘤,結果顯示出對兩種病變具有很高的區分能力;Ba-Ssalamah等[12]運用CT紋理特征來區分胃癌、淋巴瘤和胃腸道間質瘤;Dong等[13]建立了基于CT表型和Lauren類型的放射組學諾模圖,在術前預測進展期胃癌隱匿性腹膜轉移方面表現出了很大的臨床應用潛力。本研究運用CT影像組學術前預測胃癌不同預后組織學分型,報道如下。
本研究經江蘇大學附屬人民醫院倫理委員會批準。收集2012年1月至2017年12月在江蘇大學附屬人民醫院連續就診的605例胃癌患者的臨床資料,包括年齡、性別、CT-TNM分期、WHO組織學分型。入組標準: ①術后病理證實為胃癌并有明確的WHO組織學分型; ② 術前有規范的CT影像資料; ③ CT檢查前無任何針對胃癌的治療。排除標準: ① 少見類型癌(n=15); ② 腫瘤最小直徑<5 mm,不足以包含感興趣區域(n=12); ③ 胃癌病灶數量大于1(n=8)。最后,共有570例入組病例(男411例,女159例;年齡32~86歲,平均年齡62.6歲),包括7例乳頭狀腺癌、285例高/中分化管狀腺癌、247例低分化腺癌、21例黏液腺癌和10例印戒細胞癌。我們將乳頭狀腺癌和高/中分化管狀腺癌歸為預后較好組,低分化腺癌、黏液腺癌和印戒細胞癌歸為預后較差組。570例樣本按照2 ∶ 1的比例被隨機分為訓練組和驗證組。
CT成像系統有Siemens Sensation 64層CT及飛利浦公司Briliance 256i CT。患者檢查前準備:空腹4 h以上,檢查前30 min飲水800~1200 mL,CT掃描前10~15 min臀部肌肉注射鹽酸山莨菪堿20 mg。患者仰臥位掃描,行CT平掃后,經肘靜脈注射非離子型對比劑碘海醇(270 mg/100 mL),注射總量為1.2 mL/kg,注射速率為3.0 mL/s,延遲30 s動脈期掃描,延遲70 s靜脈期掃描,掃描范圍自膈頂至胃下緣(或全腹),所有期相均在吸氣后屏氣完成。掃描參數:管電壓120 kV,管電流220~250 mAs,層厚0.625 mm,螺距為1,平掃、動脈期和靜脈期軸位重建層厚5 mm,靜脈期冠狀位重建層厚3 mm,軟組織對比重建,矩陣512×512。圖像重建后以無壓縮DICOM數據上傳PACS(加拿大思代)。
下載CT圖像的DICOM數據拷貝至個人計算機,使用軟件ITK-SNAP在門靜脈期軸位CT圖像上找出腫瘤最大面積層面進行手動分割。圖像分割首先由影像科腹部組主治醫師進行病灶分割,其次是副主任醫師進行腫瘤分割區的校正,再次是主任醫師對腫瘤分割區進行最后校對。
采用多因素分析篩選出與胃癌組織分型不同預后潛在關聯較大的臨床特征。使用基于Python的Pyradiomics包從所有分割圖中提取二維圖像特征,包括一階統計特征、形狀特征、紋理特征、小波特征和其他濾波特征。為了避免模型過擬合,使用最大相關最小冗余(mRMR)、最小絕對收縮和選擇算子(LASSO)回歸和逐步回歸方法篩選掉冗余的影像組學特征,并獲得有效特征。
通過圖像有效特征構建影像組學標簽。基于影像組學標簽和臨床特征的多因素Logistic回歸分析的基礎上構建影像組學模型。同時僅包含臨床特征的臨床特征模型被用來對比。所有模型都是在訓練組上建立,并在驗證組上進行測試。ROC曲線下面積(AUC)用于測試模型的性能,并計算特異度、靈敏度和準確度。
統計學分析均使用R軟件(3.6.0版)和Python(3.6版)進行。采用t檢驗和χ2檢驗比較訓練組和驗證組中不同預后組各臨床特征的關系,采用Wilcoxon符號秩檢驗進行影像組學特征的單因素分析。P<0.05為差異有統計學意義。
訓練組包括381例患者,驗證組包括189例患者。表1總結了訓練組和驗證組中患者的主要臨床資料,兩組間臨床特征變量的分布差異無統計學意義(P>0.05)。通過多因素Logistic回歸分析,剔除P>0.5的臨床特征,最終納入年齡、性別、CT-M分期。

表1 訓練組和驗證組中患者的臨床信息
從所有分割圖中提取了985個二維圖像特征,包括18個一階統計特征、12個形狀特征、75個紋理特征、372個小波特征和508個其他濾波特征,通過mRMR對所有特征進行排序,然后通過LASSO篩選出了13個特征,再通過逐步回歸算法進一步選擇特征,最后得到了5個有效特征構建影像組學標簽,見表2。

表2 影像組學特征篩選的結果
臨床特征模型的AUC在訓練組和驗證組中分別為0.603 2(95%CI:0.546~0.660),0.612 6(95%CI:0.530~0.694)。影像組學標簽的AUC在訓練組和驗證組中分別為0.676(95%CI:0.622~0.729),0.652(95%CI:0.572~0.731)。影像組學模型的AUC在訓練組中為0.726 2(95%CI:0.676~0.776),在驗證組中為0.707(95%CI:0.632~0.781)。各模型預測胃癌不同預后組織學分型的詳細性能指標見表3。模型的決策曲線如圖1所示,影像組學模型的構造如圖2所示。影像組學模型的構造形式由左邊的指標名稱和右邊對應的帶有刻度的線段組成,它的構造參數包括影像組學標簽、年齡、性別和CT-M分期4個部分,總分由4個參數對應的分值相加所得。由圖2可見,隨著總分的增加,模型預測為胃癌預后較差組織學分型的概率增大。

表3 模型性能的評價結果

圖1 三種模型的ROC曲線
胃癌的組織學分型臨床上最常用的是WHO組織分型(1990版),分為腺癌及鱗狀細胞癌、腺鱗癌、未分化癌等少見類型癌,腺癌又分為乳頭狀腺癌、管狀腺癌、黏液腺癌、印戒細胞癌和低分化腺癌。依據文獻研究結果[2-6],本研究將乳頭狀腺癌和高/中分化管狀腺癌歸為預后較好組,低分化腺癌、黏液腺癌和印戒細胞癌歸為預后較差組。有研究者稱這種劃分為分化型胃癌和未分化型胃癌[14]。以上為胃癌常見類型,其他少見類型癌只占到胃癌的5%[15-16],不具有代表性,因此本研究將其排除在外。

圖2 影像組學模型的構造
腫瘤異質性是胃癌的重要特征之一,也是導致不同個體胃癌預后有較大差別的原因。胃癌的異質性與不同的組織學類型、發展的途徑不同有關。不同的分化水平導致組織學形態的不同,分化較好的呈乳頭狀、腺管狀,分化較差的呈巢狀、彌漫片狀及條索狀,癌細胞內黏液分泌呈印戒狀。腫瘤分化程度越差,腫瘤細胞的異質性越明顯,其生物學行為侵襲性越高[17]。腫瘤組織這些微觀層面的異質性在CT圖像上表現為腫瘤病灶密度的不均勻性,這是影像組學方法研究腫瘤內部異質性的基礎。
影像組學出現之前對于胃癌組織學分型的研究主要從病灶的CT強化方式和程度著手。例如鄒茹欣等[18]研究認為,64排螺旋CT增強掃描病灶的強化程度和強化方式與胃癌WHO組織學分型密切相關。有學者研究發現,腫瘤的強化特點與組織學類型有一定的關系,腺癌和鱗癌在動脈期、門靜脈期多呈明顯的不均勻強化,在平衡期均勻強化;而黏液腺癌強化程度較低,并呈分層樣改變[19]。
以上的方法對于圖像信息的利用還遠遠不夠,近幾年研究人員借助影像組學的方法來分析胃癌組織的圖像特征。Liu等[20]報道了CT紋理分析在預測胃癌組織病理特征方面的應用價值,發現腫瘤的紋理特征與Lauren分型相關,彌漫型胃癌門靜脈CT圖像的平均衰減、最大衰減等紋理參數明顯高于腸型胃癌;且門靜脈CT圖像的紋理參數與胃癌的分化程度呈顯著負相關。其研究中使用的數據來自107例胃癌患者,通過計算機軟件讀取已分割好的胃癌病灶感興趣區域,自動生成包括平均衰減、分布范圍等8個特征,再通過統計分析來評價CT紋理特征與組織病理特征之間的相關性。本研究入組樣本量較大,有570例患者,這樣能盡量保證模型的穩定性;其次樣本被隨機分成訓練組和驗證組,盡可能地保證了樣本的隨機性和代表性,減少了統計上的偏倚;再者從分割圖中提取的特征數量大、類型多,很好地體現了影像組學高通量提取特征的這一特性。構成影像組學標簽的5個有效特征代表著圖像中不同的紋理和強度,反映了腫瘤組織內部的不均質性。“wavelet.HL_glszm_ZonePercentage”測量CT圖像中感興趣區域的數量與體素數量的比率,特征值越高,紋理越精細,在預后較差組的胃癌中,特征值較小。“wavelet.LH_glszm_GrayLevelNonUniformity”反映灰度強度值的變化,較低的值表示強度值更均勻。“wavelet.LH_glszm_ZoneVariance”是通過計算區域大小的方差來確定灰色區域的質量。“wavelet.HH_glrlm_LowGrayLevelRunEmphasis”表示低灰度值分布,特征值越高,說明圖像中低灰度值的濃度越高。“wavelet.LL_firstorder_90Percentile”描述感興趣區域中的體素分布強度。我們構建的三種預測模型建立在訓練組上,并在驗證組中檢驗,從而實現穩健的分類性能[21]。由結果數據不難看出,影像組學模型對胃癌不同預后組織學分型的預測性能在三者中表現最好。從預測模型中可以看出,年齡越小,組織學類型越傾向于預后較差的胃癌分型,腫瘤惡性程度越高。這與郭震等[22]報道一致,即年齡越小,腫瘤細胞代謝越活躍,進展越快,早期胃癌的惡性程度就越高。因此,對于中青年人的胃鏡體檢是有必要的。另外,由預測模型發現伴有轉移的胃癌其組織學分型更傾向于預后較差,這與臨床實際情況一致。但轉移沒有細分局部轉移還是遠處轉移,還有待進一步研究。
本研究存在以下不足: ① 僅選取了CT門脈期圖像進行特征提取,平掃及動脈期圖像是否有更多有價值的特征; ② 僅選取了CT軸位上病灶最大層面,可能會導致部分采樣誤差; ③ 缺少外部驗證;這些問題都有待進一步研究。
綜上所述,相比傳統的影像診斷方法,CT影像組學可以客觀且無創地評估腫瘤異質性,發現肉眼主觀評估以外的信息。利用CT影像組學模型可在術前無創預測胃癌不同預后的組織學分型,可以為臨床醫生制定完善的個體化治療方案提供有價值的信息。