王智輝,李榮崗,鐘媚共,伍婉婷,孟子杰,鄭焱,張鑫△
江門市中心醫院 1腫瘤科,2病理科,4醫學研究中心(廣東江門 529030);3江門市婦幼保健院藥學部(廣東江門 529000);5廣東省人乳頭狀瘤病毒(HPV)相關疾病分子診斷工程技術研究開發中心(廣東潮州 521021)
乳腺癌是最為常見的女性特發惡性腫瘤,臨床上以乳腺浸潤性導管癌(breast infiltrating ductal carcinoma,BIDC)為主要病理類型。在全球及我國女性中,乳腺癌發病率一直占據著首位,且40年來呈上升趨勢,嚴重威脅著全球女性的生命健康[1-2]。令人欣慰的是,近30年來,乳腺癌患者的病死率持續下降,這主要得益于化療藥物、內分泌治療藥物及靶向藥物的規范化綜合應用[1],但是三陰乳腺癌(triple negative breast carcinoma,TNBC),作為其中一種特殊的病理分子亞型,具有較高的惡性生物學特征,且無法使用內分泌治療藥物并缺少常見的靶向藥物,5內年發生術后進展的概率明顯高于其他基因亞型[3-4],是乳腺癌臨床治療中的難點。臨床診治中[5],將雌激素受體(estrogen receptor,ER)和孕激素受體(progesterone receptor,PR)免疫組化檢測陰性,人表皮生長因子受體-2(human epidermal growth factor receptor 2,HER2)免疫組化陰性或其編碼基因ERBB2 (erb-B2 receptor tyrosine kinase 2)無擴增的浸潤性乳腺癌歸為TNBC。有研究指出[3-5],TNBC約占所有乳腺癌的15%,而我國TNBC的發病比例可能更高。因為缺少真正意義的輔助診斷指標,所以TNBC目前多作為排除性的分類;而關于TNBC全基因組拷貝(copy number variations,CNV)分析的研究較少,依然未見明確具有TNBC輔助診斷意義的CNV的報道。因此,本課題組將嘗試利用全基因組CNV分析的方法,在癌癥基因組圖譜數據庫(The Cancer Genome Atlas,TCGA,https://gdc-portal.nci.nih.gov/)中嘗試挖掘出TNBC相關的基因。
1.1 TCGA TNBC的全基因組拷貝數變異分析 參考本課題組已發表文獻[6],下載TCGA中乳腺癌的基因組拷貝信息(由Affymetrix Genome-Wide Human SNP Array 6.0芯片過濾得到)及對應樣品的臨床信息,數據庫的更新下載日期為2020年1月31日,共1 099例。利用臨床信息中ER、PR和HER2的免疫組化染色結果及ERBB2 DNA原位雜交結果,篩選出ER和PR免疫組化為陰性,同時HER2免疫組化陰性或ERBB2非擴增的TNBC 153例,占比約13.9%。在GenePattern公共服務器平臺(https://genepattern.broadinstitute.org/)上,利用GISTIC 2.0軟件分析腫瘤組織的全基因組拷貝信息,其中原始拷貝數信息源自TCGA數據庫下載整理,參考基因組為人類19版基因組(human genome 19,hg19),探針標記的物理位點信息(Markers file)和CNV參照信息(CNV file)均整理自SNP Array 6.0的第35版本信息(http://www.affymetrix.com/);關鍵的運行參數均為默認,并分析X染色體的拷貝數變異情況。運行所得的關鍵數據有:(1)每個探針標記位點的擴增或缺失情況,即G評分(G-score);G評分的高低能綜合反映該位點的擴增或缺失的深度和頻率。(2)每個樣品中單個基因的拷貝數變異情況,包括缺失(deletion)、二倍體(diploid)和擴增(gain)3個狀況。
1.2 拷貝數變異熱點區域的關鍵基因分析 參考本課題組已發表文獻[7],利用IGV軟件導入GISTIC 2.0分析所得的G評分結果,其中用紅色的線條代表擴增G-value的數值高低,用藍色的線條代表缺失G-value的數值高低。通過峰型定位拷貝數變異的染色體區段,勾畫出熱點區域中心位置的關鍵基因。最后導出所得圖像,并在Canvas 14.0軟件中繪制矢量圖。
1.3 患者一般信息 收集整理2017年1月至2019年12月在江門市中心醫院就診的并手術的BIDC患者信息和標本,排除無法取得足夠治療前樣品的接收新輔助治療的病例,共剩961例,根據ER、PR和HER2的免疫組化染色結果及ERBB2 DNA原位雜交結果,篩選出ER和PR免疫組化為陰性,同時HER2免疫組化陰性或HER2免疫組化2+及以下且ERBB2非擴增的TNBC 108例,占比約11.2%。TCGA與江門市中心醫院TNBC患者的一般信息見表1,兩群樣品在性別、年齡、病理類型及TNM臨床病理分期的分布差異均無統計學意義(P<0.05)。

表1 TCGA及江門市中心醫院TNBC患者的基本信息 例(%)
1.4 qPCR檢測石蠟標本的禽骨髓細胞瘤病病毒致癌基因同源物(avian myelocytomatosis viral oncogene homolog,MYC)基因和CUB和Sushi多結構域基因1(CUB and sushi multiple domains 1,CSMD1)基因拷貝數變異 參考本課題組已發表文獻[6],調取患者手術標本中腫瘤成分70%的石蠟組織,10 μm厚度切片4張。利用GeneRead DNA FFPE Kit按操作說明書提取石蠟切片的DNA;利用TaqMan Copy Number Assay的熒光定量PCR引物Hs00292858_cn檢測MYC基因拷貝數,引物Hs03655295_cn檢測CSMD1基因拷貝數,其中內參引物為TaqMan Copy Number Reference Assay RNase P,二倍體參考樣品為健康人血漿白膜層樣品,擴增試劑盒為TaqMan Fast Advanced Master Mix,按說明書在CFX96熒光定量PCR儀中檢測。規定樣品中目標基因的相對拷貝數檢測值<0.75為缺失,>1.5為擴增,其余為二倍體。
1.5 統計學方法 計數資料用頻數表示,用Excel 2016及GraphPad Prism 7.0軟件處理數據,各組間頻數數據統計使用2檢驗(Chi-squared test)或Fisher′s精確檢驗(Fisher′s exact test),檢驗水平α=0.05。
2.1 TCGA TNBC全基因組拷貝數分析 通過GISTIC 2.0軟件分析,能得到TCGA數據庫中TNBC腫瘤組織的全基因組拷貝數變異情況,見圖1,8q24.21、1q21.3和19q12是擴增最為顯著的3個區段(圖1-A),8p23.2、10q23.31和13q14.2是缺失最為顯著的3個區段(圖1-B)。其中,我們在擴增區段和缺失區段分別選擇了G評分最高及q值最小的8q24.21和8p23.2作為研究重點。

注:A:擴增最顯著的3個區段;B:缺失最顯著的3個區段圖1 TCGA TNBC的全基因組拷貝數分析
2.2 8q24.21區段的關鍵基因 通過IGV軟件觀察8q24.21區段的信息,可以明確TNBC的擴增峰在MYC基因處(圖2-A),利用GISTIC2.0軟件的自動閾值計算結果,得到TCGA的153例TNBC腫瘤組織中,MYC基因發生缺失3例(2.0%),正常二倍體23例(15.0%),余下127例(83.0%)為擴增。
2.3 8p23.2區段的關鍵基因 通過IGV軟件觀察8p23.2區段的信息,可以明確TNBC在8p23.2區段無顯著缺失峰,而此區段最主要的為含CSMD1基因(圖2-B),利用GISTIC2.0軟件的自動閾值計算結果,得到TCGA的153例TNBC腫瘤組織中,CSMD1基因發生擴增31例(21.7%),正常二倍體26例(18.2%),余下96例(67.1%)為缺失。

注:A:8q24.21區段;B:8p23.2區段圖2 8q24.21及8p23.2區段的拷貝數變異熱點區域基因
2.4 TCGA TNBC中MYC擴增及CSMD1缺失與患者臨床病理特征的關系 將TCGA中TNBC患者的臨床信息與MYC的擴增及CSMD1的缺失情況進行統計分析,僅發現CSMD1的缺失與較低的T分級相關(P<0.05),與年齡、病理類型、N分級、M分級及臨床病理分期無關(P>0.05);而MYC的擴增與上述臨床病理特征均無關(P>0.05)。見表2。

表2 TCGA TNBC中MYC擴增及CSMD1缺失與患者臨床病理特征的關系 例
2.5 江門市中心醫院TNBC組織中MYC和CSMD1基因拷貝數的檢測 利用qPCR檢測我院108例TNBC腫瘤組織的MYC和CSMD1基因拷貝數,結果顯示,MYC基因無缺失情況,二倍體有12例(11.1%),擴增有96例(88.9%),與TCGA數據庫的分布差異無統計學意義(2=1.761,P=0.185);CSMD1基因擴增13例(12.0%),二倍體有32例(29.6%),缺失有63例(58.3%),與TCGA數據庫的分布差異有統計學意義(2=7.292,P=0.026)。
2.6 本院TNBC中MYC的擴增及CSMD1缺失與患者臨床病理特征的關系 將本院TNBC患者的臨床信息與MYC的擴增及CSMD1的缺失情況進行統計分析,發現MYC的擴增或CSMD1的缺失與患者的年齡、病理類型、T分級、N分級、M分級及臨床病理分期無關(P>0.05)。見表3。

表3 我院TNBC中MYC擴增及CSMD1缺失與患者臨床病理特征的關系 例
近20年來腫瘤基因組學發展迅猛,分子特征檢測技術逐漸與傳統腫瘤病理鑒別診斷相結合,出現了腫瘤病理分子分型的新模式,其中,成熟的分子特征包括了關鍵驅動基因的突變、CNV及蛋白產物的表達異常等[8]。在關鍵驅動基因的CNV中,癌基因ERBB2的擴增最具有臨床意義,乳腺癌中HER2蛋白的過表達主要是編碼基因ERBB2的擴增,針對HER2蛋白為靶點的曲妥珠單抗(trastuzumab)已經上市20年,其在治療轉移性HER2過表達型乳腺癌及胃癌中療效確切,有效延長了相適應的病理分型患者的生存時間[9]。但是對于TNBC,暫時未見可以納入臨床指南的關鍵驅動基因CNV特征,只能使用排除性分類方式,進行模糊分類,這同樣限制了針對TNBC的精準診治的發展。
在本研究中,本課題組首先利用GISTIC2.0軟件,對TCGA公共數據庫中153例TNBC腫瘤組織進行全基因組的CNV分析,分別發現了8q24.21和8p23.2在TNBC顯著擴增及缺失,提示我們8號染色體在TNBC腫瘤組織中的高度不穩定,而這一現象已被眾多研究者證實,并指出8p的缺失與8q的擴增具有相關性[10-11]。一般認為,腫瘤基因組中發生擴增的區段一般包含了重要的癌基因,而缺少的區段則往往含有關鍵的抑癌基因[12]。利用基因組瀏覽器,我們能將8q24.21的擴增峰定位在MYC基因,而8p23.2的缺失主體為CSMD1基因,表明TNBC中MYC基因的擴增和CSMD1基因的缺失是值得我們研究的。
雖然未見CSMD1在TNBC樣品中缺失率的報道,但能明確的是,乳腺癌中存在一定比例的CSMD1基因缺失情況[13]。近年來的系列研究已經證實,CSMD1蛋白在腫瘤組織中表達缺失與浸潤性乳腺癌的高病理分級和差的預后相關[14];在乳腺癌細胞中,沉默CSMD1能促進細胞體外的增殖、遷移和侵襲,并促進乳腺癌細胞體內的成瘤及轉移,這表明CSMD1在乳腺癌中起抑癌基因的作用[15]。我們的研究發現,CSMD1基因在TCGA及本院TNBC樣品中的缺失率分別為67.1%和58.3%,其中TCGA中CSMD1基因的缺失與TNBC患者癌組織的T分級相關,但我院的樣品檢測并不支持相關結果,其原因可能是本研究的TNBC樣品數依然不足,高T分級樣品較少(T3~T4占比均<17%),難以得到穩定的統計學分析結果,此外,與MYC擴增情況類似,本研究并未發現CSMD1基因缺失與TNBC患者臨床病理特征的明確相關性,這提示我們CSMD1缺失和MYC擴增可能是TNBC較為普遍的分子特征,而不是TMBC內部分型的標志物。
大量的研究[16-19]指出,MYC基因是重要的癌基因,其擴增導致的MYC蛋白過表達能通過干擾多條信號通路,直接或間接促進腫瘤細胞的合成代謝和細胞周期運行,維持腫瘤細胞的高增殖和低凋亡,還能通過直接轉錄多種生長因子促進腫瘤組織血管的新生和促癌微環境的形成,最終推動腫瘤的惡性進展及放化療抵抗。在TNBC的臨床組織中,有多個課題組均發現MYC基因的擴增現象,其擴增例數占比在50%~89%之間[20-21],其數據波動較大的主要原因是,采用的檢測方法及對應的閾值均有不同,且暫無統一的標準。在我們的樣品和TCGA數據庫中都觀察到MYC基因的顯著擴增,其占比分別為83.0%和88.9%,因為缺少不同乳腺癌分子病理亞型的數據,我們暫時無法確定MYC基因是否能作為TNBC的輔助診斷分子標志物,而回答這一問題將是本課題組后續的研究方向。