(1 河北醫科大學第四醫院病理科,河北 石家莊 050011;2 河北醫科大學基礎醫學院;3 河北省胸科醫院胸三科;4 河北醫科大學藥理學教研室)
乳腺癌是女性中最常見的腫瘤,是女性癌癥死亡的主要原因[1]。據預測,到2021年我國35~49歲女性中乳腺癌病例將達到220萬[2]。在我國乳腺癌患者診斷的平均年齡為48~49歲,比西方國家確診年齡低10歲以上[3]。乳腺癌的治療效果在很大程度上取決于患者激素受體和人表皮生長因子受體2(HER2)的表達水平,而乳腺癌的不同的分子亞型(luminalA型、luminalB型、HER2過表達型及三陰型)預后差異很大[4]。HER2是受體酪氨酸激酶(RTK)的EGFR/ERBB家族的成員[5]。HER2癌基因在大約25%的乳腺癌中擴增或高表達,并且在大多數癌癥中是腫瘤細胞生長的主要驅動力[6]。臨床試驗表明,HER2“上癮”是某些腫瘤行為的基礎,HER2作為致癌基因,可促進癌細胞的增殖與轉移,并且與腫瘤復發率和患者病死率增高有關[7]。X型膠原蛋白(COL10)是結構大分子膠原超家族的一員,由COL10A1基因編碼[8]。COL10A1基因突變與日本型脊椎關節發育不良和Schmid型干骺端軟骨發育不良有關[9]。在大多數腫瘤組織中可觀察到COL10A1高表達,并且其可能與腫瘤血管生成有關。在結直腸癌的早期診斷中,外周血液中COL10A1可被視為潛在的生物標志物[10]。研究顯示COL10A1在結直腸癌組織中異常表達并參與結直腸癌的進展和EMT過程[11]。此外,通過組織微陣列和基因表達譜分析顯示,COL10A1在乳腺癌中表達上調[12]。然而,COL10A1對HER2陽性乳腺癌的影響尚不清楚。
腫瘤基因組圖譜計劃(TCGA)利用基因組測序技術研究33種癌癥類型及20 000多種分子特征。目前TCGA已經產生了大量的基因組學、表觀基因組學、轉錄組學和蛋白質組學的大量數據[13]。本研究深入挖掘基于TCGA的腫瘤在線生物信息數據庫cBioPortal、Oncomine、UALCAN等,綜合分析COL10A1在HER2陽性乳腺癌中的表達及與患者預后的關系,為進一步研究COL10A1在乳腺癌治療中的作用提供一定的參考依據。
通過GEPIA[14](http://gepia.cancer-pku.cn/)搜集相對于正常乳腺組織乳腺癌中高表達的基因,數據集選擇“Differential Genes”,Dataset(Cancer name)選擇“BRCA”。在方差分析中,|log2FC|值高于預先設定的閾值,q值低于預先設定的閾值的基因被認為是差異表達基因。對于前10個基因,|log2FC|值和百分比值高于閾值的基因被認為是過表達基因。
登錄cBioPortal 網站(http://www.cbioportal.org)的首頁[15],數據集選擇 “Breast invasive carcinoma (TCGA,PanCancer Atlas) ”,病例組則選擇“Tumor Samples with mRNA data (RNA Seq V2) (1100)”,分別分析COL10A1的突變、mRNA 水平變化及與HER2表達的關系。
通過Oncomine數據庫[16](https://www.oncomine.org/)檢索COL10A1在不同腫瘤類型中的差異性表達,限定條件為:①基因:COL10A1;②數據類型:mRNA;③顯著性:P<1E-4;④差異表達級別:大于2倍;⑤基因排序:前10%;⑥其他為數據庫默認設定。
登錄UALCAN 網站(http://ualcan.path.uab.edu)首頁[17],數據庫類型選擇 “Breast invasive carcinoma”,輸入基因名稱“COL10A1”,分析不同類型乳腺癌組織中COL10A1基因表達的變化。
數據庫類型選擇 “Metastatic breast cancer[MET500 dataset]”,輸入基因名稱“COL10A1”,分析COL10A1在HER2擴增與非擴增樣本中表達的差異。
登錄Kaplan-Meier Plotter數據分析平臺[18](http://kmplot.com/analysis/),檢索COL10A1基因,獲得COL10A1基因表達差異患者的生存曲線。限定條件為無疾病進展生存,“HER2 status”設為“HER2 positive”或“HER2 negative”,對腫瘤病理類型及臨床分期、分級等不做限制。
cBioPortal數據庫分析結果顯示,994例乳腺癌患者中,61例發生了COL10A1基因改變,改變的類型包括突變、拷貝數畸變以及mRNA 水平上調等(圖1a)。GEPIA以及Oncomine數據庫分析結果顯示,COL10A1在乳腺癌中呈現高表達(表1、圖1b)。再利用UALCAN平臺進一步分析TCGA數據庫中COL10A1在乳腺癌中的差異表達情況,在TCGA數據庫中總共涉及到正常乳腺組織114例,乳腺癌組織1 097例,COL10A1基因在乳腺癌中的表達水平大約為正常乳腺組織的177.85倍(P<1E-12)。圖2a。
UALCAN 分析顯示,luminal型與HER2陽性乳腺癌患者中COL10A1表達高于其他類型乳腺癌(P<0.05)。見圖2b。且COL10A1在HER2擴增樣本中表達水平明顯高于無擴增樣本(P<0.01)。見圖2c。GEPIA數據庫與cBioPortal數據分析顯示,COL10A1與HER2表達呈正相關(P<0.01)。見圖3a、b。HER2陽性乳腺癌樣本中COL10A1表達與HER2陰性樣本比較,差異具有顯著性(P<0.05)。見圖3c。

表1 GEPIA 數據庫中乳腺癌組織中高表達的基因

a:cBioPortal數據庫分析COL10A1在乳腺癌中的突變位點及突變方式;b:Oncomine數據庫中COL10A1在不同腫瘤中的差異性表達
圖1COL10A1在不同腫瘤中的表達情況及突變方式
對Kaplan-Meier Plotter數據庫分析顯示,在全部乳腺癌樣本中,COL10A1與患者無復發生存率(RFS)無關。見圖4a。單獨篩查HER2陰性乳腺癌樣本,RFS也未見明顯差異。見圖4b。然而,在HER2陽性乳腺癌患者中,相對于COL10A1低表達者,COL10A1高表達者RFS降低(P<0.01)。見圖4c。
乳腺癌是一種高度異質性的惡性腫瘤,與之相關的分子標志物種類眾多[19]。其中HER2表達在乳腺癌進展中發揮著重要作用。盡管目前有針對HER2陽性乳腺癌患者的靶向藥物,但抗HER2治療的乳腺癌患者往往會產生耐藥性,致使出現新的進展,預后仍不理想[20],因此本研究期望通過生物信息學數據分析發現HER2陽性乳腺癌中的新的靶點。
研究顯示COL10A1在結直腸癌、食管癌和胰腺癌等腫瘤中高表達[21-23],并且免疫熒光染色表明COL10A1定位于乳腺癌的腫瘤脈管系統,而在正常乳腺組織的脈管系統中水平較低[24]。有研究結合RNA表達譜以及免疫組織化學方法分析發現,COL10A1在對化療無反應的ER陽性/HER2陽性型乳腺癌樣本中表達上調[25]。但其在HER2陽性乳腺癌中的特異性作用尚不清楚。
TCGA是迄今為止最具實力和最成功的癌癥基因組計劃之一。TCGA項目已經生成、分析并提供了超過1.1萬例代表30多種不同癌癥類型的基因組和轉錄組數據。Oncomine數據庫是一個研究腫瘤相關基因的開放數據庫,其整合了TCGA、GEO和已發表文獻來源的DNA和RNA-seq數據,能幫助人們篩選一些值得研究的靶分子,有利于提高對癌癥的診斷、治療和發生發展機制的深入研究。Ualcan數據門戶是為了促進TCGA數據庫的基因查詢而開發的交互式網絡資源,便于分析鑒定腫瘤相關的生物分子標記物,從而分析腫瘤發生、進展和轉移的相關分子機制,使癌癥研究人員更容易獲得TCGA數據和分析結果。此外,cBioPortal癌癥基因組學在線門戶網站是一個交互式探索多維癌癥基因組學數據集的開放網站,對于腫瘤的診斷、治療及預后評估具有重要價值。

a:COL10A1在乳腺癌中基于樣本類型的表達;b:COL10A1在乳腺癌亞型中的表達;c:基于HER2基因擴增亞類的COL10A1在乳腺癌中的表達
圖2COL10A1 mRNA在HER2基因擴增樣本中的表達情況

a:GEPIA數據庫分析顯示,COL10A1與HER2 mRNA表達呈正相關;b:cBioPortal分析顯示,COL10A1與HER2 mRNA表達水平呈正相關;c:UALCAN分析結果顯示,HER2陽性乳腺癌組織中有差異表達的基因
圖3COL10A1與HER2 mRNA表達水平的關系

a、b、c分別為Kaplan-Meier Plotter數據庫中所有乳腺癌樣本、HER2陰性乳腺癌樣本及HER2陽性乳腺癌樣本
圖4COL10A1高表達與乳腺癌患者無復發生存率(RFS)的關系
本研究基于上述腫瘤在線生物信息數據庫分析COL10A1在乳腺癌中的表達及與患者預后的關系。首先通過GEPIA及Oncomine數據庫篩查發現COL10A1在乳腺癌中高表達。然后利用UALCAN進一步分析TCGA數據庫中COL10A1在不同類型的乳腺癌中的表達情況,發現COL10A1在HER2擴增樣本中表達水平明顯高于無擴增樣本,結果有統計學意義。為了探究COL10A1與HER2表達的關系,本研究利用GEPIA與cBioPortal數據庫篩查分析顯示,COL10A1與HER2表達呈顯著正相關。以上結果提示COL10A1在乳腺癌中可能為促癌因素,且與HER2相互作用,影響乳腺癌的進展。同時Kaplan-Meier Plotter數據庫分析表明,COL10A1高表達與HER2陽性乳腺癌患者預后較差有關,而與HER2陰性乳腺癌患者預后無關。以上結果顯示COL10A1可能與HER2相互促進,共同影響乳腺癌患者的預后。
綜上所述,通過生物信息數據庫綜合分析發現,COL10A1在乳腺癌中高表達,且與HER2陽性乳腺癌患者的不良預后相關,可以作為HER2陽性的乳腺癌患者臨床預后評估的潛在標志物。鑒于COL10A1基因表達的種族和個體特異性,后續工作中應在乳腺癌患者腫瘤組織樣本中進行驗證,并通過基礎實驗驗證靶基因COL10A1在HER2陽性乳腺癌發生發展中的作用,為HER2陽性乳腺癌患者的治療、診斷和預后提供新的依據。