王曼,鄢丹,2,孟波,榮維淇,戴新華,趙洋
(1.成都中醫藥大學 藥學院,成都 611130;2.首都醫科大學附屬北京友誼醫院,北京100050;3.中國計量科學研究院 前沿計量科學中心,北京 100013;4.中國醫學科學院腫瘤醫院,北京 100021)
肝癌是威脅人類健康的重大疾病,是第6大常見的惡性腫瘤疾病,其死亡率僅次于肺癌,排在第2位[1].中國是肝病大國,也是肝癌大國.據統計,全球每年約有84萬例新發肝癌病人,其中一半以上都在中國[1-2].肝細胞癌(Hepatocellular carcinoma,HCC)是最常見的肝癌類型,約占肝癌患者的90%.目前,HCC診斷方法主要包括醫學影像、組織活檢、血清甲胎蛋白檢測等方法,但其檢測靈敏度和特異性尚不能滿足臨床診斷的需求,亟須尋找新的高靈敏度、高特異性的HCC診斷方法,提高HCC診斷準確性和檢出率,提升患者5年生存率.
生物標志物具有客觀測量和評價生理過程,以及病理過程的特征[3],如DNA,RNA,蛋白質或代謝分子等均可作為生物標志物,其變化與疾病狀態的發生密切相關.作為臨床診斷技術的核心,生物標志物的研究與發現對于肝癌病人的治療和改善其預后具有重要價值.然而,目前尚未發現令人滿意的早期肝細胞癌診斷性生物標志物.蛋白質作為細胞功能活性的直接執行者,是影響機體病理發生發展的關鍵分子,也是最為重要的生物標志物來源.隨著高分辨質譜技術的進步,蛋白質組學的高度發展為高通量發現疾病診斷生物標志物提供了可能[4-6].目前,蛋白質組學技術已初步實現細胞、組織和血液等臨床樣本的蛋白質組深度覆蓋,是發現腫瘤標志物的重要方法[4,7-8].因此,以高分辨質譜技術為基礎開展肝細胞癌的血漿蛋白質組學系統性研究,對于探索和發現早期肝細胞癌診斷標志物是非常必要的.
血液作為臨床疾病診斷最常用的生物標本,具有穩定性好、創傷性小、易獲取、易保存等優點,可普遍反映個體生理病理狀態,在臨床疾病(如癌癥疾病等)的早期發現、診斷、治療與預后等方面具有重大應用價值[9-10].截至目前,仍然缺乏高靈敏且特異性好的HCC臨床血液診斷蛋白質類生物標志物.因此,本研究將利用液質串聯質譜的非標記定量蛋白質組學技術對10例HCC患者和10例健康人的血漿樣本進行蛋白質組學研究,探討HCC患者血漿蛋白質組的變化,為鑒定出靈敏度高、特異性強和易于篩查檢測的微創生物標志物,以及為HCC的早期診斷和預后篩查提供分子病理依據.
二硫蘇糖醇(DTT)、碘乙酰胺(IAA)、尿素(Urea)、甲酸(FA)、碳酸氫銨(NH4HCO3)和三氟乙酸(TFA)購自美國Sigma公司;測序級胰蛋白酶(Trypsin)購自美國Promega公司;30 kDa超濾管購自美國Millipore公司;去離子水由實驗室自備Milli-Q 純水系統制備(Millipore,USA).EASY-nLC 1200 液相色譜系統、Thermo Orbitrap Fusion Lumos高分辨質譜儀、高速離心機和微量紫外分光光度計(NanoDrop OneC)均購自美國Thermo Fisher公司;高精度分析天平(BP211D)購自德國賽多利斯公司;渦旋振蕩器(Vortex-Genie)購自Scientific Industries公司;真空離心濃縮干燥儀(Concentrator plus)購于德國Eppendorf公司;-80 ℃超低溫冰箱購于日本Sanyo公司.
HCC患者和健康人的血漿樣本均由中國醫學科學院腫瘤醫院榮維淇醫生提供,本研究經中國醫學科學院腫瘤醫院倫理委員會審批,所有參與本項研究的受試者均簽署書面知情同意書.血漿樣品經過靜脈采血,置于10 mL真空管中,加入抗凝劑室溫靜置30 min,在4 ℃下2 500 r/min離心10 min后,收集上清液分裝儲存于80 ℃冰箱,直至使用.
用過濾器輔助樣品制備方案(Filter-aided sample preparation,FASP)酶切蛋白質[11].首先配置濃度為0.1 mol/L Tris-HCl尿素緩沖溶液(含有濃度為8 mol/L的尿素),將pH調節到8.5.將凍存的血漿樣品取出于室溫融化并離心,取5 μL血漿并用尿素緩沖溶液稀釋至200 μL,將其轉移至30 kDa 超濾管中12 000 r/min離心15 min,移除套管內廢液.加入200 μL尿素緩沖溶液清洗,12 000 r/min離心15 min,重復操作一次.然后向超濾管中加入100 μL濃度為0.02 mol/L DTT溶液,37 ℃孵育4 h.12 000 r/min離心15 min后,加入100 μL 0.05 mol/L IAA室溫避光放置30 min,離心后再次加入100 μL 濃度為0.02 mol/L DTT溶液室溫避光放置20 min.離心,加入200 μL尿素緩沖溶液和200 μL濃度為0.05 mol/L碳酸氫銨溶液(NH4HCO3)分別清洗3次.更換套管,加入180 μL濃度為0.05 mol/L 碳酸氫銨溶液,并加入20 μL Trypsin胰蛋白酶進行酶切反應,37 ℃孵育16 h.過夜后12 000 r/min離心15 min收集酶切后的肽段溶液,并用100 μL 雙蒸水(ddH2O)和200 μL濃度為0.05 mol/L碳酸氫銨溶液清洗FASP管各一次,收集洗脫液.合并洗脫液在45 ℃真空離心機中熱干回收肽段,回收的肽段放于-80 ℃冰箱儲存,用于后續LC-MS/MS分析.
NanoDrop OneC分光光度計測定肽段質量分數,取500 ng用于質譜分析.儀器為Easy nLC-1200納升級液相色譜系統串聯Orbitrap Fusion Lumos質譜儀.分析柱為自制C18毛細管直噴柱(內徑100 μm,柱長25 cm,C18填料直徑為1.9 μm).液相流動相組成:流動相A體積分數為0.1% FA(99.9% ddH2O),流動相B體積分數為0.1% FA(80% ACN+19.9% ddH2O).質譜采集時流動相梯度如下:0~16 min,流動相B體積分數3%~10% ;16~76 min,流動相B體積分數10%~22%;76~106 min,流動相B體積分數22%~30%;106~118 min,流動相B體積分數30%~90%;118~120 min,流動相B體積分數90%.質譜采集條件設置:碎裂方式為高能碰撞解離(Higher-energy collision dissociation,HCD),電離方式為納升級電噴霧電離(Nano-ESI),采用正離子模式進行掃描;一級質譜參數,離子掃描的范圍為300~1 550 m/z,分辨率為120 000,自動增益控制(Automated gain control,AGC)為4×105,離子最大注入時間為50 ms;二級質譜,分辨率為15 000,AGC為5×104,最大離子注入時間為30 ms,質量數據由XCalibur進行實時采集.
對于LC-MS/MS產生的質譜檢測原始文件,采用MaxQuant[12](版本1.6.12.0)軟件進行搜庫檢索,所用的檢索數據庫為Human Uniprot(version 20200911,20 375 sequences).搜庫檢索參數設置為:水解酶類型為胰蛋白酶,最大漏切位點為2,固定修飾設置為Carbamidomethylation(C);可變修飾為Acetyl(Protein N-term),Oxidation(M);母離子質量偏差(Mass tolerance)為2×10-5,子離子質量偏差(Peptide tolerance)為4.5×10-6;FDR值(False discovery rates)小于1%;其他設置參數選擇默認值.
采用R語言(版本3.5.4)進行分析[13].蛋白質組表達譜數據利用FOT方法歸一化處理,缺失值采用最小值進行填充.為篩選早期肝細胞癌的差異表達蛋白,利用R語言limma軟件包(版本3.24.15)中的修正t檢驗(Moderated t-statistics)算法對癌和癌旁組織間的蛋白質表達譜進行統計分析,并用經驗貝葉斯算法對計算后的概率進行調整,選擇“趨勢”參數使分析更加穩健,減少方差小的基因的假陽性數量,提高識別具有較大方差的重要基因的能力.最后,利用Benjamini-Hochberg(BH)算法對修正t檢驗計算結果中的P值進行多重檢驗獲得BH矯正P值(BH-P值).蛋白質組表達譜的細胞定位與功能注釋則利用Cytoscape軟件(版本3.5.1),基于ClueGo插件,對基因本體數據庫(Gene Ontology,GO)的細胞組分(Cellular Component,CC)和生物過程(Biological Process,BP)進行富集分析[14-16].差異蛋白質功能富集分析則主要采用DAVID網頁軟件對基因本體的生物學過程進行富集分析.所有圖均使用R語言進行繪制.
共收集肝細胞癌患者血漿樣本10例,健康人血漿樣本10例.在肝細胞癌患者血漿樣本中,男性患者5例,占比50%,女性患者5例,占比50%,平均年齡(56.7±10.07)歲;健康組,男性3例,占比30%,女性7例,占比70%,平均年齡(52.2±16.39)歲(表1).肝細胞癌患者的臨床病理指標,AFP,CEA,CA199,ALT,AST,GGT含量如表2所示.

表1 肝細胞癌患者和健康人基本臨床信息

表2 肝細胞癌患者的臨床病理信息
通過血漿蛋白質組表達譜數據分析,本研究在20例血漿樣本中共鑒定了292個蛋白質,蛋白質數量鑒定范圍在212~239之間,平均蛋白質鑒定量為221個(圖1(A)).其中,HCC血漿中特異性鑒定了18個蛋白質,健康人血漿樣本中鑒定了9個蛋白質,共同鑒定了266個蛋白質(圖1(B)).

通過細胞定位富集分析,本研究鑒定的血漿蛋白質主要集中富集于35條細胞成分模塊,共形成了7個相似網絡模塊(圖2(A)).大部分蛋白質主要定位于血漿脂蛋白顆粒、含膠原細胞外基質、致密顆粒腔、膜攻擊復合物、循環免疫球蛋白復合物、細胞外細胞器、三級顆粒腔等細胞位置.通過生物學過程富集分析,鑒定的血漿蛋白質主要富集于146條信號通路,共形成10個相似網絡模塊,主要涉及蛋白脂質復合物重塑、凝血、補體活化、肽酶抑制劑活性、抗菌體液反應、共生作用、急性炎癥反應、細胞異質性黏附調節、過氧化氫分解代謝過程、腫瘤壞死因子產生的正調控等一系列生物學過程(圖2(B)).

基于血漿蛋白質組表達譜數據,通過無監督的主成分分析(Principal Component Analysis,PCA)分析了20例樣本的前3個主成分,并對第1主成分和第2主成分進行了展示,結果如圖3所示.第1主成分和第2主成分分別能表征17%和10%的蛋白質變量.通過第1主成分和第2主成分,HCC患者和健康人群有明顯區分,預示著通過血漿蛋白質組研究可以將HCC患者與健康人進行有效區分,表明通過差異蛋白質分析,可以篩查到有效的HCC患者血漿診斷生物標志物.

隨后,本研究利用有監督的修正t檢驗算法對血漿蛋白質分子特征進行了篩選,結果見圖4.依據P值小于0.01,差異倍數大于2倍的卡值標準,共鑒定了31個差異表達的血漿蛋白質,16個蛋白質表現為上調表達,主要包括CRP,EFEMP1,FGA,FGB,FGG,ITIH3,LBP,LGALS3BP,LRG1,MBL2,IGHV3-30,IGLV3-21,PIGR,SAA1,TGFBI和VWF等蛋白質;15個蛋白質表現為下調表達,主要包括SELL,RBP4,CRTAC1,TTR,HOXD1,CNCP1,APOF,PCYC,SHROOM3,P0DP01,P80748,IGFALS,HGFAC,RFX7和CETP等蛋白質.其中,FGB和FGG為肝細胞癌血液中特異性表達蛋白質,SELL為健康人血液中特異性表達蛋白質.

利用DAVID網站對生物標志物所參與的細胞生物學過程進行了富集分析.通過富集分析發現上調蛋白質主要參與了血小板脫顆粒過程(Platelet degranulation)、血小板激活(Platelet activation)、急性期反應(Acute phase response)、細胞外基質組成(Extracellular matrix organization)、細胞調理反應(Opsonization)、纖維蛋白溶解(Fibrinolysis)、天然免疫應答(Innate immune response)、細胞基質黏附(Cell-matrix adhesion)、ERK1和ERK2反應(ERK1 and ERK2 cascade)、EGFR信號通路(EGFR signaling pathway)、細胞黏附(Cell adhesion)等生物學過程(圖5).而下調生物標志物則主要參與了一系列代謝反應過程,如視黃醇代謝過程(Retinol metabolic process)、類維生素a代謝過程 (Retinoid metabolic process)、膽固醇代謝過程(Cholesterol metabolic process)等.其中,EGFR信號通路、細胞黏附、細胞基質黏附、ERK1和ERK2等信號通路已明確報道與腫瘤發生發展有直接或間接相關性[17-20].

本研究發現了31個潛在的肝細胞癌臨床診斷生物標志物,包括16個上調蛋白質和15個下調蛋白質.其中,VWF,LGALS3BP,FGG,FGB,FGG,PIGR,IGFALS,APOF(Apolipoprotein F,APOF)等差異表達蛋白質均已報道與肝癌相關.血管性血友病因子(Von Willebrand Factor,VWF)已明確報道是診斷嚴重肝纖維化和預測肝細胞癌發生發展的潛在生物標志物[21-22],在嚴重肝纖維化或肝細胞癌患者的血漿中明確上調表達,預示著VWF不僅可作為診斷標志物,還可作為預防和治療肝細胞癌與HBV感染肝纖維化治療的一個重要治療靶點[23].FGA,FGB和FGG等蛋白質是纖維蛋白原的主要組成部分,參與了血小板脫顆粒過程、細胞基質黏附、ERK1和ERK2等生物學過程,多項研究也表明它們在肝細胞癌的細胞或組織中顯著上調表達,提示它們可能是肝癌診斷或預后的潛在生物標志物[24-26].FGA,FGB和FGG蛋白質在肝細胞癌患者血液中顯著上調表達,證明了該類蛋白質作為未來臨床診斷生物標志物的潛能.半乳糖凝集素-3結合蛋白(Galectin-3-binding protein,LGALS3BP),是已被報道的肝硬化患者標志物[27].LIU等[28]發現LGALS3BP或將具有比AFP更好的臨床診斷潛能.聚合物免疫球蛋白受體(Polymeric immunoglobulin receptor,PIGR)的過度表達已被證明會促進肝細胞癌發生發展,具有作為肝細胞癌臨床診斷標志物的潛能[29].在本研究中,以上蛋白質同樣被證明在肝細胞癌患者中顯著上調表達,進一步證實了該類蛋白質組為肝細胞癌臨床診斷生物標志物的潛能.
在肝細胞癌血漿下調表達的基因中,胰島素生長因子亞基(Insulin-like growth factor-binding protein complex acid labile subunit,IGFALS)與載脂蛋白F等已報道與肝細胞癌或其他腫瘤有明確相關性.MARQUARDT等[30]通過轉錄組研究發現IGFALS是肝細胞癌發生時優先下調表達的關鍵基因,表明IGFALS可能是一個潛在臨床診斷或治療的關鍵靶點.WANG等[31]發現在肝細胞癌組織中,APOF基因在mRNA和蛋白質水平均顯著下調,并通過細胞和動物實驗證明了APOF的過表達可以抑制癌細胞增殖和轉移,預示著APOF可作為肝細胞癌的抑癌因子,具有重大臨床應用價值.本研究在血液層面進一步證明了該類蛋白質具有作為臨床診斷生物標志物的重大潛能,值得后期繼續關注與研究.
本研究與先前肝細胞癌的研究結果的一致性證明了血漿蛋白質組研究的穩健性與可靠性.除已報道的生物標志物外,本研究還發現了一系列新的潛在生物標志物,如:EGFR信號通路相關蛋白質,PIGR和EFEMP1等;血小板脫顆粒信號通路相關蛋白質,ITH3等;免疫反應相關蛋白質,CRP,SAA1,LBP和 MBL2等.它們與肝細胞癌發生發展的聯系與機制值得進一步深入探索.綜上所述,基于非標記的蛋白質組學技術,發現了一系列潛在的肝細胞癌臨床診斷候選生物標志物,為探索肝細胞癌的疾病分子病理機制提供了新的線索.然而,由于研究樣本數量較少,該研究結論仍需在大規模隊列中進行驗證和討論.此外,本研究采用了常規的非標記定量蛋白質組技術探討了肝細胞癌的血漿蛋白質組變化水平,雖然在一定程度上減少了實驗誤差,提升檢測準確率,但由于血漿中存在高豐度蛋白質的掩蓋效應,會導致一部分低豐度蛋白質不能被有效檢出,后續需引入高豐度蛋白質去除技術,加強低豐度蛋白質的檢出率,完善肝細胞癌的血漿蛋白質組研究,為肝細胞癌的精準醫療提供分子病理線索.