王莽原、宋雷綜述,霍強、楊毅寧審校
蛋白質是生理功能的執行者,生命現象的直接體現者。蛋白質組是指研究一個器官、組織或細胞內表達的所有蛋白質。蛋白質組學旨在闡明生物體全部蛋白質的表達模式及功能模式,其內容包括鑒定蛋白質的表達、存在方式(修飾形式)、結構、功能和相互作用,是研究這些蛋白質的組成及變化規律的一個學科。上世紀九十年代起的人類基因組學研究基本完成后,發現很多生物學現象仍無法合理解釋,因而出現了蛋白質組學這一新生的前沿學科,由澳大利亞學者Wilkins等[1]于1996年最早提出。
進入新世紀以來,作為后基因組時代的蛋白質組學研究成為了前沿熱點研究領域之一,因此國際人類蛋白質組計劃應運而生。其中包括中國科學家賀福初院士領銜的“人類肝臟蛋白質組計劃”和美國科學家Gibert Omenn領銜的“人類血漿蛋白質組計劃”,“人類肝臟蛋白質組計劃”已于2014年6月升級為“中國人類蛋白質組計劃”,目前已有胃癌[2]、肝癌[3]、肺腺癌[4]三方面的臨床轉化的研究成果,將來還要在更多中國常見疾病領域研究蛋白質組臨床轉化研究,以驅動多種常見疾病的精準治療,而“人類血漿蛋白質組計劃”目前尚未有高質量的臨床轉化研究成果,因此“人類肝臟蛋白質組計劃”大幅度領先于“人類血漿蛋白質組計劃”;然而,美國臨床蛋白質組腫瘤分析協會(CPTAC)也在乳腺癌[5]、卵巢癌[6]、結直腸癌[7]、腎透明細胞癌[8]、肺腺癌[9]等方面有蛋白質組和基因組篩查結合分析的研究成果,因此,蛋白質組學在中國的發展一直保持著與國際齊頭并進的態勢,甚至在部分領域引領蛋白質組學的發展。
目前單細胞蛋白質組學處于起步階段[10-11]。在單細胞分離方面,郭國驥團隊對60種人體組織樣本和7種細胞培養樣本進行了單細胞分離和Microwell-seq高通量單細胞測序分析,系統性地繪制了跨越胚胎和成年兩個時期,涵蓋八大系統的人類細胞圖譜[12-13]。在單細胞蛋白質組學技術建立方面,Budnik等[14]建立了基于質譜檢測的哺乳動物單細胞蛋白質組學檢測。目前尚缺乏高質量的應用單細胞蛋白質組學進行臨床轉化解決臨床實際問題的研究。
秦鈞教授的研究檢測到癌癥組織和癌旁組織對比的差異蛋白質通路富集到細胞周期(代表腫瘤細胞增殖)、上皮間質轉化(EMT,代表腫瘤細胞轉移)、免疫(代表腫瘤細胞免疫豁免)中的普遍表達豐度分為PX1(腫瘤細胞高增殖、低轉移、低免疫豁免)、PX2(腫瘤細胞高增殖、高轉移、低免疫豁免)、PX3(腫瘤細胞低增值、高轉移、高免疫豁免),并發現PX1的臨床預后最好,PX2的臨床預后其次,PX3的臨床預后最差且對化療不敏感,并發現CD300A、CYBA、IDO1三個蛋白質的高表達在臨床上的預后均比低表達組預后更差,而這幾個蛋白質可以作為彌漫型胃癌患者(尤其是彌漫型胃癌PX3型患者)潛在的免疫治療的靶點[2];之后,賀福初院士團隊研究了關于人肝癌和人肺腺癌基于不同臨床預后的蛋白質分子臨床分型,根據蛋白質表型對不同預后的肝癌患者和肺癌患者進行分期并將早期患者篩查出來[3-4]。
2020年CPTAC研究在110個肺腺癌腫瘤組織和相匹配的101個正常的癌旁組織中進行了基因組學、表觀遺傳組學、蛋白質組學、磷酸化蛋白質組學、乙酰化蛋白質組學多組學數據綜合分析,發現 了PTPN11(EGFR)、SOS1(KRAS)、neutrophil degranulation(STK11)三種肺腺癌候選藥物靶點[9]。2019年CPTAC研究在103例腎透明細胞癌病例中進行了基因組學、表觀遺傳組學、轉錄組學、蛋白質組學、磷酸化蛋白質組學多組學數據綜合分析,發現了腎透明細胞癌特異的蛋白質組學和磷酸化蛋白質組學改變,并明確了該腫瘤的免疫分型[8]。2016年CPTAC研究描述了105例乳腺癌的蛋白質組學和磷酸化蛋白質組學的定量質譜分析,其中77例提供了高質量的數據,CDK12、PAK1、PTK2、RIPK2、TLK2等磷酸化激酶被鑒定出;研究表明蛋白質組學和基因組學結合分析闡明了乳腺癌體細胞突變的功能后果,確定了乳腺癌的治療靶點[5]。同年CPTAC的又一項研究在174個卵巢腫瘤組織中進行了蛋白質組學、基因組學、表觀遺傳組學多組學數據結合分析,闡明了特異性蛋白質乙酰化可作為對患者進行治療分層的一種潛在方法[6]。2014年CPTAC研究在結直腸癌腫瘤組織中進行了蛋白質組學和基因組學多組學數據結合分析,闡明了染色體20q上的HNF4A、TOMM34、SRC在腫瘤組織中的mRNA和蛋白質層面都有最顯著的改變;基因組學和蛋白質組學結合分析為揭示基因組異常提供了蛋白質功能學背景,為理解結直腸癌腫瘤生物學提供了新的模式[7]。
目前心臟研究領域的蛋白質組學研究尚處于起步階段,Doll等[15]的研究闡述了心臟16個解剖區域的3種主要心臟細胞類型的蛋白質組學特征,并根據心臟細胞不同的細胞器建立了亞細胞水平的心臟蛋白質組模型,進而揭示了心房顫動線粒體功能障礙的個體差異。有研究通過對100例實體解剖的年輕人冠狀動脈和主動脈標本進行質譜蛋白質組分析,描述了與早期動脈粥樣硬化密切相關的人類動脈蛋白質組和蛋白質組學特征,證明了在早期動脈粥樣硬化中線粒體蛋白豐度存在顯著地降低,以及鑒定出一系列血漿蛋白(VTN、TGFBI、C7、ITIH1、TPP1、LTA4H、APOB)可以高質量(AUC=0.93)預測經動脈造影證實的冠心病[16]。
另外,有少量文獻報道了心臟研究領域的尿蛋白質組學研究。尿液在臨床上十分便于收集,因此尿蛋白質組學研究最大的優勢便在于此,近二十年來心臟研究領域的尿蛋白組研究呈逐漸增長的趨勢,尤其在2013年蛋白篩查實驗技術路線確定及質譜儀器日臻完善之后[17]心臟研究領域的尿蛋白組研究呈大幅度增長,尿蛋白質組研究主要應用于以下心臟研究領域:尿蛋白質組研究舒張期心力衰竭早期診斷標準和生物標記物[18],該研究使用了毛細電泳-質譜聯用技術,比較了19例無癥狀左心室舒張功能不全的高血壓患者和19例健康對照者,將85個潛在的生物標志物組合在高維模型分類器中,結果顯示舒張型心力衰竭的ROC曲線AUC為0.84(95% CI:0.70~0.98,P=0.001);尿蛋白質組研究收縮期心力衰竭早期診斷標準和生物標記物[19],該研究使用了毛細電泳-飛行時間質譜聯用技術,對比了總計126例根據年齡、性別和腎功能匹配的59例左心室射血分數降低的心力衰竭患者和67例對照者,總共識別出107個顯著差異的肽段,并使用基于支持向量機的分類器,最后將該分類器應用于25例左心室射血分數降低的心力衰竭患者和33例對照受試者的測試隊列,結果顯示該診斷方法的敏感度為84%,特異度為91%,測序結果顯示大部分肽段是Ⅰ型和Ⅲ型膠原的片段;尿蛋白質組研究冠心病早期診斷和生物標記物[20-21],研究通過對84例患者和84例匹配對照者的蛋白質組學分析,發現了75條魚急性冠狀動脈綜合征相關的尿肽段,據此研究建立了急性冠狀動脈綜合征預測因子(ACSP75)。
如前所述,蛋白質組學技術在腫瘤領域的應用已經有很大發展[2-4],相比于此,目前蛋白質組學技術在心臟領域的應用尚進展緩慢,這主要是因為蛋白質組學技術在心臟研究領域的應用存在一定的困難:
第一方面,心臟組織取材困難,心臟組織不同于腫瘤組織,尤其最有研究意義的心室部分和正常心臟組織,在心臟一般手術中無法取材,只有通過心臟移植手術的患者受體心臟,才可多層面、多部位的系統性取到心臟組織以供研究[22],而能進行心臟移植手術的醫院以及心臟移植的病例數量都十分有限[23-24],大幅度限制了心臟領域利用蛋白質組學技術進行的臨床轉化研究。
第二方面,人心室壁組織和大動脈組織堅韌,提取出的細胞核蛋白質純度低,其中混雜的細胞質蛋白很多,從而引起轉錄因子檢出率和覆蓋度低:人類右心室壁心肌轉錄因子高通量篩查僅能篩查到數種至數十種轉錄因子,而之前有研究顯示在人類心臟組織中使用RNA測序篩查轉錄因子可檢測到近200種轉錄因子[25]。
為了解決人心室壁組織和大動脈組織堅韌導致提取出的細胞核蛋白純度低的問題,需要將人類心臟新鮮組織消化為細胞,而中國醫學科學院阜外醫院胡盛壽院士團隊和聶宇研究員團隊在2018年和2020年分別提出了將人類和小鼠心臟新鮮組織消化為細胞的改進方法,這種方法有效消化分離了心肌組織中的細胞,并保持了分離的細胞的活性,以及保持了心臟疾病的表型,為研究各類心肌疾病提供了良好的細胞模型[26-27]。再提取消化后細胞的細胞核蛋白,之后再進行蛋白質組學實驗技術研究,如此即可解決細胞和蛋白純度低的問題,進而使得蛋白質組學實驗技術可以檢測到足夠的蛋白質種類數,以達到滿意的高通量篩查檢測覆蓋度。
中國人類蛋白質組計劃將分三個階段展開:第一階段,全面揭示肝癌、肺癌、胃癌等疾病所涉及主要的組織器官的蛋白質組,了解疾病發生、發展的蛋白質組學主要特征,進而研制診斷試劑、篩選藥物,目前這一階段已基本完成;第二階段,爭取覆蓋中國人的其他常見疾病,提升中國人群疾病的防治水平;第三階段,實現人類更多疾病的覆蓋。目前中國人類蛋白質組計劃正處于第二階段的起步階段,而心血管疾病(比如高血壓、終末期心力衰竭、心肌梗死、心房顫動等)是中國人的常見多發疾病,而且病情重、社會資源占用多[28-29],非常有必要對其進行蛋白質組學驅動的精準醫療轉化研究,將會是中國人類蛋白質組計劃下一階段的重要組成部分之一。因此本綜述此部分主要展望中國人類蛋白質組計劃第二階段心血管疾病領域部分可能會有較大突破的方面。
2019年,胡盛壽院士和宋江平團隊的研究[30]結合致心律失常性心肌病(arrhythmogenic cardiomyopathy,AC)的橋粒、非橋粒或其他基因突變及在左心室前壁、左心室側壁、左心室后壁、室間隔、右心室前壁、右心室后壁纖維脂肪替代心肌的情況,將AC分為了4個亞型:第一個亞型是橋粒基因突變,病變主要為脂肪替代,主要發生在右心室和左心室后壁;第二個亞型是非橋粒基因突變,主要發生在右心室前壁(主要是脂肪替代)和左心室(廣泛地輕度纖維替代);第三個亞型包含了Desmoplakin基因突變,左心室病變情況較重(尤其是左心室后壁);第四個亞型的基因突變尚未知,纖維脂肪替代病變主要發生在左心室(尤其是左心室后壁),是典型的左心室型AC。并且該研究發現心電圖V1~4胸導聯的QRS波群振幅可以用來預測AC患者的預后。該文最大的突破和創新點是闡明了AC心室壁內中外層分別的病變特點及與突變基因相關的病理分型,尤其是首次利用心臟移植受體心臟明確地闡述了左心室型AC心室壁內中外層分別的病變特點及與突變基因的關系;顯示即時在心室壁內層依然存在纖維脂肪替代的病變,而且左心室型AC高于心臟其他部位(尤其是室間隔)的主要左心室后壁纖維脂肪替代病變在心室壁內層也顯著高于其他部位(尤其是室間隔)心室壁內層的存在。然而,在臨床上每個左心室型AC患者的預后千差萬別,AC已知的基因突變只能用來協助診斷或預測獲得右心室型AC的風險,尚沒有指標能有效預測左心室型AC的預后,而利用心內膜活檢并將活檢組織進行蛋白質組學檢測則能很好地直接解決這一臨床問題。因此可以進行左心室型AC的蛋白質組臨床蛋白質分子分型的研究。在左心室型AC患者中進行左心室后壁和室間隔的心內膜活檢,左心室后壁的活檢組織作為病變組,室間隔的活檢組織作為無病變的對照組,兩組均進行蛋白質組學的總蛋白高通量篩查,根據病變組和對照組之間對比出的差異蛋白的通路富集分析在細胞凋亡、纖維和脂肪形成方面的蛋白質表達峰度將患者分為高細胞凋亡纖維脂肪形成的預計預后差組和低細胞凋亡纖維脂肪形成的預計預后好組,接著再隨訪這兩個組,以死亡或者心臟移植為臨床終點觀察預計預后差組是否比另一組的預后顯著差。該研究后續還可進行多地區、多中心、更多樣本量的驗證研究,以驗證該蛋白質組學分型方法的準確性。
自從2011年Porrello等[31]的研究發現了新生小鼠剛出生的一段時間內的心尖有完全再生能力,以及2018年Ye等[32]的研究發現了新生豬剛出生的一段時間內的心臟也有再生能力,心臟再生領域便從研究斑馬魚心臟再生進入了研究哺乳動物心臟再生的新階段,意味著離人類臨床轉化越來越更近一步,也意味著有大量轉錄因子和相關信號通路機制再需要進一步驗證和研究,這給蛋白質組學轉錄因子高通量篩查實驗和后續生物學驗證及相關信號通路機制的研究提供了施展的機會。目前作者已經篩查并初步驗證出候選關鍵轉錄因子并已得到候選關鍵轉錄因子的通路富集結果[33],將來有望通過基因敲除小鼠的生物學驗證確認這個關鍵轉錄因子的結論,并根據通路富集結果為線索,探討這個關鍵轉錄因子相關的信號通路機制。這個研究的臨床意義在于心肌再生的關鍵轉錄因子及相關信號通路分子可作為心臟再生醫學治療的候選干預靶點。
蛋白質組學研究方法在將來也可用于研究心房顫動關鍵轉錄因子的高通量篩查和生物學驗證及信號通路機制的基礎研究,研究大致的技術路線圖與心肌再生關鍵轉錄因子及相關信號通路機制研究的類似。目前,已有一些轉錄因子被證實在房顫的發生、發展中起關鍵作用,比如ETV1[34]、PITX[35-37]、NFKB[38]、PPARs[39]。但房顫發生、發展的分子機制尚未完全清楚。該研究的臨床意義在于心房顫動的關鍵轉錄因子及相關信號通路分子可作為治療心房顫動新藥研發的候選干預靶點。
利益沖突:所有作者均聲明不存在利益沖突