牟永瑩顧培明馬博閆文秀王道平潘映紅
(1. 中國農業科學院作物科學研究所 農作物基因資源與基因改良重大科學工程,北京 100081;2. 東北農業大學,哈爾濱 150036)
技術與方法
基于質譜的定量蛋白質組學技術發展現狀
牟永瑩1,2顧培明1馬博1閆文秀1王道平1潘映紅1
(1. 中國農業科學院作物科學研究所 農作物基因資源與基因改良重大科學工程,北京 100081;2. 東北農業大學,哈爾濱 150036)
蛋白質組定量分析技術是支撐蛋白質組學研究的關鍵技術之一,隨著蛋白質組定量分析技術的發展,基于質譜的定量蛋白質組學已成為蛋白質組學研究的重要分支。蛋白質組學定量技術可分為非靶向定量和靶向定量兩類,靶向定量技術有MRM和PRM模式,非靶向定量技術有非標記定量和體內外標記定量模式,目前使用最多的同位素標記試劑是iTRAQ和TMT。蛋白質組定量技術按數據采集模式還可分DDA和DIA兩類。通過對國內外相關文獻收集和分析,系統介紹了蛋白質組質譜定量技術的主要特點和發展現狀,旨在為生命科學研究者更好地應用定量蛋白質組學技術提供幫助。
定量蛋白質組學;靶向定量;穩定同位素標記;非標記定量;翻譯后修飾定量
蛋白質組學(Proteomics)是一門在器官、組織、細胞和亞細胞水平上研究完整蛋白質組表達、翻譯后修飾以及蛋白質間相互作用的新興學科。隨著人類及多種模式生物基因組全序列測定工作的完成,蛋白質組學在后基因組時代迅速興起[1-4]。早期的蛋白質組學研究主要集中在定性分析方面,隨著研究的不斷深入,提供蛋白質種類和修飾類型等定性信息的蛋白質組學分析技術已經不能滿足實際研究需求,因此基于不同原理的蛋白質組定量技術被陸續開發[5-7]。現有的蛋白質組定量分析主要基于雙向電泳(Two-dimensional electrophoresis,2-DE)[8,9]和質譜(Mass spectrometry,MS)[10,11]兩大類技術,近10年來隨著高精度生物質譜技術和數據處理技術的快速發展,基于質譜的蛋白質組定量技術已成為主流的分析手段[12]。本文介紹了目前基于質譜的主要蛋白質組定量技術和一些常用的數據處理軟件,以及定量蛋白質組學技術在翻譯后修飾蛋白質定量中的應用。
蛋白質組定量分析在起步階段主要依賴2-DE技術,通過分析膠圖上分離到的蛋白質進行定量,基于質譜的蛋白質組學定量技術則通過對酶切肽段的液相色譜分離和質譜分析完成定量。根據是否對目標蛋白進行定量,基于質譜的蛋白質組學定量技術可分為非靶向定量蛋白質組學(Untargeted quantitative proteomics)和靶向定量蛋白質組學(Targeted quantitative proteomics),其中靶向定量技術包括多重反應監測技術(Multiple reaction monitoring,MRM)和平行反應監測(Parallel reaction monitoring,PRM),非靶向定量技術包括非標記定量和穩定同位素標記定量,穩定同位素標記又可分為多種模式,最值得關注的是等重同位素標記相對和絕對定量(Isobaric tags for relative and absolute quantitation,iTRAQ)和串聯質量標簽(Tandem mass tags,TMT)技術(圖1)。涉及定量蛋白質組學研究的文獻近年來顯著增長,以proteomics和PRM/MRM/iTRAQ/TMT/Label-free為關鍵詞,分別統計NCBI PubMed “Title/Abstract” 中包含各組關鍵詞的文獻數量,發現目前應用最多的是iTRAQ定量和非標定量技術,TMT標記技術和靶向定量技術的應用也快速增長,顯示了定量蛋白質組學強勁的發展趨勢(圖2)。目前質譜定量技術主要采取數據依賴采集模式(Data dependent analysis,DDA),新發展的數據非依賴采集模式(Data independent analysis,DIA)綜合了DDA和其他方法的優勢,具有更好的分析準確度和動態范圍,也值得重點關注。

圖1 定量蛋白質組學技術分類圖
非靶向定量蛋白質組學技術是一種對樣品中所有蛋白進行無差別分析的定量技術。根據是否對蛋白質或多肽進行標記,非靶向定量蛋白質組學技術可分為非標記(Label-free)和標記(Stable isotope labeling)定量技術。

圖2 2004年-2016年基于質譜的定量蛋白質組學技術相關文獻數量變化趨勢圖
2.1 非標記定量技術
非標記定量蛋白質組學技術主要通過計算蛋白肽段匹配的二級譜圖鑒定數目和一級質譜峰面積進行相對定量,使用該技術的優勢在于成本低廉和樣品制備簡單。
2.1.1 基于二級譜圖的非標記定量技術 基于二級譜圖的非標記定量技術采用匹配肽段的譜圖計數(Spectrum counting)實現蛋白定量。質譜分析肽段混合物樣品時,某一肽段被鑒定到的幾率與其在混合物中的豐度成正比,豐度高的蛋白質被檢測到的肽段數和二級譜圖數會更多,基于這一原理的方法叫做譜圖計數法[13]。Gao等[14]早期發展的肽段鑒定數目技術(Peptide hits technology)即利用不同樣品中肽段數目的比值對蛋白質進行相對定量,后期Griffin等[15]整合肽段數目、譜圖數目及二級碎片離子強度這3種質譜豐度特征,開發和測試了歸一化非標記定量方法(Normalized spectral index)消除了質譜重復測量之間的差異,提高了分析結果的重復性。傳統的譜圖計數法利用質譜鑒定到的全部肽段進行定量,而部分肽段可能屬于兩個或多個蛋白共有的非特異性肽段,因此定量的準確性會受到影響。2015年,Zhang等[16]提出使用每個蛋白質的特征肽段進行定量,可有效提高非標記定量的準確性,在樣本中加入已知量的標準蛋白還可以進行絕對定量。2.1.2 基于一級譜圖的非標記定量技術 基于一級質譜的非標記定量的依據是質譜峰面積強度(Peak area intensity),其原理最早由Chelius等[17]提出并驗證,即每條酶解多肽的質譜信號強度與其濃度相關,因此比較一級譜圖中的離子信號強度或峰面積,就能確定不同樣品中對應蛋白質的相對含量,這類方法被稱為離子強度法或信號強度法。Silva等[18]最先發現蛋白質濃度與其所含的3個信號最強肽段的質譜信號平均值呈線性相關,受到Silva的啟發,Grossmann等[19]根據類似原理拓展了T3PQ(Top 3 Protein Quantification)非標記定量計算方法,并證明該方法適用于DDA所采集的數據,可用于蛋白質的相對和絕對定量。伴隨著質譜技術和軟件的發展,基于一級質譜的蛋白質非標記定量技術已得到較廣泛的應用,近年來一系列配套的數據處理軟件和程序也應運而生,如SAINT-MS1[20],QPROT[21],RIPPER[22]等。
2.2 標記定量技術
標記定量的主要策略是向不同蛋白質或多肽樣品中引入具有穩定同位素標記的小分子,通過同位素標記后所產生的質量差來識別肽段的來源。在同一次質譜掃描中化學性質相同的標記肽段離子化效率和碎裂模式也相同,因此比較不同的同位素標記物的信號強度就可以計算出不同樣品中蛋白質的相對含量[23]。該方法的優點在于將不同樣本混勻后同時進行質譜檢測,可以避免樣品前處理所帶來的定量誤差。根據引入同位素標記方式的不同,同位素標記的定量蛋白質組學技術分為體內標記和體外標記兩類。
2.2.1 體內標記定量技術 經典的體內標記定量技術是穩定同位素氨基酸細胞培養技術(Stable isotope labeling by amino acids in cell culture,SILAC)[24],該技術的基本原理是將輕、重同位素標記的必需氨基酸(通常為賴氨酸和精氨酸)分別加入到細胞培養基中,經過5-6個倍增周期,細胞內新合成的蛋白質氨基酸幾乎完全被穩定同位素標記,根據混合樣品中兩種同位素標記肽段呈現的峰強度或面積比例即可實現對蛋白質的精確定量。SILAC技術在蛋白層次對樣本進行混勻,可以有效避免后續酶解等操作所帶來的定量誤差,具有標記效率高和定量準確性高的特點,主要缺點是存在同位素標記的精氨酸代謝轉換成脯氨酸的現象[25],導致標記效率偏低,定量準確性下降,同時該技術早期只適用于活體培養的細胞,對于醫學研究常用的組織、體液等樣品則無法應用。為了克服上述缺點,在SILAC的基礎上發展出了一些新的技術。Super-SILAC技術[26]將SILAC標記方法培養的細胞作為內標加入到人組織樣品中,實現對臨床組織樣品的定量分析,擴大了SILAC技術的應用范圍。最近,Coon研究組將中子編碼(Neutron encoding,NeuCode)與SILAC技術結合發展為NeuCode SILAC[27],提高了標記效率,使蛋白質組分析具有良好的動態范圍和精度,理論上可達到39重標記。
2.2.2 體外標記定量技術 基于代謝反應的體內標記定量技術存在著耗時長、價格貴等問題,因而發展出一系列體外標記定量技術,其中在樣品處理后期進行酶促標記和化學標記是當前研究的重點。
2.2.2.1 酶促標記技術18O酶促標記技術由Fenselau實驗室首次應用[28],這種技術通過胰蛋白酶的催化作用將一組樣品的肽段C末端16O原子替換成
18O,從而使兩組樣品產生分子量的差異,通過比較標記肽段和未標記肽段的峰面積,即可對蛋白樣本進行定量。該技術具有價格低廉、操作簡便等優點,缺點是標記穩定性差且易發生18O-16O回標反應。為了解決這一問題,近年來對該方法進行了一系列完善和改進。Zhao等[29]采用微波加熱提高反應速率,使用高濃度還原劑和烷基化試劑將胰蛋白酶滅活,有效提高了18O的標記效率并抑制了18O-16O回標反應。Modzel等[30]提出了一種用18O和二甲氨基偶氮苯甲酰(Dabsyl)雙重標記肽段的新方法,該方法廉價高效,且定量可信度高。顏輝[31]也報道在18O標記肽段的C端的同時,用金屬標記肽段的N末端,實現雙重等重標記,結合MRM技術進行目標蛋白質的絕對定量,可提高定量的準確性。
2.2.2.2 化學標記技術 化學標記技術利用化學反應在蛋白質或肽段上引入同位素基團實現樣品標記,是發展最快的一類體外標記定量技術,目前在定量蛋白質組學研究中應用廣泛。這類技術依據標記基團和檢測方法不同有多種類型,常見的有基于一級質譜的同位素親和標簽(Isotope coded affinity tags,ICAT)技術和二甲基化標記(Dimethyl Labeling)技術,以及基于串級質譜的iTRAQ技術和TMT技術。
基于一級質譜的化學標記技術直接在一級質譜譜圖中比較輕重標記樣品的峰面積或強度,目前在定量蛋白質組分析領域應用不多。Gygi等[32]發展了一種針對半胱氨酸巰基(-SH)的ICAT試劑,這一試劑由反應基團、連接基團和生物素標簽組成,可用于定量比較細胞和組織中球蛋白的表達,使蛋白質組分析更簡單、準確和快速。但ICAT技術無法用于不含巰基的蛋白或肽段的定量分析,這一缺點導致其應用范圍受限。二甲基化標記技術由Hsu等[33]提出,其原理是利用甲醛和氰基硼氫化鈉組合標記肽段所有的活性氨基,具有快速、高效、價格低廉等優點。最近,Wu等[34]將甲醛和氰基硼氫化鈉分子上的H用D取代,甲醛上的12C用13C取代,組成五重標記試劑,可極大地提高標記效率。
基于串級質譜的化學標記技術通過比較二級或者三級質譜譜圖中不同樣品的定量報告離子的峰強度實現定量分析,是目前主流的蛋白質組標記定量技術。等重同位素標記相對和絕對定量技術(iTRAQ)是Ross等[35]發展的一種體外同位素標記的相對定量技術,該技術利用多種同位素試劑標記蛋白多肽N末端或賴氨酸側鏈基團,具有通量高、穩定性強、應用范圍廣等優點,可同時比較最多達八組樣品的蛋白表達量。串聯質量標簽(TMT)試劑[36]與iTRAQ試劑的原理類似,由報告基團、平衡基團和反應基團這3部分組成(圖3)。常用的TMT試劑盒有2-plex、6-plex和10-plex三種,前兩者分別標記2組和6組樣品,10-plex通過使用報告離子質荷比差異為6mDa的中子標簽可標記10組樣品[37]。目前TMT試劑在蛋白質組學研究中應用也比較多,這類定量技術可以結合其他標記技術和高分辨質譜技術,實現更高通量的蛋白質組學定量分析。例如,Dephoure等[38]將TMT技術與SILAC相結合,實現了18重(chong)(18-plex)標記,再配合高分辨率的質譜儀,可對多種蛋白質進行精確的定量分析。Wojdyla等[39]利用TMT標記和抗體富集方法對半胱氨酸氧化及其逆反應進行組合分析,這一方法替代了現有的半胱氨酸氧化分析法,有助于了解半胱氨酸亞硝基化(S-nitrosylation,SNO)和亞磺酰化(S-sulfenylation,SOH)之間的關系。Zhang[40]還提出了一種增強各種同位素標記數據可比性的方法,可顯著提高現有iTRAQ 4-plex、iTRAQ8-plex、TMT6-plex和TMT 10-plex結果的應用價值。

圖3 TMT 10-plex和iTRAQ 8-plex構成
傳統的iTRAQ與TMT技術均使用二級譜圖(MS2)進行蛋白質定量,但由于母離子共篩選(coisolation)和共碎裂(co-fragment)干擾,定量結果的準確度會受到影響。三級質譜(MS3)定量利用高分辨率的多功能質譜選擇目標離子進行誘導碰撞解離(Collision-Induced Dissociation,CID),然后從中過濾出信號最強的MS2碎片離子,進一步進行高能碰撞解離(High energy collision dissociation,HCD),利用MS3譜圖進行定量,有效降低了母離子共篩選和共碎裂干擾的影響[7]。與MS2定量技術相比,MS3定量的問題是采集速度較慢,離子碎裂效率較低,導致定量蛋白質數目減少,定量靈敏度下降。為解決這一問題,Dayon等[41]提出將氣相色譜分離(Gas-phase fractionation,GPF)與MS3分析模式結合,并證明在使用GPF與MS3結合分析TMT標記的胰蛋白酶時,定量的精度、準確度和蛋白質組覆蓋率均有所提高。McAlister等[42]提出的MultiNotch MS3定量蛋白質組學技術,采集報告離子數是標準MS3的10倍,增加了報告離子動態范圍,降低報告離子的方差,極大提高了定量蛋白數目和準確度。
傳統的非靶向蛋白質組學定量技術的重復性、靈敏度和分析效率較低,值得慶幸的是,近年來可彌補上述質譜定量缺陷的靶向定量技術取得了長足的進步[43]。目前文獻報道的靶向定量蛋白質組學技術主要有多重反應監測技術(MRM,又稱選擇反應監測技術Selected reaction monitoring,SRM)和平行反應監測技術(PRM)。
3.1 多重反應監測技術
MRM/SRM技術選擇目標蛋白的特定母離子和子離子對,進行質譜分析,最大限度排除干擾離子的影響,顯著提高了目標肽段的信噪比,是一種很有前景的高通量靶向蛋白定量技術。該技術具有靈敏度高、準確性好、特異性強的優點,被譽為質譜定量的“金標準”,特別適用于標志蛋白的高通量驗證。Dominik等[44]以基于MRM的多重累積方法在人血漿中成功地定量監測了67個心血管疾病的生物標志物,Whiteaker等[45]將SRM與基于抗體的免疫親和富集相結合實現了復雜樣品中目標蛋白的精準定量。MRM技術還可對目標蛋白進行絕對定量,如Gerber等[46]通過向樣本中摻入已知濃度的合成同位素標準肽段,實現了對人的分離酶蛋白(Human separase protein)的絕對定量。
3.2 平行反應監測技術
PRM也可在復雜樣品中同時對多個目標蛋白進行相對或者絕對定量。與MRM相比,PRM采集目標肽段的高分辨率MS2質譜圖后,使用相關軟件在ppm級別的質量偏差窗口范圍內對定量子離子進行峰面積抽提,可以有效排除背景離子的干擾。Kim等[47]利用該技術分析檢測了83個酪氨酸激酶,Ronsein等[48]的研究也證明PRM定量的動態范圍較廣且精度較高。PRM技術的缺點是待分析肽段的數量過大時,需要精細調整質譜采集參數,否則會極大影響定量數據的準確度。2015年,Gallien等[49]設計了一種內標觸發并聯反應監測新方法(Internal standard triggered-parallel reaction monitoring,ISPRM),通過添加內標和對采集參數的實時調整來定量內源肽段,在完成大量肽段分析的同時也可使質譜始終保持高性能狀態。
數據依賴采集技術(DDA)已廣泛的用于復雜樣品中蛋白質的定性和定量分析,然而DDA一級掃描過程中隨機選擇肽段進行裂解時總是偏向信號強的肽段,因此易造成低豐度肽段的丟失。隨著高分辨率,高掃描速度質譜的出現,數據非依賴采集技術(DIA)越來越受到重視,并入選《Nature Methods》2015年度最值得關注技術。DIA采集數據時,首先將質譜掃描的整個質量軸切割為若干區域,使用四級桿或者離子阱將各個區域的母離子篩選出來,再利用高分辨質譜采集該區域范圍內所有母離子的全部碎片離子信息,最后根據DDA的譜圖庫信息抽提出DIA數據中對應的子離子信息用于最終的定量分析。簡單來說,在任意一個洗脫時間點,DDA模式通常按照離子強度由高到低采集母離子的碎片離子信息,采集結果具有一定隨機性;DIA模式在整個檢測時間內,將整個質量軸切割為固定的幾個部分,按照順序進行檢測,所有母離子碎片離子均采集;MRM模式在設定的時間窗口內僅僅對某些特定母離子采集特定或者全部的碎片離子(圖4)。與DDA相比,DIA可對樣品中所有離子的碎片信息進行無偏向性的數據采集,提升了定量結果的重復性和準確性[50];與MRM/PRM相比,DIA數據采集不受指定目標肽段的限制,可用于未知蛋白和大規模蛋白的定量分析[51]。

圖4 DDA、DIA和MRM的原理比較圖
DIA技術是一種高通量的蛋白質組學研究手段,特別適合于臨床生物標志物的研究,如Zhong等[52]采用DIA技術篩選出了結核病的潛在血清標志物;Muntel等[53]開發了快速可靠的尿蛋白質組學DIA技術,實現了大規模的尿蛋白質組學研究。在現有的DIA技術中,SWATH(Sequential window acquisition of all theoretical spectra)策略已被較廣泛應用,Gillet等[54]使用該技術對酵母全細胞蛋白進行了定量分析;Ortea等[55]利用SWATH-MS和靶向數據提取技術發現了肺腺癌的潛在蛋白質生物標志物。DIA可實現對所有母離子的檢測,但選擇性相對于DDA或MRM降低了5-10倍,采集的MS2譜圖為所有母離子的碎片離子,易造成子離子定量數據的混亂。Egertson等[6]開發的msxDIA技術,可以使得母離子的選擇性提高5倍,降低數據處理的復雜度。Tsou等[56]開發的DIA-Umpire軟件,首先對DIA數據進行母離子-子離子峰匹配,將DIA數據“轉換”為Pseudo-MS/MS MGF 文件,然后使用其他DDA搜庫軟件進行檢索并將該檢索結果作為譜圖庫,最后再使用DIA-umpire軟件對DIA數據進行峰面積抽提定量分析,與傳統的DIA數據處理模式相比其優勢在于研究者無需采集DDA數據用于構建譜圖庫。毫無疑問,克服了DDA隨機性和MRM低通量缺點的DIA/SWATH技術,將成蛋白質組定量和標志蛋白發現與驗證的強有力工具。但任何一種技術都不是完美無缺的,需要根據實際情況選擇適用的定量技術(表1)。
生物體細胞對蛋白質合成后進行的共價加工即翻譯后修飾(Post-translational modification,PTM)與許多重要的生命進程控制相關,因此全面揭示翻譯后修飾的發生規律才能理解蛋白質復雜多樣的生物功能。蛋白質發生翻譯后修飾時其分子質量會發生相應的改變,如發生磷酸化修飾時分子量會增加79.966 Da,通過質譜可對翻譯后修飾蛋白質進行精確的定性與定量研究。常見的PTM有磷酸化、乙酰化、泛素化和糖基化翻譯后修飾,分析流程基本相同,主要涉及修飾蛋白質或修飾肽段富集,以及修飾位點的定性和定量檢測。
5.1 磷酸化修飾蛋白定量
磷酸化是蛋白質翻譯后修飾技術最為重要的一種形式。真核生物中大概有一半以上的蛋白質可發生磷酸化修飾,蛋白質磷酸化幾乎調節著整個生命活動過程。因此,定量分析內部和外部因子作用下磷酸化蛋白質的分子調控機制對理解生物功能非常重要[57]。磷酸化蛋白或肽段富集目前主要有抗體富集法、固相金屬離子親和色譜法、金屬氧化物親和色譜法、強陰陽離子交換色譜法和親水相互作用色譜法。Mertins等[58]將iTRAQ標記試劑與磷酸化富集技術結合起來對磷酸化肽段進行定性和定量分析,這種定量方法可進行多個條件或時間點樣品間的比較分析,在磷酸化定量蛋白質組分析中得到廣泛的應用。Piovesana等[59]將Graphitized carbon black(GCB)與金屬氧化物TiO2制備成磁性復合材料(mGCB@TiO2),優化了磷酸化肽段的選擇性富集過程。近年來,隨著質譜技術的進步,對磷酸化蛋白質組進行規模化分析已成為現實[60]。
5.2 乙酰化修飾蛋白定量
蛋白質的乙酰化修飾是通過乙酰轉移酶的作用,在蛋白質賴氨酸殘基上添加乙酰基的過程。乙酰化修飾影響著細胞生理的各個方面,如蛋白質翻譯、折疊、DNA包裝和線粒體代謝等,在染色體結構形成及核內轉錄調控因子激活方面具有重要作用[61],對其進行定量分析可為代謝類疾病的藥物研發提供重要依據[62,63]。將SILAC或iTRAQ標記技術與乙酰化抗體富集技術相結合,即可對細胞樣本中的乙酰化修飾進行相對定量。Zhang等[64]將抗體富集技術與高精度的質譜相結合,在大腸桿菌中鑒定到了349個乙酰化蛋白和10 709個乙酰化位點,相對于傳統方法分別提升了3倍和8倍,實現了大規模的賴氨酸乙酰化蛋白質的鑒定。
5.3 泛素化修飾蛋白定量
泛素化修飾是指一個或多個泛素分子在一系列酶的作用下與底物蛋白質分子共價結合的翻譯后修飾過程[65]。泛素化在蛋白質的代謝調節中起著重要作用,可參與細胞分裂增殖、基因表達、信號傳導、炎癥免疫等幾乎一切生命活動。通過將非標記定量技術與泛素化抗體肽段富集方法相互結合,可以實現對泛素化肽段同時定性和定量的目的。Cai等[66]提出了利用蛋白質序列中氨基酸的理化性質(Physicochemical properties,PCPs)對泛素位點進行預測,建立了6個泛素集對其進行驗證,結果表明這一方法與其它方法相比具有很大優勢。Akimo等[67]描述了一個將特異性的泛素結合結構域(Ubiquitin binding domains,UBDs)與SILAC技術相結合,以

表1 定量蛋白質組學主要技術特點與應用
質譜鑒定是定量蛋白質組學研究的關鍵步驟之一,其核心在于對質譜數據的解析。目前常用的數據庫檢索軟件包括MaxQuant、Mascot、Sequest、X!Tandem等,依賴于譜圖庫的檢索軟件有Pepitome、SpectraST等,其他相關軟件有Skyline,Spectronaut等。
MaxQuant是常用的標記和非標記定量蛋白質組學數據分析平臺,該平臺廣泛使用的集成搜索引擎Andromeda可以一種簡單的分析工作流程實現大規模數據集的分析[73]。Tyanova等[74]開發了優化MaxQuant報告結果的工具Maxreport,以幫助用戶更好的理解和分享數據。Mascot和Sequest是利用分子序列數據檢索的方法來鑒定樣本中蛋白質組成的經典軟件,Brosch等[75]提出了對數據搜索結果再評分的算法Mascot Percolator,允許使用多重替代碎裂技術直接比較鑒定肽段,可作為獨立工具或集成到現有的數據分析流程中[76]。X!Tandem是一個在蛋白質鑒定過程中將質譜與肽序列匹配起來的開源軟件,用戶可以按照自己的需求對其源代碼進行修實現對泛素相關的細胞信號通路進行選擇性定量的蛋白質組學研究策略。Meng等[68]利用4個相同的泛素相關結構域(Ubiquitin-associated domains,UBA)構建了GST-qUBAs誘餌蛋白,并且利用該誘餌蛋白和兩步親和富集法完成了水稻等植物泛素化修飾蛋白的富集和分析。
5.4 糖基化修飾蛋白定量
糖基化是蛋白質或脂質在酶的催化下結合上不同類型糖基的過程。糖基化修飾影響蛋白質的空間結構和生物活性,是最重要、最復雜的翻譯后修飾過程之一,在蛋白質折疊、定位和轉運以及細胞生長、病毒復制、免疫保護等生物過程中起著重要的作用[69-70]。糖基化蛋白富集方法主要有氧化石墨烯固定化凝集素法、親水相互作用色譜法、代謝標簽法、化學酶促標記法和抗體富集法等,分析的難點主要在于質譜鑒定方面,即特異性糖鏈結構的解析,但近年來已有較多研究結果,如Hashii等[71]利用氚標記定量分析了小鼠腎臟糖基化的變化;Ahn等[72]將MRM與Aleuria aurantia lectin(AAL)富集結合,用于肝癌血漿中異常蛋白質糖基化定量。改,如Yang等[77]開發的Self-boosted Percolator,處理X!Tandem搜索結果時可提高肽段鑒定能力。
Pepitome是一種新的依賴于質譜譜圖庫的搜索引擎,該軟件采用統計方法進行評分,可靠性較高[78]。SpectraST是另一種功能全、通量高的開源MS2譜圖檢索軟件,適用于序列測定和靶向蛋白質組學分析[79]。
Skyline是一款由美國華盛頓大學MacCoss實驗室開發的開源文檔編輯器,支持使用和創建各種資源的MS2譜庫,可依據之前觀察到的數據來選擇SRM過濾器并驗證結果,常用于靶向蛋白質組學方法建立和定量數據分析[80]。Spectronaut是由瑞士蛋白質組學公司Biognosys AG開發的可快速、準確分析處理DIA或SWATH數據的軟件,具有強大的峰選擇算法,可自動質控并修正干擾[81]。
定量蛋白質組學在現代生物學和醫學研究中發揮著重要作用。目前主要應用的定量蛋白質組學技術有體內標記技術SILAC、基于串級質譜的同位素標記技術TMT和iTRAQ、非標記定量技術、目標離子檢測技術MRM/PRM,以及數據非依賴采集技術DIA/SWATH,其中MRM/PRM和DIA/SWATH是特別值得關注的定量蛋白質組學新技術。此外,MS3定量技術解決了同重同位素標記時共洗脫肽段干擾的問題,有望成為蛋白質組學定量的新工具。翻譯后修飾蛋白質組的定量分析涉及多種富集方法和質譜技術,目前正處于迅速發展階段,有望成為定量蛋白質組學研究的一個重要新領域。未來定量蛋白質組學技術的發展方向是進一步提高通量、準確度、穩定性和自動化程度。數據處理軟件也是定量蛋白質組學技術的關鍵組件,有待在易用性、可靠性和計算效率方面進一步發展。
致謝:
中國農業科學院科技創新工程(作物分子標記技術及其應用科研創新團隊)和國家重點研發計劃(編號:2016YFD0101005)對項目研究給予了經費支持;徐江研究員和鄭兆彬工程師對本文的撰寫也給予了熱情幫助,特致謝意。
[1] Adams MD, Celniker SE, Holt RA, et al. The genome sequence of Drosophila melanogaster[J]. Science, 2000, 287(5461):2185-2195.
[2] Gregory SG, Barlow KF, Mclay KE, et al. The DNA sequence and biological annotation of human chromosome 1[J]. Nature, 2006, 441(7091):315-321.
[3] Muzny DM, Scherer SE, Kaul R, et al. The DNA sequence, annotation and analysis of human chromosome 3[J]. Nature, 2006, 440(7088):1194-1198.
[4] Yu J, Hu SN, Wang J, et al. A draft sequence of the rice genome(Oryza sativa L. ssp indica)[J]. Science, 2002, 296(5565):79-92.
[5] Kruger M, Moser M, Ussar S, et al. SILAC mouse for quantitative proteomics uncovers kindlin-3 as an essential factor for red blood cell function[J]. Cell, 2008, 134(2):353-364.
[6] Egertson JD, Kuehn A, Merrihew GE, et al. Multiplexed MS/MS for improved data-independent acquisition[J]. Nature Methods, 2013, 10(8):744-746.
[7] Ting L, Rad R, Gygi SP, et al. MS3 eliminates ratio distortion in isobaric multiplexed quantitative proteomics[J]. Nature Methods, 2011, 8(11):937-940.
[8] Marouga R, David S, Hawkins E. The development of the DIGE system:2D fluorescence difference gel analysis technology[J]. Analytical and Bioanalytical Chemistry, 2005, 382(3):669-678.
[9] Wu WW, Wang GH, Baek SJ, et al. Comparative study of three proteomic quantitative methods, DIGE, cICAT, and iTRAQ, using 2D gel- or LC-MALDI TOF/TOF[J]. Journal of Proteome Research, 2006, 5(3):651-658.
[10] Boersema PJ, Raijmakers R, Lemeer S, et al. Multiplex peptide stable isotope dimethyl labeling for quantitative proteomics[J]. Nature Protocols, 2009, 4(4):484-494.
[11] Levin Y, Schwarz E, Wang L, et al. Label-free LC-MS/MS quantitative proteomics for large-scale biomarker discovery in complex samples[J]. Journal of Separation Science, 2007, 30(14):2198-2203.
[12] Chahrour O, Cobice D, Malone J. Stable isotope labelling methods in mass spectrometry-based quantitative-proteomics[J]. Journal of Pharmaceutical and Biomedical Analysis, 2015, 113:2-20.
[13] Washburn MP, Wolters D, Yates JR. Large-scale analysis of the yeast proteome by multidimensional protein identification technology[J]. Nature Biotechnology, 2001, 19(3):242-247.
[14] Gao J, Friedrichs MS, Dongre AR, et al. Guidelines for the routine application of the peptide hits technique[J]. J Am Soc Mass Spectrom, 2005, 16(8):1231-1238.
[15] Griffin NM, Yu J, Long F, et al. Label-free, normalized quantification of complex mass spectrometry data for proteomic analysis[J]. Nat Biotechnol, 2010, 28(1):83-89.
[16] Zhang Y, Wen Z, Washburn MP, et al. Improving label-free quantitative proteomics strategies by distributing shared peptides and stabilizing variance[J]. Analytical Chemistry, 2015, 87(9):4749-4756.
[17] Chelius D, Bondarenko, PV. Quantitative profiling of proteins in complex mixtures using liquid chromatography and mass spectrometry[J]. J Proteome Res, 2002, 1(4):317-323.
[18] Silva JC, Gorenstein MV, Li GZ, et al. Absolute quantification of proteins by LCMSE-A virtue of parallel MS acquisition[J]. Molecular & Cellular Proteomics, 2006, 5(1):144-156.
[19] Grossmann J, Roschitzki B, Panse C, et al. Implementation and evaluation of relative and absolute quantification in shotgun proteomics with label-free methods[J]. Journal of Proteomics, 2010, 73(9):1740-1746.
[20] Choi H, Glatter T, Gstaiger M, et al. SAINT-MS1:Proteinprotein interaction scoring using label-free intensity data in affinity purification-mass spectrometry experiments[J]. Journal of Proteome Research, 2012, 11(4):2619-2624.
[21] Choi H, Kim S, Fermin D, et al. QPROT:Statistical method for testing differential expression using protein-level intensity data in label-free quantitative proteomics[J]. J Proteomics, 2015, 129:121-126.
[22] Van Riper SK, Higgins L, Carlis JV, et al. RIPPER:a framework for MS1 only metabolomics and proteomics label-free relative quantification[J]. Bioinformatics, 2016, 32(13):2035-2037.
[23] 錢小紅. 定量蛋白質組學分析方法[J]. 色譜, 2013(8):719-723.
[24] Ong SE, Blagoev B, Kratchmarova I, et al. Stable isotope labeling by amino acids in cell culture, SILAC, as a simple and accurate approach to expression proteomics[J]. Molecular & Cellular Proteomics, 2002, 1(5):376-386.
[25] Bicho CC, Alves FD, Chen ZA, et al. A genetic engineering solutionto the “arginine conversion problem” in stable isotope labeling by amino acids in cell culture(SILAC)[J]. Molecular & Cellular Proteomics, 2010, 9(7):1567-1577.
[26] Neubert TA, Tempst P. Super-SILAC for tumors and tissues[J]. Nat Methods, 2010, 7(5):361-362.
[27] Hebert AS, Merrill AE, Bailey DJ, et al. Neutron-encoded mass signatures for multiplexed proteome quantification[J]. Nat Methods, 2013, 10(4):332-334.
[28] Xudong Yao AF, Javier Ramirez, Plamen A. Demirev, and Catherine Fenselau. Proteolytic 18O labeling for comparative proteomics:model studies with two serotypes of adenovirus[J]. Analchem, 2001, 73(13):7.
[29] Zhao Y, Jia W, Sun W, et al. Combination of improved18O incorporation and multiple reaction monitoring:a universal strategy for absolute quantitative verification of serum candidate biomarkers of liver cancer[J]. J Proteome Res, 2010, 9(6):3319-3327.
[30] Modzel M, Plociennik H, Kielmas M, et al. A synthesis of new, bilabeled peptides for quantitative proteomics[J]. J Proteomics, 2015, 115:1-7.
[31] 顏輝. 金屬標記結合生物質譜的蛋白質組相對定量及絕對定量新方法研究[D]. 合肥:安徽醫科大學, 2014.
[32] Gygi SP, Rist B, Gerber SA, et al. Quantitative analysis of complex protein mixtures using isotope-coded affinity tags. [J]. Nat Biotechnol, 1999, 17(10):6.
[33] Hsu J L, Huang SY, Chow NH, et al. Stable-isotope dimethyl labeling for quantitative proteomics[J]. Analytical Chemistry, 2003, 75(24):6843-6852.
[34] Wu Y, Wang F, Liu Z, et al. Five-plex isotope dimethyl labeling for quantitative proteomics[J]. Chem Commun(Camb), 2014, 50(14):1708-1710.
[35] Ross PL, Huang YN, Marchese JN, et al. Multiplexed protein quantitation in Saccharomyces cerevisiae using amine-reactive isobaric tagging reagents[J]. Mol Cell Proteomics, 2004, 3(12):1154-1169.
[36] Andrew Thompson J, 1rgen Schagunter KK, Stefan Kienle, Josef Schwarz, , 1nter Schmidt TN, And Christian Hamon. Tandem mass tags:A novel quantification strategy for comparative analysis of complex protein mixtures by MS MS[J]. Analchem, 2003, 75(8):10.
[37] Werner T, Sweetman G, Savitski MF, et al. Ion Coalescence of neutron encoded TMT 10-plex reporter Ions[J]. Analytical Chemistry, 2014, 86(7):3594-3601.
[38] Dephoure N, Gygi SP. Hyperplexing:a method for higher-order multiplexed quantitative proteomics provides a map of the dynamic response to rapamycin in yeast[J]. Sci Signal, 2012, 5(217):9.
[39] Wojdyla K, Williamson J, Roepstorff P, et al. The SNO/SOH TMT strategy for combinatorial analysis of reversible cysteine oxidations[J]. Journal of Proteomics, 2015, 113:415-434.
[40] Zhang Z, Yang XY, Mirokhin YA, et al. Interconversion of peptide mass spectral libraries derivatized with iTRAQ or TMT labels[J]. Journal of Proteome Research, 2016, 15(9):3180-3187.
[41] Dayon L, Sonderegger B, Kussmann M. Combination of gasphase fractionation and MS3acquisition modes for relative protein quantification with isobaric tagging[J]. Journal of Proteome Research, 2012, 11(10):5081-5089.
[42] Mcalister GC, Nusinow DP, Jedrychowski MP, et al. MultiNotch MS3enables accurate, sensitive, and multiplexed detection of differential expression across cancer cell line proteomes[J]. Analytical Chemistry, 2014, 86(14):7150-7158.
[43] Searle BC, Egertson JD, Bollinger JG, et al. Using data independent acquisition(DIA)to model high-responding peptides for targeted proteomics experiments[J]. Molecular & Cellular Proteomics, 2015, 14(9):2331-2340.
[44] Domanski D, Percy AJ, Yang J, et al. MRM-based multiplexed quantitation of 67 putative cardiovascular disease biomarkers in human plasma[J]. Proteomics, 2012, 12(8):1222-1243.
[45] Whiteaker JR, Zhao L, Anderson L, et al. An automated and multiplexed method for high throughput peptide immunoaffinity enrichment and multiple reaction monitoring mass spectrometrybased quantification of protein biomarkers[J]. Molecular & Cellular Proteomics, 2010, 9(1):184-196.
[46] Gerber SA, Rush J, Stemman O, et al. Absolute quantification of proteins and phosphoproteins from cell lysates by tandem MS[J]. Proceedings of the National Academy of Sciences of the United States of America, 2003, 100(12):6940-6945.
[47] Kim HJ, Lin D, Lee HJ, et al. Quantitative profiling of protein tyrosine kinases in human cancer cell lines by multiplexed parallel reaction monitoring assays[J]. Molecular & Cellular Proteomics,2016, 15(2):682-691.
[48] Ronsein GE, Pamir N, Von Haller PD, et al. Parallel reaction monitoring(PRM)and selected reaction monitoring(SRM)exhibit comparable linearity, dynamic range and precision for targeted quantitative HDL proteomics[J]. Journal of Proteomics, 2015, 113:388-399.
[49] Gallien S, Kim SY, Domon B. Large-Scale targeted proteomics using internal standard triggered-parallel reaction monitoring(ISPRM)[J]. Molecular & Cellular Proteomics, 2015, 14(6):1630-1644.
[50] Law KP, Lim YP. Recent advances in mass spectrometry:data independent analysis and hyper reaction monitoring[J]. Expert Review of Proteomics, 2013, 10(6):551-566.
[51] Egertson JD, Maclean B, Johnson R, et al. Multiplexed peptide analysis using data-independent acquisition and Skyline[J]. Nature Protocols, 2015, 10(6):887-903.
[52] Zhong LJ, Li Y, Tian HF, et al. Data-independent acquisition strategy for the serum proteomics of tuberculosis[J]. International Journal of Clinical and Experimental Pathology, 2017, 10(2):1172-1185.
[53] Muntel J, Xuan Y, Berger ST, et al. Advancing urinary protein biomarker discovery by data-independent acquisition on a quadrupole-orbitrap mass spectrometer[J]. Journal of Proteome Research, 2015, 14(11):4752-4762.
[54] Gillet LC, Navarro P, Tate S, et al. Targeted data extraction of the MS/MS spectra generated by data-independent acquisition:A new concept for consistent and accurate proteome analysis[J]. Molecular & Cellular Proteomics, 2012, 11(6):17.
[55] Ortea I, Rodriguez-Ariza A, Chicano-Galvez E, et al. Discovery of potential protein biomarkers of lung adenocarcinoma in bronchoalveolar lavage fluid by SWATH MS data-independent acquisition and targeted data extraction[J]. Journal of Proteomics, 2016, 138:106-114.
[56] Tsou CC, Avtonomov D, Larsen B, et al. DIA-Umpire:comprehensive computational framework for data-independent acquisition proteomics[J]. Nature Methods, 2015, 12(3):258-264.
[57] 甄艷李, 施季森. 磷酸化蛋白質組定量研究策略. [J]. 分子植物育種, 2014, 12(3):7.
[58] Mertins P, Udeshi ND, Clauser KR, et al. iTRAQ labeling is superior to mTRAQ for quantitative global proteomics and phosphoproteomics[J]. Molecular & Cellular Proteomics, 2012, 11(6):12.
[59] Piovesana S, Capriotti AL, Cavaliere C, et al. New magnetic graphitized carbon black TiO2 composite for phosphopeptide selective enrichment in shotgun phosphoproteomics[J]. Analytical Chemistry, 2016, 88(24):12043-12050.
[60] Song C, Ye M, Liu Z, et al. Systematic Analysis of protein phosphorylation networks from phosphoproteomic data[J]. Molecular & Cellular Proteomics, 2012, 11(10):1070-1083.
[61] 阮班軍, 代鵬, 王偉, 等. 蛋白質翻譯后修飾研究進展 [J].中國細胞生物學學報, 2014, 36(7):1027-1037.
[62] Scholz C, Weinert BT, Wagner SA, et al. Acetylation site specificities of lysine deacetylase inhibitors in human cells[J]. Nature Biotechnology, 2015, 33(4):415-136.
[63] Yang L, Vaitheesvaran B, Hartil K, et al. The Fasted/Fed mouse metabolic acetylome:N6-acetylation differences suggest acetylation coordinates organ-specific fuel switching[J]. Journal of Proteome Research, 2011, 10(9):4134-4149.
[64] Zhang K, Zheng S, Yang JS, et al. Comprehensive profiling of protein lysine acetylation in Escherichia coli[J]. Journal of Proteome Research, 2013, 12(2):844-851.
[65] Lu L, Li D, He FC. Bioinformatics advances in protein ubiquitination[J]. Hereditas(Beijing), 2013, 35(1):17-26.
[66] Cai B, Jiang X. Computational methods for ubiquitination site prediction using physicochemical properties of protein sequences[J]. Bmc Bioinformatics, 2016, 17:116.
[67] Akimov V, Rigbolt KTG, Nielsen MM, et al. Characterization of ubiquitination dependent dynamics in growth factor receptor signaling by quantitative proteomics[J]. Molecular Biosystems, 2011, 7(12):3223-3233.
[68] Meng Q, Rao L, Pan Y. Enrichment and analysis of rice seedling ubiquitin-related proteins using four UBA domains(GST-qUBAs)[J]. Plant Science An International Journal of Experimental Plant Biology, 2014, 229:172-180.
[69] 包慧敏, 謝力琦, 陸豪杰. 糖蛋白質組學中基于化學反應的富集方法研究進展[J]. 色譜, 2016(12):1145-1153.
[70] 張偉. 基于生物質譜的蛋白質N-糖基化定性與定量新技術[D]. 上海:復旦大學, 2012.
[71] Hashii N, Kawasaki N, Itoh S, et al. Alteration of N-glycosylationin the kidney in a mouse model of systemic lupus erythematosus:relative quantification of N-glycans using an isotope-tagging method[J]. Immunology, 2009, 126(3):336-345.
[72] Ahn YH, Shin PM, Kim YS, et al. Quantitative analysis of aberrant protein glycosylation in liver cancer plasma by AAL-enrichment and MRM mass spectrometry[J]. Analyst, 2013, 138(21):6454-6462.
[73] Cox J, Neuhauser N, Michalski A, et al. Andromeda:a peptide search engine integrated into the MaxQuant environment[J]. Journal of Proteome Research, 2011, 10(4):1794-1805.
[74] Tyanova S, Temu T, Cox J. The MaxQuant computational platform for mass spectrometry-based shotgun proteomics[J]. Nature Protocols, 2016, 11(12):2301-2319.
[75] Brosch M, Yu L, Hubbard T, et al. Accurate and sensitive peptide identification with mascot percolator[J]. Journal of Proteome Research, 2009, 8(6):3176-3181.
[76] Wright JC, Collins MO, Yu L, et al. Enhanced peptide identification by electron transfer dissociation using an improved mascot percolator[J]. Molecular & Cellular Proteomics, 2012, 11(8):478-491.
[77] Yang PY, Ma J, Wang PH, et al. Improving X! Tandem on peptide identification from mass spectrometry by self-boosted percolator[J]. Ieee-Acm Transactions on Computational Biology and Bioinformatics, 2012, 9(5):1273-1280.
[78] Dasari S, Chambers MC, Martinez MA, et al. Pepitome:evaluating improved spectral library search for identification complementarity and quality assessment[J]. Journal of Proteome Research, 2012, 11(3):1686-1695.
[79] Lam H, Deutsch EW, Eddes JS, et al. Development and validation of a spectral library searching method for peptide identification from MS/MS[J]. Proteomics, 2007, 7(5):655-667.
[80] Maclean B, Tomazela DM, Shulman N, et al. Skyline:an open source document editor for creating and analyzing targeted proteomics experiments[J]. Bioinformatics, 2010, 26(7):966-968.
[81] Bruderer R, Bernhardt OM, Gandhi T, et al. Extending the limits of quantitative proteome profiling with data-independent acquisition and application to acetaminophen-treated three-dimensional liver microtissues[J]. Molecular & Cellular Proteomics, 2015, 14(5):1400-1410.
[82] Mann M. Functional and quantitative proteomics using SILAC[J]. Nature Reviews Molecular Cell Biology, 2006, 7(12):952-958.
[83] Werner T, Becher I, Sweetman G, et al. High-resolution enabled TMT 8-plexing[J]. Analytical Chemistry, 2012, 84(16):7188-7194.
[84] Pichler P, Koecher T, Holzmann J, et al. Peptide labeling with isobaric tags yields higher identification rates using iTRAQ 4-plex compared to TMT 6-plex and iTRAQ 8-plex on LTQ orbitrap[J]. Analytical Chemistry, 2010, 82(15):6549-6558.
[85] Neilson KA, Ali NA, Muralidharan S, et al. Less label, more free:Approaches in label-free quantitative mass spectrometry[J]. Proteomics, 2011, 11(4):535-553.
[86] Collins BC, Gillet LC, Rosenberger G, et al. Quantifying protein interaction dynamics by SWATH mass spectrometry:application to the 14-3-3 system[J]. Nature Methods, 2013, 10(12):1246-1253.
(責任編輯 朱琳峰)
Advancements in Quantitative Proteomics Technologies Based on Mass Spectrometry
MU Yong-ying1,2GU Pei-ming1MA Bo1YAN Wen-xiu1WANG Dao-ping1PAN Ying-hong1
(1. Institute of Crop Science,Chinese Academy of Agricultural Sciences,Beijing 100081;2. Northeast Agricultural University,Harbin 150036)
Quantitative proteomic analysis is one of the key technologies in proteomics research. With the development of quantitative techniques,quantitative proteomics based on mass spectrometry has become an important branch of proteomics research. Quantitative proteomics technology is generally classified into two categories,untargeted quantitative proteomics and targeted quantitative proteomics. Targeted quantitative technology includes MRM and PRM models,and untargeted quantitative technology includes label-free and in vivo or vitro labeling. The most commonly used isotope labeling reagents are iTRAQ and TMT. According to the data collection model,the quantitative technology can be grouped into DDA and DIA. Through the collection and analysis of relevant literature,this article systematically introduces the main characteristics and current situation of quantitative proteomics based on mass spectrometry,aiming at providing help for the researchers on life science to better apply the quantitative proteomics technologies.
quantitative proteomics;target quantitative;stable isotope labeling;label-free;post-translational modification
10.13560/j.cnki.biotech.bull.1985.2017-0343
2017-04-28
國家重點研發計劃(2016YFD0101005),中國農業科學院科技創新工程
牟永瑩,女,碩士研究生,研究方向:蛋白質組學;E-mail:mu_yongying@163.com
潘映紅,男,研究員,研究方向:蛋白質組學;E-mail:panyinghong@caas.cn