萬 建, 胡 原, 秦麗瑋, 熊國梅, 李 兵, 萬翠紅, 楊繼紅
(華中師范大學 生命科學學院,湖北省生物學實驗教學示范中心;國家級生物學虛擬仿真實驗教學示范中心,武漢 430079)
蛋白質(zhì)組學研究的對象是一個基因組所表達的全部蛋白[1],是溝通基因組到最終生物表型的重要環(huán)節(jié)[2],為科研工作者探究生命系統(tǒng)活動和內(nèi)部復(fù)雜的分子調(diào)控機理提供了一個新的思路[3]。隨著質(zhì)譜技術(shù)的發(fā)展,蛋白組學的研究水平得到了飛速進步[4]。
近年來質(zhì)譜質(zhì)量分析技術(shù)快速發(fā)展[5],從最初的三重四級桿到離子井、飛行時間再到現(xiàn)在的傅里葉變換[6]。質(zhì)譜分析的精確度和分辨率取得了質(zhì)的飛躍。Nano-LC-Q-Obitrap將納升級液相色譜的高分離性能與高分辨的準確質(zhì)量數(shù)Orbitrap檢測技術(shù)相結(jié)合,具備優(yōu)異性能和出色多功能性。為生命科學特別是蛋白組學領(lǐng)域提供了高質(zhì)量的研究分析手段[7]。
為拓展學生專業(yè)視野,使學生了解目前生命科學的研究熱點[8]。實驗中心將液相色譜與質(zhì)譜聯(lián)用系統(tǒng)應(yīng)用到研究生教學中。本文通過實驗摸索建立了一套基于納升級液相色譜與高分辨質(zhì)譜(Obitrap)聯(lián)用的實驗方法,以人類全蛋白標樣為材料,完成蛋白質(zhì)的樣品制備、液相色譜分離、質(zhì)譜檢測、蛋白質(zhì)定量分析、生物信息分析的主要實驗流程體系[9]。
人類全蛋白酶解標準樣品(Promega公司,美國);色譜純乙腈(Fisher公司,美國);色譜純水(Fisher公司,美國);色譜純甲酸(Fluka公司,瑞士)。
納升級液相色譜Easy-nLC1200(ThermoFisher公司,美國);Obitrap質(zhì)譜儀Q-Exactive Plus(ThermoFisher公司,美國);小型渦旋儀MX-S(SCILOGEX公司,美國);小型低速離心機D1008(SCILOGEX公司,美國);蛋白分析鑒定軟件Proteome Discoverer 2.1 SP1(ThermoFisher公司,美國);蛋白數(shù)據(jù)庫檢索網(wǎng)站(http://www.uniprot.org/)。
將購置的人類全蛋白酶解多肽標準樣品用純水溶解,配成濃度為1 μg/μL的樣品,在配好的樣品中按照0.1%的體積比加入色譜純級別的甲酸。渦旋混勻后離心備用。
色譜柱:預(yù)柱為Acclaim PepMap,C18,100 μm×2 cm,5 μm,10 nm(100 ?);分析柱為Acclaim PepMap,C18,50 μm×15 cm,2 μm,10 nm(100 ?)。
流動相:A相為含有0.1%甲酸的純水;B相為含有10%純水的乙腈,并加有0.1%的甲酸。流速為300 nL/min,洗脫梯度[10]見表1。色譜流出樣品直接通過HESI離子源進入質(zhì)譜。液相色譜進樣量1 μL。

表1 色譜洗脫梯度
納升級液相色譜分離后的多肽組分進入質(zhì)譜進行檢測分析。主要質(zhì)譜參數(shù):離子源電壓2 kV;質(zhì)譜采集模式為正離子模式;一級質(zhì)譜采集分子量范圍350~2 000 m/z;分辨率70 000;最大離子注入時間20 ms;二級質(zhì)譜采集分辨率17 500;最大離子注入時間50 ms;TopN設(shè)定為20;碎裂能量設(shè)定為27 eV。
在開放的蛋白數(shù)據(jù)庫網(wǎng)站Uniport(http://www.uniprot.org/)上查找人類全蛋白的氨基酸序列,并以FSATA格式進行下載[11]。導入到Proteome Discoverer 2.1 SP1軟件中進行蛋白數(shù)據(jù)庫檢索。檢索參數(shù)設(shè)定:比對多肽質(zhì)量范圍350 Da~5 000 Da;信噪比(S/N)>1.5;多肽片段中氨基酸個數(shù)范圍6~144;母離子誤差<10×10-6;多肽片段誤差<0.2 Da;正反數(shù)據(jù)庫比對檢驗閾值,顯著0.05,極顯著0.01。
分析實驗使用的人類全蛋白酶解多肽標樣在質(zhì)譜的總離子流(TIC)分布情況,總離子流分布均勻,并且質(zhì)譜峰型分離明顯可反映出液相色譜設(shè)置的合理與否,同時峰強度也可反映質(zhì)譜檢測的效率。納升級液相色譜屬于微量色譜,最小可在0.5 μL的上樣條件下完成樣品的高效分離。本次實驗選用色譜分析柱填料為2 μm,在超過50 MPa(500 bar)的柱壓下完成分析。實驗采用數(shù)據(jù)依賴的質(zhì)譜采集模式,完成一級質(zhì)譜掃描后,依據(jù)一級質(zhì)譜的結(jié)果,對質(zhì)譜峰強度較高的母離子進行二級碎裂檢測,得到二級質(zhì)譜檢測結(jié)果。依據(jù)此策略可獲得樣品中含量較高的離子二級質(zhì)譜碎裂信息[12]。
實驗過程中進入質(zhì)譜的樣品為人類全蛋白酶解后的多肽片段,故質(zhì)譜比對時也是以多肽片段為標準進行比對。例如,完成多肽序列比對后的結(jié)果(見圖1),比對上的多肽氨基酸序列為TAVCDIPPR。質(zhì)譜中的高能碰撞池主要是對肽段主鏈的氨基進行裂解,一般而言,總是產(chǎn)生等量的b 和y 碎片離子。一個滿意的序列分析一般需要對母離子進行主鏈裂解后的完全或接近完全的指認和歸屬[13]。此肽段由8個氨基酸組成,共比對上b碎片離子4個,y碎片離子8個(見圖2)。

圖1 多肽氨基酸序列碎片信息
依據(jù)此方法完成人類全蛋白的多肽序列比對,根據(jù)多肽片段的交叉覆蓋度完成全蛋白序列的拼裝。
使用專業(yè)的蛋白質(zhì)組學分析軟件Proteome Discoverer 2.1 SP1完成蛋白質(zhì)的鑒定[14]。依據(jù)button-up的策略,首先將大蛋白酶解為多肽片段,通過對多肽片段的鑒定,根據(jù)多肽片段的覆蓋度完成蛋白氨基酸序列的組裝,從而完成蛋白質(zhì)的鑒定[15]。本次實驗,首先篩選得到質(zhì)量較好的質(zhì)譜圖42 625張,通過與Uniport數(shù)據(jù)庫網(wǎng)站中的人類全蛋白多肽片段碎裂譜圖比對,匹配上的質(zhì)譜圖22 592張,鑒定到肽段序列15 368條,這些肽段與數(shù)據(jù)庫中的3 617個蛋白氨基酸序列匹配。對這些蛋白氨基酸序列去除重復(fù)最終鑒定到2 939個蛋白質(zhì)。分析蛋白匹配的細節(jié),可得到更多的信息。圖3展示的是人類全蛋白中鑒定到的α-微管蛋白,蛋白氨基酸序列中有72.36%匹配到數(shù)據(jù)庫中α-微管蛋白。實驗采用button-up的策略的蛋白鑒定策略,酶解后的多肽拼裝蛋白序列,由于樣品肽段覆蓋度及檢索比對方法設(shè)置等原因比對結(jié)果很難達到100%。

圖2 多肽氨基酸序列質(zhì)譜圖比對

圖3 人類全蛋白氨基酸序列比對結(jié)果
具有相似序列的蛋白質(zhì)具有相似的功能。因此,最可靠的確定蛋白質(zhì)功能的方法是進行數(shù)據(jù)庫的相似性搜索。并且許多功能可直接依據(jù)蛋白質(zhì)序列預(yù)測出來。例如,疏水性信息可用于跨膜螺旋的預(yù)測[16]。通過Proteome Discoverer 2.1 SP1軟件完成蛋白質(zhì)功能數(shù)據(jù)庫比對,得到檢測蛋白在細胞中的定位以及蛋白功能預(yù)測。統(tǒng)計分析得到參與代謝過程的蛋白為鑒定到總蛋白數(shù)量的24.8%,參與細胞組成的蛋白14.7%、轉(zhuǎn)運蛋白11.4%、生物調(diào)控蛋白19.78%、應(yīng)激反應(yīng)蛋白13.15%、其他未鑒定到功能的蛋白16.17%,見圖4。

圖4 蛋白質(zhì)功能預(yù)測統(tǒng)計結(jié)果
生物信息學是目前生物學領(lǐng)域發(fā)展的熱點之一,而蛋白組學后續(xù)的數(shù)據(jù)處理很大程度上依賴生物信息學的發(fā)展。通過將生物信息學分析融入到實驗教學中,使學生們感受到生物信息學在數(shù)據(jù)分析中的強大功能。幫助他們在今后的學習和科研工作中更好地認識學科交叉的意義。
應(yīng)用于教學的實驗需要做到實驗原理明確,實驗步驟簡單,實驗結(jié)果穩(wěn)定易得、再現(xiàn)性高[17]。本實驗設(shè)計滿足以上要求,且全部實驗步驟耗時在2~3 h,但由于受到大型儀器設(shè)備使用的限制,使得本實驗設(shè)計僅適合小班教學,故在研究生的實驗教學中推行本實驗教學設(shè)計。
實驗過程中,學生可自主完成大型液相色譜與質(zhì)譜聯(lián)用儀器的樣品檢測,同時了解色譜洗脫梯度以及質(zhì)譜檢測模式的設(shè)定對實驗結(jié)果的影響。了解高分辨質(zhì)譜儀器的性能,擴寬學生對現(xiàn)代生物學分析儀器的認識。同時也讓大型儀器在教學方面發(fā)揮作用,更好地服務(wù)于教學與科研。實驗基于目前生物學研究的熱點領(lǐng)域蛋白組學,融合了生物化學、分子生物學、生物信息學以及分析化學等領(lǐng)域的知識,使學生們體會到學科交叉對本學科的推動作用,增加學生對科研的興趣。