張 玉 張 帥 林穎悅
河南文正檢測技術有限公司,河南 鄭州 450048
蛋白質組,通俗理解為特定的條件機理中,存在于有機體中的蛋白質種類與數量總和。對這些存在于生命體內的蛋白質種類與數量總和進行深入研究,包括對蛋白質組的特性、蛋白質組的組成結構以及在不同的條件機理中蛋白質組的變化規律等現象進行研究的學科,即為蛋白質組學(proteomics)。除此之外,為了研究蛋白質組而創造的相關技術,也能夠被劃分至蛋白質組學這一學科中來。
然而受制于蛋白質組學的鑒定手段門檻較高,很多鑒定技術人員并未對蛋白質組中潛藏著的遺傳學信號給以足夠的關注與深入研究,也往往忽略了蛋白質組技術僅需一次測量即可獲取大量信息,包括全部的蛋白質類型及其數量,同時,檢測結果中也可得出蛋白質中的每個氨基酸序列[1]。這對于鑒定DNA缺失或DNA濃度低于限制的生物物證鑒定,具有十分特殊的重要意義。
2-DE方法,即雙向凝膠電泳方法。2-DE是等電聚束電泳與SDS-PAGE的結合技術,換言之就是指攜帶有相同等電點的蛋白質,不管其分子數量多少,在等電場方法的影響下最終都會在某一特殊部位聚合,然后借助SDS-PAGE方法把各種分子數量的蛋白質分開,在電泳后再通過蛋白質的上樣量對膠開始添加染料,經染料上色后所得的電泳圖是一個二維分布式的蛋白質圖像,通過存儲凝膠圖像可以獲得蛋白質定性與定量信號,使用圖像解析軟件可以分析蛋白質傳遞的各種基因信號。由于傳統的2-DE技術普遍存在膠和膠之間的重復性不佳的弊端,在此技術發展上,2D-DIGE,即雙向差異凝膠電泳法的問世十分有效地克服了這一不足。因為2D-DIGE能夠從同一張雙向電泳膠中分離出來數種熒光標記的樣本,且首次在2D-DIGE中引進了內標的概念,使其在蛋白質定量上的結果更為精準。
MS技術,即質譜技術。MS技術以其高度特異性、高靈敏度、高智能化的多項優點,被廣泛應用于蛋白質識別中。因為長鏈大化合物是不能直接被質譜篩選出的,因此必須利用蛋白酶對蛋白質進行分割,將其分割成較小的肽段,所用的蛋白質酶多為胰酶(Trypsin),Trypsin的特點在于,其能夠在賴氨酸和精氨酸殘基后,完成肽鍵的切斷。而蛋白質譜技術,其基本原理即借助蛋白酶消化蛋白質后得到的肽片段混合物,通常情況下,由蛋白質酶斷開的蛋白質片段上的氨基酸個數在14個左右,完成全部的酶切流程大概需要耗費10個小時。最新的一項將胰酶固定于液象學色譜分析法上的技術,則能夠更快地完成全部的酶切流程。上述步驟完成之后,然后在質譜儀上產生充能電離,再經由質譜分析儀和探測器的分析與檢測之后,將特定的質量質荷之比(m/z)進行分散和收集,然后再利用質量分析儀分析得到每個肽片段的m/z,最終能夠制成蛋白質的一級質譜峰圖。
目前,運用得最多的蛋白質組離子化方法為ESI技術,即電噴霧離子化,是利用電噴霧電離的離子源使肽段離子化,在第一級質譜掃描色譜柱分離出來的全部成分,在第二級串聯質譜中選取幾個豐度較高的峰,加以依次分開,并標記它們的第二級斷裂質譜。全部步驟不超過一秒鐘,在全部色譜分離步驟中重復數千次,最終可以得到幾千至數萬條洗脫肽二級串聯質譜。如果在電離過程中存在強度很大的多肽段,則離子選擇器會對它做二次質譜分析。而蛋白質的鑒定結果可以利用前后兩次質譜峰圖之間的比對而確定。目前,專業領域內使用的質譜儀靈敏度也在不斷地提升,這對于提升蛋白質譜技術的檢測靈敏度也大有裨益。
蛋白質的定性往往強調要達到全面覆蓋的效果,盡管就目前的科學水平來說,八成左右的人體蛋白質檢出是能夠實現的,然而剩余部分的蛋白質,由于或是豐度不足或是疏水性過強等原因,導致其難以檢出。目前,定性技術運用較多的為蛋白質芯片技術(proteinchip),這是一類全新的生物芯片技術,其基本原理是將已知的分子產物做上熒光記號,并將其固定在通過特定化學加工后的高固相含量載體上。待測蛋白中,存在能夠與已知的蛋白質分子物質的特異性融合的種類,這類待測蛋白能夠被準確捕捉到。將捕捉到的待測蛋白進行漂洗后提純,然后再經過檢測芯片上各點的熒光強度,再由電子計算機解析結果,從而實現了檢測各種蛋白質的目標。蛋白質芯片擁有能夠從ng數量級的極小樣本中捕捉到豐度很低的低蛋白質,并且能夠直接對血清、體液等生物物證進行迅速的高通量檢測。
ITRAQ技術,即同位素標記技術。ITRAQ技術,即同位素標識相對比和絕對定性技術。主要是同時對4~8種不同種類的蛋白質樣本中已被裂解的蛋白質多肽N末端或賴氨酸側鏈基團進行標記與比對,進而形成幾千個可鑒定多肽,進而運用質譜分析法對形成的多肽做定量分析,再運用生物信息學,對數據加以更高效的處理。但鑒于蛋白質組成的極其復雜性,目前仍未有一個微生物中的蛋白質覆蓋率能夠達到百分之百。
PSM信息技術,即肽譜匹配技術,其基本原理是通過對現存于數據系統中的全部待測蛋白質進行分割,然后計算分割得到的胰蛋白酶肽的質量。進而將理論上的碎片信息與實際圖譜中得到的碎片信息加以比對,同時對兩者的相似性得分進行計算,以此為判斷其匹配與否的依據。顯然,運用該技術的過程之中,需要借助專業的數據庫軟件,以及評分方程,一方面要確保檢測數據的準確水平,另一方面對于數據庫的完整性也提出了很高的要求,這也對能否準確識別到目標多肽產生顯著的影響。此外,PSM方法中的評分步驟并非完全可靠,因為對于錯誤的配對結果是無法規避的。因此,為了處理這一問題,引入了錯誤發現率的概念,即指代整個肽譜配對中發現錯誤的概率。具體而言,就是在數據庫中添加并不實際存在于待測樣本中的誘餌序列,一旦出現與誘餌序列發生配對的,均可視為錯誤的配對,而錯誤發現率就是根據與誘餌肽譜配對的數量得出的。所以,錯誤發現率只是估算整個肽譜配對中錯誤量的參考值,并無法表明每一個肽譜配對的可信度,這就必須用其他計算方法來度量。
現代生物信息學一般從微生物基因組學和蛋白質組學兩個方向表現。在蛋白質研究過程中,生物信息學技術的主要作用除了能夠進行資料庫的查詢與相關信息技術資源的整合之外,而且在蛋白質組研究應用領域中,如鑒別蛋白質、對已有蛋白質組織進行研究等方面的作用也是非常重要的。高流量、大面積的實驗資料經過生物信息學系統的處理,就可以對圖像研究、蛋白質鑒別與比較等帶來更加方便的幫助。
蛋白質組相較于DNA而言,其氨基酸序列同樣是由DNA上的堿基序列編碼而來,因此實質上看,兩者所攜帶的為同一種遺傳密碼。因此即使在生物體內各個蛋白質中的DNA一樣,但各種部位、結構或細胞種類的蛋白質組是完全不一樣的,其差別體現在蛋白質的種類和濃度。利用蛋白質組技術,不但能夠確定蛋白質序列信息,而且還能夠獲取蛋白質成分的種類和濃度特征。當生物物證缺失DNA時,依靠氨基酸序列的多態性,就能夠實現基因的鑒定。
蛋白質作為人類機體的主要組成之一,機體蛋白質會在人類死亡后,逐漸被各種蛋白質水解酶以及腐敗菌所溶解,形成氨基酸和小分子的含氮化合物,蛋白質的濃度也會隨著死亡時間的增加而逐步下降甚至消失。例如,腦脊液中的白蛋白會在致死后3天內完成降解,其降解具有線性特征。因而就可以利用能夠與其產生反應的特定染料對其進行染色,然后對染色得到的化合物做吸收光譜后進行定量分析。最終,可以根據分析結果,推斷尸體的死亡時間。
在死亡原因的認定中,部分死亡案件死因較為明朗,也很易于得出正確的認定意見。但部分案件因為沒有特異性的指標,對于進行具體的死因判斷存在一定的困難。而體內蛋白質的結構也會在人體死亡后發生改變,并且呈現一定的特殊規律。例如,不同的心臟病變,會導致左右心室中蛋白質濃度的差異。如心臟左、右心室的中心尖區和基底區域中的多種蛋白質,在含量上都具有明顯差別。左右心室即使存在相同類型的蛋白質,但是其濃度會因為心室區域的不同而存在差異。存在于左心室的五種蛋白質在心尖中具有更高的含量;而存在于右心室中的兩種蛋白質在心尖中具有更高的含量。具體的蛋白質種類如圖1所示。因為不同的慢性心臟病變對不同心室的產生影響也是不同的,因此可以利用這一規律對司法案件中不明的突發心臟病猝死案件的致死原因進行判斷。

圖1 左右心室濃度較高的蛋白質類比
盡管血液、唾液等生物物證的STR分型技術已經十分成熟,但是由于毛干的基本組成物為角質化細胞,其細胞核DNA濃度很低,并且分解極其強烈。因此,利用STR分型的精準度表現很差。而蛋白質的穩定性要明顯優于角質化細胞的細胞核DNA濃度。在不同的生物個體中,蛋白質氨基酸順序也具有顯著不同,這就是SAP,即單氨基酸多態性,主要由nsSNP經轉錄產生。
從毛干蛋白質組中得到的nsSNP可以進行族群推斷,對SNP數據進行整合后完成數據庫的建立,就能夠利用質譜測試毛干蛋白質組中數十種含有SAP的特異性多肽類物質序列。這也意味著,毛干SAP的個體辨識,能夠很好填補STR個體識別中毛干識別的不足[2]。
DNA鑒定技術雖然能夠對身份信息進行識別,卻難以判斷DNA來自哪一類體液和組織。蛋白質組學利用不同蛋白質的不同配比以及通過機器學習的方式,來實現對體液中斑跡物質來源的識別。通過非靶向技術,能夠對不同體液斑跡物質的特異性標記蛋白進行識別,也可以準確鑒定出混合類型的體液中的有效物質。然而,相對于血液與精液混合物的檢出率,陰道分泌物和唾液混合物的檢出率稍顯遜色。因此,通過借助豐度水平的機器學習技術,對其檢出率加以提高。在實際使用中,還可以通過對槍擊案中現場殘留彈頭上的組織遺留物開展蛋白質組學分析,目的是使彈頭結構和槍擊受害人的損傷疤痕加以對應。
運用蛋白質組學技術手段可以對人死后各個時點的蛋白質水平進行準確定性,并尋找其變化規律,進而對死亡時間做出合理推測,同時運用蛋白質組學技術手段可以找出不明致死因素的特異性標記,進而探測出蛋白質水平和蛋白質結構的交互影響。如果能夠有效把控蛋白質樣本生產與存儲過程的均一化,則運用蛋白質組學技術手段破解法醫物證鑒定中的疑難問題也就變為了可能。