王 強,李衛真 ,張永云
(1.云南農業大學動物科學技術學院,云南 昆明 650201;2.云南農業大學農科專業基礎實驗教學中心,云南 昆明 650201)
由于單核苷酸多型性在醫藥上的重要性,美國國家衛生研究院(NIH)提供約三千萬美元的經費給序列定序中心,進行搜尋并定位人類單核苷酸多型性(SNPs)的計劃,定位一百萬個人類的SNPs。由各大藥廠等組成的單核苷酸多型性協會(TSC)也出資尋找定位出約三十萬個人類的SNPs。現有的人類SNPs總數約為2421261個,這個數字還會繼續增加。至于其他物種的SNPs就不是那么熱門,目前還不超過700筆。這是因為其他物種的基因體相關定序計劃(如基因體解序、EST解序、SNP尋找及定位)本來就比人類基因體相關的定序計劃少和慢,畢竟人類基因體相關的定序計劃對我們來說才是最重要最有用的。在臺灣地區,以基因體研發為主軸的賽亞基因科技公司,已于2002年7月完成了亞洲人種的單一核苷酸多型性(SNP)數據庫初稿,接下來的目標將針對肝炎、哮喘、乳癌、Ⅱ型糖尿病等亞洲地區的多發性疾病,積極進行相關的基因體研究,包括臨床基因體學、微衛星基因定型分析、SNP定型分析、高效能定序、基因微數組及生物信息多項中心等。
化學家Lieber和遺傳學家Housman的夢幻組合創造了一項簡單的新技術,即應用原子壓力顯微鏡(AFM)觀察SNP。首先設計一個寡核苷酸探針能與你要找的基因組區域嚴格匹配,將此探針與一大分子如鏈霉抗生物素偶聯,讓此探針與DNA片段進行雜交。如果探針雜交成功,那么用AFM進行觀察就能發現雜交陽性位點。此方法相比傳統方法的一個明顯優點就是能夠對單倍體基因組進行檢測。當數個探針同時在數百Kb的距離上進行搜索,再加上自動分析,那么SNP的相關性研究恐怕就能大大地向前邁進一步了。
SNPs即單核苷酸多態性(SNPs)是指基因組水平上由單個核苷酸的變異所引起的DNA序列多態性,包括單個堿基的轉換、顛換、插入和缺失等。從理論上來看每一個SNPs位點都可以有4種不同的變異形式,但實際上發生的只有兩種,即轉換和顛換,二者之比為2∶1。一般而言,SNP是指變異頻率大于1%的單核苷酸變異。
在遺傳學分析中,SNPs作為一類遺傳標記得以廣泛應用,主要源于這幾個特點∶
2.1 密度高 SNPs在人類基因組的平均密度估計為10000bp,在整個基因組的分布達3×106個,遺傳距離為2~3cm,密度比微衛星標記更高,可以在任何一個待研究基因的內部或附近提供一系列標記。
2.2 富有代表性 某些位于基因內部的SNPs有可能直接影響蛋白質結構或表達水平,因此,它們可能代表疾病遺傳機理中的某些作用因素。
2.3 遺傳穩定性 與微衛星等重復序列多態性標記相比,SNPs具有更高的遺傳穩定性。
2.4 易實現分析的自動化 SNPs標記在人群中只有兩種等位型,故也稱為雙等位標記。這樣在檢測時只需一個“+/-”或“全/無”的方式,而無需像檢測限制性片段長度多態性、微衛星那樣對片段的長度作出測量,這使得基于SNP的檢測分析方法易實現自動化。
用目前的方法每年可以檢測出上千個基因中的SNP,而其成本會隨著技術和手段的不斷成熟而大大降低,同時檢出率也不斷提高。由于具有以上特點,SNPs已成為繼RFLP(限制性片段長度多態性)、微衛星多態標記后的第三代分子遺傳標記。
人們對SNPs的研究方法進行了許多探索和改進。SNPs分析技術按其研究對象主要分為兩大類:(1)對未知SNPs進行分析,即尋找未知的SNP或確定某一未知SNPs與某種遺傳病的關系。檢測未知SNPs有許多種方法可以使用,如溫度梯度凝膠電泳(TGGE)、變性梯度凝膠電泳(DGGE)、單鏈構象多態性(SSCP)、變性的高效液相色譜檢測(DHPLC)、限制性片段長度多態性(RFLP)、隨機擴增多態性DNA(RAPD)等,但這些方法只能發現含有SNPs的DNA鏈,不能確知突變的位置和堿基類別,要想做到這一點,必須對那些含有SNPs的DNA鏈進行測序。(2)對已知SNPs進行分析,即對不同群體的SNPs遺傳多樣性進行檢測或在臨床上對已知致病基因的遺傳病進行基因診斷。篩查已知SNPs的方法有等位基因特異寡核苷酸片段分析(ASO)、突變錯配擴增檢驗(MAMA)、基因芯片技術(gene chips)等。各種SNPs的檢測方法區別很大,但迄今為止還沒有任何一種方法是萬能的,在實際應用時要根據研究目的、實驗室設備與技術條件等進行選擇。每種SNPs的檢測方法都由兩部分組成,即區分SNPs特異位點的原理和數據的檢測分析手段。
傳統SNP檢測方法包括DNA測序、限制性片段長度多態性(RFLP)、單鏈構象多態性、變性梯度凝膠電泳、陣列雜交分析、同源雜交、直接測序法等。新興的方法包括TaqMan探針技術、基因芯片技術等。其中基因芯片技術具有高通量、簡便快捷、平行化和成本低廉等優點,且芯片技術的高密度探針矩陣可為大規模SNP分型提供一個高效檢測途徑。芯片技術平臺包括微球微點陣,纖維薄膜微點、玻璃片基微點陣芯片等,其探針密度跨越范圍從幾百至上百萬不等,其中GoldenGateTM所使用的微球芯片密度可達100萬,Affymetrix SNP芯片密度近200萬,可見芯片技術的探針密度可無限擴增。而高通量的大規模SNPs篩選,其瓶頸之處在于DNA的制備方法與制備技術,而非雜交平臺的選擇。
SNP標記已應用于牛、豬、羊等家畜的遺傳學研究中。在牛的遺傳研究中,SNP標記主要應用于數量性狀座位的定位。在牛的生長、肉質、產奶等數量性狀的研究中,SNP技術取得了一些明顯的成就。SNP在制作高密度的遺傳圖譜上也有著極大的應用價值。QTL信息在育種上的高效應用則要求圖譜間距精確到幾厘米,這樣才能識別出QTL變異的堿基,高密度SNPs遺傳圖譜的出現使育種工作者能夠更精確地進行標記輔助選擇和品種資源、品種純度的鑒定。目前,在牛的生長發育、瘦肉率、肉質、產仔率等性狀方面,SNP研究取得了較為明顯的進步。
SNP作為第三代遺傳標記,在復雜疾病的基因定位、關聯分析、個體疾病易感性分析與藥物基因組學等的研究中發揮著越來越重要的作用。
4.1 致病基因定位 SNP是一種可以早期檢測的突變,可用于疾病的連鎖分析。人大約有300萬個SNP,且分布于全基因組,已知或未知致病基因附近都可能找到眾多的SNP位點。因此,SNP可以作為致病基因的遺傳標記。
4.2 易感基因的檢出 不同個體或群體對疾病的易感性有著很大的不同。在全基因組范圍內比較易感和非易感人群之間的SNP圖譜,有可能獲得易感人群基因組的結果特點,并通過關聯分析或連鎖不平衡分析指導尋找易感基因。
4.3 在藥物基因組學中的應用 通過檢測SNP的遺傳多態性標記,揭示人群中不同個體對不同藥物的敏感性差異的根本原因,從而對醫生針對性的用藥和藥物的開發提供指導依據。
SNP雖然列于基因體學的范疇內,但若能結合多重學科,將可發展個體化醫學,也就是針對個人基因特質的醫藥方式。除了人類基因組的DNA序列數據以外,尚需藥物遺傳學、臨床藥理學、毒理學、生物信息學、蛋白質體學等的參與。蛋白質體學的研究目標是確定所有的機體內蛋白質與蛋白質間的相互關系,可望對個體化醫學的發展作出重大貢獻;而決定個體間蛋白質差異的基因就在于SNP。大規模的SNP分型需要準確可靠的檢測方法作為技術支持,所以在未來的SNP發展中,建立一種快速、準確、可靠且成本低廉的方法是SNP分型的發展方向,例如一些商用的檢測試劑盒已經出現。隨著SNP技術的不斷成熟,將會對疾病診斷、治療和預防帶來革命性的進步。
[1]Yoshiura K,Kinoshita A,Ishida T,et al.A SNP in the ABCC11 gene is the determinantofhuman earwax type[J].Nature Genet,2006,(38):324-330.
[2]Brookes A J.The essence of SNPs[J].Gene,1999,234(2):177-186.
[3]Olivier M,Chuang L M,Chang M S,et al.High throughput genotyping of single nucleotide polymorphisms using new biplex invader technology[J].Nucleic Acids Res.,2002:30-33.
[4]Woolley A T,Guillemette C,Cheung C L,et al.Direct haplotyping of kilobase-size DNA using carbon nanotube probes[J].Nature Biotechnol,2000,(18):760-763.
[5]Marsh S,Kwok P,McLeod H L.SNP databases and pharmacogenetics:great start,but a long way to go[J].Hum.Mutat,2002,(20):174-179.