黃 杰 劉 磊 楊 波 楊承忠
(1.商丘師范學院 生物與食品學院,商丘,476000;2.中國大熊貓保護研究中心,都江堰,611830;3.重慶師范大學,生命科學學院,重慶市動物生物學重點實驗室,重慶,401331)
微衛星(Microsatellite),是基因組中以少數幾個核苷酸(一般1—6個)為基本短重復單元組成的DNA串聯重復序列[1]。微衛星標記具有序列短、突變率高、選擇中性、多態性豐富、通用性強、分布廣泛、數量眾多、檢測容易、重復性好等特點,被廣泛用于物種的遺傳學研究[2]。近年來常被用于動物的親權鑒定[3]、個體識別[4]、連鎖分析[5]、物種進化[6]、指紋分析[7]、遺傳疾病[8]等方面的研究。
普通鸕鶿(Phalacrocoraxcarbo),又名鸕鶿、大鸕鶿,隸屬于鵜形目(Pelecaniformes),鸕鶿科(Phalacrocoracidae),鸕鶿屬,是一種極為常見的海鳥,全身為帶金屬光澤的藍黑色,眼和嘴后方的裸露皮膚黃色,并有寬廣的白帶[9]。普通鸕鶿廣泛分布于世界各地,繁殖于中國各地的適宜生境,種群的數量趨于穩定,屬低危(LC)物種[10]。
目前國內外學者對普通鸕鶿的研究主要集中于其繁殖期對筑巢樹的選擇[11]、營養級結構分析[12]、線粒體基因組分析[13]、糞便寄生蟲研究[14]等,而有關普通鸕鶿基因組微衛星分布規律迄今知之甚少。近年來,由于棲息地破碎化、環境污染和大量的人為捕獵,普通鸕鶿的數量逐漸下降,因此對普通鸕鶿的保護顯得尤為重要。生物多樣性保護是物種保護的重要方面,其中,遺傳多樣性降低會使物種的適應環境能力和抵抗疾病的能力明顯下降[15]。目前,國內外學者主要通過蛋白質[16]、線粒體DNA[17]、MHC基因[18]、微衛星DNA[19]、SNPs[20]等一系列分子標記進行種群遺傳多樣性研究。本研究是在普通鸕鶿基因組水平上,對其微衛星進行搜索,進而分析其分布情況,為今后建立完整的普通鸕鶿種群遺傳背景資源庫、個體識別、遺傳多樣性分析等相關方面的研究提供基礎資料。
本研究中普通鸕鶿基因組序列下載自http://www.diark.org/diark/species網站,該基因組序列大小約1.0 GB,下載的所有序列均以FASTA格式進行保存,以備分析。
采用微衛星搜索及統計軟件MSDB v2.4(http://msdb.Biosv.com)[21],對普通鸕鶿基因組的序列進行搜索和統計,獲得微衛星相關類型和重復數量等信息。
本研究微衛星序列分析用到如下術語:
(1)重復類型:即重復序列中的每個重復單元的堿基數,現研究的微衛星的重復類型有6種。
(2)重復拷貝類別:是每種重復類型不同的堿基組合。
(3)重復拷貝數:即每個重復拷貝類別的重復數,如(GTC)12表示GTC重復拷貝數為12。
(4)重復數目:每種重復拷貝類別在基因組中的數目[22]。
(5)豐度:指1Mb基因組序列中微衛星數量,單位(個/Mb)。
(6)密度:指1Mb基因組序列中微衛星總長度,單位(bp/Mb)。
單堿基重復序列拷貝數≥12;二堿基重復序列拷貝數≥7;三堿基重復序列拷貝數≥5;四堿基、五堿基和六堿基重復序列拷貝數均≥4。本研究中,將所有與其互補的序列和可循環的序列分為同一類型,如三堿基重復ACT與ACT、CTA、TAC、TGA、GAT、ATG可合并為同一類型,因此,單堿基重復類型有2種,二堿基有4種類型,三堿基有10種類型,四堿基有33種類型,五堿基有102種類型,六堿基有350種類型[23]。
普通鸕鶿基因組序列中,用MSDB v2.4微衛星搜索軟件共搜索到135 498個不同類型重復序列,總長度約為2 304 711 bp。所有的重復類型如表1所示,單堿基重復數目最多,為102 005個,總長度為1 466 603 bp,豐度為102.8個/Mbp,占重復類型總數目的75.3%;其次是四堿基重復類型,為10 663個,總長度為289 560 bp,豐度為10.8個/Mbp,占重復類型總數目的7.8%;二堿基重復類型,為9 399個,總長度為160 132 bp,豐度為9.5個/Mbp,占重復類型總數目的6.9%;三堿基重復類型,為8 813個,總長度為152 043 bp,豐度為8.9個/Mbp,占重復類型總數目的6.5%;五堿基重復類型,為4 004個,總長度為203 835 bp,豐度為4.0個/Mbp,占重復類型總數目的3.0%;最少的是六堿基重復類型,為614個,總長度為32 538 bp,豐度為0.6個/Mbp,僅占重復類型總數目的0.5%。
表1 不同重復類型的微衛星在普通鸕鶿基因組的分布情況

Tab.1 Distribution of SSR for different repeat types in genomic of Phalacrocorax carbo
如表2所示,在單堿基重復類型中,拷貝類別為A的重復數目最多,為98 605個,所占比例為96.67%;在二堿基重復類型中,拷貝類別為AC的重復數目最多,為5 206個,所占比例為55.39%,其次是AT重復拷貝類別,數目為2 501,占二堿基重復序列總數目的26.61%;在三堿基重復類型中,拷貝類別為AAT的重復數目最多,為2 667個,所占比例為30.26%,其次是AAC重復拷貝類別,數目為1 783,占三堿基重復序列總數目的20.23%;在四堿基重復類型中,拷貝類別為AAAC的重復數目最多,為3 275個,所占比例為30.74%,其次是AAAT重復拷貝類別,數目為1 950,占四堿基重復序列總數目的18.30%。
如圖1所示,在普通鸕鶿基因組中微衛星數量最多的前16種重復拷貝類別依次為A、AC、C、AAAC、AAT、AT、AAAT、AAC、AG、AGG、AAAG、AAGG、ACC、ACG、AACC、AGC。其中均為單堿基、二堿基、三堿基和四堿基重復類型,而且這些重復拷貝類別的微衛星數量都在500個以上,總數是126 226個,占所搜索到的微衛星重復拷貝類別總數的93.32 %,而其他所有拷貝類別僅占6.68%。
本研究利用微衛星搜索軟件,對普通鸕鶿基因組微衛星序列的種類、數量等分布特征進行了統計和分析。1.0 Gb的普通鸕鶿基因組序列中搜索到135 498個不同類型重復序列,總長度約為2 304 711 bp,占到整個基因組序列長度的0.23% 。與牛Bostaurus(4.7%)[24],綿羊Ovisaries(4.8%)[24],北極熊Ursusmaritimus(0.79%)[25],大熊貓Ailuropodamelanoleuca(0.64%)[25]等多種哺乳動物基因組中相比,微衛星序列在普通鸕鶿基因組中分布相對較少。但與綠尾虹雉Lophophoruslhuysii(0.54%)[26],紅原雞Gallusgallus(0.49%)[27],虎皮鸚鵡Melopsittacusundulatus(0.41%)[1]等多種鳥類基因組中相比,微衛星序列在普通鸕鶿基因組中分布相差不大,這或許與哺乳動物基因組重復序列較多且較大有關。
表2 1—4堿基重復類型中各重復拷貝類別數量及其在所屬類型中的比例

Tab.1 The number of repeat copy categories and the percent in their own types in 1-4 bp repeats

續表2

圖1 普通鸕鶿基因組中分布最多的不同重復拷貝類型微衛星Fig.1 Distribution of the most frequent microsatellite motifs of Phalacrocorax carbo
不同物種基因組微衛星的重復類型、數量、豐度、密度等都存在很大差別[28]。在所有的微衛星重復類別中,單堿基重復類型所占的比例最高,為75.3%。這與牦牛(Bosgrunniens)[29]、紅尾蚺(Boaconstrictor)[30]、原矛頭蝮(Protobothropsmucrosquamatus)[30]等物種基因組中優勢微衛星類型相同。這一結果表明物種基因組中單堿基微衛星類型重復偏多。其次是四堿基重復類型,所占的比例為7.8%。與二、三堿基重復類型相比,四堿基重復類型的微衛星位點在PCR過程中,不容易出現陰影帶或滑帶,基因分型結果更精確、更穩定,這一結果與紅原雞[27]和四川山鷓鴣(Arborophilarufipectus)[23]研究結果相同,進一步支持了鳥類基因組具有四堿基微衛星的偏好。
在單堿基重復類型中,拷貝類別為(A)n的重復數目最多,為98 605個,所占比例為96.67%。這一結果與已進行了全基因組微衛星序列分析的大多數物種的研究一致,這表明微衛星的分布對(A)n基具有偏好性。在二堿基重復類型中,拷貝類別為AC的重復數目最多,為5 206個,所占比例為55.39%,這與豬(Susscrofa)[31]、食蟹猴(Macacafascicularis)[32]、大黃魚(Larimichthyscrocea)[33]二堿基AC重復數目的分布規律相同。CG重復拷貝類別最少,數目為21,占二堿基重復序列總數目的0.22%。一般認為,堿基的滑動有可能造成微衛星產生,而AT之間的雙鍵比GC之間的三鍵較容易斷裂,因而可能導致CG重復拷貝類別較少。在三堿基重復類型中,拷貝類別為AAT的重復數目最多,為2 667個,所占比例為30.26%,與綠尾虹雉[26]基因組中AAT的重復數目最多相同,然而蝦虎魚科(Gobiidae)[34]以ACT 重復拷貝類別最多,中華按蚊(Anophelessinensis)[35]中含有較多的AGC,由此可以看出,微衛星分布規律在不同物種中是有差異的。在四堿基重復類型中,拷貝類別為AAAC的重復數目最多,為3 275個,所占比例為30.74%,其次是AAAT重復拷貝類別,數目為1 950,占四堿基重復序列總數目的18.30%。這一結果與藏羚羊(Pantholopshodgsoni)[36]、德國小蠊(Blattellagermanica)[37]、食蟹猴[32]的研究結果一致。
隨著生物信息學的發展,微衛星越來越受到重視,如在瀕危動物保護[38]、異地保種[39]方面,通過對普通鸕鶿微衛星DNA的分布規律的分析,一方面了解了普通鸕鶿微衛星的分布特點,另一方面也為研究微衛星在基因組中的功能奠定了基礎。了解普通鸕鶿中微衛星分布的特點,即為普通鸕鶿遺傳多樣性、物種保護、建立完整的遺傳背景資源庫以及不同物種微衛星的比較分析等方面提供基礎理論依據。