微衛星是廣泛分布于各類生物體基因組中的一組簡單重復序列(simplesequencerepeats,SSRs),由核心序列和側翼序列兩部分組成。其中核心序列通常是由1~6個核苷酸組成的短串聯重復DNA序列,側翼序列則是位于其兩端的單拷貝序列1。因其具有分布廣、多態性豐富、共顯性遺傳、雜合率高、應用成本低等優勢,是比較理想的分子標記,已成為物種鑒定與保護、性別標記篩選、個體識別、親緣關系鑒定、遺傳圖譜構建及分子標記輔助育種等研究領域中廣泛應用的分子標記技術[2-5]。近年來,隨著高通量測序技術發展,通過全基因組挖掘物種特有的微衛星位點,可為后續開發高多態性分子標記并應用于野生動物種質資源保護奠定基礎。
黑葉猴(Trachypithecusfrancoisi)是烏葉猴屬中的一種珍稀靈長類動物,為我國一級重點保護野生動物,被列入世界自然保護聯盟紅色名錄,屬于瀕危物種[。目前,全球黑葉猴零散分布于越南北部的紅河至我國廣西、貴州、重慶的部分區域。由于狩獵行為和棲息地被破壞等因素,黑葉猴面臨著嚴峻的生存危機,導致野外種群數量稀少,在我國其種群主要分布于麻陽河、大沙河、柏箐、寬闊水、野鐘等5個保護區。通過特異性PCR擴增技術對黑葉猴線粒體DNAD-Loop全序列進行解析,發現該區域全長1090bp,其結構特征包含中央保守區(CD)、兩個擴展終止結合序列區(ETAS1/2)以及三個保守序列盒(CSB1-3),結合構建的系統發育樹顯示,黑葉猴與靈長類物種的進化關系具有高度一致性[7]
目前,黑葉猴基因組中微衛星的分布特征尚未見報道。開展黑葉猴全基因組微衛星數量及分布特征的研究,有助于篩選和開發黑葉猴特異性分子遺傳標記。本文通過全基因組數據分析,揭示黑葉猴SSR的分布規律及與基因組組成的潛在關聯,旨在為黑葉猴這一瀕危物種分子標記開發和遺傳資源保護提供理論依據。
1材料與方法
1.1基因組數據獲取
從NCBI數據庫下載雄性黑葉猴全基因組序列(RefSeq組裝編號GCF_009764315.1,下載鏈接:https://www.ncbi.nlm.nih.gov/datasets/genome/GCF009764315.1/。該基因組大小為 2.9Gb ,采用Illumina平臺測序和SOAPdenovov.2.0組裝,包含21701個蛋白質編碼基因,未定位到染色體的序列占 8.96% (257.67 Mb)。
1.2微衛星序列檢索與分析
初步檢索:將基因組序列導入MSDB軟件,利用軟件內置的PerfectSearch模塊,在默認模式下系統檢索完美型(Perfect)微衛星序列。檢索范圍覆蓋單核苷酸(mononucleotide)、二核苷酸(dinucleotide)、三核苷酸(trinucleotide)、四核苷酸(tetranucleotide)、五核苷酸(pentanucleotide)及六核苷酸(hexanucleotide)共六種重復單元類型。為確保識別到具有統計學和功能意義的SSR位點,依據文獻慣例及不同重復單元類型的特征,設置最小重復次數閾值分別為:單核昔酸重復 ≥12 次;二核苷酸重復≥7次;三核苷酸重復 ≥5 次;四核苷酸、五核昔酸及六核苷酸重復均≥4次。
數據優化:由于DNA雙鏈的互補性,同一個微衛星位點在兩條鏈上會被分別識別為不同的序列,可能導致同一SSR位點在原始數據中被重復計數,造成初步檢索獲得的原始SSR數據集可能包含大量冗余信息。為解決此問題并提升后續分析的準確性,通過自主開發的Perl腳本,基于滑動窗口算法和堿基互補配對原則,對原始SSR數據進行聚類整合,識別互補序列(如ACT與TGA)并歸類等價重復模式,提升分析準確性。
關聯分析:首先,利用DNASTAR軟件包中的EditSeq模塊計算每條染色體的整體GC含量,以及每條染色體上識別出的所有SSR序列(考慮其重復單元本身)的平均GC含量。其次,計算SSR的豐度與密度。SSR豐度計算需要統計每條染色體(或指定基因組區域)上識別到的SSR位點的絕對數量;SSR的密度,即計算每條染色體(或指定基因組區域)上單位長度(通常為每Mb或每Kb)內包含的SSR位點數量。最后,采用Spearman秩相關檢驗分析以下相關項:一是SSR豐度與染色體整體GC含量之間的相關性;二是SSR密度與染色體整體GC含量之間的相關性;三是SSR序列的平均GC含量與染色體整體GC含量之間的相關性。
2結果
2.1微衛星序列整體分布特征
黑葉猴全基因組共檢測到1403902個微衛星,總長度 26364086bp ,占基因組的 0.909% 。其平均長度為 21.44bp ,平均豐度為81.37個/Mb,平均密度為1528.06bp/Mb 。不同重復類型中,單堿基重復占比最高( 59.87% ),其次為二堿基( 15.22% )和四堿基( 15.12% ),六堿基重復最少( 0.53% )表1)
2.2染色體水平分布差異
性染色體(Y染色體)的微衛星數量最多(占6.44% ),其次為1號和5號染色體;19號染色體SSR數量最少( 1.60% ),21號染色體次之( 2.23% )。染色體長度與SSR數量呈極顯著正相關( Plt;0.000 1 ,R=0.913 0 ),但SSR豐度、密度與染色體GC含量無顯著相關性( Pgt;0.05 )。
2.3重復拷貝類型特征
全基因組共鑒定出344種重復拷貝類別,前十種高頻類型見表2。單堿基重復中,A占絕對優勢(835761次);二堿基重復以AC為主(121616次),AG次之(49756次);三堿基重復中AAT頻率最高(25572次);四堿基重復以AAAC、AAAG、AAGG為主;五堿基和六堿基重復則以多聚A/T序列為主。各類型重復次數集中在單堿基12~24次、二堿基7~24次、三堿基5~13次、四/五堿基 4~10 次、六堿基4~6次。
表1黑葉猴染色體微衛星重復類型分布

表2高頻微衛星重復拷貝類型及次數

3討論(微衛星類型分布的生物學意義)
3.1基因組穩定性與適應性進化的關系
研究結果顯示,單堿基重復中以A重復和T重復為主,占黑葉猴SSR總量的 59.87% ,這一特征與哺乳動物基因組中AT-rich區域的普遍分布一致。AT重復序列的簡單結構使其在DNA復制過程中易發生“滑動錯配”,通過突變積累形成多態性位點,為基因組可塑性提供基礎。例如,A重復的高頻出現(835761次)可能與其在啟動子區或轉錄因子結合位點的富集相關,通過調控基因表達水平響應環境壓力(如喀斯特生境的溫度波動)。同時,單堿基重復的穩定性與基因組三維構象密切相關,可通過影響染色質環的形成參與染色體高級結構維持,可為黑葉猴適應喀斯特地貌的極端環境提供遺傳基礎。
3.2染色體長度與SSR數量的相關性
染色體長度與SSR數量呈強正相關,表明基因組大小是影響SSR豐度的重要因素,但SSR密度未隨染色體增大而顯著變化,提示其分布可能受局部染色質結構或功能區域調控。GC含量與SSR豐度無關聯,說明黑葉猴SSR的分布可能不受基因組堿基組成偏好性影響。黑葉猴基因組中單堿基重復占比近 60% ,以A/T為主,這與多數哺乳動物基因組特征一致,可能與DNA復制滑動導致的串聯重復擴增有關。此外,性染色體SSR數量顯著高于常染色體,可能與性染色體進化過程中重組率低、重復序列積累有關,需進一步結合性別特異性遺傳機制分析。
3.3高頻重復類型的進化啟示
高頻出現的A/T富集型SSR(如A重復、AC重復、AAAT重復)可能與基因組低GC背景(黑葉猴基因組GC含量未明確測定,但靈長類通常為 40%~45% )及重復序列的突變偏向性有關。多聚A/T序列的高穩定性和低重組率可能導致其在基因組中廣泛積累,也為開發物種特異性分子標記提供了候選位點。
結語
本研究首次系統解析了黑葉猴全基因組微衛星序列的分布特征,發現單堿基重復為主要類型,性染色體SSR富集,且染色體長度是影響SSR數量的關鍵因素。研究結果為黑葉猴遺傳多樣性評估、進化研究及瀕危物種保護提供了重要基因組資源。
參考文獻:
[1]涂飛云,劉俊,韓衛杰,等.食蟹猴全基因組微衛星分布特征分析[J].野生動物學,2018,39(02):400-404.
[2]張增翠,侯喜林.SSR分子標記開發策略及評價[J].遺傳,2004(5):763-768.
[3]趙娜,常劍波,陶江平,等.基于微衛星標記的中華鱘親子關系判別及案例分析[J].水生態學雜志,2023,44(05):92-99.
[4]邵偉偉,喬芬,蔡瑋,等.大蹄蝠全基因組微衛星分布特征分析[J].獸類學報,2023,43(02):182-192.
[5]朱克誠,宋嶺,劉寶鎖,等.黃鰭棘鯛家系親緣關系鑒定[J].水產學報,2020,44(3):351-357.
[6]顏修剛,齊曉光,郭艷清,等.黑葉猴個體識別的新方法:基于腹股溝白斑斑紋觀測[J].獸類學報,2024,44(02):247-251.
[7]黃崢嶸,張才昌,闕騰程,等.廣西黑葉猴線粒體DNAD-Loop全序列的克隆與結構分析[J].黑龍江畜牧獸醫,2010,(23):147-149.
收稿日期:2025-07-04
作者簡介:趙娟娟(1997—),女,漢族,碩士研究生。研究方向:野生動物保護。*通訊作者:晏玉瑩(1988—),女,漢族,碩士研究生,工程師。研究方向:野生動物保護。