朱 明, 申 欣, 朱笑琳, 屠海淼, 楊 婕, 孟學平
(淮海工學院 海洋學院, 江蘇省海洋生物產業技術協同創新中心, 江蘇 連云港222005)
基于形態學[1-2]和同功酶[1]資料、擴增片段長度多態性(AFLP)和 16S rRNA 基因[3]、內轉錄間隔區1(ITS1)[4]、細胞色素c氧化酶亞基 1基因(cox1)[5]、細胞色素b基因(cob)[6]等核DNA和線粒體DNA資料分析顯示, 中國黃、渤海西施舌(即墨、膠南、日照、連云港和啟東)以及南方的廣西北海群體與福建群體(長樂、漳州)發生了高水平的遺傳分化[1]。作者用比較線粒體基因組學的資料[7]從全基因組結構差異角度揭示漳州西施舌發生了明顯的分化, RAPD分析也認為福建(長樂)群體發生了明顯的分化[8], 福建群體可能是西施舌的一個亞種或是腔蛤蜊屬的新種。上述資料為西施舌群體遺傳分化提共了有力的形態學與分子生物學證據, 但是根據現有資料確定福建西施舌是西施舌的亞種或是隱種, 證據尚顯不足, 還需更多的資料證實。
組蛋白是真核生物染色質的基本單位—核小體的重要結構成份, 也是基因表達調控的重要成份[9-10], 特別是與核小體的組蛋白變體與基因轉錄、DNA復制和染色體的異染色化有關[11]。組蛋白H2A家族的成員之一H2AX與DNA損傷修復、基因組穩定性維持及腫瘤抑制有關[12-13], 組蛋白還有抗菌作用[14]。后生動物組蛋白基因為多拷貝, 如海膽基因組有 2套編碼無多腺苷酸尾 mRNA的組蛋白基因, 其中編碼核心組蛋白的基因有34個, 分散存在于基因組的不同位置, 還有編碼組蛋白變體的基因[15]。組蛋白基因很保守, 如親緣關系較遠的后生動物海膽組織的H3與小牛胸腺H3序列只差1個氨基酸, 小牛胸腺H3與豌豆H3只有4個氨基酸不同。組蛋白中H2A的保守性為中度, 若福建西施舌與其他群體 H2A仍然存在明顯的差異, 則能補充說明上述分子生物學資料證據, 因此, 基于組蛋白核苷酸的西施舌群體遺傳差異分析資料顯得尤為重要。NADH脫氫酶亞基 6基因(nad6)和亞基1(nad1)基因間有2個tRNA基因和1個非編碼區[7], 因此, 在nad6的5′端和nad1的3′端設計引物擴增的片段(nad6~nad1)包括nad63′、nad15′端部分序列,tRNAGln和tRNAThr2個 tRNAs基因序列及其之間的非編碼區(約 100bp),nad6~nad1區域能夠同時反映蛋白質編碼基因、tRNA基因和非編碼區核苷酸差異, 可提供有效的群體差異分析資料。核基因組DNA和線粒體 DNA資料相互印證, 分析結果更有說服力。
本研究所用西施舌(Coelomactra antiquata)采自山東日照、福建漳州、廣西北海沿海。取西施舌斧足肌肉酒精固定4℃保存備用。
取乙醇保存西施舌組織浸出乙醇或新鮮組織研碎, 用SDS-蛋白酶K裂解組織, 酚-氯仿抽提蛋白質,乙醇沉淀DNA。詳細步驟參考文獻[4]操作, 個別步驟稍作修改。
用 SeqMan軟件對作者已經測定的西施舌浮游幼蟲表達序列標簽(ESTs)進行拼接, 獲得含有組蛋白H2A編碼區的DNA序列, 用Primer-BLAST(http://www.ncbi.nlm.nih.gov/tools /primer-blast/)在線從編碼區兩翼的非編碼區設計上下游引物, 引物名稱及序列如下: HP83-F: GAA AGT CCC TGC CGA ACA;HP83-R: GAA GCA CAC TCG CAC ACC T; PCR 退火溫度為52 ℃ , 25μL 體系, 延伸時間40 s, 35個循環。根據西施舌[16-17]、四角蛤蜊[7]和中國蛤蜊(作者測序未登錄)nad63′端和nad15′端分別設計擴增nad6~nad1片段上下游引物 YJ-4clam-na6-F: GCY GCT GCK CGY ATD TGT AG 和 YJ-4clam-nd1-R:TGY GCA ATA GCA CGY ATA GC。擴增條件: 退火溫度54℃, 延伸時間45 s。PCR產物經0.8%瓊脂糖凝膠電泳檢測后送生工生物工程(上海)有限公司雙向測序。
雙向測序結果用 DNAStar軟件包中的 SeqMan拼接, 結合測序峰圖對序列進行人工校對。用ClustalX (1.83)對序列進行比對并取齊, 用SPSS 17.0進行堿基含量差異顯著性分析; 用DnaSP v5.1軟件進行基因型或單倍型確定; 用MEGA4.0進行核苷酸序列差異分析: 統計變異位點、簡約信息位點, 根據Kimura 2-parameter(K-2P)計算遺傳距離; 用 Arlequin v3.1進行分子方差分析(AMOVA), 群體間遺傳分化指數(FST)計算采用pairwise difference模型。
本研究共獲得西施舌日照(RZ, 10個樣本)、北海(BH, 7個樣本)和漳州(ZZ, 6個樣本)3個群體H2A基因區(包括 H2A編碼基因和基因兩翼的非編碼區)序列 23條, 去除兩端不可信序列后所得序列長度為606bp(RZ, BH)或 616bp(ZZ), 同源序列存在長度多態性; 經DnaSPv5對23條序列分析共獲得9種基因型(Gen), 其中, Gen1~3、Gen 5由日照和北海群體共享, Gen 4為日照群體獨享, 北海群體無獨享單倍型,說明日照、北海西施舌存在基因交流。Gen6-9為漳州群體獨享, 西施舌漳州群體與其他 2個群體無交叉共享基因型, 無基因交流; Gen 1~5 (RZ, BH)堿基平均含量(%)分別為 T : 23.0、C : 26.2、A : 27.5、G :23.3, Gen 6~9(ZZ)堿基平均含量(%)分別為 T : 23.3、C : 26.0、A : 28.2、G : 22.5, 前者的 AT 含量(%)為50.6, 后者的為51.5, 堿基含量存在差異。
將H2A基因區片段23個序列進行比對分析, 共獲得 616個比對位點(圖 1), 其中變異位點(V)30個,占比對位點的 4.86%, 簡約信息位點(Pi)25個, 占4.05%。日照、北海群體合并為一組計算, 組內 V位點4個, Pi位點1個, 漳州群體內V位點5個, 無Pi位點; 在 616個比對位點中, H2A開放閱讀框(ORF)(375bp)相對保守, 只有 6個變異位點, 占變異位點的 20%(此區在圖 1中只列出一部分), 其中有 3個位點為漳州群體共享單核苷酸突變位點, 變異發生在密碼子的第 3位, 未引起氨基酸組成的改變; 兩翼分別是基因上游和下游非編碼區, 其中1~106位點為上游非編碼區, 漳州群體在此區10~19位點有一段10堿基(CCCGCTGATC)的插入序列(圖1左側虛框所示),在56~96位點區有一堿基高變區(圖1右側虛框所示);482~616位點為下游非編碼區, 此區漳州群體有7個共享單苷酸變異位點。序列比對發現, H2A基因ORF的上游變異較大, 有插入序列和高變區, 而 ORF的下游變異相對小, 但ZZ群體ORF上、下游序列中均有標志性的變異位點, 可作為ZZ群體的分子標記。

圖1 西施舌H2A基因區兩翼部分序列比對Fig.1 Flanking sequences comparison of H2A gene of Coelomactra antiquata
H2A基因區基因型序列比對顯示, 在30個變異位點中, 西施舌漳州群體有 23個共享變異位點, 其中在基因區有 3個共享變異位點, 兩翼序列中有 20個。日照、北海西施舌有26個共享變異位點(圖2), 漳州西施舌與日照、北海西施舌無共享變異位點, 說明無基因交流。

圖2 西施舌H2A基因型序列比對Fig.2 H2A genotype sequence comparison of Coelomactra antiquata
根據基因型核苷酸序列, 用Clustalx軟件比對后,用MEGA軟件計算遺傳距離(K-2P) (表1), 將漳州群體分為一組, 日照、北海群體分為另一組(混合組)。結果顯示, 混合組組內遺傳距離 0.002~0.005, 平均為0.003, 漳州組組內遺傳距離為0.002~0.007, 平均為 0.004, 混合組與漳州組間的遺傳距離為0.041~0.048, 平均為0.044。組間遺傳距離與組內(漳州組)遺傳距離之比為 11。分子方差分析(AMOVA)顯示兩組間的FST= 0.9370(P<0.01), 說明兩群體間發生了極顯著的遺傳分化。
PCR擴增產物經雙向測序獲得 710bp左右的nad6~nad1片段, 將全部序列經Clustalx取齊后得到547個比對位點, 從 2個群體中共獲得 20條nad6~nad1序列(每個群體10個樣本), 核苷酸含量統計顯示RZ群體T、C、A、G含量分別為40.5%、10.5%、27.5%、21.5%, A+T平均含量為68%, 明顯高于C+G含量。ZZ群體T、C、A、G含量分別為38.5%、11.0%、28.1%、22.4%, A+T平均含量為66.6%。2個群體中的T、G含量存在顯著差異(P<0.01), RZ群體T顯著高于ZZ群體, 而G顯著低于ZZ群體。

表1 基于西施舌H2A基因區核苷到序列的遺傳距離Tab.1 Genetic distances based on H2A gene region nucleotide sequence of Coelomactra antiquata
對nad6~nad1片段的核苷酸序列檢測獲得 7種單倍型(hap), 其中漳州西施舌10個個體有2種單倍型(hap1, hap2), RZ群體 10個個體有 5種單倍型(hap3~hap7), 漳州群體與日照群體無交叉共享單倍型; 對7種單倍型進行序列比對顯示, 變異位點占比對位點的16.5%(圖3), 簡約信息位點占15.7%。2群體間的遺傳距離(K-2P)0.199~0.202, 平均為 0.200,群體內平均遺傳距離分別為 0.003(RZ)和 0.004(ZZ),群體間與群體內遺傳距離之比為50~66。
nad6和nad1之間有tRNAGln和tRNAThr2個tRNA基因和tRNAs基因間非編碼區。用于比對的序列5′端nad6部分因質量差全部被切除,tRNAGln5′端部分被切除,3′端只剩下9個堿基, 其后依次是96bp的非編碼區(NCR96),tRNAThr、4bp的非編碼區和最后的368bp的nad1區域(圖3)。圖3顯示在NCR96(96個位點)區, 漳州、日照群體有 4處堿基缺失/插入,且在tRNAThr、nad1編碼區均有堿基缺失和插入序列, 兩個群體nad6~nad1片段的一級結構存在極大的差異, 包括單核苷酸的高頻率突變與堿基的缺失和插入(圖3)。將此nad1片段翻譯成氨基酸序列, 序列比對發現在 N-端前 20個氨基酸變異很大(圖 4),此區日照西施舌 nad1缺失“QILWVQ”6個氨基酸,且在第3、6、13、14、16、17、20、25、113位等 9個座位的氨基酸不同。
本研究結果顯, H2A 基因型Gen1~3, Gen5為北海群體和日照群體所共享, 而北海群體與漳州群體發生了明顯的遺傳分化, 這種現象不符合地理距離產生遺傳分化的理論。說明在進化歷史過程中, 西施舌日照、北海群體有基因交流發生。日照與北海的地理距離很遠, 通過海洋進行的基因交流幾率很小,基因交流由人為生成的可能性相對大, 其確切原因有待進一步研究。然而基因型Gen6~9為漳州西施舌特有, 與日照、北海西施舌無共享現象, 只有 Gen8為漳州西施舌 3個不同個體共享。這說明漳州西施舌與日照、北海西施舌無基因交流。nad6~nad1序列分析也顯示漳州群體和日照群體無交叉共享單倍型,從線粒體基因角度證實在演化歷史上這 2個群體間無基因交流, 已經發生了遺傳分化。
關于福建(長樂、漳州)西施舌遺傳分化的研究已有報道,cox1分析顯示福建(長樂、漳州, 稱為 DH組)西施舌與黃、渤海、北部灣(稱為BH組)西施舌間的遺傳距離為0.0 837, 而DH組和BH組組內遺傳距離分別為 0.0047和 0.0035, 組間與組內遺傳距離之比為17.8和23.5[5]。 基于cox1缽水母綱13個屬屬內種間遺傳距離(K-2P)在 0.056~0.381, 種內平均遺傳距離為 0.013, 種間與種內遺傳距離之比為4.3~29.3[18], 西施舌DH與BH組間與組內遺傳距離之比值在此范圍內;cob分析顯示長樂西施舌與非長樂西施舌(大連、啟東、北海群體)間的遺傳距離為0.191~0.209, 而長樂群體和非長樂群體內平均遺傳距離為 0.010, 群體間與群體內遺傳距離之比為19.1~20.9倍[6]; 16S rRNA分析顯示長樂群體與非長樂群體(遼寧大連、山東即墨、膠南、日照、連云港、啟東、廣西)間的遺傳距離平均為0.081, 群體內的遺傳距離為 0.007, 兩者之比為 11.6[19], 上述研究顯示長樂群體與非長樂群體間遺傳距離之比值均大于11.6; ITS1分析顯示長樂群體與非長樂群體間的平均遺傳距離為 0.0329, 群體內遺傳距離平均為 0.0088,群體間與群體內遺傳距離之比為3.7[4]; ITS2分析顯示長樂群體非長樂群體間遺傳距離平均為 0.029, 群體內平均遺傳距離為 0.012, 兩者之比為 2.42[19]; 本研究發現漳州西施舌與非漳州(日照、北海)西施舌間的遺傳距離平均為 0.044, 而群體內的遺傳距離平均為 0.004, 兩者之比達 11。不同基因解析能力不同,但有規律可循, ITS1和ITS2群體間與群體內遺傳距離之比值在2.4~4.2, 不大于5, 而線粒體基因組此值大于 10, 這達到了“10×”規則的標準[20-21], 說明福建(長樂、漳州)與其他群體西施舌發生了明顯的分化。特別是來自組蛋白基因兩翼序列的證據證明, 漳州西施舌發生了明顯的分化。組蛋白H2A基因在核心組蛋白中屬中度保守, 但在漳州和非漳州西施舌群體中相對保守, 只有 3個漳州群體特征性單核苷酸突變位點, 但通過這 3個位點的堿基可識別漳州西施舌。H2A基因的兩側非編碼區突變率高, 在群體分子遺傳學研究中具有重要意義, 特別是組蛋白H2A編碼區上游-77至-86位的插入序列和-11至-50區的高變區可以作為漳州西施舌明顯的分子標記(圖1方框), 在群體鑒別中具有重要意義。

圖3 日照、漳州西施舌nad6~nad1片段核苷酸序列差異分析Fig.3 Analysis of difference in nad6~nad1 fragment nucleotide sequence of Coelomactra antiquata from Rizhao and Zhangzhou coast

圖4 日照、漳州西施舌nad1 N′端氨基酸序列比對Fig.4 Amino acid sequence aligment of nad1 N′-end between Rizhao and Zhangzhou Coelomactra antiuqata
本研究擴增了nad6和nad1基因之間的核苷酸序列, 用來比對的 DNA序列包括trnQ(9bp)部分序列、2個非編碼區(96bp+4bp)、trnT(63bp)全序列和nad1(371bp)部分序列(圖 3), 此 DNA片段的總堿基數雖不多, 但所包涵的信息卻很豐富, 這些信息顯示西施舌日照、漳州群體這個區域核苷酸差異極為明顯, 2個群體的7種單倍型有90個變異位點, 2個群體nad1編碼的氨基酸有6個位點不同, 可見此區域是區分日照、漳州西施舌的更加有效的分子標記。而漳州西施舌共享變異位點 84個, 占變異位點的93.3%。本研究結果為西施舌的系統演化研究提供了來自核基因組和線粒體基因組的重要參考。
[1] Kong L F, Li Q, Qiu Z X. Genetic and morphological differentiation in the clamCoelomactra antiquata(Bivalvia: Veneroida) along the coast of China [J].Journal of Experimental Marine Biology and Ecology,2007, 343 (1): 110-117.
[2] 劉德經, 朱善央. 福建與江蘇西施舌群體形態差異研究[J]. 南方水產, 2010, 6 (2): 29-34.
[3] Kong L F, Li Q. Genetic comparison of cultured and wild populations of the clamCoelomactra antiquata(Spengler) in China using AFLP markers[J]. Aquaculture,2007, 271: 152-161.
[4] 孟學平, 高如承, 申欣, 等. 西施舌 5個地理群體ITS1序列變異及系統發生分析[J]. 生態學報, 2010,30 (20): 5555-5561.
[5] 孟學平, 高如承, 申欣, 等. 基于 COI的中國西施舌DNA 條形碼[J]. 水產科學, 2011, 30 (10) : 626-630.
[6] 孟學平, 申欣, 張波, 等. 西施舌Cytb基因核苷酸差異分析[J]. 水產科學, 2010, 29 (9) : 537-542.
[7] Meng X P, Shen X, Zhao N N, et al. The complete mitochondrial genome of the clamMactra veneriformis(Bivalvia: Mactridae): Has a unique non-coding region,missing atp8 and typical tRNASer[J]. Mitochondrial DNA, 2013, 24(6): 613-615.
[8] 孟學平, 王帥, 高如承, 等. 西施舌群體遺傳結構及分化的RAPD分析[J]. 海洋科學, 2011, 35 (2): 6-9.
[9] 陳偉, 羅遼復. 基于組蛋白甲基化信息的 H2A.Z和H2A 核小體識別[J]. 生物物理學報, 2009, 25 (4):269-274.
[10] Marzluff W F, Duronio R J. Histone mRNA expression:multiple levels of cell cycle regulation and important developmental consequences[J]. Current Opinion in Cell Biology, 2002, 14(6): 692-699.
[11] 張瓊. 蜘蛛組蛋白H3基因保守序列的克隆與進化分析[D]. 武漢: 湖北大學, 2006.
[12] 倪冠英, 何淑梅, 董娟聰, 等. 電離輻射對 Jurkat細胞γ-H2AX蛋白表達的影響[J]. 吉林大學學報, 2010,36 (5): 895-899.
[13] 涂文志, 尚增甫, 李兵, 等. 與細胞周期 G2/M 期進程相關的 H2AX磷酸化[J]. 中國生物化學與與分子生物學報, 2012, 28 (4): 339-345.
[14] 李成華. 櫛孔扇貝核心組蛋白的基因結構及 H2A抗菌活性的研究[D]. 青島: 中國科學院海洋研究所,2007.
[15] Marzluff W F, Sakallah S, Kelkar H. The sea urchin histone gene complement[J]. Developmental Biology,2006, 300(1): 308-320.
[16] Meng X P, Shen X, Zhao N N, et al. Mitogenomics reveals two subspecies inCoelomactra antiquata(Mollusca: Bivalvia) [J]. Mitochondrial DNA, 2013, 24(2): 102-104.
[17] 孟學平, 申欣, 趙娜娜, 等. 漳州西施舌線粒體基因組全序列: 腔蛤蜊屬(Coelomactra)存在新種的證據[J].海洋學報, 2013, 35(3): 213-222.
[18] Ortman B D, Bucklin A, Pages F, et al. DNA barcoding the Medusozoa using mtCOI[J]. Deep-Sea Research II,2010, 57: 2148-2156.
[19] 孟學平, 申欣, 趙娜娜, 等.基于ITS2 和16S rRNA的西施舌群體遺傳差異分析[J].生態學報, 2013,33(24): 7882-7891.
[20] Hebert P D N, Cywinska A, Ball S L, et al. Biological identifications through DNA barcodes[J]. Proceeding of the Royal Society B: Biology Science, 2003, 270(1512): 313-321.
[21] Hebert P D N, Penton E H, Burns J M, et al. Ten species in one: DNA barcoding reveals cryptic species in the neotropical skipper butterflyAstraptes fulgerator[J]. Proceedings of the National Academy of Seieaees of the United States of America, 2004, 101(41): 14812-14817.