美洲(Alosasapidissima)隸屬于鯡形目(Clupeiformes)、鯡科(Clupeidae)、亞科(Alosi-nae)西鯡屬(Alosa),與我國長江(Tenualosareevesii)屬于同一亞科,原分布于北美洲大西洋沿岸水域,是美國漁業資源保護的重要野生品種,因具有肉鮮味美、營養豐富、養殖經濟價值高等諸多優點而被世界各地廣泛引種[1-3]。我國長江素有“魚中西施”之說,曾被列為“、甲、鯧、黃”四大名魚之首,與長江水域的刀魚、河鲀并稱為“長江三鮮”。但是在20世紀末期,由于過度捕撈、水域污染、水利工程等諸多因素,長江自然種質資源急劇衰退,近年來長江流域已鮮見其蹤跡[]。有鑒于此,上海市水產研究所(上海市水產技術推廣站)自1998 年開始從美國密西西比河水域引進美洲受精卵進行人工繁養殖研究,并在后期陸續攻克了其苗種培育、養殖和繁育技術難關,以期將其作為長江的理想替代品種以滿足消費市場的需求[1,3]。伴隨著美洲人工繁育和養殖技術的逐漸成熟,其養殖規模和產量日益擴大,但是良種的匱乏嚴重制約了養殖產業健康、可持續的發展。開展美洲良種選育需要科學有效的育種策略,否則極易造成生長和抗逆性等生產性狀的退化,因此,亟須加強美洲種質資源的開發研究,并適時對養殖群體的遺傳多樣性進行檢測,以有效降低種質退化和近交衰退發生的概率[3]
近年來,對美洲的研究主要集中于形態特征[4]、胚胎發育[5]、生長特性[1-2]、病害防治[6-8]性腺發育[9]、環境脅迫[10-12]、同工酶鑒定[13]等方面,而對于群體遺傳分析和分子標記開發方面的研究相對較少,僅見于國外學者利用微衛星標記和線粒體研究不同水域或緯度群體的遺傳結構和遺傳分化[14-15],以及國內學者利用微衛星標記和線粒體研究蘇南地區美洲不同養殖群體的遺傳多樣性[16]。美洲養殖群體可用分子標記匱乏的現狀在一定程度上制約了其種質資源的充分開發和利用,而基于分子標記技術有效評估養殖美洲的遺傳多樣性能夠為其種質資源的開發、保護、利用和遺傳改良提供理論指導和科學依據。
伴隨著分子標記技術的發展,隨機擴增多態性 DNA(random amplified polymorphic DNA,RAPD)、擴增片段長度多態性(amplified fragmentlengthpolymorphism,AFLP)、間簡單重復序列(inter simple sequence repeat,ISSR)、簡單重復序列(simple sequence repeat,SSR)及單核苷酸多態性(singlenucleotidepolymorphism,SNP)等分子標記先后在水產動物種質資源評估中綻放異彩。SNP是指在基因組上由單個核苷酸變異形成的遺傳標記,是動植物基因組中數量最為豐富的分子標記資源,具有數量多、密度高、遺傳穩定性好、突變率低及易于實現自動化檢測分析等優點。該標記被廣泛應用于水產動物群體遺傳學分析、品種鑒定、重要性狀的基因定位、遺傳圖譜構建及分子標記輔助育種等相關研究,也是復雜遺傳性狀解析和基因組進化研究的重要工具。傳統的SNP標記的開發方法是對DNA擴增片段進行直接測序,適用于少量SNP位點的開發和驗證,成本相對較高,不適合規?;拈_發和應用。伴隨著高通量測序技術的發展和測序成本的降低,利用高通量轉錄組測序的方法,可以規?;诰騽游镛D錄組中表達序列標簽(expressed sequence tag,EST)的SNP標記(EST-SNP標記),并結合等位基因頻率的評估結果,獲得與目標性狀關聯性較高的位點用于輔助分子標記輔助育種研究。該標記相對于EST-SSR標記更加穩定,能夠直接用于水產動物的分子育種實踐。
魚類大腦作為神經系統的高級調控中樞,不僅能夠通過腦-垂體-肝臟生長軸(GH/IGF)對生長性狀進行精準調控,而且能夠通過腦-垂體-性腺軸(BPG)對性別分化、生殖發育等進行精準調控。研究魚類不同性別或極端生長表型個體間腦轉錄組的差異,對于魚類的生長和發育等相關性狀的遺傳解析及新品種(系)的選育具有重要作用,特別是多態性EST-SNP分子標記的挖掘能夠為魚類分子標記輔助良種培育提供較好的技術支撐。
目前,關于美洲腦轉錄組EST-SNP標記的挖掘、特征分析及多態性驗證等方面的研究相對較少。基于美洲腦轉錄組數據規模化開發多態性EST-SNP標記位點,對于美洲功能性分子標記的開發、遺傳圖譜的構建、優良種質的鑒定及遺傳改良具有較好的應用前景。本研究利用生物信息學技術手段挖掘美洲腦轉錄組中的EST-SNP標記,開展初步的特征分析,并對篩選的部分EST-SNP位點開展了有效性和多態性驗證,以期為養殖美洲的種質資源評估和分子標記輔助良種選育研究提供重要的理論基礎和技術支持。
1 材料和方法
1. 1 試驗魚
用于腦轉錄組測序的6尾美洲取自上海市水產研究所(上海市水產技術推廣站)奉賢科研基地于2017年貯備的2齡性成熟美洲(性比為
;用于EST-SNP標記有效性和多態性驗證的30尾美洲取自該基地于2017年繁育獲得的美洲亞成魚( 1+ 齡)。
1.2 試驗方法
1.2.1 美洲鯽腦組織轉錄組測序
將6尾2齡性成熟美洲用MS-222麻醉后,迅速解剖,取其腦組織置于液氮速凍,然后轉移至-80°C 冰箱保存備用。RNA 提取參照Invitrogen公司的TrizolReagents試劑盒說明書進行;cDNA測序文庫構建參照Illumina轉錄組測序文庫試劑盒說明書進行;利用Illumina HisSeqXTen高通量測序平臺對3個雌魚樣品(BF1、BF2和BF3)和3個雄魚樣品(BM1、BM2和BM3)進行轉錄組測序;利用Trinity2.4.0軟件對測序原始數據進行組裝、優化和分析。
1.2.2 美洲腦轉錄組EST-SNP標記的挖掘和特征分析
利用HISAT22.1.0軟件中的全局比對方式,將不同長度的cleanreads(經處理后得到的高質量、干凈的讀取序列)與美洲參考基因組(NCBIbioprojectID:PRJNA736150)進行比對,獲得比對文件后,再使用SAMtools1.5軟件將比對文件進行排序;然后將雌、雄美洲(BF組和BM組)的所有樣本進行排序后的比對文件和相應的參考基因組序列輸入到BCFtools1.5軟件中,利用該軟件中的mpileup命令將2組美洲比對后的bam文件轉換成vcf文件,并利用BCFtoolsfilter對轉換好的vcf文件進行過濾。過濾條件:(1)篩選出至少被6個clean reads覆蓋的 EST-SNP 標記;(2)覆蓋度大于8;(3)最小等位基因質量 ?20 。最后,利用EXCEL軟件對篩選到的美洲腦轉錄組中的EST-SNP標記進行相關特征分析。
1.2.3 美洲腦轉錄組EST-SNP標記的有效性驗證
隨機選取70個在美洲雌、雄個體中均存在的EST-SNP分子標記位點,對30尾養殖美洲進行基因分型,以開展EST-SNP標記的有效性和多態性驗證研究。
30尾美洲個體的DNA提?。好總€美洲樣本取約 25mg 的尾鰭,利用滅菌 ddH20 清洗干凈后,剪碎并保存于 1.5mL 離心管中,參照天根生化科技(北京)有限公司的海洋動物組織基因組DNA提取試劑盒(DP324-03)說明書提取美洲不同樣本的基因組DNA。分別利用瓊脂糖凝膠電泳和NanoVuePlus紫外可見分光光度計對提取好的DNA樣本的質量和濃度進行評估。經1.5% 瓊脂糖凝膠電泳檢測,顯示無拖尾降解現象、條帶清晰,且在 260nm 和 280nm 下的吸光度比值 (A260/A280 為 1.8~2.0 的DNA 樣品,將其稀釋到 50ng/μL 后,置于 -20°C 冰柜中保存備用。
基因分型:委托上海捷瑞生物工程有限公司用SNaPshot基因分型技術對30尾美洲個體開展基因分型服務和分析,參照美國應用生物系統公司(AppliedBiosystemsInc.,ABI)所提供的SNaPshot試劑盒說明書進行操作,然后利用ABI3730xl DNA分析儀進行基因分型。
1.2.4 美洲腦轉錄組多態性EST-SNP標記的利用
經驗證多態性較好的EST-SNP標記用于評估1個美洲養殖群體的遺傳多樣性。采用GenAlex6.5軟件[17]計算最小等位基因頻率(mi-norallelefrequency,MAF)觀測雜合度(observedheterozygosity, Ho )和期望雜合度(expectedheterozygosity, He )等遺傳參數。基于等位基因頻率,利用PopGene321.31軟件,計算各個EST-SNP標記的多態信息含量(polymorphismin-formationcontent,PIC)。利用GENEPOP4.0軟件進行哈迪-溫伯格平衡檢測和分析。
2 結果
2.1 美洲腦轉錄組EST-SNP標記特征分析
基于IlluminaHisSeqXTen高通量測序平臺和Trinity軟件,從美洲腦轉錄組中共獲得總長度為157104493bp的拼接基因257648個,利用BCFtools軟件總共鑒定到113898個潛在的EST-SNP位點,平均 1.379kb 就能檢測到1個EST-SNP位點;其中有50454個拼接基因檢測到至少有1個SNP位點,平均每個拼接基因能夠鑒定到2.26個EST-SNP位點。
單個堿基的變異類型主要包括單個堿基的轉換、顛換、插入或缺失,而一般所說的SNP標記往往是指轉換和顛換2種類型。在本研究中,對113898個EST-SNP位點開展堿基置換類型統計和分析,結果顯示,美洲雌、雄個體腦轉錄組中的堿基置換類型具有明顯一致的偏好性,不同美洲個體轉換類型EST-SNP位點的數量均顯著大于顛換類型的數量(見圖1)。對不同EST-SNP位點突變類型的分布情況進行分析,結果顯示,CT,AG,TC 和 GA 是最主要的變異類型,約占 65% ,其中
突變類型占比相對較高,約為 17% ,其他幾種EST-SNP位點變異類型相對較少,累計占比 35% (見圖2)。


2.2 美洲EST-SNP標記的有效性檢測
為驗證美洲轉錄組測序數據中113898個潛在的EST-SNP標記的有效性,隨機挑選出在雌、雄美洲個體中均存在的70個EST-SNP標記,利用SNaPshot基因分型技術對30尾 1+ 齡美洲個體進行初步的基因分型,結果顯示,57個EST-SNP標記能夠穩定擴增且具有多態性,能夠成功分型,占比為 81.43% ;其余13個EST-SNP標記未能成功分型
2.3 美洲養殖群體的遺傳多樣性分析
基于57個多態性較好的EST-SNP標記開展美洲養殖群體的遺傳多樣性分析,結果顯示,最小等位基因頻率(MAF)為 0.067~0.483 ,觀測雜合度( Ho )和期望雜合度(
)分別為 0. 033~ 0.567和
57個EST-SNP標記的多態信息含量(PIC)為 0.117~0.375 ,其中38個位點為中度多態性(PIC大于0.25,小于0.50),19個位點為低度多態性(PIC小于0.25)。哈迪-溫伯格平衡檢測的結果顯示,在美洲57個多態性EST-SNP位點中,有2個EST-SNP位點顯著偏離哈迪-溫伯格平衡( P<0.01 (見表1)。
3 討論
伴隨著高通量測序技術的迅猛發展,測序準確率、效率和測序深度均不斷得到完善。利用生物信息學技術從轉錄組數據中規模化挖掘候選EST-SNP標記,并開展相關功能驗證,日趨成為一種高效的EST-SNP標記開發模式,特別是對于無參考基因組物種具有較好的參考價值?;诟咄哭D錄組測序技術目前已在大口黑鱸(Micropterussalmoides )[18-19]、草魚(Ctenopharyngodon idel-la)[20]、日本沼蝦(Macrobrachium nipponense)[21]紫貽貝(Mytilusgalloprovincialis)[22]及棘胸蛙(Quasipaaspinosa)[23]等水產動物重要經濟品種的EST-SNP開發應用方面獲得了成功,這為美洲多態性EST-SNP分子標記的規?;_發和利用提供了良好的借鑒。
本研究從美洲腦轉錄組中總共獲得了257 648個拼接基因和113898個EST-SNP位點,其中有50454個拼接基因至少存在1個EST-SNP位點,約占總拼接基因的 19.58% ,平均每個拼接基因能夠檢測到2.26個EST-SNP位點,EST-SNP位點檢出率相對較高,可能與研究材料間的遺傳背景差異有關。有研究表明,EST-SNP位點的檢出頻率越高,表明所用研究材料的遺傳背景差異越大。SNP變異理論上每個位點能夠存在4種形式的變異,但是實際上發生的只有轉換和顛換2種,且二者的比例約為 2:1[24] 。本研究還發現,EST-SNP位點的堿基變異類型中,
和 T?C 是主要的變異類型。這4類堿基變異類型均屬于轉換突變,約占總EST-SNP位點的 65% ,其他堿基變異類型屬于顛換突變,數量相對較少,約占總EST-SNP位點的 35% ,平均轉換和顛換的比例為 1.86:1 ,略低于理論值(2:1),略高于紫貽貝的相關比例(1.6:1)[22]
基于生物信息學技術手段所開發的EST-SNP位點往往存在一定比例的假陽性,而且功能基因轉錄后, mRNA 存在剪切編輯,需要通過試驗方法在基因組DNA水平開展有效性和多態性的進一步驗證。本研究從美洲雌雄個體腦轉錄組中所鑒定到的113898個潛在EST-SNP位點中,隨機選取70個EST-SNP位點開展了有效性和多態性驗證,結果顯示,81. 43% 的EST-SNP位點較為穩定且具有多態性,還有 18.57% 的EST-SNP位點未分型成功。究其原因,可能是這些序列復雜性較高或者側翼序列還存在其他變異位點,導致本研究采用SNaPshot基因分型技術未能成功分型,后續需要利用其他基因分型技術進行進一步的研究。





雜合度( Ho/He 和多態信息含量(PIC)等遺傳參數是評估水產動物群體遺傳變異程度的重要參考指標,對于美洲養殖群體的種質資源評估具有重要參考價值。本研究利用57個多態性EST-SNP分子標記評估美洲養殖群體的遺傳結構,結果顯示,該群體的平均觀測雜合度( ???? )、期望雜合度 (He )和多態信息含量(PIC)分別為0.3497.0.3410 和0.2756,表明該美洲養殖群體的遺傳變異程度相對較好?;贐otstein 等[25]提出的多態性劃分標準,即PIC小于0.25屬于低度多態,PIC大于0.25、小于0.50屬于中度多態。本研究中有 66.67% 的EST-SNP位點屬于中度多態, 33.33% 的EST-SNP位點屬于低度多態,PIC平均值為0.2756,低于課題組前期基于微衛星分子標記技術分析該群體所得到的PIC平均值(0.561)[3]。原因主要是這些EST-SNP分子標記均屬于二等位基因多態,相對低于微衛星標記的多等位基因多態。哈迪-溫伯格平衡定律亦稱遺傳學平衡定律,是群體有性繁殖上下代之間基因頻率和基因型頻率是否能夠保持平衡的檢驗尺度[26],也是水產動物開展保種和新品種(系)選育的重要理論依據。本研究對57個多態性EST-SNP位點開展哈迪-溫伯格平衡檢測,結果顯示,55個EST-SNP位點符合哈迪-溫伯格平衡(
),2個EST-SNP位點顯著偏離哈迪-溫伯格平衡( P<0.05) ,表明這2個EST-SNP位點可能已經受到人工選擇壓力的影響,而大部分位點能夠用于美洲養殖群體的遺傳分析。本研究結果可為后續美洲的種質資源評估、基因分型和性狀關聯分析等研究奠定理論基礎。
參考文獻
[1]施永海,徐嘉波,陸根海,等.養殖美洲的生長特性[J].動物學雜志,2017,52(4):638-645.
[2]徐嘉波,稅春,施永海,等.池養美洲 1+ 齡魚種生長特性的研究[J].上海海洋大學學報,2018,27(1):55-63.
[3]于愛清,施永海,徐嘉波,等.美洲腦轉錄組多態性EST-SSR的規模化開發與利用[J].西北農林科技大學學報(自然科學版),2023,51(11):1-12.
[4]洪孝友,朱新平,陳昆慈,等.孟加拉、美洲和中國形態學比較分析[J].華南農業大學學報,2013,34(2):203-206.
[5]徐鋼春,張呈祥,鄭金良,等.美洲的人工繁殖及胚胎發育的研究[J].海洋科學,2012,36(7):89-96.
[6]王會林,晉懷遠,高曄,等.美洲魚嗜水氣單胞菌病原的分離與鑒定[J].漁業科學進展,2024,45(2):257-266.
[7]高曉華,高瑋,張明輝.40種中草藥對美洲源溫和氣單胞菌的體外抑菌作用研究[J].飼料工業,2023,44(12):67-73.
[8]施永海,鄧平平,徐嘉波.美洲專題系列講座美洲病害防治[J].科學養魚,2022(11):13-14.
[9]袁新程,施永海,徐嘉波,等.美洲V、V期卵巢營養成分、卵黃蛋白原、組織蛋白酶D及其mRNA表達的比較分析[J].上海海洋大學學報,2024,33(3):623-634.
[10]郭印,戴習林.急性鹽度脅迫對美洲幼魚滲透調節的影響[J].水產科學,2022,41(4):676-681.
[11]袁新程,蔣飛,施永海,等.高溫脅迫對美洲 1+ 齡魚種抗氧化與非特異性免疫相關指標的影響[J].浙江大學學報(農業與生命科學版),2021,47(1):107-117.
[12]張勇,徐鋼春,杜富寬,等.急性操作脅迫對美洲親魚血清生化指標及HSP70基因表達的影響[J].上海海洋大學學報,2016,25(5):652-658.
[13]張濤,周劍光,陳建武,等.美洲形態特征及其兩種同工酶的組織特異性分析[J].南方農業學報,2018,49(4):773-779.
[14]JULIANSE,BARTRONML.Microsatellite DNA markersforAmerican shad(Alosa sapidissima) and cross-species amplifica-tion within the family Clupeidae[J].Molecular Ecology Notes,2007,7(5) :805-807.
[15]HASSELMANDJ,BENTZENP,NARUMSR,etal.Formationofpopulation genetic structure following the introduction and es-tablishment of non-native American shad(Alosa sapidissima)alongthe Pacific Coast of North America[J].Biological Inva-sions,2018,20(11):3123-3143.
[16]李玉林,羅明坤,馮冰冰,等.我國蘇南地區美洲7個養殖群體的遺傳多樣性分析[J].上海海洋大學學報,2024,33(2):285-296.
[17]PEAKALL R,SMOUSE P E.Genalex 6:genetic analysisinExcel.Population genetic software for teaching and research[J].Molecular EcologyNotes,2006,6(1) :288-295.
[18]李勝杰,白俊杰,趙犖,等.大口黑鱸EST-SNP標記開發及其與生長性狀的相關性分析[J].海洋漁業,2018,40(1):38-46.
[19]馬冬梅,全迎春,樊佳佳,等.基于轉錄組測序的大口黑鱸馴食相關SNP開發及其與生長性狀的關聯分析[J].水產學報,2018,42(11):1684-1692.
[20]孫雪,李勝杰,姜鵬,等.利用RNA-Seq技術分析草魚生長性狀相關基因和SNP標記[J].水產學報,2021,45(3):333-344.
[21]李喜蓮,楊元杰,李飛,等.日本沼蝦EST-SNP的篩選及多態性檢測[J].東北農業大學學報,2016,47(2):67-73.
[22]李宏俊,梁瑜,邢坤,等.紫貽貝EST-SNP的篩選及多態性檢測[J].水產學報,2011,35(3):348-355.
[23]魏朝宇,謝永廣,魏秀英,等.基于轉錄組測序的棘胸蛙SSR和SNP分子標記開發[J].南方農業學報,2022,53(3):759-767.
[24]丁佩劍,金秀菊,孫寶信.人類單核苷酸多態性研究進展[J].臨床和實驗醫學雜志,2016,15(12):1235-1237.
[25]BOTSTEIND,WHITE RL,SKOLNICKM,etal.Construction ofa genetic linkage map in man using restriction fragment lengthpolymorphisms[J].American Journal of Human Genetics,1980,32(3):314-331.
[26]管宇,張香云,徐群芳,等.哈迪-溫伯格平衡檢驗及其基因頻率的估計[J].浙江林學院學報,2009,26(1):122-126.
Development and application of polymorphic EST-SNP markers from the brain transcriptome of Alosa sapidissima
YUAiqing,SHI Yonghai,XU Jiabo,LIU Yongshi,YAN Yinlong (Shanghai Fisheries Research Institute,Shanghai Fisheries Technical Extension Station,Shanghai ,China)
Abstract:A total of 113 898 single nucleotide polymorphism(EST-SNP)markers based on expression sequence tags were successfully identified from thebrain transcriptome data of Alosa sapidissima by bioinformatics toos,and 57 polymorphic EST-SNP markers were developed for genetic diversity assessment in A . sapidissima. The minor allele frequency(MAF),the observed heterozygosity( Ho ),expected heterozygosity( He )and polymorphism information content (PIC) were 0.067-0.483,0.033-0.567,0.124-0.499 and 0.117-0.375,respectively. Two loci of the 57 EST-SNP significantly deviated from the Hardy-Weinberg equilibrium ( P<0, 05 ). The results demonstrated thatthese polymorphic EST-SNP markers were potent tools for evaluating genetic diversity and germplasm analysis of A . sapidissima,which could be capitalized in future conservation strategies and breeding programs to protect and improve thisvaluable fish.
Key words: Alosa sapidissima; transcriptome; single nucleotide polymorphism; genetic diversity