999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于轉錄組數據的三峽庫區消落帶適生狗牙根SNPs和SSRs分析

2020-05-05 03:14:48李彥杰賈洪沅李慶天白藝旋劉蕓杉
西南農業學報 2020年3期

李彥杰,賈洪沅,李慶天,白藝旋,劉蕓杉

(1.重慶三峽學院 生物與食品工程學院,重慶 萬州 404100;2.重慶三峽學院 教師教育學院,重慶 萬州 404100)

【研究意義】三峽大壩水位調度使其上游庫區兩岸出現了周期性的反季節淹沒——出露消落帶區域[1-2]。消落帶植被受水陸環境交替影響而逐漸退化,加劇了庫區生態環境的不穩定性,進而引發水土流失等次生災害[3]。穩定消落帶生態環境的關鍵是消落帶植被的重建和恢復[4]。研究表明,作為三峽庫區消落帶原生植物,狗牙根通過調整來自多個基因信號通路的眾多基因表達,從通氣組織生成、伸長性生長和不定根形成等形態學變化以及細胞加固和抗氧化組分增高等代謝調整,在多方面、多層次適應水淹信號,從而使其表現出一定程度的水淹生境適生性[5-8]。開發、建立大規模的分子標記有利于分離和鑒定與消落帶原生狗牙根水淹適生性相關的等位基因,并且在遺傳性狀解析、分子育種、多樣性分析以及抗水淹植物篩選等方面具有重要作用。簡單重復序列標記(simple sequence repeats,SSRs)和單核苷酸多態性(single nucleotide polymorphisms,SNPs)是使用較多的兩種共顯性分子標記,前者是片段標記,多用于目標基因定位和遺傳圖譜構建等,后者是序列信息標記,多用于目標基因精細定位和識別等[9-10]。【前人研究進展】目前,基于SSR標記的狗牙根相關研究相對較少,且主要集中在種質遺傳多樣性分析和抗寒性狀鑒定等方面,而有關狗牙根SNP標記研究鮮有報道[11-14]。【本研究切入點】三峽庫區消落帶原生狗牙根水淹適生性與其序列片段及序列信息有關,解析其SSRs和SNPs數量及分布以評估其遺傳多樣性分析和種質資源,進而分析其與水淹相關的現狀及定位功能基因,有助于加深對狗牙根耐水淹機制的理解。【擬解決的關鍵問題】為三峽庫區消落帶的植被重建及生態環境恢復提供基礎和參考。

1 材料與方法

1.1 供試材料

實驗材料取自位于重慶市萬州區新田鎮譚紹村的三峽庫區天然消落帶,材料處理、取樣方法和測序樣品制備等見課題組前期研究[5]。Illumina HiSeq 4000 平臺測序及SSR引物合成由深圳華大基因科技有限公司完成。測序樣品分為水淹處理組(A2)和未水淹對照組(A1)。

1.2 試驗方法

轉錄組測序原始讀序(Raw reads)經去除測序接頭讀序(reads)、未知堿基含量大于5 %的reads和低質量的reads后得到純凈讀序(clean reads)。使用Trinity V2.0.6軟件首先將clean reads打斷為較短片段(K-mer)構建數據庫,選高頻率作為種子向兩端延伸得到線性重疊群(contigs),再將Contigs聚類得到片段集合(Component),并對每個Component構建de Bruijin圖,最后根據pair-end reads解讀de Bruijin圖信息得到轉錄本序列(Full-length transcriptome assembly from RNA-Seq data without a reference genome)。將上述轉錄本序列基于Tgicl v2.0.6r軟件進行聚類去冗余得到Unigene。使用HISAT v0.1.6-beta把clean reads比對到Unigene,利用GATK v3.4-0檢測SNPs。使用MISA v1.0搜索Unigene的SSRs,篩選標準為:單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的重復次數分別設置為12、6、5、5、4和4次。

2 結果與分析

2.1 測序數據整理及組裝

整理轉錄組測序原始讀序(Raw reads)和純凈讀序(clean reads)得Total Raw Reads、Total Clean Reads、Total Clean Bases、Clean Reads Q20、Clean Reads Q30和Clean Reads Ratio分別為89.875 Mb、73.72 Mb、11.055 Gb、99.14 %、97.19 %和82.035 %。其中,Clean Reads Q20是指質量值大于20的堿基數目占總堿基數目的比例,若其值大于80 %則認為測序數據質量較高[15]。本次所得clean reads為99.14 %,說明狗牙根轉錄組測序的Raw reads經過濾后所得clean reads質量高。兩組樣本基于Trinity軟件共組裝得到162323條轉錄本,其平均長度為721個核苷酸(nucleotide,nt),將上述轉錄本基于Tgicl軟件去冗余得含147256條序列的非冗余基因數據庫(universal gene,unigene)(表1)。將所有的Unigene按照從長到短排序,將排序后的Unigene從長到短依次相加,當相加長度等于Unigene總長度的一半時所對應的Unigene長度即為N50值。N50可用來評估轉錄本和Unigene組裝質量,其值越大表示組裝或所得的序列質量越高[16]。本實驗轉錄組測序數據經組裝所得轉錄本的N50為1287 nt,所得Unigene的N50為1509 nt,且長度大于500 nt的Unigene超過50 %(圖1),故認為所得Unigene質量較高,其可滿足后續數據庫注釋和差異基因富集等分析。

2.2 狗牙根轉錄組中SNP數量與分布

利用GATK軟件從兩組樣本共檢測出297 542個SNPs,其中轉換型位點數量為183 565個,顛換型位點數量為113 977個。從圖2可知,每組樣品內的A-G或C-T轉換型位點數量相近,且均遠多于顛換型位點數;4種顛換型位點數量按照從多到少依次為C-G>G-T>A-C>A-T。水淹樣品(A2)的各類型SNPs數量均小于未水淹樣品(A1)。

表1 轉錄本和Unigene組裝結果Table 1 Assembly results of transcripts and Unigene

圖1 Unigene長度分布Fig.1 Length distribution of Unigene

圖2 SNPs類型分布Fig.2 Type distribution of SNPs

2.3 狗牙根轉錄組中SSR數量與分布

利用MISA軟件對狗牙根的147 256條Unigene作序列搜索共檢測到22 154個SSRs分布于18 982條Unigene中,發生頻率為(含SSRs的Unigene數目與總Unigene數目的比值)12.89 %,出現頻率(SSR總數與總Unigene數目的比值)為15.04 %,含有超過一個SSR位點的Unigene有2680條,含復合型SSR位點的Unigene有1023條。SSRs以單核苷酸、二核苷酸和三核苷酸重復為主,三者總和約占SSRs總數量的94.99 %(表2)。單核苷酸SSRs中腺苷酸(A)和胸腺嘧啶(T)分別為3776和3650條,胞嘧啶(C)和鳥苷酸(G)分別為103和225條。

表2 Unigene中的SSRs數量Table 2 Number of SSRs in Unigene

進一步統計SSRs分布可知,二核苷酸重復類型中4種SSRs數量大小為:AG/CT>AC/GT>CG/CG>AT/AT,其中AG/CT型SSRs數量明顯高于其他3種,且與AT/AT型SSRs數量相差近10倍;三核苷酸重復類型中10種SSRs數量大小為:CCG/CGG>ATC/ATG>AGG/CCT>AGC/CTG>ACT/AGT>ACG/CGT>ACC/GGT>AAT/ATT>AAG/CTT>AAC/GTT,其中CCG/CGG型SSRs數量比AAC/GTT型高出10倍(圖3)。隨著重復次數的增加,單核苷酸和其他5種SSRs數量均呈下降趨勢,其中重復6次的位點數在二核苷酸SSRs中占比最高,其約占二核苷酸SSRs總數的29.41 %,重復6~10次和6~20次的二核苷酸SSRs分別占二核苷酸SSRs總數的68.80 %和94.74 %(圖4)。三核苷酸SSRs和四核苷酸SSRs的重復次數主要以5和6次為主,其中重復5次的SSRs分別占兩類SSRs總數的62.79 %和97.41 %。五核苷酸SSRs和六核苷酸SSRs以4次重復為主,該重復次數的SSRs分別占兩類SSRs總數的83.82 %和87.60 %。

圖3 SSRs類型分布Fig.3 Type distribution of SSRs

圖4 不同重復次數的SSRs位點數量分布Fig.4 Number distribution of SSRs with different repetition times

SSRs基序長度可用來評估多態性高低,通常12~20 bp的長度范圍具有中等多態性,低于12 bp和高于20 bp分別具有低多態性和高多態性[17]。本次實驗獲得的SSRs基序長度在12~246 bp之間,平均長度為19.60 bp。SSRs基序長度分布如圖5,可知,基序長度在12~20 bp的SSRs數量最多,占比為78.52 %,其次為占比13.37 %的基序長度在12~20 bp的SSRs,基序長度大于30 bp的SSRs占比為8.11 %,說明狗牙根轉錄組SSRs具有中等多態性,可用于后續的遺傳多樣性和品質鑒定等分析。

圖5 SSRs基序長度分布Fig.5 Distribution of SSRs motif length

3 討 論

不同植物或同一種植物的SSRs堿基組成和拷貝數隨物種或個體的不同而表現出一定差異,而SSRs的兩側序列卻相對保守,因此可通過設計引物擴增SSR或基于測序數據分析其序列多態性。SSRs序列多態性與DNA復制、修復過程中DNA滑動和錯配,或有絲分裂、減數分裂期姐妹染色單體不均等交換有關[18-19]。SSRs中的重復核苷酸數常為一至六,其中以單核苷酸、二核苷酸和三核苷酸型SSRs占比最高。本實驗中,狗牙根SSRs主要以單核苷酸、二核苷酸和三核苷酸型為主。此外,SSRs的長度和數量可能與染色體結構、轉錄調控和功能基因鑒定等有關[20]。本實驗中狗牙根轉錄組SSRs具有中等多樣性,故借助SSRs數量、類型分布、位點分布和長度分布等信息有助于解析與三峽庫區消落帶原生狗牙根耐水淹的相關性狀,或可進一步用于相關功能基因的識別和定位等。SNPs是由于單個核苷酸的變異所引起的DNA序列多態性,且多為二等位多態性。SNPs主要分為轉換和顛換兩種形式,轉換的頻率遠高于顛換,這可能與CpG二核苷酸上的胞嘧啶殘基易于脫去氨基而形成胸腺嘧啶有關。本實驗中搜索到的SNPs標記也是以轉換型為主,且總數約占總SNPs數目的2/3。SNPs在基因組可分布于多個位置,其中位于基因編碼區的SNP(coding-region SNP,cSNPs)雖然相對數量較少,但其對生物性狀解析和輔助育種等具有重要作用,故通過進一步深挖狗牙根轉錄組數據的cSNPs信息,繪制cSNPs圖譜可用于狗牙根與抗逆相關的多樣性分析、品質鑒定和分子育種等研究。

SSRs和SNPs技術較為成熟,在植物分子育種以及相關性狀解析等多個方面發揮了重要作用。SSRs有標準化的分析流程,但其分辨率相對較低,而SNPs具有數量更多、密度更高、分布更廣,因此有相對較高的分辨率。植物以多倍體為多,使得SNPs的可用性降低,因此在實際工作中可將SSRs和SNPs標記結合使用。

4 結 論

基于狗牙根轉錄組測序數據共得到297 542個SNPs和22 154個SSRs,其中這些SSRs的發生頻率為12.89 %,且主要以單核苷酸、二核苷酸和三核苷酸重復為主,三者合計占比為94.99 %;基序長度在12~20 bp的SSRs數量最多,占比達78.52 %,顯示出較好多態性。由于狗牙根為多倍體,故結合豐富的SSRs和SNPs信息,或可為其遺傳多樣性分析和分子育種等提供參考。

主站蜘蛛池模板: 97久久免费视频| 亚洲成人动漫在线观看| 九九九精品视频| 亚洲天堂福利视频| 丁香综合在线| 在线视频97| 国产一级二级在线观看| 国产69精品久久久久孕妇大杂乱 | 2021最新国产精品网站| 色综合网址| 久草视频精品| 国模极品一区二区三区| 热久久综合这里只有精品电影| 日韩久草视频| 亚洲视频四区| 日韩福利在线观看| 粉嫩国产白浆在线观看| 亚洲一区二区精品无码久久久| 欧美人人干| 亚洲国产成人久久77| 99热精品久久| 五月婷婷丁香色| 国产三级视频网站| 在线日韩一区二区| 中文字幕在线永久在线视频2020| 欧美成人免费一区在线播放| 国产97视频在线| 无码AV动漫| 久久久精品国产亚洲AV日韩| 国产黄在线免费观看| 广东一级毛片| 日韩欧美视频第一区在线观看| 欧美激情成人网| 激情乱人伦| 欧美午夜久久| 精品人妻一区无码视频| 91在线视频福利| 人妻丰满熟妇啪啪| 国产免费羞羞视频| 一区二区三区高清视频国产女人| 欧美啪啪网| 91麻豆精品视频| 日a本亚洲中文在线观看| 日本欧美一二三区色视频| 99r在线精品视频在线播放| 99视频精品在线观看| 午夜一级做a爰片久久毛片| 日韩东京热无码人妻| 国产白丝av| 毛片一级在线| 国产精品免费露脸视频| 中文字幕无线码一区| 国产在线观看精品| 中文字幕 91| 国模沟沟一区二区三区| 五月婷婷综合色| 婷婷亚洲最大| 人妻中文字幕无码久久一区| 丰满人妻中出白浆| 99视频在线免费观看| 激情五月婷婷综合网| 成人在线天堂| 日韩国产黄色网站| 久久这里只有精品2| 久久国产精品波多野结衣| 麻豆精品视频在线原创| 无码AV动漫| 亚洲第一中文字幕| 国产美女一级毛片| 久久亚洲美女精品国产精品| 毛片网站在线看| 精品国产一区二区三区在线观看 | 亚洲中文字幕在线一区播放| 国产亚洲精品无码专| 国产毛片基地| 日韩精品毛片| 天堂va亚洲va欧美va国产 | 色爽网免费视频| 久久香蕉国产线| 狠狠色丁香婷婷| 在线免费不卡视频| 中国黄色一级视频|