999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

扁莖黃芪轉錄組測序及生物信息學分析

2022-03-22 06:33:00王星哲單飛彪孫鴻舉
華北農學報 2022年1期
關鍵詞:數據庫功能

武 悅,陳 陽,王星哲,單飛彪,張 勇,孫鴻舉

(1.內蒙古大學 生命科學學院,內蒙古 呼和浩特 010020;2.巴彥淖爾市農牧業科學研究院,內蒙古 臨河 015000)

扁莖黃芪(Astragaluscomplanatus),別名夏黃草、大沙苑,屬豆科蝶形花亞科,為多年生草本藥用植物,在我國多省市均有分布[1]。扁莖黃芪成熟種子干燥后又名沙苑子,味甘性溫,富含多種人體必需氨基酸、黃酮苷、有機酸和微量元素等營養物質,具有補肝、明目、益腎之功效,是我國歷史悠久的名貴藥材[2-3]。扁莖黃芪根系深長,植株高大,耐寒、耐旱、耐瘠薄、生命力頑強,能防風固沙,尤其適于干旱少雨地區種植,頗具生態價值[4]。扁莖黃芪生物產量高,植株富含營養,可作為優質的飼草料及果園綠肥作物[5-7]。目前,關于扁莖黃芪的研究多集中于牧草引種[8]、綠肥應用[9-10]、藥理作用分析[11-12]、偽品鑒定[13]和多倍體誘導[14-15]等方面,其分子水平的研究未見報道,遺傳信息還有待探索。

基于高通量測序技術的轉錄組研究能夠在物種基因組學背景空白的情況下通過測序獲得大量遺傳信息,已逐漸應用于非模式生物[16]。我國大多數藥用植物遺傳背景復雜,普遍缺乏基因組信息,制約中藥的發展與利用。近年來,轉錄組測序技術已廣泛應用于藥用植物的多個領域研究,包括功能基因挖掘、次生代謝網絡調控和分子標記開發等方面[17]。郝大程等[18]利用 Illumina HiSeq平臺獲得中藥材虎杖根的轉錄組數據,注釋Unigene 86 418個,發現144個可能參與蒽醌類等藥用物質生物合成的Unigene,其結果可用于蓼屬植物農藝性狀改良、次生代謝物產量等研究;齊琳潔等[19]利用黃芩轉錄組測序結果挖掘到9對穩定、清晰且多態性好的SSR引物用于分析不同產地黃芪的遺傳多樣性,為黃芩的品種選育、種質資源保護等提供了依據;康恒等[20]利用粗莖秦艽的根、莖等組織的轉錄組測序結果,結合qRT-PCR對可能參與環烯醚萜類合成的Unigene進行驗證,發現涉及的HMGS、DXS、MCS等7個基因均在地上部分表達量較高,為研究藥用植物累積次生代謝規律奠定了基礎。

本研究利用Illumina HiSeq平臺對扁莖黃芪幼苗葉片的轉錄本進行測序,建立扁莖黃芪的轉錄組數據庫,對測序結果進行富集分類、功能注釋、代謝通路及SSR位點分析,旨在為開展扁莖黃芪有效藥用成分利用、真偽鑒定、遺傳多樣性分析、生物功能基因挖掘及利用等方面提供理論依據。

1 材料和方法

1.1 材料及RNA文庫構建

植物材料扁莖黃芪(編號20ZY01)幼苗采自巴彥淖爾市農牧業科學研究院種植基地。取新鮮幼苗的嫩葉,蒸餾水洗凈后吸干表面水分,迅速于液氮中冷凍后置于-80 ℃冰箱中保存,送至北京組學生物科技公司采用TRIzol法提取總RNA,利用Nanodrop 2000檢測RNA純度(OD260/280>2.0)、Agilent 2100檢測RNA完整性(RIN>8.5),合格后構建扁莖黃芪cDNA文庫。

1.2 轉錄組測序及數據組裝

利用Illumina HiSeq平臺對扁莖黃芪幼苗葉片轉錄組進行測序,嚴格控制測序得出的原始數據質量,對所獲得的高質量序列進行堿基質量評估和統計。利用Trinity軟件完成數據組裝,獲得可靠的Unigene(單基因簇)和Transcript(轉錄本),分別統計其長度、平均長度及N50(拼接所得序列從大到小排序累加,長度超過總長1/2時所累加序列的長度),評價數據組裝質量。

1.3 轉錄組功能注釋

使用Blast軟件將扁莖黃芪Unigene序列與Nr、GO、COG、KOG、KEGG、Swiss-Prot數據庫比對,統計Unigene在6大數據庫的注釋結果。

1.4 SSR特征分析

利用MISA軟件對獲得的扁莖黃芪Unigene進行SSR位點發掘,篩選單堿基至六堿基類型以最少重復次數依次為10,6,5,5,5,5為標準,進一步對篩選到的SSR位點進行特征分析。

2 結果與分析

2.1 扁莖黃芪轉錄組測序及數據組裝

扁莖黃芪幼苗葉片的轉錄組測序共獲得33 217 041個reads,共計9 965 112 300 bp,其中42.74%為G、C堿基,Q20、Q30的堿基數分別占98.03%,93.89%(表1),說明扁莖黃芪轉錄組測序質量較高。

表1 測序數據質量分析Tab.1 Quality analysis of sequencing data

利用Trinity軟件對扁莖黃芪轉錄組測序數據進行拼接、組裝,共獲得Transcript 21 565條,序列總長27 333 335 bp,平均長度1 267 bp,N50為2 079 bp;獲得Unigene的數量為19 280條,總長23 472 470 bp,平均長度1 217 bp,N50為2 094 bp(表2)。Transcript、Unigene的N50分別是其平均長度的1.64,1.72倍,說明數據的組裝完整度較高。

表2 扁莖黃芪轉錄本和單基因簇統計分析Tab.2 The statistics analysis of Astragalus complanatus transcript and Unigene

2.2 扁莖黃芪Unigene的功能注釋

利用Blast軟件將組裝獲得的19 280條扁莖黃芪Unigene與6個不同功能領域的數據庫比對(圖1),得到扁莖黃芪較為全面的基因信息,共有12 715條Unigene獲得注釋,占總Unigene的65.95%。其中,Nr數據庫注釋數目最多,有12 541條,占總Unigene的65.05%;其次依次為Swiss-Prot數據庫(注釋Unigene 10 120條,占比52.49%)、GO數據庫(注釋Unigene 9 412條,占比48.81%)、KEGG數據庫(注釋Unigene 8 953條,占比46.44%)和KOG數據庫(注釋Unigene 7 494條,占比38.87%);COG數據庫注釋Unigene最少(5 052條),占比26.20%。

圖1 扁莖黃芪Unigene的注釋統計Fig.1 The statistics analysis of annotated Unigene in Astragalus complanatus

2.3 扁莖黃芪Unigene的Nr數據庫功能注釋

經比對,扁莖黃芪12 541條Unigene在Nr數據庫中得到注釋。將注釋結果進行統計及物種比對,繪制扁莖黃芪同源物種分布圖(圖2),結果發現扁莖黃芪Unigene主要注釋到豆科植物,共占比86.26%。其中,鷹嘴豆(Cicerarietinum)注釋比最高,為31.49%;其次依次為蒺藜苜蓿(Medicagotruncatula)和相思子(Abrusprecatorius),注釋比分別為14.50%和11.65%;其余有一定匹配度的豆科植物有紅三葉(Trifoliumpratense)(5.63%)、地三葉草(Trifoliumsubterraneum)(5.60%)、木豆(Cajanuscajan)(4.97%)、大豆(Glycinemax)(4.69%)、黧豆(Mucunapruriens)(3.47%)、野大豆(Glycinesoja)(2.60%)和羽扇豆(Lupinusangustifolius)(1.66%)。

圖2 扁莖黃芪Unigene的Nr數據庫匹配物種分布Fig.2 Matched species distribution of Astragalus complanatus Unigene in Nr database

2.4 扁莖黃芪Unigene的GO分類

將扁莖黃芪所有Unigene在GO數據庫中進行分類注釋,獲得注釋Unigene 9 412條、注釋信息548 323個,分為細胞組分、分子功能和生物進程3個大類,涉及52個功能亞類(圖3)。其中,細胞組分類別注釋Unigene數目最多(22 522條),包含15個亞類,主要是細胞(4 697個)、細胞部分(4 660個)、膜(3 394個)和細胞器(3 327個),分別占細胞組分類別的20.86%,20.69%,15.07%,14.77%;分子功能類別注釋Unigene 10 374條、亞類15個,主要GO功能是催化活性(4 544條)和綁定(4 452條),分別占分子功能類的43.80%,42.91%;生物進程類別注釋Unigene 15 415條,分為22個亞類,主要GO功能是代謝過程(4 813個)、細胞進程(4 598個)、生物調控(1 631個)和定位(1 096個)。

1.胞外區;2.細胞;3.類核;4.膜;5.病毒體;6.細胞連接;7.膜封閉腔;8.含蛋白復合物;9.細胞器;10.胞外區部分;11.細胞器部分;12.病毒部分;13.膜部分;14.細胞部分;15.超分子復合體;16.催化活性;17.結構分子活性;18.轉運蛋白活性;19.綁定;20.抗氧化活性;21.蛋白標簽;22.運貨受體活性;23.蛋白質折疊伴侶;24.翻譯調節活性;25.營養儲存活性;26.分子轉導活性;27.分子功能調節劑;28.分子載體活性;29.傳譯調節活性;30.小分子傳感器活性;31.繁殖;32.細胞殺傷;33.免疫過程;34.代謝過程;35.細胞群增殖;36.細胞進程;37.碳利用;38.氮利用;39.生殖過程;40.生物黏附;41.信號傳導;42.多細胞生物進程;43.發育進程;44.生長;45.轉運;46.節律進程;47.應激反應;48.定位;49.多有機體進程;50.生物調控;51.細胞組分及來源;52.解毒。

2.5 扁莖黃芪Unigene的KOG數據庫注釋

扁莖黃芪Unigene與KOG數據庫比對后獲得注釋Unigene 7 494條,涉及KOG注釋信息8 315個。獲得注釋的25個功能中,一般功能預測注釋Unigene最多,有1 551條,占比18.65%;其次依次為翻譯后修飾、蛋白轉運和信號傳導機制功能,注釋Unigene 分別為926,683條,占比11.14%和8.21%;注釋Unigene最少的功能為細胞活性,僅有3條,占比0.04%(表3)。

表3 扁莖黃芪Unigene的KOG數據庫功能分類Tab.3 KOG function categories of Astragalus complanatus Unigene

2.6 扁莖黃芪的KEGG數據庫注釋

扁莖黃芪轉錄組中共有8 953條Unigene在KEGG數據庫中獲得注釋,涉及6個大類通路,包含43個亞類(圖4),按照注釋Unigene數量由高到低分別是新陳代謝類(Unigene 4 373條)、人類疾病類(Unigene 3 567條)、有機系統類(Unigene 2 319條)、遺傳信息處理類(Unigene 1 930條)、環境信息處理類(Unigene 1 750條)和細胞過程類(Unigene 1 170條)。亞類主要集中于病毒、細菌、寄生感染性疾病(Unigene 2 097條)、信號轉導(Unigene 1 668條)和碳水化合物代謝(Unigene 1 489條)。8 953條Unigene共獲得15 528個KEGG注釋信息,涉及354條代謝通路,按照注釋Unigene數量由高到低排序,以注釋Unigene數量大于200條為標準,得到10條扁莖黃芪KEGG富集顯著的代謝通路(表4),其中注釋Unigene數量最多的通路為嘌呤代謝。

1.耐藥性:抗菌;2.耐藥性:抗腫瘤藥;3.心血管病;4.免疫疾病;5.藥物依賴;6.內分泌和代謝疾病;7.癌癥:特定類型;8.神經退行性疾病;9.癌癥:總覽;10.感染性疾病:寄生;11.感染性疾病:細菌;12.感染性疾病:病毒性;13.人類疾病類;14.感覺系統;15.開發與再生;16.循環系統;17.排泄系統;18.消化系統;19.老化;20.神經系統;21.內分泌系統;22.免疫系統;23.有機系統類;24.細胞群落-原核生物;25.細胞運動;26.細胞群落-真核生物;27.細胞生長與死亡;28.運輸和分解代謝;29.細胞過程類;30.信號分子與相互作用;31.膜運輸;32.信號轉導;33.環境信息處理類;34.復制和修復;35.轉錄;36.折疊、分類和降解;37.翻譯;38.遺傳信息處理類;39.萜類和聚酮化合物的代謝;40.異生物素的生物降解和代謝;41.其他氨基酸的代謝;42.糖的生物合成與代謝;43.輔助因子和維生素的代謝;44.核苷酸代謝;45.能量代謝;46.脂質代謝;47.氨基酸代謝;48.碳水化合物代謝;49.新陳代謝類。

表4 扁莖黃芪轉錄組Unigene數量最多的10個通路注釋Tab.4 Top ten metabolic pathways involving Astragalus complanatus Unigene

2.7 扁莖黃芪SSR特征分析

在扁莖黃芪19 280條Unigene中共搜索到SSR位點5 849個,SSR出現頻率為30.34%、平均距離4.01 kb。扁莖黃芪SSR位點豐富,6種堿基類型全部出現,以單堿基重復類型數量最多,有2 372個,占比40.56%,主要重復基元是A/T;三堿基和雙堿基類型數量占比次之,依次為28.62%和26.55%,其中AAG/CTT和AG/CT重復基元出現頻率較高;四堿基、五堿基、六堿基重復類型占比較低,僅占總數的4.27%(圖5)。扁莖黃芪SSR重復單元數主要分布在5~11次,約占總SSR的78.1%。單堿基SSR主要分布在10~11次(1 490個,占總SSR的25.47%);雙堿基SSR主要分布在6~8次(775個,占總SSR的13.25%);三堿基SSR主要分布在5~8次(1 556個,占總SSR的26.60%);四、五、六堿基SSR主要分布在5~6次,重復次數較少(表5)。

圖5 扁莖黃芪SSR類型及主要基元統計Fig.5 The statistics of SSR types and main unit in Astragalus complanatus

表5 扁莖黃芪轉錄組 Unigene SSR 分析Tab.5 SSR analysis of Astragalus complanatus transcriptome Unigene

3 結論與討論

了解扁莖黃芪的分子生物學背景、分析其基因組信息,對扁莖黃芪資源的開發利用、次生代謝物研究和真偽鑒定等方面均能夠起到良好的推動作用,同時也能夠為其藥用部位沙苑子的研究提供基礎數據。本研究利用Illumina HiSeq平臺對扁莖黃芪幼苗葉片進行轉錄組測序,獲得了9 965 112 300 bp的序列信息,組裝后得到19 280條Unigene,GC含量達40%以上,Q20、Q30比例均高于90%,說明測序質量和組裝效果較好,為開展數據統計分析奠定了基礎。經與六大公共數據庫比對發現,有近70%的Unigene(12 715條)獲得注釋,為研究扁莖黃芪基因功能提供了依據。另外,仍有近30%的扁莖黃芪Unigene未獲得注釋,可能與數據庫信息不健全、存在非蛋白質的短序列和扁莖黃芪的特有基因有關。

本研究表明,扁莖黃芪Unigene在Nr數據庫獲得最高比例注釋,注釋到的同源物種主要為豆科植物,說明這些豆科植物同源性較高,基因組間存在共性或近似信息。其中扁莖黃芪在鷹嘴豆、蒺藜苜蓿和相思子物種中比對的Unigene數目最多,占比分別為31.49%,14.50%,11.65%。扁莖黃芪與鷹嘴豆、蒺藜苜蓿和相思子同屬豆科蝶形花亞科,這3個物種的基因組信息能夠為研究扁莖黃芪基因功能提供重要參考依據。同時,隨著扁莖黃芪轉錄組數據的挖掘與分析,豐富了豆科植物的基因組信息,為其近緣物種的功能基因研究提供參考依據。扁莖黃芪Unigene的GO及KOG功能類群全面、KEGG代謝通路豐富,分別注釋到52個GO功能、25個KOG功能及354個KEGG代謝通路中,且均存在一條Unigene具有多個注釋信息,為全面挖掘扁莖黃芪基因的不同功能奠定基礎。在GO、KOG和KEGG數據庫中比對的扁莖黃芪Unigene數目最多的功能、通路分別為代謝過程、一般功能預測和嘌呤代謝,說明扁莖黃芪幼苗期葉片細胞新陳代謝活躍,基因表達豐富。另外,扁莖黃芪Unigene在KEGG數據庫中較為集中于人類疾病類別,特別是在感染性疾病中注釋數目較多,說明除種子沙苑子具有藥用價值外,扁莖黃芪植株部位也可能含有藥用成分,這與薛利娟等[21]的研究結果一致,為扁莖黃芪的植株利用及藥用價值研究提供新思路。

本研究利用MISA軟件共得到5 849個扁莖黃芪SSR位點,SSR出現頻率為30.34%,略低于蒙古黃芪(31.26%),遠高于膜莢黃芪(13.42%)[22-23]。扁莖黃芪基因組內SSR位點豐富、類型多樣化,單堿基到六堿基重復全部出現,其中單堿基、雙堿基、三堿基為主要重復類型,占比約95%。主要基元類型分別為A/T、AG/CT和AAG/CTT,與川芎[24]、三叉苦[25]及天目鐵木[26]等中草藥材的SSR位點信息相似,這些標記的開發為挖掘扁莖黃芪新基因提供了研究基礎。

本研究利用RNA-Seq技術對扁莖黃芪幼苗葉片進行測序并獲得了大量扁莖黃芪功能表達基因和遺傳信息,同時挖掘到豐富的SSR標記位點,為扁莖黃芪的分子育種、藥理研究、抗逆基因挖掘、遺傳多樣性分析、真偽鑒別等方面提供科學依據。

本研究對扁莖黃芪幼苗葉片進行轉錄組測序,獲得了9 965 112 300 bp的高質量序列信息。將扁莖黃芪Unigene在六大公共數據庫進行比對及功能注釋,發現扁莖黃芪與鷹嘴豆親緣關系最近,GO功能、KOG功能及KEGG通路均主要集中于代謝,說明扁莖黃芪幼苗新陳代謝旺盛。同時扁莖黃芪Unigene代謝通路在感染性疾病類別通路中也較為集中,表明扁莖黃芪的植株也可能含有藥用成分。扁莖黃芪的SSR位點豐富,以單堿基為主,主要基元類型是A/T、AG/CT和AAG/CTT。

猜你喜歡
數據庫功能
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
關于非首都功能疏解的幾點思考
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
懷孕了,凝血功能怎么變?
媽媽寶寶(2017年2期)2017-02-21 01:21:24
“簡直”和“幾乎”的表達功能
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
中西醫結合治療甲狀腺功能亢進癥31例
主站蜘蛛池模板: 欧美激情综合| 久久综合伊人 六十路| 亚洲国产精品VA在线看黑人| 国精品91人妻无码一区二区三区| 91区国产福利在线观看午夜| 国产极品美女在线播放| 国产另类乱子伦精品免费女| 又黄又湿又爽的视频| 国产真实乱人视频| 国产va视频| 亚洲男人在线| 亚洲欧美日韩中文字幕一区二区三区| 国产精品欧美在线观看| 精品国产电影久久九九| 色综合成人| 久久国产精品无码hdav| 九色综合视频网| 综合亚洲色图| 亚洲高清在线播放| 久久综合色88| 免费一看一级毛片| 波多野结衣二区| 狠狠色丁香婷婷综合| 国产一区二区三区免费| 国产超薄肉色丝袜网站| 狠狠ⅴ日韩v欧美v天堂| 精品久久香蕉国产线看观看gif| 成色7777精品在线| 国产精品区视频中文字幕 | 无码一区18禁| 久久99精品久久久大学生| 亚洲VA中文字幕| 欧美第一页在线| 亚洲精品在线91| 国产后式a一视频| 污网站免费在线观看| 在线中文字幕日韩| 亚洲国产欧美国产综合久久 | 亚洲另类国产欧美一区二区| 麻豆精品视频在线原创| AV色爱天堂网| 欧美一道本| 久久久精品久久久久三级| 97国产一区二区精品久久呦| 亚洲中文字幕23页在线| 亚洲天堂久久| 欧美自慰一级看片免费| 91精品国产自产91精品资源| 欧美日韩v| 中文字幕亚洲乱码熟女1区2区| 免费观看男人免费桶女人视频| 国产婬乱a一级毛片多女| 无码专区国产精品一区| 91黄视频在线观看| 欧美精品伊人久久| 全部免费毛片免费播放| 露脸国产精品自产在线播| 国产精品第| 99久久亚洲精品影院| 亚洲有码在线播放| 成人国产精品视频频| 69综合网| 亚洲第一av网站| 亚洲国产中文精品va在线播放 | 麻豆精品在线| 久草美女视频| 无码中文AⅤ在线观看| 视频一本大道香蕉久在线播放| 毛片免费在线| 亚洲国产亚洲综合在线尤物| 精品综合久久久久久97| 日韩毛片视频| 国产精品夜夜嗨视频免费视频| 欧美日韩中文字幕二区三区| 在线观看的黄网| 日本一区二区不卡视频| 国产熟女一级毛片| 国产你懂得| 99成人在线观看| 精品无码日韩国产不卡av| 天天综合网色中文字幕| 色综合五月|