999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高通量測序的建蘭轉錄組信息分析

2023-06-15 05:27:43樊榮輝林兵吳建設鐘淮欽
福建農業科技 2023年3期

樊榮輝 林兵 吳建設 鐘淮欽

鐘淮欽,1979年出生,碩士,副研究員,福建省農業科學院青年英才,主要從事蘭科植物種質資源鑒定評價、新品種選育與示范推廣等工作。主持福建省種業創新與產業化工程、福建省人民政府-中國農業科學院“5511”協同創新工程、福建省自然科學基金、福建省林業種苗科技攻關等項目20多項,作為骨干參與國家科技支撐計劃、福建省科技重大專項(專題)等項目30多項;獲福建省科技進步三等獎2項(第1)、福建省農業科學院科技獎特等獎1項(第1);主持選育的4個品種獲植物新品種權授權,參與選育的9個品種通過省級審(認)定,獲授權國家發明專利6件;在《BMC Plant Biology》等刊物上發表論文28篇,2篇論文獲福建省自然科學優秀論文三等獎。現任福建省特色花卉工程技術研究中心主任、福建省農業科學院作物研究所花卉研究室主任,兼任福建省園藝學會常務理事、福建農林大學碩士生校外導師等。

摘 要:為獲得建蘭轉錄組信息,以花發育3個時期為研究對象,進行轉錄組測序、組裝、注釋及差異基因分析。結果表明:共獲得120.86 Gb clean reads,組裝得到56804個Unigenes,平均長度為1502 bp,其中34324條Unigenes獲得注釋,占所有Unigene的60.43%。33908條Unigenes在NR數據庫中得到注釋,與石斛的匹配度最高;18459條Unigene被注釋到GO數據庫中的50個分支;在KEGG中共注釋到13145條Unigene,11662條注釋到129個KEGG通路中。差異基因聚類分析表明,7873個差異基因,其中3934個上調表達,3939個下調表達。差異基因的KEGG注釋中,花香相關途徑差異基因較多。利用MISA軟件篩選得到19737個SSR位點,其中單核苷酸重復SSRs數量最多,有13291個,二核苷酸重復次之,有3374個。本研究為后期建蘭基因功能驗證及次生代謝解析提供基礎數據。

關鍵詞:建蘭;轉錄組;生物信息學分析;功能注釋

中圖分類號:S 682.31? ?文獻標志碼:A? ?文章編號:0253-2301(2023)03-0001-08

DOI: 10.13651/j.cnki.fjnykj.2023.03.001

Abstract: In order to obtain the transcriptome group information of Cymbidium ensifolium, the transcriptome sequencing, assembling, annotation and differential gene analysis were carried out by taking the three stages of flower development as the research objects. The results showed that a total of 120.86 Gb clean reads were obtained, and 56804 Unigenes were assembled, with a mean length of 1502 bp. Among them, 34324 Unigenes were annotated, accounting for 60.43% of all Unigenes. 33908 Unigenes were annotated in the NR database, which had the highest matching degree with Dendrobium nobile. 18459 Unigenes were annotated to 50 branches in the GO database. A total of 13145 unigenes were annotated in KEGG and 11662 unigenes were annotated to 129 KEGG pathways. The cluster analysis of differential genes showed that there were 7873 differential genes, among which 3934 showed upregulated expression and 3939 showed downregulated expression. In the KEGG annotation of differential genes, there were more differential genes in the related pathways of flower scent. A total of 19737 SSR loci were screened by MISA software, among which the number of SSRs with single nucleotide repeats was the highest (13291), followed by that with dinucleotide repeats (3374). This study could provide basic data for the gene functional verification and secondary metabolism analysis of Cymbidium ensifolium in the later stage.

Key words: Cymbidium ensifolium; Transcriptome group; Bioinformatics analysis; Functional annotation

建蘭Cymbidium ensifolium又稱四季蘭,是國蘭主要種類之一,其株型飄逸、花香清幽、花色素雅、花期長,是珍貴的蘭花品種。建蘭以其主產地為福建命名,是唯一以省份命名的國蘭[1]。通過轉錄組測序和生物信息學分析得到建蘭遺傳信息,以研究建蘭次生代謝途徑關鍵酶基因和分子標記等,為后續建蘭基礎研究和開發應用提供基礎數據。

轉錄組測序獲得的結果可以反映生物體某一組織在特定的狀態下基因的表達情況[2],是非模式植物研究的有用手段[3]。近年來,轉錄組測序研究基因差異篩選和分子標記開發方面廣泛應用[4-5],如Yue等[6]對姜花Hedychium coronarium進行轉錄組分析,研究花發育過程中萜類代謝途徑基因表達情況;Xu等[7]對百合Lilium ‘Tiny Padhye花被片發育過程中顏色變化進行轉錄組信息分析,確定顏色變化的主控基因。本研究對建蘭花發育過程花朵進行轉錄組測序,為挖掘次生代謝產物合成及其調控的相關基因等研究提供數據。

1 材料與方法

1.1 試驗材料

福建省農業科學院花卉種質資源圃種植的建蘭(3年生),品種為素君荷,采集花發育的3個不同時期,置液氮中冷凍,-80℃儲存。 3個花發育時期分別為:花蕾初期(Early bud stage)、花蕾中期(Midbud stage)、始花期(Anthesis stage)。

1.2 建蘭3個時期花RNA的提取

收集花發育的3個時期的整朵花進行轉錄組測序。使用通用RNA提取試劑盒(百泰克)提取總RNA。應用NanoDrop 2000 UVvis分光光度計(Thermo Scientific,USA)和Agilent 2100生物分析儀(Agilent Technologies,USA)進行RNA質量和濃度測定。

1.3? 建蘭基因文庫構建和轉錄組測序

文庫構建由北京百邁克生物科技有限公司(中國北京)進行。基于邊合成邊測序(Sequencing By Synthesis,SBS)技術,使用Illumina Hiseq高通量測序平臺對cDNA文庫進行測序。

1.4 建蘭基因組數據組裝和功能注釋

收集3組樣品的raw reads,并去除低質量reads。 應用Trinity軟件[8]通過重疊區域將高質量clean reads延伸為更長的conings,通過對端連接進一步組裝成transcripts,然后聚類成unigenes。 通過序列相似性,將所有組裝的unigenes與公共數據庫進行比對,E值閾值為10-5。八大數據庫包括Nr(NCBI nonredundant protein)、Nt(nonredundant nucleotide databases)、GO、KOG(eukaryotic orthologs groups)、KEGG、clusters of COG(orthologous groups of proteins)、Pfam(SwissProt protein database,protein family)和eggNOG(orthologous groups of genes)。

1.5 建立基因文庫差異基因聚類及KEGG分析

應用FPKM(fragments per kilobase of transcript per million mapped reads)計算每個基因的表達計數(read counts)。應用DESeq軟件鑒定文庫中的差異基因。絕對錯誤率<0.01和倍數變化值≥2作為閾值以確認表達水平的顯著差異。

對篩選出的差異表達基因做層次聚類分析,將具有相同或相似表達行為的基因進行聚類,用于展示不同試驗條件下基因集的差異表達模式。不同的列代表不同的樣品,不同的行代表不同的基因。顏色代表了基因在樣品中的表達量FPKM以2為底的對數值。

KEGG數據庫是關于Pathway的主要公共數據庫,對差異基因進行KEGG注釋分析。

1.6 建立轉錄組簡單重復序列(SSRs)特征檢測

使用MISA軟件對建蘭轉錄組進行SSRs搜索,對Unigenes進行SSRs檢測。

2 結果與分析

2.1 建蘭基因文庫構建和轉錄組測序

對建蘭花發育過程中的花蕾前期、花蕾中期、盛花期整朵花進行轉錄組測序,共得到120.86 Gb clean reads,各樣品Q30堿基百分比均不小于93.29%,GC含量為46.74%,說明測序結果質量良好,可用于后續分析。

2.2 建蘭基因組數據組裝和功能注釋

2.2.1 數據組裝 通過組裝獲得56804個Unigenes,平均長度為1502 bp,N50為2526 bp,其中27086條Unigenes長度在1000 bp以上,占全部Unigenes的47.7%,14931條Unigenes長度超過2000 bp,占全部Unigenes的26.3%,說明組裝的轉錄本質量較高(圖1)。

2.2.2 功能注釋 將組裝得到的Unigenes進行八大數據庫注釋,共有34324條 Unigenes獲得注釋,占所有Unigene的60.43%。其中33908 條Unigenes在Nr數據庫中得到注釋,占所有Unigene的59.69%;在GO數據庫中獲得注釋的Unigenes為18459條,注釋率為32.50%;13145條Unigenes在KEGG中注釋,占比為23.14%(表1)。

在Nr 數據庫中,轉錄組數據與石斛Dendrobium catenatum的同源數量最多,達54.48%;其次是蝴蝶蘭Phalaenopsis equestris,同源比例達到19.88%;再次是玉米Zea mays,同源性達13.46%;與深圳擬蘭Apostasia shenzhenica和葡萄Vitis vinifera的同源性相對較低,分別為1.5%和0.58%。有10.11%的Unigene屬于其他物種(圖2)。

通過GO數據庫比對,共有18459個Unigene獲得注釋,這些Unigene分布在細胞組分(Cellular component)、分子功能(Molecular function)、生物過程(Biological process) 3個大類和 50個小類中。細胞組分中,細胞(Cell)和細胞部分(Cell part)Unigene數量最多;分子功能中,催化活性(Catalytic activity)和結合(Binding)基因數量最多;生物進程中,參與代謝過程(Metabolic process)和細胞過程(Cellular process)的Unigene數量最多(圖3)。

KEGG通路分析中,共注釋到13145條Unigene,其中11662條注釋到129個KEGG通路中。糖酵解(Glycolysis)代謝通路的Unigene數量最多,有482條;其次是檸檬酸循環(Citrate cycle)和磷酸戊糖途徑(Pentose phosphate pathway),分別有442條和394條(表2)。

在此基礎上進一步分析KEGG次生代謝通路,共有16個通路,結果見表3。這些次生代謝通路中,咖啡因代謝(Caffeine metabolism)的Unigene 數量最多,有168條;其次是苯丙氨酸代謝(Phenylalanine metabolism)通路,有107條;卟啉與葉綠素代謝(Porphyrin and chlorophyll metabolism)、萜類骨架生物合成(Terpenoid backbone biosynthesis)、吲哚生物堿生物合成(Indole alkaloid biosynthesis)和單萜生物合成(Monoterpenoid biosynthesis)分別有54、53、53和 53條,這些數據為進一步研究建蘭次生代謝途徑及分子機制提供了基礎。

2.3 建蘭基因文庫差異基因聚類及KEGG分析

采用主流的層次聚類對花蕾前期和盛花期基因的FPKM值進行聚類分析,共得到7873個差異基因,其中上調表達的有3934個,下調表達的有3939個,說明隨著花的發育可能有更復雜的生物代謝(圖4)。

對差異表達基因的Pathway注釋分析有助于進一步解讀基因的功能。隨著花的發育,核糖體(Ribosome)、氨基酸的生物合成(Biosynthesis of amino acids)和植物激素信號轉導(Plant hormone signal transduction)差異基因最多,分別有118、84和83個。說明隨著花的發育這3個代謝途徑更活躍。在次級代謝中,苯異丙烷生物合成(Phenyipropanoid biosynthesis)、脂肪酸代謝 (Fatty acid metabolism)和α亞麻酸代謝(alphaLinolenic acid metabolism) 差異及基因最多,說明隨著花的發育,花香相關代謝被啟動(圖5)。

2.4 建蘭轉錄組SSRs特征分析

Unigene序列中,利用MISA軟件篩選得到19737個SSRs位點,其中單核苷酸重復 SSRs 數量最豐富,有13291個,占總量的67.34%;二核苷酸重復次之,有3374個,占百分比為17.09%; 三核苷酸重復有1942個(9.84%);復合型SSRs和有重疊的復合型SSRs分別為 999個和 21個,四核苷酸重復、五核苷酸重復和六核苷酸重復分別為91、7和11個(圖6)。

3 討論與結論

非模式植物中,通過高通量測序技術獲得該物種基因序列,對鑒定基因功能具有重要作用[9-11]。本研究對建蘭的轉錄組數據進行分析,得到120.86 Gb Clean reads,組裝獲得56804個Unigenes,平均長度為1502 bp。N50值越大,說明長片段越多,組裝效果越好[12],本研究的N50為2526 bp,說明組裝結果良好,這為后續基因注釋和差異表達分析提供良好的數據基礎。

KEGG數據庫是能系統分析基因的代謝途徑及其功能的數據庫,在建蘭KEGG注釋中共發現129條代謝通路。其中14條為次級代謝通路,隨著花的發育,這些基因與建蘭的咖啡因、苯丙氨酸、葉綠素和萜類等次生代謝活動有關,為建蘭次生代謝分子生物學研究奠定基礎。差異基因的KEGG數據分析表明,隨著花的發育,花香相關代謝差異基因數多,代謝活躍,可能隨著花的發育,花香揮發物釋放量有顯著變化。

簡單重復序列SSRs是一類由幾個核苷酸(一般為1~6個)為重復單位組成的長達幾十個核苷酸的串聯重復序列,廣泛分布于真核生物基因組中[13-15]。本研究使用軟件MISA篩選得到19737個SSRs位點,其中單核苷酸為主要重復類型,其次為二核苷酸重復和三核苷酸重復。SSRs標記信息為后續建蘭種質資源鑒定、遺傳多樣性分析提供基礎。

參考文獻:

[1]劉清涌.中國蘭花名品珍品鑒賞圖典[M].福州:福建科學技術出版社,2004.

[2]WU T Q, LUO S B, WANG R, et al.The first Illuminabased de novo transcriptome sequencing and analysis of pumpkin (Cucurbita moschata Duch.) and SSR marker development[J].Mol Breeding,2014,34(3):1437-1447.

[3]WARD J A,PONNALA L,WEBER C A.Strategies for transcriptome analysis in nonmodel plants[J].Am J Bot,2012,99(2):267-276.

[4]FAN R, CHEN Y, YE X, et al.Transcriptome analysis of Polianthes tuberosa during floral scent formation[J].PLoS ONE,2018,13(9):e0199261.

[5]石桃雄,黎瑞源,黃娟,等.甜蕎根轉錄組SSR位點特征分析[J].江西農業學報,2021,33(8):1-5.

[6]YUE Y,YU R,FAN Y.Transcriptome profiling provides new insights into the formation of floral scent in Hedychium coronarium[J].BMC Genomics,2015,16:470.

[7]XU L,YANG P,FENG Y,et al.Spatiotemporal transcriptome analysis provides insights into bicolor tepal development in Lilium “Tiny Padhye”[J].Front Plant Sci, 2017,8:398.

[8]LANGMEAD B, TRAPNELL C, POP M, et al.Ultrafast and memoryefficient alignment of short DNA sequences to the human genome[J].Genome Biology Italic,2009,10(3):25.

[9]陳藝荃,方能炎,葉秀仙,等.基于轉錄組測序的文心蘭花香形成分析[J].核農學報, 2022, 36(3): 578-588.

[10]林兵,陳藝荃, 鐘淮欽,等.荷蘭鳶尾'玉妃'花色變異關鍵結構基因分析[J].中國農業科學,2021,54(12):2644-2652.

[11]FAN R H,LIN B,FANG N Y,et al.Transcriptomesequencing analyses reveal flower color formation in Strelitzia reginae[J].Biologia plantarum,2020,64:717-724.

[12]HUANG M, FAN R, Ye X, et al.The transcriptome of flower development in Freesia hybrida provides insight into floral scent formation[J].Plant growth regulation,2018,86(1):93-104.

[13]劉藝平,倪夢輝,吳芳芳,等.荷花花器官性狀與SSR標記的關聯分析[J].園藝學報,2023,50 (1):103-115.

[14]吳超,郭方其,徐丹彬,等.多頭菊頭狀花序轉錄組SSR特點分析[J].分子植物育種,2022,20(18):6067-6075.

[15]陳岳,張微微,莫海波,等.ESTSSR標記構建蓮(Nelumbo Adans.)遺傳連鎖圖譜[J].分子植物育種, 2017, 15(6): 2265-2273.

(責任編輯:柯文輝)

主站蜘蛛池模板: 国产精品久久久久久久伊一| 天天操精品| 国产精品美人久久久久久AV| 日韩精品少妇无码受不了| 91精品国产福利| 十八禁美女裸体网站| 无码视频国产精品一区二区 | 日韩欧美国产三级| 亚洲成人播放| 国内a级毛片| 在线a网站| 香蕉久久国产精品免| 午夜日本永久乱码免费播放片| 亚洲视频二| 久久综合丝袜日本网| 午夜精品久久久久久久99热下载| 国产成人8x视频一区二区| 在线观看国产小视频| 婷婷色婷婷| 99无码中文字幕视频| 亚洲天堂成人在线观看| 亚洲成人黄色在线观看| 精品综合久久久久久97超人该| 日韩东京热无码人妻| 99热这里只有精品2| AV在线天堂进入| 天堂网亚洲系列亚洲系列| 亚洲无码视频一区二区三区 | 波多野结衣一区二区三区四区视频| 中国精品自拍| 人人看人人鲁狠狠高清| 国产第四页| 性欧美在线| 特黄日韩免费一区二区三区| 精品午夜国产福利观看| 国产迷奸在线看| 国产精品美人久久久久久AV| 九九这里只有精品视频| 亚洲精品第五页| 无码一区二区波多野结衣播放搜索| 亚洲视屏在线观看| 午夜福利网址| 中文字幕在线观看日本| 欧美国产另类| 国产一区二区色淫影院| 日韩欧美国产精品| 欧美日韩国产在线人成app| 人妻免费无码不卡视频| 成年人国产视频| 人妻无码一区二区视频| 欧美综合区自拍亚洲综合天堂 | 91精选国产大片| 国产激情在线视频| a天堂视频| 毛片久久网站小视频| 蜜臀AVWWW国产天堂| 无码国产伊人| 99精品在线看| 色亚洲成人| 中文字幕不卡免费高清视频| 国产日本视频91| 丝袜无码一区二区三区| 亚洲AV电影不卡在线观看| 色网站在线视频| 青青久久91| 免费a级毛片18以上观看精品| 中文字幕亚洲专区第19页| 97国产精品视频自在拍| 中文天堂在线视频| 又黄又湿又爽的视频| 久久黄色免费电影| 四虎在线观看视频高清无码| 久久99热这里只有精品免费看 | 国产亚洲精品91| 有专无码视频| 精品久久高清| 国产97色在线| 成人免费网站久久久| 国产剧情国内精品原创| 亚洲一区二区三区在线视频| 九色国产在线| 亚洲无码视频一区二区三区|