*"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?朱立強, 李慶華, 張彥婷, 朱相展, 關方
1)鄭州大學第二附屬醫院檢驗科 鄭州 450014 2)鄭州大學生命科學學院 鄭州 450001
基于RNA-seq的杜氏鹽藻全轉錄組測序與分析>*

1)鄭州大學第二附屬醫院檢驗科 鄭州 4500142)鄭州大學生命科學學院 鄭州 450001
關鍵詞杜氏鹽藻;轉錄組;RNA-seq
摘要目的:利用RNA-seq技術對杜氏鹽藻細胞的全部轉錄本進行測序、功能分析。方法:提取杜氏鹽藻總RNA,反轉錄得cDNA,在Illumina平臺上進行測序,經拼接、組裝、聚類后獲得全部unigene,并將所得unigene與數據庫比對,對其進行功能注釋和分類。結果與結論:共得到197 295個unigene,將獲得的unigene與NR、SWISS-PROT、CDD、KEGG和TREMBI數據庫進行比對,有89 800個unigene獲得注釋。其中95 767個unigene映射到GO的不同功能節點;5 710個unigene獲得COG注釋,并分為22個功能分類;9 497 個unigene獲得了KEGG注釋,映射到282條信號通路。所得杜氏鹽藻的轉錄組信息為今后相關研究與應用提供了豐富的資源和線索。
杜氏鹽藻即鹽生杜氏藻(Dunaliellasalina,D.salina),是一種無細胞壁的單細胞真核綠藻,藻體為卵圓形、橢圓形或梨形,長18.0~28.0 μm,寬9.5~14 μm,因其能在極端高鹽環境下生長,且含有豐富的油脂、β-胡蘿卜素、蛋白質、多糖等,具有高度的研究價值和應用前景[1-4]。美國能源部聯合基因組研究所(DOE JGI) 自2006年開始對杜氏鹽藻標準藻株CCAP19/18的核基因組DNA進行測序,但到目前為止完整拼接好的核DNA序列還未公布[5]。研究人員通過各種技術也陸續獲得了一些基因序列和基因表達序列標簽(EST)[6],但到2015年8月26日為止,在NCBI上能檢索到的杜氏鹽藻基因組信息只有571個核序列,6 829個EST。基因組信息不全這一問題造成了其分子生物學方面的研究進展緩慢,尤其是其核轉化系統的構建。
隨著第二代測序技術的發展,基于Illumina平臺的轉錄組研究也進入了高速發展的時期。轉錄組測序又稱RNA-seq或mRNA-seq,是對mRNA、small RNA和non-coding RNA(ncRNA)的全部或者部分序列進行高通量測序分析的技術。相較于傳統的雜交測序方法,它靈敏度更高,可以檢測低豐度的目標基因以及重復序列,可以捕捉到目的基因表達水平的微小變化。RNA-seq不僅可以用于有參考基因或基因組的物種,也可用于無參考基因或基因組較大且復雜的物種;可以檢測未知基因,也可以有效地發掘新的功能基因,還可以精確地識別可變剪切位點、單核苷酸多態性(single nucleotide polymorphism,SNP)位點和非翻譯區(untranslated region,UTR)。RNA-seq已成功用于釀酒酵母[7]、擬南芥[8]、鼠類[9]和人[10]等的RNA測序。
作者采用Illumina技術對杜氏鹽藻細胞的全轉錄本進行了測序,對得到的unigene進行功能注釋,構建杜氏鹽藻基因數據庫。
1材料與方法
1.1藻株與培養杜氏鹽藻UTEX LB-1644購自美國德克薩斯州大學,用改良的PKS培養基在三角瓶中培養,溫度26 ℃,光照度4 500 Lux,明暗周期各為 12 h。
1.2總RNA提取與mRNA純化取對數生長期杜氏鹽藻500 mL,2 000 r/min離心5 min收集沉淀,用新鮮培養基清洗2次后加入Trizol(Invitrogen公司),然后采用氯仿抽提法提取總RNA并溶于200 μL無核酸酶純水中,最后用微量分光光度計NanoDrop測定總RNA濃度并檢測其完整性。向總RNA中加入10 U DNase Ⅰ(Ambion公司)37 ℃孵育1 h,然后加入無核酸酶純水,樣品定容到250 μL。采用MicroPoly(A) Purist試劑盒(Ambion公司)完成mRNA的純化并進行定量。
1.3cDNA文庫的構建與RNA-seq將上述純化后的mRNA 95 ℃變性5 min,退火時加入含solexa接頭序列的生物素標記的隨機引物,然后加入RNA連接酶37 ℃孵育3 h,最后通過PCR獲得雙鏈cDNA文庫。cDNA文庫的序列在Illumina GA Iix平臺上測定。
1.4拼接、組裝和注釋將測序獲得的約95 bp的堿基對通過Velvet和Oases軟件進行拼接組裝,得到不同長度的unigene。通過BLASTP檢索以下數據庫,對這些unigene進行功能注釋。在NCBI(http://www.ncbi.nlm.nih.gov/)檢索NR(non-redundan)數據庫,在EBI (http://www.ebi.ac.uk/)上檢索SWISS-PROT和TREMBI數據庫。通過RPS-BLAST檢索NCBI 上的保守結構域數據庫(CDD)進行蛋白結構域的預測和直系同源基因簇(COG)分類。將序列上傳到KAAS-KEGG自動注釋服務在線軟件(http://www.genome.jp/kegg/)完成代謝途徑的注釋。而GO分類則是通過檢索NR、SWISS-PROT和TREMBI 3個數據庫根據其同源序列進行注釋。
2結果
2.1測序、組裝和序列分析對培養的500 mL杜氏鹽藻細胞進行RNA-seq,共得到23 284 936條95 bp paired-end reads,去除了一些接頭序列、重復序列、不確定和低質量的reads后,得到21 450 679條clean reads,約占總量的96.8%。經Velvet和Oases軟件組裝后,得到263 855個包含非翻譯區、可變剪切位點的contig。大多數contig的長度在100~500 bp,但有10 238 個contig長度≥1 000 bp。 這些contig中仍包含許多骨架結構而非表達基因,因此將這些數據通過序列聚類軟件進一步做序列拼接、去冗余處理,最終得到197 295 個unigene,其中19 237 個unigene長度≥500 bp,7 277個長度≥1 000 bp,285個長度≥3 000 bp;但大多數(約174 315個)unigene的長度在100~500 bp。
2.2功能注釋由于杜氏鹽藻的全基因組測序結果還未公布,故將獲得的unigene與數據庫比對,從而對unigene進行功能注釋。聚類后獲得的197 295 個unigene中共有89 800個(45.52%)被注釋,其中注釋到NR數據庫22 139個(11.22%),注釋到SWISS-PROT數據庫12 037個(6.1%),注釋到CDD數據庫13 091個(6.64%),注釋到PFAM數據庫19 527個(9.9%),注釋到TREMBI數據庫23 006個(11.66%);14 660 個(16.32%)unigene注釋信息不明確,被命名為“unknown”“unnamed”“putative uncharacterized”或“predicted”蛋白。此外,還有107 495個(54.48%)unigene未能注釋。
同源性比對發現,注釋的unigene與Volvoxcarteri、Chlamydomonasreinhardtii、Chlorellavariabilis、Arabidopsisthaliana和Homosapiens同源性較高,還有1 087 個unigene為D.salina基因 (圖1)。

圖1 杜氏鹽藻注釋的unigene比對物種分布
2.3COG分類注釋到COG數據庫的共有5 710個unigene,涉及大多數的生命功能。根據功能可以分為22類(表1),其中最多的5類依次是“General function prediction only”“Translation, ribosomal structure and biogenesis”“Posttranslational modification, protein turnover, chaperones”“Amino acid transport and metabolism”以及“DNA replication, recombination, and repair”。

表1 杜氏鹽藻注釋的unigene COG功能分布表
2.4GO功能分類與GO數據庫比對,有95 767個unigene被注釋,對應到GO的生物過程(biological process)、細胞組分(cellular component)和分子功能(molecular function)等3個本體的unigene分別有34 556、34 435、26 776個。其中生物過程又包含21個節點,細胞組分包含13個節點,分子功能包含10個節點。在生物過程分類的節點中,功能注釋為代謝過程(metabolic process)和細胞過程(cellular process)的unigene最多;在細胞組分分類中,注釋為細胞(cell)和細胞成分(cell part)的最多;而在分子功能分類中,注釋最多的為結合功能(binding functions)和催化活性(catalytic activity)。注釋到其他功能的unigene豐度不一(圖2)。

圖2 杜氏鹽藻注釋的unigene GO功能分布圖
2.5KEGG功能分類為了系統地分析轉錄組測序所獲得的轉錄本參與的代謝通路和這些基因產物的功能,將unigene與KEGG數據庫進行比對,有9 497個unigene映射到282條KEGG信號通路(圖3)。其中注釋數量較多的信號通路有Purine metabolism (470個)、Spliceosome (333個)、Huntington's disease (275個)、Pyrimidine metabolism(256個)和RNA transport (248個)。

圖3 杜氏鹽藻注釋的unigene映射信號通路分布圖
3討論
傳統的杜氏鹽藻轉錄組研究方法是建立cDNA文庫、Sanger法測序獲得基因、構建基因芯片,該方法操作復雜,實驗周期長,花費大,讓很多研究人員望而卻步[11]。該課題組于2010年通過shotgun技術獲得了520個蛋白片段[12],但是由于杜氏鹽藻相關數據庫不全等因素,得到的氨基酸序列信息不全,且氨基酸序列很難轉化為基因序列,仍然無法滿足實驗要求。
RNA-Seq技術結合了轉錄組測序建庫的實驗方法與數字基因表達譜(digital gene expression profiling, DGE)的信息分析手段,具有定量準、可重復性高、檢測范圍寬等特點,已廣泛應用于新基因的發現、生理調控、農業性狀、生物標記、環境改造、疾病機制和藥物篩選等領域[13-17]。
此次研究利用RNA-seq技術對杜氏鹽藻的全部轉錄本進行研究,通過測序、系列的組裝、拼接、聚類,最后獲得了197 295個unigene,最長的為7 113 bp。將所得到的unigene與NR、SWISS-PROT、CDD、KEGG和TREMBI等5個數據庫進行比對,有89 800(45.52%)個unigene獲得注釋或功能預測。但是由于杜氏鹽藻基因組信息不全,約有14 660(16.32%)個unigene注釋信息不明確。此外,實驗中還有54.48%的unigene沒有與已知的數據比對上,這里面可能有新基因,但同時也有一部分是由于測序和組裝的原因而出現的假基因,有待于進一步驗證。
綜上所述,該研究利用RNA-seq技術獲得了非常全面、豐富的杜氏鹽藻轉錄組信息,能夠為相關研究提供豐富的資源和線索,可為今后杜氏鹽藻的研究與應用提供參考。
參考文獻
[1]OREN A.A hundred years of Dunaliella research:1905-2005[J].Saline Systems,2005,1:2
[2]HOSSEINI TAFRESHI A,SHARIATI M.Dunaliella biotechnology: methods and applications[J].J Appl Microbiol,2009,107(1):14
[3]KATZ A,JIMéNEZ C,PICK U.Isolation and characterization of a protein associated with carotene globules in the AlgaDunaliellabardawil[J].Plant Physiol,1995,108(4):1657
[4]MOULTON TP,BOROWITZKA LJ,VINCENT DJ.The mass culture ofDunaliellasalinafor β-carotene: from pilot plant to production plant[J].Hydrobiologia,1987,151/152(1):99
[5]SMITH DR,LEE RW,CUSHMAN JC,et al.TheDunaliellasalinaorganelle genomes: large sequences, inflated with intronic and intergenic DNA[J].BMC Plant Biol,2010,10:83
[6]ALKAYAL F,ALBION RL,TILLETT RL,et al.Expressed sequence tag(EST) profiling in hyper saline shockedDunaliellasalinareveals high expression of protein synthetic apparatus components[J].Plant Sci,2010,179(5):437
[7]NAGALAKSHMI U,WANG Z,WAERN K,et al.The transcriptional landscape of the yeast genome defined by RNA sequencing[J].Science,2008,320(5881):1344
[8]LISTER R,O'MALLEY RC,TONTI-FILIPPINI J,et al.Highly integrated single-base resolution maps of the epigenome in Arabidopsis[J].Cell,2008,133(3):523
[9]MORTAZAVI A,WILLIAMS BA,MCCUE K,et al.Mapping and quantifying mammalian transcriptomes by RNA-Seq[J].Nat Methods,2008,5(7):621
[10]MORIN R,BAINBRIDGE M,FEJES A,et al.Profiling the HeLa S3 transcriptome using randomly primed cDNA and massively parallel short-read sequencing[J].Biotechniques,2008,45(1):81
[11]劉紅亮,鄭麗明,劉青青,等.非模式生物轉錄組研究[J].遺傳,2013,35(8):955
[12]JIA Y,XUE L,LI J,et al.Isolation and proteomic analysis of the halotolerant algaDunaliellasalinaflagella using shotgun strategy[J].Mol Biol Rep,2010,37(2):711
[13]張秋平.基于RNA-seq技術的甘藍型油菜抗、感菌核病分子機理分析[D].長沙:湖南農業大學,2014.
[14]ZENONI S,FERRARINI A,GIACOMELLI E,et al.Characterization of transcriptional complexity during berry development inVitisviniferausing RNA-Seq[J].Plant Physiol,2010,152(4):1787
[15]李瀅,孫超,羅紅梅,等.基于高通量測序454 GS FLX的丹參轉錄組學研究[J].藥學學報,2010,45(4):524
[16]張曉慧,黃春輝,鐘敏,等.基于RNA-seq的黃肉獼猴桃類胡蘿卜素合成相關基因的表達分析[J].果樹學報,2015,32(3):404
[17]GRAHAM IA,BESSER K,BLUMER S,et al.The genetic map ofArtemisiaannuaL. identifies loci affecting yield of the antimalarial drug artemisinin[J].Science,2010,327(5963):328
Transcriptome sequencing and analysis ofDunaliellasalinabased on RNA-seq

1)ClinicalLaboratory,theSecondAffiliatedHospital,ZhengzhouUniversity,Zhengzhou450014 2)SchoolofLifeSciences,ZhengzhouUniversity,Zhengzhou450001
Key wordsDunaliella salina;transcriptome;RNA-seq
AbstractAim: To obtain the total transcripts of Dunaliella salina by RNA-seq and analyze their function. Methods: The total RNA of Dunaliella salina was extracted and reverse-transcribed to cDNA,which was sequenced on Illumina platform. The total unigenes were obtained after de novo assembly, and the unigenes were analyzed with functional annotation and classification after blasting with databases. Results and Conclusion: In the study, 197 295 unigenes were obtained, and 89 800 unigenes were annotated with gene descriptions, conserved protein domains, or GO terms against public databases NR, SWISS-PROT, CDD, KEGG and TREMBI. 95 767 of them were annotated with GO classification, 5 710 were grouped into 22 function categories compared against COG, and 9 497 annotated unigenes were assigned to 282 putative KEGG pathways. The results of the study may supply plentiful resources and clues to the research on Dunaliella salina in the future.
doi:10.13705/j.issn.1671-6825.2016.03.001
#通信作者,女,1969年2月生,教授,博士研究生導師,研究方向:干細胞與再生醫學,E-mail:guanfangxia@126.com
中圖分類號Q781
*科技部國際科技合作基金資助項目2007DFA01240;河南省高等學校重點科研項目15A310028,15A180022