999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“溫138”核桃硬殼初期轉錄組序列的初步研究

2016-10-28 03:30:48賈昌路徐崇志
塔里木大學學報 2016年3期
關鍵詞:分類數據庫功能

賈昌路 徐崇志 張 銳,3*

(1 塔里木大學植物科學學院, 新疆 阿拉爾 843300)(2 新疆生產建設兵團塔里木盆地生物資源保護利用重點實驗室, 新疆 阿拉爾 843300)(3 塔里木大學生命科學學院, 新疆 阿拉爾 843300)

?

“溫138”核桃硬殼初期轉錄組序列的初步研究

賈昌路1徐崇志2張 銳2,3*

(1 塔里木大學植物科學學院, 新疆 阿拉爾 843300)(2 新疆生產建設兵團塔里木盆地生物資源保護利用重點實驗室, 新疆 阿拉爾 843300)(3 塔里木大學生命科學學院, 新疆 阿拉爾 843300)

為了探究“溫138”核桃硬殼出現露仁現象的根本原因,從分子水平出發,運用轉錄組測序技術,探索出硬殼中基因的功能。經測序后,共得到51 521 252個reads片段,包含4 636 912 680個核苷酸序列信息,對 reads 進行拼接組裝后,共得到56 639條Unigene,序列信息長度達到了46 623 389 nt;將Unigene 和 COG、GO數據庫進行比對表明,核桃硬殼轉錄組中的 Unigene 根據COG功能可分為 25 類;根據GO功能可分為生物過程、細胞組分和分子功能3大類53小類。

核桃;硬殼;轉錄組;基因功能

核桃(Juglans regia L.)又名胡桃、羌桃,為胡桃科胡桃屬多年生落葉果,是世界著名的四大干果之一。核桃中含有較為豐富的蛋白質,被廣泛認為是優質的植物蛋白資源,經研究表明,核桃蛋白有著與動物蛋白相近的營養價值[1]。中國是核桃發源地之一,在悠久的栽培歷史中,由于核桃分布廣范,地理條件和氣候條件不同,加上人們長期的觀察和選育,形成了極為豐富的種質資源,如:隔年核桃、薄皮核桃、穗狀核桃等,分布范圍包括河北、云南、新疆等地[2]。

所謂轉錄組,從廣義上講,是指生物體(包括生物體中的細胞、組織等)中出現的所有RNA的總和,包括能夠編碼蛋白質的RNA(即mRNA)和不能編碼蛋白質的RNA(ncRNA,如rRNA、tRNA、mieroRNA等);從狹義上講通常是指細胞所轉錄出的所有mRNA的總和[3-4]。隨著科學技術的發展,人們在研究生物的過程中開始向后基因組時代挺進,陸續出現了轉錄組學、蛋白質組學、代謝組學等各種組學技術,在諸多組學中,以蛋白質組學和轉錄組學為研究重點,而轉錄組學又較蛋白質組學率先發展起來且應用廣泛[5-6]。目前已有不少學者做過有關植物轉錄組的研究,2011年熊麗東[7]采用Solexa測序技術對紅花轉錄組進行了測序,結果共得到153 769條紅花Unigenes,隨后對Unigenes進行了功能注釋,結果顯示:將Unigenes與nr庫比對,得到相似基因65 536條;與Swiss-Prot庫比對,得到相似基因56 843條;與KEGG庫比對,得到相似基因35 056條;與COG庫比對,得到相似基因11 010條。2012年李鐵柱等[8]對杜仲幼果和成熟果實進行測序后,共獲得了64 474個Unigene片段,隨后將Unigene和COG庫進行比對,發現共存在65 536條Unigene與COG庫中的基因相似,與GO庫進行比對,相似基因共有12 923條。2012年楊楠等[9]以紅心蠟梅H29為材料,利用Illumina測序平臺得到105個與花色合成相關的Unigene,對Unigene分析發現,其平均長度677 bp,在200~500 bp之間的有46個片段,在500~1 000 bp之間的有24個片段,大于1 000 bp的有21個片段。將Unigene與nr數據庫進行比對,發現Unigene都具有較高的同源度(E值<10-5),其中存在45條片段與nr數據相比,同源度極高(E值<10-50)。

“溫138”核桃是從原產于新疆的紙皮核桃的實生后代中選育出來的一個核桃品種,該品種與紙皮核桃相比,品質差異不大(通過化學測定方法對兩個核桃品種中主要營養物質的測定結果)。但是,“溫138”核桃不同于紙皮核桃的特性主要表現為“溫138”核桃在成熟后,核桃硬殼包被不完全,出現露仁現象。為了研究“溫138”核桃露仁的主要原因,本文借助于現有的高效測序技術——轉錄組測序技術,分析“溫138”核桃硬殼中遺傳信息,為從分子角度探究“溫138”核桃露仁的真正原因奠定基礎。

1 試驗材料與方法

1.1試驗材料

試驗以新疆阿克蘇地區溫宿縣木本糧油核桃林場種植的“溫138”核桃為試驗材料,于2014年6月13日進行采樣,將采摘的核桃果實去青皮,用小刀將核桃切成片狀,剔除核桃內的果仁,僅將核桃的內果皮保留,并迅速切碎,用液氮進行速凍,保存至-70℃冰箱,備用。

1.2核桃硬殼RNA提取

核桃硬殼中總RNA的提取采用pBIOZOL植物組織RNA提取試劑盒(BioFlux),具體操作參照說明書進行。

1.3核桃硬殼轉錄組的測序、數據組裝及基因功能注釋

轉錄組測序工作委托于深圳華大公司完成。對核桃硬殼形成過程中的轉錄組進行測序后,將測序圖像數據經base calling轉化為序列數據(raw reads),然后再通過filter_fq軟件對轉化后的數據進行過濾,得到最終所需的數據(clean reads),然后進行數據分析。對最終數據進行組裝,得到所需要的Unigene,最后再對所得的Unigene進行分析、功能注釋。

2 結果與分析

對核桃硬殼中的RNA進行測序后,共得到55 585 658條reads片段,利用filter_fq軟件對reads進行過濾后共得到51 521 252個reads片段,其中包含有4 636 912 680個核苷酸序列信息,質量大于20%的堿基占97.94%,中間未知序列片段為0%,GC%含量達到了46.18%,由此可以看出,所測的轉錄組序列較為可靠,能夠為數據組裝提供很好的數據。

2.1核桃硬殼轉錄組數據組裝

用over-lap的方法對51 521 252個reads片段進行拼接,共得到Contig片段94 301條,序列信息長度達到了39 186 004 nt,平均長度為416 nt;其中,長度在100-200 nt范圍內的Contig片段達到了51 008條,比例占到了54.09%;在200-300 nt范圍內的Contig片段達到了14 017條,比例占到了14.86%;在300-400 nt范圍內的Contig片段達到了6 868條,比例占到了7.28%;在400-500 nt范圍內的Contig片段達到了4 002條,比例占到了4.27%;大于等于500 nt的Contig片段達到了18 386條,比例占到了19.50%(如表1、圖2所示)。由以上數據不難發現,用over-lap的方法對reads片段進行拼接后得到的Contig片段效果較好。

表1 核桃硬殼轉錄組Contig數據組裝情況統計

圖2 核桃硬殼轉錄組Contig數據長度分布圖

由reads片段拼接組裝得到Contig片段后,再利用Contig片段數據進行進一步的拼接組裝,得到Unigene。通過拼接組裝后,共得到56 639條Unigene,序列信息長度達到了46 623 389 nt,平均長度為823 nt,N50為 1 543 nt;其中,長度在100~500 nt范圍內的Unigene片段達到了30 701條,比例占到了54.20%;在500~1 000 nt范圍內的Unigene片段達到了9 434條,比例占到了16.66%;在1 000~1 500 nt范圍內的Unigene片段達到了6 444條,比例占到了11.38%;在1 500~2 000 nt范圍內的Unigene片段達到了4 325條,比例占到了7.64%;大于等于2 000 nt的Unigene片段達到了5 735條,比例占到了10.13%(如表2、圖3所示)。

表2 核桃硬殼轉錄組Unigene數據組裝情況統計

圖3 核桃硬殼轉錄組Unigene數據長度分布圖

將Unigene 進行覆蓋度分析,結果發現,有37 071條 Unigene 能夠與測序的原始數據 reads 相對應,并且對應關系也各不相同,depth(測序深度——即reads堿基數與Unigene序列長度的比值)和coverage(覆蓋度——即Unigene中有reads覆蓋的堿基數與Unigene序列長度的比值)表示,其中,depth在0. 059 9-33 899. 706 6的范圍內,coverage在4. 80%-100. 00%的范圍內。對應長度在200-15 681 nt,GC%在14.85%-71.98%,不存在未知序列,說明通過拼接組裝后得到的Unigene效果較好。

2.2Unigene的功能分類與分析

2.2.1Unigene 的COG功能的分類及分析

COG(Cluster of Orthologous Groups of proteins)是對基因產物進行直系同源分類的數據庫,是基于細菌、藻類、真核生物具有完整基因組的編碼蛋白、系統進化關系進行構建的,將Unigene和COG數據庫進行比對,預測Unigene可能的功能并對其做功能分類統計,進而從宏觀上了解相應物種的基因功能分布特征。

通過將樣品的Unigene與COG數據庫進行比對,發現共有43 521條Unigene與COG數據庫中的基因具有相似性。將比對出具有相似性的Unigene進行分類,可以分為25類(如圖4所示),并對每一類的基因數量進行統計(表3)。從圖與表中可以看出,Unigene的COG功能比較全面,其中,涉及到普通功能的Unigene數量最多,為8 196條;而與核結構有關的基因只有10條,與細胞外結構有關的基因只有12條,其他相關功能的基因也有不同的差異,如表3所示。

圖4 核桃硬殼轉錄組Unigene COG功能分類統計圖

功能代號COG功能分類基因數量ARNAprocessingandmodification384BChromatinstructureanddynamics468CEnergyproductionandconversion1043DCellcyclecontrol,celldivision,chromosomepartitioning1498EAminoacidtransportandmetabolism1680FNucleotidetransportandmetabolism425GCarbohydratetransportandmetabolism2490HCoenzymetransportandmetabolism764ILipidtransportandmetabolism912JTranslation,ribosomalstructureandbiogenesis2243KTranscription4658LReplication,recombinationandrepair3987MCellwall/membrane/envelopebiogenesis1464NCellmotility320OPosttranslationalmodification,proteinturnover,chaperones3013PInorganiciontransportandmetabolism1326QSecondarymetabolitesbiosynthesis,transportandcatabolism968RGeneralfunctionpredictiononly8196SFunctionunknown1896

續上表

功能代號COG功能分類基因數量TSignaltransductionmechanisms3883UIntracellulartrafficking,secretion,andvesiculartransport989VDefensemechanisms314WExtracellularstructures12YNuclearstructure10ZCytoskeleton578

2.2.2Unigene 的GO功能分類與分析

Gene Ontology(簡稱GO)是一個國際標準化的基因功能分類體系,是通過一套動態更新的標準詞匯表(controlled vocabulary)來全面描述生物體中基因和基因產物的屬性。GO從三個方面對基因進行了描述,分別為基因的分子功能(molecular function)、細胞組分(cellular component)、參與的生物過程(biological process)。根據NR注釋信息,使用Blast2GO軟件得到Unigene的GO注釋信息,然后用WEGO軟件對所有Unigene做GO功能分類統計,從宏觀上認識該物種的基因功能分布特征。

通過對樣品Unigene的GO功能進行分析,共有7 419條Unigene與數據庫中的基因呈現出相似性,且存在著單條Unigene與多種基因相對應的現象,并建立了一定的對應關系,從而可以得到3大類53小類的分類情況,結果如圖5所示,并對每一小類的基因數進行統計,結果如表4所示。結合Unigene GO 功能分類圖與分類表,可以看出,在核桃硬殼期轉錄組序列的GO功能中,參與生物過程的基因總數遠高于表現出分子功能的基因總數,在三大主要基因功能中,調控細胞與細胞分裂的基因最多,達到了5 048個,而在基因的分子功能區中,具有連接功能的基因數最多,達到了3 675個,在生物過程區中,調控細胞過程的基因數最多,達到了4 717個,其他功能的基因數也存在著較大的差異,具體統計如表4所示。

圖5 核桃硬殼轉錄組Unigene GO功能分類

OntologyClassNumberbiological_processbiologicaladhesion59biological_processbiologicalregulation1960biological_processcellularcomponentorganizationorbiogenesis1266biological_processcellularprocess4717biological_processdevelopmentalprocess1340biological_processestablishmentoflocalization1217biological_processgrowth357biological_processimmunesystemprocess416biological_processlocalization1304biological_processlocomotion9biological_processmetabolicprocess4520biological_processmulti-organismprocess767biological_processmulticellularorganismalprocess1324biological_processnegativeregulationofbiologicalprocess475biological_processpositiveregulationofbiologicalprocess421biological_processregulationofbiologicalprocess1801biological_processreproduction715biological_processreproductiveprocess672biological_processresponsetostimulus2667biological_processrhythmicprocess46biological_processsignaling821biological_processsingle-organismprocess3278cellular_componentcell5408cellular_componentcelljunction332cellular_componentcellpart5408cellular_componentextracellularmatrix7cellular_componentextracellularmatrixpart1cellular_componentextracellularregion510cellular_componentextracellularregionpart5cellular_componentmacromolecularcomplex726

續上表

OntologyClassNumbercellular_componentorganelle4181cellular_componentorganellepart1215cellular_componentsymplast332cellular_componentvirion1cellular_componentvirionpart1molecular_functionantioxidantactivity48molecular_functionbinding3675molecular_functioncatalyticactivity3670molecular_functionelectroncarrieractivity102molecular_functionenzymeregulatoractivity90molecular_functionmetallochaperoneactivity2molecular_functionmoleculartransduceractivity123molecular_functionnucleicacidbindingtranscriptionfactoractivity235molecular_functionnutrientreservoiractivity16molecular_functionproteinbindingtranscriptionfactoractivity21molecular_functionproteintag1molecular_functionreceptoractivity59molecular_functionstructuralmoleculeactivity188molecular_functiontransporteractivity491

3 討論

2014年,蔣弘剛[10]對花椒皮刺中的轉錄組進行分析,共得到2*100 bp的原始數據,經過拼接組裝后得到45 057條長度大于200 bp的Unigene,總長度為610 bp,N50為846 bp。將得到的Unigene與COG、GO數據庫進行比對、注釋,分別注釋了70.26%,43.34%的Unigene。

2012年,李鐵柱等[11]對杜仲的果實與葉片轉錄組數據進行分析,共得到54 471 338條reads,對reads進行拼接組裝后,得到452 421條Contig,總長度達到了90 705 736 nt;對Contig進一步拼接組裝后,得到49 610條Unigene,總長度達到了37 616 729 nt。隨后,將Unigene與COG、GO數據庫進行比對、注釋,發現有與COG、GO數據庫中的基因具有相似性的Unigene條數分別為125 934條、8 260條。

2013年,杜艷玲[12]運用 HiSeqTM 2000測序平臺,對人參根、莖、葉的轉錄組序列進行組裝,分別獲得53 870,69 591,66 045條 Unigenes;序列的平均長度分別為553 nt,686 nt,644 nt。將人參根、莖、葉的Unigene分別與GO數據庫進行比對,有 30 519、37 539、36 078 條Unigenes被歸類到61個GO功能類別中;分別與COG數據庫進行比對,有11 755、15 646、14 803條Unigenes 被歸類到25個COG功能類別中。

實驗對“溫138”核桃硬殼中的轉錄組進行測序后,共得到51 521 252個reads片段,其中包含有4 636 912 680個核苷酸序列信息,對 reads 進行拼接組裝,共得到94 301條Contig片段,序列信息長度達到了39 186 004 nt,平均長度為416 nt,在Contig 數據的基礎上,進一步進行拼接組織,共得到56 639條Unigene,序列信息長度達到了46 623 389 nt,平均長度為823 nt,N50為 1 543 nt;將 Unigene與 COG 數據庫進行比對,發現共有43 521條Unigene與COG數據庫中的基因相似,與GO數據庫進行比對,共有7 419條Unigene與GO庫中的基因相似。

4 結論

與前人在轉錄組方面的研究相比,本次實驗所得的轉錄組序列信息量大,且組裝效果較好,得到的Unigene的可信度高,能夠反映出“溫138”核桃硬殼中基因的功能情況。

[1]劉玲,韓本勇,陳朝銀.蛋白質研究進展[J].食品與發酵工業,2009,35(9):116-118.

[2]郗榮庭,張毅萍.中國果樹志·核桃卷[M].1994:83-87

[3]史碩博,陳濤,趙學明.轉錄組平臺技術及其在代謝工程中的應用[J].生物工程學報,2010,26(9):1187-1198.

[4]Costa V,Angelini C,De Feis I,Ciccodicola A.Uncovering the complexity of transcriptomes with RNA-Seq,J Biomed Biotechnol,2010,12:853-916.

[5]Lockhart D J,Winzeler E A.Genomics,gene express and DNA arrays.Nature,2000,405(6788): 827-836.

[6]張春蘭,秦孜娟,王桂芝,等.轉錄組與RNA-Seq技術[J].生物技術通報,2012,12:51-56.

[7]熊麗東.紅花轉錄組測序分析及其油體蛋白基因全長的獲得[D].吉林:吉林農業大學,2011.

[8]李鐵柱,杜紅巖,劉慧敏,等.杜仲幼果和成熟果實轉錄組數據組裝及基因功能注釋[J].中國林業科技大學學報,2012,32(10):9-17.

[9]楊楠,趙凱歌,陳龍清.蠟梅花轉錄組數據分析及次生代謝產物合成途徑研究[J].北京林業大學學報,2014,34(1):104-107.

[10]蔣弘剛.花椒皮刺分化轉錄組測序及數據分析[D].陜西:西北農林科技大學,2014.

[11]李鐵柱,杜紅巖,劉慧敏,等.杜仲果實和葉片轉錄組數據組裝及基因功能注釋[J].中國林業科技大學學報,2012,32(11):122-130.

[12]杜艷玲.人參根、莖、葉轉錄組測序及差異表達基因分析[D].吉林:長春中醫大學,2013.

The Study of Transcriptome Sequences in Harden Endocarp of ‘Wen138’ Walnut

Jia Changlu1Xu Chongzhi2Zhang Rui2,3*

(1 College of Plant Science and Technology,Tarim University,Alar, Xinjiang 843300) (2 Xinjiang Production and Construction Corps Key Laboratory of Protection and Utilization of Biological Resources in Tarim Basin, Alar, Xinjiang 843300) (3 College of Life Science,Tarim University,Alar, Xinjiang 843300)

In order to explore the reason of bared nut for ‘Wen 138’ walnut, transcriptome sequencing technology were used, the function of genes in hard shell walnut was investigated. A total of 51, 521, and 252 reads fragment contains 4, 636, 912 and 680 nucleotides sequence were obtained, and got 56 639 Unigene fragment after splicing and assembling with the sequence information of 46 623 389 nt;Aligned with the COG database, Unigene in the transcriptome of ‘Wen 138’walnut could be broadly divided into 25 classes according to the function. The Unigene GO functions could be broadly divided into biological processes, cellular components and molecular function major major categories of 53 subsecs.

walnut; hard shell; transcriptome; gene ontology

2015-08-17

國家自然科學基金(31260469)

賈昌路(1991-),男,2014級碩士研究生,主要從事核桃露仁分子機理研究。E-mail:429315095@qq.com

?E-mail:zhrgsh@163.com

1009-0568(2016)03-0011-09

S664.1;Q789

ADOI:10.3969/j.issn.1009-0568.2016.03.003

猜你喜歡
分類數據庫功能
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
分類算一算
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
關于非首都功能疏解的幾點思考
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 国产精品xxx| 久草国产在线观看| 毛片在线播放a| 久久精品66| 日韩精品亚洲人旧成在线| 成人福利在线观看| 成人福利在线免费观看| 国产综合网站| 国产精品永久免费嫩草研究院| 天天做天天爱夜夜爽毛片毛片| 亚洲欧美在线精品一区二区| 亚洲精品视频在线观看视频| 成人精品午夜福利在线播放| 亚洲天堂色色人体| 波多野结衣在线se| 欧美成人精品一区二区| 国产专区综合另类日韩一区 | 伊人久久大线影院首页| 狂欢视频在线观看不卡| 999在线免费视频| 高清精品美女在线播放| AV老司机AV天堂| 中字无码av在线电影| 日韩国产黄色网站| 美女一级毛片无遮挡内谢| 国产视频入口| 国产精品亚欧美一区二区三区| 国产三级视频网站| 亚洲精品日产精品乱码不卡| 成人av专区精品无码国产 | 国产欧美综合在线观看第七页| 亚洲成a人在线观看| 无码免费试看| 老司机久久99久久精品播放| 夜夜操狠狠操| 国产精品网址你懂的| 亚洲精品无码AⅤ片青青在线观看| 亚洲色精品国产一区二区三区| 欧美一级视频免费| 蜜桃视频一区二区| 国产成人精品在线1区| 91精品国产自产在线老师啪l| 在线看国产精品| 毛片久久久| 1769国产精品免费视频| 中文成人在线视频| 中文字幕av无码不卡免费| 亚洲高清无码久久久| 亚洲精品国产日韩无码AV永久免费网| 亚洲成人网在线观看| 丝袜国产一区| 99这里只有精品在线| 三上悠亚在线精品二区| 精品三级网站| 日本午夜三级| 萌白酱国产一区二区| 国产Av无码精品色午夜| 中文一区二区视频| 8090成人午夜精品| 亚洲天堂首页| 玩两个丰满老熟女久久网| 91精品国产91久无码网站| 欧美午夜小视频| 亚洲高清中文字幕| 久久黄色视频影| 久久久久人妻一区精品色奶水| 国产成人综合久久精品尤物| 久久鸭综合久久国产| 一级黄色网站在线免费看| 国产免费高清无需播放器| 亚洲中文字幕久久无码精品A| 日韩午夜片| 国产一二视频| 国产精品自在在线午夜区app| jizz在线观看| 国产成人1024精品下载| 理论片一区| 久久国产V一级毛多内射| 国产凹凸视频在线观看| 午夜日本永久乱码免费播放片| 欧美三级视频在线播放| 国产真实自在自线免费精品|