近日,中國科學院昆明植物研究所研究員李德銖團隊基于長期研究成果,搭建并公布了一個竹類組學和分類學信息平臺(BambooBase)。
這一信息平臺收錄了竹類植物18個不同版本的基因組、476個轉錄組和16個表觀基因組的數據,以及135個屬的分類學信息。研究團隊基于序列相似性和基因共線性信息,構建了竹亞科物種基因組及亞基因組間的同源基因數據集。
該平臺提供了豐富的生物信息學工具,方便用戶對不同竹類植物基因以及基因同源關系進行查詢、分析和可視化。“竹類組學和分類學信息平臺用戶界面友好,是一個集成竹類多組學和分類學資源的信息平臺,可為全球從事竹類相關研究的人員提供一站式數據支持。”李德銖介紹。
在演化進程中,竹類植物經歷過多次異源多倍化事件,各主要分支間形成復雜的網狀演化關系,同源基因的鑒定比較困難。該平臺選擇水稻作為外類群,以亞基因組為單位,通過整合序列相似性和基因共線性信息,將13個基因組27個亞基因組的基因聚類劃分到16.63萬個共線直系同源基因簇。與僅使用序列相似性信息聚類方法獲得的基因簇相比,同源基因簇在區分直系同源基因和旁系同源基因方面表現更優。
竹類組學和分類學信息平臺為每個基因建立一張“卡片”,記錄包括基因注釋、各類組織和不同發育階段表達量等基本信息。研究人員還可以從該卡片鏈接到基因組可視化和同源基因等模塊以及相關外部數據庫。此外,平臺還提供了豐富的查詢、分析和可視化工具,如微觀和宏觀尺度(亞)基因組共線性、序列搜索比對、引物設計、同一竹種不同拼接組裝版本的基因ID轉換、功能基因富集和共表達網絡分析等。
除了多組學數據外,平臺的竹類系統發育工作組版塊集中介紹了全球竹亞科已知的3個族135屬的主要分類學信息,包括每個屬發表時的原始文獻、異名、模式種、形態學描述和地理分布等。同時,該平臺還提供了一些主要屬的相關研究文獻、標本及活體照片和所含物種等信息。