王 宇,楊文麗,李嘉鈺,向雪靜,李月萍,蔡佳麗
(1.攀枝花學院附屬醫院,四川 攀枝花617000;2.攀枝花學院醫學院,四川攀枝花617000)
白芨是多年生草本植物,屬于蘭科白芨屬。主要分布在云南、四川、貴州、湖南、湖北、江西等省,多生長在海拔高度為950-3500 m的闊葉林下。白芨及其塊莖是我國藥典記錄的傳統中藥材之一,最早在《神農本草經》中就有記載,其塊莖中含有較豐富的芐類、萜類和多糖類化學成分,具有止血潤肺、消腫生肌、抗氧化、清除自由基、預防心血管疾病、抗菌和抗腫瘤等功效,在醫藥食品等領域已廣泛應用[1-4]。
目前,通過構建cDNA文庫和高通量轉錄組測序,已對多種藥用植物進行分子生物學研究,挖掘出了一些重要功能基因,對于揭示不同生物學性狀的分子機制具有重要意義[5]。
本研究采用高通量測序技術對白芨塊莖進行轉錄組分析,得到白芨的重要功能基因,對其進行功能注釋、分類和代謝通路分析,這為下一步研究白芨的藥用成分、次生代謝等機制奠定基礎。
1.1.1實驗材料
植株由攀枝花市豐盛源農林開發有限公司提供。
1.1.2主要儀器與試劑
凝膠成像系統和電泳儀購于美國伯樂公司、超微量核酸分析儀購于杭州奧盛儀器有限公司、RNA提取試劑盒購于天根生化科技有限公司。
1.2.1RNA提取
按照RNA提取試劑盒說明提取總RNA,使用凝膠電泳和超微量核酸分析儀對其質量和濃度進行分析。
1.2.2cDNA文庫的構建
首先用磁珠富集poly(A)mRNA,然后以mRNA為模板,經逆轉錄反應合成第一鏈cDNA和第二鏈cDNA,對雙鏈cDNA進行純化后再進行末端修復、加尾和加接頭,片段分選以及PCR擴增,最后構建成cDNA文庫,對文庫質檢后進行測序。
1.2.3生物信息學分析
對測序得到的原始數據用生物信息學軟件進行處理,得到有效數據(Unigene序列),再將獲得的Unigene序列與SwissProt、Nr、GO、KEGG和COG數據庫進行比對,獲得功能注釋,推測基因的功能與作用。
測序得到5624755條序列,經過組裝得到130721條Unigene,N50長度為1490 bp,最短序列長度為201 bp,最長序列長15579 bp,平均長度為802 bp。在130721條Unigene中,76239條在200-500bp之間,占58.32%;21645條在500-1000 bp之間,占16.56%;11919條在1000-1500bp之間,占9.12%;8234條在1500-2000 bp之間,占6.30%;12683條大于2000bp,占9.70%(圖1)。

圖1 Unigene不同長度區間分布

圖2 Unigene在各數據庫注釋分布
將130721條Unigene序列通過NR、COG、Swissprot、KEGG等數據庫進行比對,60827條Unigene獲得注釋。60033條Unigene在NR數據庫中獲得注釋,占45.92%,30267條Unigene在COG數據庫中獲得注釋,占23.15%;39368條在Swissprot數據庫中獲得注釋,占30.12%;8252條在KEGG數據庫中獲得注釋,占6.31%,見圖2。
25820條Unigene得到GO功能注釋,共分為54個小類,其中生物進程、有19個小類,主要有:信號轉導、細胞調控、細胞自噬、生物調控、刺激反應、繁殖進程等;分子功能有22個小類,主要有:結構分子活性、運輸活性、催化活性、營養儲存活性、抗氧化活性、與蛋白質結合的轉錄因子活性、分子功能調控等;細胞組分有13個小類,主要有:細胞膜、突觸部分、細胞外基質、大分子復合體等。
COG數據庫是由NCBI創建并維護的蛋白數據庫,通過比較大量生物的蛋白質序列對基因產物進行同源分類。將Unigene通過COG數據庫后進行分類,可以分為RNA加工和修飾、細胞周期控制、防御機制等不同功能,詳見圖3。

圖3 Unigene的COG功能分類
30267條Unigene得到GO功能注釋,可分為26類;其中參與“一般功能預測”(General function prediction only)的轉錄物最多,有4286個,占 14.16%;第二為參與“信號傳導機制”(Siganl transduction mechanisms)的轉錄物,有3733個,比例為12.33%。此外,還包括核酸運輸代謝、RNA組裝修飾、糖類運輸代謝、輔酶運輸代謝、脂類運輸代謝、能量生產轉化等多數生理生化過程。
KEGG代謝途徑分析表明,1916條Unigene參與了葡萄糖、果糖、半乳糖等多種糖類代謝,1320條Unigene參與了多種氨基酸代謝;185條Unigene參與了萜類和酮類化合物的代謝,此外,參與脂類、核酸、能量等代謝類型的Unigene有9194條;1147條Unigene參與了各種細胞和組織系統(如運輸與分解代謝)進程,4259條Unigene參與了遺傳物質(如折疊、分類和降解)和環境信息(如信號轉導)的處理和加工過程。
白芨膠質的主要成分為白芨多糖,以葡萄糖和甘露聚糖為主,找到相關合成的酶基因,有利于闡明白芨膠質多糖的生物合成與分解途徑。本研究發現了有關白芨多糖合成的多個酶基因,如β-葡萄糖苷酶、β-葡糖醛酸基轉移酶、α-甘露糖苷酶、磷酸異構酶、6-磷酸果糖激酶等,這些酶基因都參與了糖代謝途徑。
微衛星DNA序列就是簡單重復序列,廣泛分布于真核生物的基因中,可以作為優良的遺傳標記。在白芨中發現39585個星位點,以單核苷酸、雙核苷酸和三核苷酸三種類型為主,單核苷酸的基序為A/T/C,二核苷酸基序為AT/AG/CT,三核苷酸的基序為TTC/ATC/CGG。
白芨塊莖含有豐富的多糖,具有誘導免疫調節因子表達、增強天然殺傷性細胞活性等免疫功能,因此可以開發為抗腫瘤藥物或者化妝品添加物[6]。此外,白芨塊莖中含有萜類、甾類以及聯芐類物質,研究表明白芨萜類及其衍生物具有抗血管生成,誘導血管內皮細胞凋亡的作用。目前,將白芨的化學成分和藥理研究結合起來,對研制新藥具有廣闊的應用前景[7]。
本研究通過對白芨的轉錄組進行分析,找到了大量參與白芨多糖和萜類合成與代謝相關的基因,這為研究白芨的藥用成分、次生代謝具有重要意義。同時,通過對微衛星DNA序列分析可為白芨的遺傳多樣性和分子標記輔助育種奠定基礎。