王振恒,王引權*,雒軍,荔淑楠,晉玲,陳燕
1.甘肅中醫藥大學 藥學院,甘肅 蘭州 730000;
2.甘肅省高校中(藏)藥化學與質量研究省級重點實驗室,甘肅 蘭州 730000;
3.西北中藏藥協同創新中心,甘肅 蘭州 730000
當歸為傘形科植物當歸Angelica sinensis(Oliv.)Diel 的干燥根。當歸藥材以人工栽培為主,主產區主要分布在甘肅東南部,其中岷縣當歸量大質優;四川、云南、湖北、陜西、青海等省也有種植,分布范圍較廣[1]。當歸中主要化學成分有揮發油類、香豆素類、黃酮類及有機酸類等[2]。
人工栽培當歸為3 年生草本植物:第一年育苗;第二年移栽,秋季可成藥;第三年可以采收種子,但其根已不能入藥。在當歸栽培過程中,第二年有10%~20%的抽薹率[3],影響當歸藥材產量。早期抽薹發生后,當歸根的次生韌皮部和次生木質部比例發生改變,根木質化并空心,根部柴性大、缺乏油氣,不能入藥。已有文獻對當歸的研究主要集中在育種[4]、栽培技術[5-6]、化學成分[7]、功效[8]等方面,分子生物學水平的研究多是利用分子標記技術,如簡單序列重復區間擴增多態性(ISSR)[9-10]、隨機擴增多態性DNA[11]及內轉錄間隔區(ITS)[12]等分析當歸種質資源的遺傳多樣性,而通過轉錄組學方法研究當歸的功能基因相對較少。抽薹的機制尚未闡明,仍是影響當歸生產和供給的突出問題。本實驗探索當歸早期抽薹后相關基因表達,為當歸抽薹機制研究及分子育種提供基礎數據。
當歸樣品采自甘肅定西市岷縣十里鎮臺子村岷縣紅太陽食用菌種植農民專業合作社試驗田(N103°59′10.176″,E34°25′31.44″),于2017年7月21日采樣,在試驗田隨機選取6 株植物,抽薹和未抽薹的各3 株,剪取倒數第三片完全展開的成熟葉片中部小葉片,快速放入盛有液氮的容器中混合,剪碎除去葉柄葉軸部分,輕輕研磨成粉末狀,待液氮快揮發完時裝入凍存管,移入液氮罐當天運輸回實驗室,放入冰箱-80 ℃條件下保存,供后期轉錄組測序使用;RNA 6000 Nano Kit(美國Agilent 公司)。
2100 型生物分析儀(美國Agilent 公司);NanoDrop 2000c 型紫外-可見分光光度計(Thermo Fisher Scientific公司)。
當歸RNA 提取、cDNA 文庫構建及測序實驗均由武漢華大基因科技有限公司進行。當歸樣本所測片段的序列過濾掉低質量、接頭污染及未知堿基N含量過高的reads,進行分析、組裝后得到Unigene。利用BLAST[13]程序搜索并比對非冗余蛋白(NR)、核酸序列(NT)、基因本體(GO)、真核生物蛋白相鄰類的聚簇(KOG)、京都基因與基因組百科全書(KEGG)、SwissProt和InterPro數據庫進行注釋。
以抽薹與未抽薹的當歸樣本Unigene|lg2(foldchange)|≥1.5 和P≤0.05 為標準,篩選出DEGs,并對其功能進一步分類,查找與抽薹相關的基因。
測序數據去除雜質后發現,每個當歸轉錄組的數據量超過100 Mb reads,其中長度>20 個堿基的占比為95%以上。把過濾后的reads 利用Trinity 2.0.6軟件進行合并組裝,共獲得了129 Mb原始序列的數據,去除原始序列數據中的接頭污染數據、重復冗余數據及低質量數據,共獲得了110 Mb 有效序列,其中有效序列占原始序列的85.24%。以上數據結果表明,高通量測序技術平臺BGISEQ-500 對當歸進行轉錄組測序獲得的序列數量和質量均較高[14]。其中抽薹當歸的基因序列長度為300 nt 的有17 253 條,基因序列長度為3000 nt的有455條,基因序列長度>3000 nt的有4665條(圖1)。

圖1 當歸轉錄組組裝序列長度分布
NR注釋結果顯示,當歸的同源Unigenes與葡萄Vitis viniferaL.、芝麻Sesamum indicumL.、中粒咖啡Coffea canephoraPierre ex Froehn.和大薊Cynara cardunculusFisch.ex DC.同源Unigenes百分比分別為18.51%、8.29%、7.46%和5.42%(圖2)。

圖2 當歸總轉錄本NR注釋匹配的物種分布
為了進一步了解當歸功能基因表達和與抽薹相關的功能基因情況,利用BLAST[14]對當歸轉錄組數據進行基因功能分類,最終發現219 197 條Unigene在GO 中得到注釋。綜合Unigene 功能將其分為細胞組分、生物過程和分子功能3 類,其中有些基因序列可能同時參與了多個進程。
細胞組分功能可分為17 個功能亞類,其中組成細胞結構(cell structure)的Unigene 有16 642 條,細胞組分(cell component)有16 510 條,組成細胞膜(cell membrane)的有15 367 條,這幾個功能亞類的基因注釋數量明顯高于其他細胞組分功能亞類。在分子功能中共有14 個亞類,可以看出許多功能亞類與活性有關,如核酸結合轉錄因子活性、抗氧化活性等。其中參與催化活性(catalytic activity)的Unigene 有21 330 條、參與結合(combination)的Unigene 有19 420 條、參與轉運活性(transport activity)的Unigene 有3125 條。參與生物過程的功能亞類最多,主要分類為細胞形成過程(cell formation process)20 820 條、細胞成分的組織或生物合成(tissue or biosynthesis of cellular components)3283 條、代謝過程(metabolic process)21 470 條、生長發育過程(growth and development process)1870 條、生物調節(biological regulation)4500 條、生長過程(growth process)348條(圖3)。

圖3 當歸轉錄組總Unigene的GO功能分類
根據各樣品基因表達結果可以檢測樣品(或者樣品組)之間的DEGs,使用DEseq2 和PossionDis算法進行檢測,差異表達結果見圖4。X、Y坐標軸均取基因表達量的對數值。通過2.2 項下的條件篩選得到936個DEGs。

圖4 抽薹與未抽薹當歸轉錄組DEGs散點圖
當歸的936 個DEGs 中 有69 個 與SwissProt、InterPro、NT 和KOG 等數據庫都不匹配。通過SwissProt數據庫對其余867個與數據庫匹配的DEGs進行分析,其中505 個與已知功能基因相匹配,比對成功,362 個被聚合為尚待鑒定的基因。505 個已知功能基因被分為182 個上調基因(UR)和323 個下調基因(DR)。根據生物功能和生理特性,將505個基因分為9 大類,分別為次生代謝、細胞形態發生、生物信號傳導、初生代謝、光合/能量、轉錄/多核苷酸代謝、翻譯/蛋白質修飾、轉運、脅迫耐受。
在DEGs 分析過程中,使用|lg2(fold-change)|≥1.5和P≤0.05的標準來識別DEGs。使用UniProtKB/SwissProt數據庫進行功能基因分類。其中轉錄/多核苷酸代謝的功能基因序列有82 條(占比16.24%);細胞形態發生的功能基因序列74 條(占比14.65%);生物信號傳導的功能基因序列70 條(占比13.86%);轉運的功能基因序列62 條(占比12.28%);初生代謝的功能基因序列60 條(占比11.88%);次生代謝的功能基因序列54 條(占比10.69%);光合/能量的功能基因序列50 條(占比9.90%);脅迫耐受的功能基因序列33 條(占比6.53%);翻譯/蛋白質修飾的功能基因序列20 條(占比3.96%)。從此次分類中可以看到,在當歸的生長發育過程中,除了最基本的生命活動,如轉錄核苷酸代謝外,細胞形態建成、生物信號傳導、次生代謝和初生代謝也占有重要地位,這表明細胞形態建成在當歸葉的形成和發育的過程中起到了重要作用。
從SwissProt數據庫中注釋到74個與當歸形態建成相關的DEGs,其中40 個涉及調節當歸開花、莖尖生長發育、種子發育、細胞生長分化、光合作用、葉片生長發育和開花的DEGs(表1)。

表1 當歸形態建成相關基因
目前,當歸全基因測序尚未完成,影響當歸抽薹相關的基因研究較少。葉是植物光合作用的重要器官,可積累營養物質為開花提供物質基礎。本研究采用BGISEQ-500 平臺測序技術對當歸葉轉錄組進行高通量測序,通過將當歸樣本的Unigene 與功能數據庫進行比對,找出DEGs 并進行功能基因分類。結果表明,在當歸的生長發育過程中,除了最基本的生命活動,如轉錄核苷酸代謝外,細胞形態建成、生物信號傳導、次生代謝和初生代謝占重要地位。其中有74 個差異表達基因參與細胞形態建成,占14.65%,表明細胞形態建成在抽薹當歸葉的生長發育的過程中起到了重要作用。
當歸抽薹形態上表現出花期過早或者當歸地上部分發育過度,所以從當歸DEGs 中進行分析,發現影響細胞的分裂和調節生長的基因有CDC48C、CYCA1-1;調節當歸種子生長發育的基因主要有CSLA2、AUG8,主要調節種皮發育和啟動胚胎發生;促進當歸葉片生長的基因有CER26、BTAF1等;調節當歸開花的基因有TPS1、ALA6、AP2、SOCI,主要調節當歸花瓣和花粉管等的發育;調節葉片光合作用的基因主要有CAB37、CAP10A,其主要功能有參與光合作用、光捕獲、積累營養物質。
轉錄組測序反映的是特定條件下表達活躍的基因,可以快速、高效地研究生物調控方式,因此轉錄組測序在分子標記、代謝物含量監控、功能基因的挖掘、藥用植物活性成分生物合成與調控分析、藥材道地性分子機制探索方面提供了新的思路和方法[15]。目前利用轉錄組測序技術在金銀花[16]、丹參[17]、人參[18]等藥用植物活性成分的生物合成與調控研究中已取得重大進展。當歸早期抽薹不僅影響藥材的產量和質量,還制約當歸資源可持續發展。本實驗結果豐富了當歸轉錄組數據,為進一步研究影響當歸抽薹及分子育種提供了基礎數據。但是調控當歸抽薹的分子機制和通路有待進一步研究。研究表明,與未抽薹植株比較,早期抽薹當歸可溶性糖和蛋白質含量降低,而游離氨基酸含量、過氧化物酶和多酚氧化酶活性有升高趨勢[19];在內源激素方面,早期抽薹植株開花過程中植株體內赤霉素A3(GA3)、玉米素核苷和多胺類含量均呈增加的趨勢[20]。因此,可進一步考察當歸抽薹植株可溶性糖、蛋白質、GA3含量的變化,使調控開花的基因和代謝通路更加清晰。