王 芬, 張龍芬, 木 仁, 馬 媛, 郭治友, 崔寶祿, 李 靜, 張 雯
(1.黔南民族師范學院生物科學與農學院, 貴州 都勻 558000;2.長順縣農業農村局, 貴州 長順 550700)
茶產業是“一帶一路”國家戰略中的傳統優勢特色外向型產業,發展前景廣闊。茶樹是世界上最受歡迎的非酒精飲料作物之一[1],也是非常重要的商業化飲料作物[2];茶樹是中國西南地區的特有種,目前種植在40多個國家[3-4]。貴州特有的喀斯特地貌氣候呈立體結構,年均降水量1 500 mm,適宜的溫度孕育了豐富多樣的茶樹資源[5],是茶樹的發源地及茶葉經濟的故鄉[6]。截止2016年,貴州的茶葉種植面積達到4.4×105hm2,是茶葉種植面積最大的省份[7],主要品種為福鼎大白茶,具有繁殖力強、產量高、品質好、適應性廣的特性。茶葉的流行不僅僅是因為特殊的風味,更是由于主要的次生代謝產物——茶多酚[9-10]。它對人體有益[11],可以抗菌[12],抗腫瘤,具有抗氧化活性[13-15],對心血管疾病、肥胖、糖尿病和代謝綜合征都有療效[16-17]。
蛋白質相互作用網絡[18]是指一個物種內的所有蛋白質之間的相互作用關系,并從信號轉導、生化等角度進行研究。揭示蛋白質相互作用關系,構建蛋白質相互作用網絡圖,已成為蛋白組學[19]研究的熱點,也是后基因組時代的難題所在。蛋白質相互作用是生物體進行代謝活動的基礎,因此,在所有生命活動中,都有蛋白質相互作用現象的發生。研究都勻毛尖的蛋白質相互作用網絡可以對茶的整個生物過程有一個綜合的理解。
以貴州省黔南州喀斯特山區優勢茶葉品種福鼎大白種茶為材料,利用二代Illumina測序平臺對其進行轉錄組測序,分析根莖葉的差異基因,構建差異基因蛋白質相互作用網絡。挖掘都勻地區福鼎大白種茶參與類黃酮生物合成、萜類化合物生物合成等代謝途徑的相關基因,揭示影響茶多酚代謝的關鍵因素,為培育更好的茶樹品種探尋茶多酚代謝機理提供參考。
試驗材料福鼎大白種茶樹(Camelliasinensis(L.)O.Ktze),是2018年11月在黔南州都勻市紅敏茶園剪取的枝葉扦插所得,在培育的茶苗中選取培養條件相同、長勢情況基本一致、沒有被污染的茶苗植株9盆,分為3組,分別取嫩根、嫩莖和嫩葉標為“根1重復、根2重復、根3重復,莖1重復、莖2重復、莖3重復、葉1重復、葉2重復、葉3重復”,放入液氮中再放入-80 ℃冰箱保存。
將二代Illumina測序得到的結果進行基因表達量分析,并進一步分析葉與莖、葉與根、莖與根的差異表達基因,運用同源比對的方法將差異基因與STRING 9.1數據庫進行比對以及提取出差異表達分析結果與STRING 9.1數據庫收錄的互作關系,再利用Cytoscape 3.3.0將比對上的差異基因進行蛋白質相互作用網絡的構建,分別構建出葉與莖、葉與根、莖與根的差異基因蛋白質相互作用網絡并對網絡進行合并。
利用Illumina測序平臺對福鼎大白種進行轉錄組測序,根據基因表達量篩選根、莖、葉的差異基因,通過同源比對的方法以及差異表達分析結果和STRING 9.1數據庫收錄的互作關系對,構建差異基因的蛋白質相互作用網絡(表1)。

表1 差異基因蛋白質相互作用數目
將葉與莖、葉與根、莖與根的差異基因蛋白質相互作用網絡合并為一個大的綜合差異基因互作網絡,該網絡共4 249個節點,66 342個互作。從聚合系數、直徑、半徑、最短路徑、特征路徑長度等方面對4個網絡的特性進行比較,發現差異不顯著,并且網絡表現出小世界特性(表2),大部分節點不與彼此鄰接,但是可以從任一其他點經少數幾步就可到達。

表2 4個網絡的全局特性
中介中心性的值介于0與1之間,是指網絡中的節點充當其它兩個節點之間最短路徑的中介次數,次數越高,中介中心性就越大(圖3 a)。蛋白i的度是與此蛋白相連節點數,即蛋白i的互作數目,i的度越高,說明蛋白i越重要。在葉和莖、葉和根、莖和根以及合并的網絡中,發現節點的度符合冪律分布(圖3 b),其中葉與根的差異基因蛋白互作網絡中,P(x)≈854.28x-1.174,R2=0.738,相關性是0.959。葉與莖的網絡中,P(x)≈509.82x-1.194,R2=0.747,相關性是0.955。莖與根的網絡中,P(x)≈543.96x-1.281,R2=0.759,相關性是0.863。在合并的網絡中,P(x)≈888.33x-1.15,R2=0.692,相關性是0.939。說明大多數蛋白的相互作用數較少,很少一部分蛋白質的連接度較高,是一種無尺度現象。接近中心性的值也介于0和1之間,是指網絡中的一個節點與其它節點的接近程度,即一個節點到其它節點的平均最短路徑的倒數(圖3 c)。蛋白u的拓撲系數是Tu=avg(S(u,v))/nu。S(u,v)表示u和v共同的相鄰蛋白數,nu表示u的鄰居數(圖3 d)。
在葉與莖、葉與根、莖與根以及合并的差異基因蛋白質相互作用網絡中,利用Cytoscape 3.3.0的插件MCODE分別預測出66、99、62個和110個功能模塊(表3),參數設置為默認,對于蛋白質功能預測以及揭示各種生化反應過程的分子機理都有著極大的幫助。葉與根差異基因蛋白質相互作用網絡中最大的功能模塊(圖2)得分為56.941,具有120個節點,3 388個互作,主要參與植物病原互作通路,植物激素信號轉導通路等。

表3 差異基因蛋白質相互作用網絡中的功能模塊特性
利用差異基因蛋白質相互作用網絡可以預測蛋白質的功能。在一個蛋白質相互作用網絡中,如果已知某些蛋白質的功能,那么與之相連的其他蛋白可能具有類似的功能。葉與莖的差異基因蛋白相互作用網絡中共15 764個互作,其中TEA 003744,TEA 019056,TEA 020779,TEA 005686,TEA 008246,TEA 000931,TEA 024511,TEA 033307是相互作用數最多的8個蛋白(表4),它們在功能上具有相似性。TEA003744是絲氨酸/蘇氨酸蛋白激酶,具有ATP結合功能,參與信號轉導,與其互作的蛋白有281個,由此可以推出這281個蛋白也可能具有類似的功能。

表4 葉與莖差異基因蛋白質相互作用網絡關鍵蛋白
利用Cytoscape 3.3.0提取葉與莖差異基因蛋白質相互作用網絡中最大的一個子網(圖3),具有1 062個節點,13 726個邊,紅色的節點代表度最大的8個節點,與整體網絡一致,通過子網也可以預測蛋白質的功能。
利用STRING 9.1數據庫和同源比對方法預測出葉與莖有15 764個蛋白質相互作用,葉與根有49 191個相互作用,莖與根11 406個互作,合并的網絡共有66 342個相互作用。4個網絡都符合冪律分布,即少部分蛋白具有高連接度,而大部分蛋白的連接度較低。葉與根的差異基因的蛋白質相互作用最多,可能由于葉與根差異基因較多導致。對四個網絡的聚合系數、直徑、半徑、最短路徑、特征路徑長度等特性進行比較分析,差異不大,并且網絡表現出小世界特性。
利用Cytoscape 3.3.0的插件MCODE分別預測出4個網絡的功能模塊,對于蛋白質功能預測意義重大。其中茶多酚相關功能模塊打分為9.412,具有18個節點和80個互作(圖3)。該18個蛋白主要是細胞色素P 450、香葉醇8-羥化酶、氧化酶、類吡喃二烯氧合物、類黃酮。全部參與茶多酚次生代謝產物的生物合成、運輸和代謝,主要表現為油菜素類固醇生物合成、類黃酮生物合成、二萜生物合成、倍半萜和三萜生物合成、甲基赤蘚糖4-磷酸途徑。分子功能主要體現在氧化還原酶、金屬離子結合、芳香化酶活性等。因此,推斷18個蛋白均與茶多酚功能相關,為培養茶樹新品種提供理論依據。
通過差異基因蛋白質相互作用網絡可以預測蛋白質的功能。都勻毛尖福鼎大白茶富含茶多酚,具有提神醒腦、抑制動脈粥樣硬化、抑菌抗癌等功能。都勻毛尖特有的芳香主要自類黃酮和萜類化合物等的代謝,通過差異蛋白質相互作用網絡可以預測與類黃酮等物質相關的基因。本研究結果可為類黃酮等物質的代謝機理研究提供一定的理論依據,為培養良種茶樹提供理論參考。