雷鳴任海龍
(1.西藏大學理學院;2.西藏大學醫學院,西藏 拉薩 850000)
菊葉香藜是藜科刺藜屬植物[1],其具有刺激性氣味,具有抑菌、昆蟲活力抑制等作用[2,3],中藥用于治療哮喘、支氣管炎和偏頭痛[4],據藏藥志記載有抗腫瘤活性[5]。菊葉香藜也為中等飼用植物[6],通常情況下為亞優勢種或伴生種[7]。研究發現在群落演替中重要值在明顯增加,同時也可作為固定沙地的指示植物[8]。許新勇等[9]研究發現,在西藏“一江兩河”流域地區,伴隨著植被發育和群落演替的進程,在半固定沙丘和固定沙丘,菊葉香藜逐漸成為優勢種,說明菊葉香藜本身生理生態特征非常適應“一江兩河”流域氣候環境。2003年,朱格鱗等在Flora of China中,基于形態學特征將菊葉香藜等植物歸類到刺藜屬植物[1],并未對菊葉香藜的進行分子方面的鑒定。另外,psbA基因是葉綠體基因,序列相對保守,編碼產物D1蛋白,是PSⅡ反應中心2個核心蛋白之一,介導光合作用過程中的電子傳遞[10],在植物屬以上水平的分子系統發育的比較中具有顯著作用[11]。因此,在本研究中,通過菊葉香藜psbA序列生物信息學分析和系統發生樹構建,為菊葉香藜的分類學提供分子依據。
通過轉錄組測序,將注釋到psbA基因的unigenes在NCBI進行比對,然后再進行拼接。
通過NCBI在線分析軟件ORF Finder對核苷酸序列進行分析,預測出可能的氨基酸序列;通過蛋白質二級結構在線預測軟件PredictProtein,預測出氨基酸序列的二級結構、相對親水表面、氨基酸組分和核苷酸組分;用CondonW和CUSP對菊葉香藜psba基因編碼序列進行密碼子偏好性分析,基于中性繪圖和ENC-plot探索影響psba基因密碼子偏好性的因素;psba基因編碼蛋白的理化性質采用ExPasy-ProtParam分析軟件及BioEdit軟件預測;疏水性/親水性采用Ex-Pasy-ProtScale預測;跨膜區域通過軟件TMHMM進行分析;結構功能域及功能分類采用ProtFun預測;通過Swiss-Model在線預測軟件預測出三級結構;通過BioEdit進行序列差異分析;用MEGA6.05計算菊葉香藜與其近緣物種的遺傳距離,并構建系統進化樹。
從NCBI數據庫中下載其它物種psbA基因完整序列,共9個物種(表1)。

表1 NCBI數據庫中下載9個物種psbA基因完整序列
2.1.1 菊葉香藜psbA基因編碼蛋白理化性質。基于轉錄組測序,將注釋到psbA基因的unigenes(c1846_g1、c19645_g1、c24547_g1)在NCBI數據庫中進行比對,然后拼接在一起,最終的序列長度為1059bp,GC含量為41%,序列已上傳到NCBI數據庫,序列號為:KY942083。
通過NCBI在線分析軟件ORF Finder對核苷酸序列進行分析,預測出氨基酸序列,共353個氨基酸,如下所示:MTAILERRESESLWGRFCNWITSTENRLYIGWFGVL MIPTLLTATSVFIIAFIAAPPVDIDGIREPVSGSLLYGN NIISGAIIPTSAAIGLHFYPIWEAASVDEWLYNGGPYE LIVLHFLLGVACYMGREWELSFRLGMRPWIAVAYSA PVAAATAVFLIYPIGQGSFSDGMPLGISGTFNFMIVFQ AEHNILMHPFHMLGVAGVFGGSLFSAMHGSLVTSSLI RETTENESANEGYRFGQEEETYNIVAAHGYFGRLIFQ YASFNNSRSLHFFLAAWPVVGIWFTALGISTMAFNLN GFNFNQSVVDSQGRVINTWADIINRANLGMEVMHER NAHNFPLDLAAIEAPSING
負電荷殘基總數為28,正電荷殘基總數為15,其理論分子量為38962.62Da,理論等電點為5.12,不穩定指數是36.33。分子式為C1793H2682N456O493S14,原子總數為5438,脂肪系數為96.77。
2.1.2 菊葉香藜psbA基因編碼蛋白氨基酸組分分析。氨基酸組分中最多的為A 35(9.9%),最少的為C 2(0.6%),其中,沒有氨基酸K;相對親水表面為71.67%在0-16%之間,28.33%在16%-100%之間。(如圖1所示)

圖1 菊葉香藜psbA基因編碼蛋白氨基酸組分
2.1.3 菊葉香藜psbA基因編碼蛋白二級結構。通過蛋白質二級結構在線預測軟件PredictProtein,預測出氨基酸序列的二級結構為α-螺旋57.51%,β-折疊4.82%,β-轉角37.68%.
2.1.4 菊葉香藜psbA基因編碼蛋白親疏水性分析。用ProtParam分析軟件對菊葉香藜psbA基因編碼蛋白的疏水性/親水性進行預測,其疏水性平均系數為0.350。參照ExpASy的Protscale程序計算菊葉香藜psbA基因編碼蛋白的疏水性/親水性圖譜(圖2)分析氨基酸殘基的得分可知,多肽鏈的第51號的丙氨酸(Ala)具有最高分值3.189,疏水性最強。第234號天冬酰胺(Asn)具有最低分值-2.133,親水性最強。

圖2 菊葉香藜psbA基因編碼蛋白親疏水性分析
2.1.5 菊葉香藜psbA基因編碼蛋白跨膜區域。由圖3可知,菊葉香藜psbA基因編碼蛋白存在7個跨膜區域,分別位于29~51、71~93、105~127、142~164、171~193、197~219和273~295氨基酸之間,跨膜區分析結果與該蛋白的親/疏水性分析結果基本一致。

圖3 菊葉香藜psbA基因編碼蛋白跨膜區域
2.1.6 菊葉香藜psbA基因編碼蛋白結構功能域及功能分類。通過Protfun分析軟件預測菊葉香藜psbA基因編碼蛋白結構功能域及功能分類從分析結果可知(表2),菊葉香藜psbA基因編碼蛋白為非酶類(Prob=0.805,odds=1.128)和轉運相關蛋白(Prob=0.191,odds=1.749),該蛋白具有翻譯、脂肪酸代謝、輔酶因子的生物合成和能量代謝作用的可能性分別為4.760、4.477、3.423和2.195。因此,推測該蛋白的主要作用與轉運有關。

表2 psbA基因編碼的蛋白質的功能預測
2.1.7 菊葉香藜psbA基因編碼蛋白三級結構預測。通過Swiss-Model在線預測軟件預測出三級結構,選取Template>30%、GQME值接近1、|QMEAN|<4的模型,預測出的菊葉香藜psbA基因編碼蛋白三級結構(圖4)。

圖4 菊葉香藜psbA基因編碼蛋白三級結構預測模型
2.1.8 菊葉香藜psbA基因密碼子偏好性。通過CUSP和CondoW程序分析菊葉香藜及其近緣種psbA基因的密碼子偏好性基本指標。從表3中可以看出,各物種psbA基因在密碼子偏好性方面差異較小,其中CBI、GC含量、GC3和GC3s,莧科植物均大于藜科植物,而ENC值,莧科植物均小于藜科植物。GC1、GC2、GC3和GC含量均小于0.5,說明psbA基因密碼子各位點均偏好使用含A/T的密碼子,而GC3s均小于0.3,說明在同義密碼子中,psbA編碼序列更偏好使用以A/T結尾的密碼子,其中,NNT>NNA>NNC>NNG,NNT遠大于NNC。ENC值均位于35-50之間,說明psbA基因密碼子偏好性一般,基因表達水平一般。
通過CUSP和CondoW程序分析菊葉香藜psbA基因的密碼子偏好性可知,菊葉香藜psbA基因總共使用了49個密碼子,23個密碼子為偏好性密碼子(RSCU>1),其中 GCU、GAU、GAA、GGU、AUU、CUA、UUA、CCU、CAA、CGU、AGU、UCU、ACU和GUA為高頻密碼子(RSCU>1.5),以GU和CU結尾的密碼子全部為高頻密碼子。在偏好性密碼子中,有18個密碼子以A/T結尾,這18個密碼子Fraction和使用頻率(Frequency)都相對較高(表4)。
為探索影響psbA基因密碼子偏好性的因素,通過中性繪圖和ENC-plot繪圖進行分析。中性繪圖結果顯示(圖5所示),GC12與GC3相關性不顯著(R2=0.1,P=0.251),說明psbA基因密碼子第1、2位和第3位堿基相關性不顯著,psbA基因GC含量高度保守,密碼子偏好性主要受選擇作用影響。
ENC繪圖結果顯示(圖6),所有物種的psbA基因均落在標準曲線下方相對較遠的位置,說明密碼子的偏好性只受到選擇作用的影響。進一步探究影響選擇作用的因素,本研究主要分析CAI值和蛋白長度對ENC值的影響,發現CAI值與ENC值表現為極顯著的負相關(R2=0.6817,P<0.01,回歸方程為:y=-37.053x+51.522),蛋白長度與ENC值表現為完全線性相關(x=353)。因此,選擇作用主要受到表達水平和蛋白質長度的影響,psbA基因密碼子偏好性受到表達水平和蛋白質長度的的影響。

表3 菊葉香藜及其近緣種psbA基因的密碼子偏好性基本指標

表4 CUSP和CondoW程序分析菊葉香藜psbA基因的密碼子偏好性

圖5 GC3和GC12中性繪圖結果

圖6 GC3s和ENC繪圖結果
2.1.9 菊葉香藜psbA基因系統發生樹結果。由菊葉香藜及其近緣物種的psba完整序列生成的系統進化樹可知(圖7),系統樹上聚為兩大支,藜科和莧科各聚為一大支,說明在藜科和莧科中,psbA基因存在差異。而對于藜科這一支來說,psbA基因在藜科各屬之間差異相對較大;各進化支部分種間自展值為100%,說明psbA序列對于種的鑒定存在一定的局限性。菊葉香藜原為藜科藜屬植物,但在近年來的藜屬與刺藜屬的爭議中,被劃為藜科刺藜屬中,從圖7中我們可知,菊葉香藜與藜屬植物分別聚為一支,正好與形態學分類上的觀點一致。

圖7 菊葉香藜psbA基因系統發生樹結果(“●”為菊葉香藜)
菊葉香藜psbA基因編碼序列長度為1059bp,GC含量為41%,共編碼353個氨基酸,最多的為丙氨酸(A),為35個(9.9%),不含有賴氨酸,符合psbA基因的特征。二級結構包含α-螺旋(57.51%),β-折疊(4.82%),β-轉角(37.68%)。psbA 基因編碼蛋白為疏水性蛋白,包含7個跨膜區域,是非酶類轉運蛋白。psbA基因密碼子偏好性水平相對較弱,主要受到選擇作用、表達水平和蛋白質長度的影響,該結果與尚明照等[12]研究結果一致,為進一步研究影響psbA基因密碼子偏好性的因素提供依據。在同義密碼子中,psbA編碼序列更偏好使用以 A/T 結尾的密碼子,其中,NNT>NNA>NNC>NNG,NNT遠大于NNC,與侯惠靜[13]研究結果不一致,與侯士昌等[14]研究結果一致。系統發生樹的結果證明菊葉香藜與藜屬植物存在差異,支持將其劃歸到刺藜屬中。