李浠榕
(西安交通大學附屬中學,陜西 西安710000)
生物因為光、暗,冷、熱等呈周期變化的自然因素產生的節律行為具有周期性,而隨著外界自然環境變化,生物體自身進化出了一套能夠進行前瞻性調節的機制。根據節律的長短以及響應不同的環境變化,這個機制的節律可分為:日節律、月節律、季節節律和年節律等。而被研究最多的是以24 小時為周期的日節律變化,這是生物因晝夜變化做出的適應,從生物的生理方面進行有周期性波動的內在節奏稱為生物鐘(Circadian Clock)。
植物的生物鐘被首先發現與植物的葉片移動,比如菜豆葉片在光照條件不變的條件下,也會做出上下擺動,而葉子的升起和下降運動的所構成的周期接近27 小時,近似于一天的24小時,這是植物的近似晝夜節律的典型例子。
一般來說,植物生物鐘系統可以分成三個組成部分:輸入途徑、核心振蕩器和輸出途徑。輸入途徑負責將外界環境變化信號傳導入生物鐘的信號通路,從而使核心振蕩器響應環境信號,已知的輸入途徑有接受光- 暗變化以及冷- 熱變化等信號通路。核心振蕩器定位于細胞核內,為幾個以轉錄因子為主的基因所構成的互相抑制調控的閉合回路,并利用表達高低不同產生近似24 小時的晝夜節律的振蕩。輸出途徑為核心振蕩器通過時間性表達差異調控植物其他基因的調控機制,單個振蕩器可以通過其轉錄因子特性,調控多個其他基因的表達,并利用其本身的表達節律性從而影響其他基因的表達節律性,以達到調控諸多關鍵基因從而控制植物生長發育和重要生理過程的目的。
十字花科植物擬南芥為植物研究的模式物種,具有在全球分部廣,生長周期短,結種多,基因組小等作為植物研究的優點。2000 年,國際擬南芥基因組合作聯盟首先完成了擬南芥的基因組測序,是第一種完成全基因組測序和分析的植物,并闡述了擬南芥基因組序列與植物演化和農業的關系,并介紹了其他植物基因組的課題。2016 年6 月9 日,1135 個擬南芥(Arabidopsis thaliana)基因組重測序的論文在Cell 期刊在線發表。這篇對1135 個擬南芥基因組全基因組序列分析的論文的發表,宣告了對模式植物擬南芥至少1001 個品系(生態型)的全基因組序列分析計劃項目一個階段的結束,該項目揭示不同株系的野生型擬南芥基因組上自然的序列突變,并發現了擬南芥存在著祖先的殘余群體。
前文已敘述過擬南芥基因組測序的已完成工作,在2017年,擬南芥基因組注釋得到了更新。現今擬南芥的全部生物學信息位于The Arabidopsis Information Resource (TAIR)網站上供研究人員查詢使用,并包括擬南芥27 000 個基因和35 000個編碼蛋白的研究分析信息。通過該網站可以尋找各個擬南芥基因的序列,以及關于該基因的很多分析信息,另外還可以根據每一個基因的位置查找并且購買該基因的突變體。本文的生物信息學資源均來自TAIR 網站。
Diurnal 網頁是對多個植物基因的節律性表達進行預測的服務網頁,為的Mockler 實驗室構建,是連接計算生物信息學和分子基因組學的重要分析工具,其數據來源為已知的基因表達分析數據。該網站是一個連接生物信息學和分子基因組生物學的工作站,可以根據基因編號查找通過計算方法統計出可視化數據,可以預測一個基因的時間性表達狀況,自我剪接等等內容,現在已經收錄了包括擬南芥,水稻,短穗二柄草,大豆,楊樹,玉米等植物的相關生物學信息。
Plant CARE 網頁是啟動子分析服務網頁,為比利時根特大學和VIB 研究所共同創建,該服務網頁收錄了已公開發表的擁有染色質免疫沉淀測序(ChIP-Seq)數據,并根據數據分析了各種轉錄因子結合在啟動子上的結合片段(motif),而后根據已知的轉錄因子結合的motif 來預測一段啟動子上可能結合的轉錄因子情況。
為了預測擬南芥未知基因AT1G16730 的表達節律性,我們先在TAIR 網站上查找關于該基因的生物信息學資料,根據網頁顯示得知:該基因位于擬南芥第一條染色體上,堿基位數為第5727406-5726358,反向表達。基因組全長1039bp,其中編碼區全長609bp,編碼區中間有一個內含子。編碼區可以編碼一段202 個氨基酸殘基的蛋白,分子量為21685.9,蛋白質的等電點為4.79。該基因表達時期分析結果表明,基因表達的細胞內定位在細胞核內,以及過氧化物酶體上,在擬南芥生長史上與開花時期表達,表達部位為保衛細胞、雄蕊以及花莖。

圖1 AT1G16730 的表達節律,在第20 到24 小時有很明顯的表達高峰

圖2 AT1G16730 基因的啟動子分析
通過上述描述可以看出,這個基因的大小并不大,編碼的蛋白是一個相對比較小的蛋白,只有20kd 左右。另外這個基因在擬南芥植株的生活史中,只在開花時期才表達,并且表達有組織特異性,只在雄蕊,保衛細胞,花莖中表達。根據擬南芥的生長規律,花莖只有擬南芥抽薹之后(進入花期)才會生長出來,而雄蕊更是只有花開始發育之后才會表達,證明該基因在擬南芥幼苗期,以及營養生長期的表達不會很高(只長蓮座葉時期),而基于其細胞內定位在細胞核與過氧化酶酶體上這一點來看,該基因編碼的很可能是一個轉錄因子,這預示著它和擬南芥開花以及花的生長發育有關,并且在這個過程中起重要的轉錄調控作用。
使用Diurnal 網頁輸入AT1G16730 基因的編號,可以對該基因的表達節律性可能性進行預測。前文已敘述過,Diurnal 網站通過收錄的各種植物的轉錄情況數據可以對某個基因的2個晝夜的表達情況進行預測。在輸入頁面之上,在Genome 選項中選擇物種Arabidopsis thliana(擬南芥),確定物種,而后選擇LLHD 選項選擇24 小時全光照的光照條件,最后在Cutoff 選項中選擇默認的數值0.8,這個選項是將節律表現的不夠強的基因表達曲線去除,最后電擊Submit 提交條件。網頁歸化出的表達曲線表現出了很強的表達節律,在第0 小時和24 小時有明顯的表達峰值,但是在其他時間點表達量都不高(圖1)。
通過這個分析,我們得知該基因在全光照條件下在一天大部分時間表達量都不高,只有在臨近一天結束時期才會有一個峰值,這說明只有在午夜附近時候該基因的功能才起到最重要的作用,這首先預示著該基因可能在黑暗環境下的作用會比在有光照時候的作用大,結合該基因在保衛細胞中表達這一點來看,有可能對氣孔開閉控制有調控作用。
一般情況某個基因的轉錄水平與該基因的啟動子直接相關,現已知AT1G16730 基因的表達可能存在節律性,所以對該基因的啟動子做生物信息學分析就顯得尤為重要。利用Plant CARE 網頁進行分析,在網頁中點開Search of CARE 一項,將AT1G16730 基因起始密碼子上游1666 個堿基作為該基因的啟動子序列輸入進輸入框,點擊Search 鍵開始進行分析。
從分析的結果中可以得知,該基因啟動子中不但有擬南芥核心振蕩器調控必備的G-Box 區域以及與能夠被核心振蕩器基因CCA1,LHY 調控的相似序列MYB-Binding 序列,這預示著該基因有被擬南芥核心振蕩器調控的可能性(圖2)。
綜上所述,擬南芥AT1G16730 基因的各種分析表明,該基因表達可能有節律并且有可能是被生物鐘核心振蕩器直接調控的基因。因為生物鐘的重要性但是因為該基因表達存在組織特異性(只在雄蕊,保衛細胞,花莖中表達)和生長階段特異性(只在開花時期表達),這與已知的直接被生物鐘核心振蕩器直接調控的基因有一定的差異,因為一般被核心振蕩器直接調控的基因在擬南芥幼苗階段就可以表達。關于擬南芥生物鐘的研究目前還比較多的集中于對擬南芥幼苗時期核心振蕩器的轉錄,翻譯,修飾以及它們構成的對其他基因的調控網絡,但是對于擬南芥開花時期生物鐘究竟是如何發揮作用的,除了影響開花時間之外其他方面研究還比較少。基于擬南芥的生活史,抽薹是擬南芥由營養性生長向生殖性生長的拐點,從此擬南芥進入花期,而植株整體的很多基因的表達,調控肯定會發生變化,是否會有很多類似AT1G16730 基因一樣只有在開花時期才表達的基因參與了生物鐘對植物各個方面的調控,從而參與到這個過程之中,這方面未來有待于相關研究人員做進一步的研究,而這些未知功能基因的生物信息學分析無疑是非常重要的一個步驟。