摘要:利用NCBI數據庫中小鼠Embryonic Stem Cells (ESC)與Neural Progenitor Cells (NPC)的基因芯片結果及NPC時期的RFX1ChIPSeq數據,進行有關RFX1的分析,結果表明:RFX1結合位點富集在1,2,4,5,7,9,11染色體上,Y染色體上最少,其他染色體上比較均衡;在基因組中結合位點分布區域主要在基因的promoter區域,約有53.2%,其次是intergentic,占22.5%,body區域,占13.1%,enhancer區域,占11.2%.說明RFX1是以結合在基因的promoter區為主要形式對目的基因進行調控.同時在DAVID數據庫中用生物信息學方法探索了RFX1靶基因的生物學功能分類.
關鍵詞:神經先祖細胞;RFX1;ChIPSeq
中圖分類號:Q341文獻標識碼:A
轉錄因子RFX1(regulatory factor X1)是RFX基因家族(小鼠基因組中含有7個RFX家族成員)第一個被發現的成員,以結合蛋白的形式存在于主要組織相容性復合物分類II基因(major histocompatibility complex (MHC) class II)啟動子中\[1\],且在人類基因組中具有大量的結合位點\[2\].前人的研究表明RFX1是RFX家族中最典型的成員,在各種組織中都有表達,尤其在哺乳動物腦組織中表達量特別高\[3\],其除了控制乙肝病毒I型增強子\[4\]及與纖毛起源形成有關外,有可能還對靶基因的活性具有重要的調控作用.
RFX1含有一個Cterminal抑制區域,與二聚化功能域相重疊;含有一個Nterminal激活區域,主要在基因的啟動子區對基因起到抑制或激活作用\[5\].以往研究表明RFX1不是一個常規的轉錄因子,早期可能沒有活性,當它的啟動子與其他因子形成復合物時被激活或抑制[6-7].除了MHCII基因外,幾個潛在靶基因可能被RFX1與臨近的RFX2,RFX3共同調控.RFX1激活白介素5受體α基因\[8\]、促進大鼠神經特異性基因煙胺比林谷氨酸運載體類型3基因的表達\[9\],敲除線蟲中與RFX1同源基因,呈現嚴重的感覺器官缺陷癥,說明RFX1在神經系統中具有一定的作用,可能參與調控了感覺神經的分化過程\[10\].RFX1與HDAC1(Histone deacetylase)相互作用抑制COL1A12和ID2的表達\[11-13\].RFX1通過與HDAC1及DNMT1(DNA methyltransferases)相互作用抑制分化抗原CD11a與CD70的表達,在系統性紅斑狼瘡綜合癥中有重要的作用\[14\].RFX1抑制cmyc基因、增殖細胞核抗原PCNA(proliferating cell nuclear antigen)、微管相關蛋白MAP1A、成纖維細胞生長因子FGF1的表達\[15-18\].Xie等2008年通過生物信息方法預測RFX1在人基因組中含有15 319個結合位點\[19\],小鼠中敲除RFX1導致胚胎早期致死\[20\],人類染色體含有RFX1的一段19p13.12缺失,會導致多種先天性畸形,包括耳聾、淚道狹窄、斜視、雙側頸靜脈竇、先天性心臟畸形、胼胝體發育不全、小腦蚓部發育不全\[21\],說明RFX1在生物進程中具有重要的調控作用.然而RFX1轉錄因子在靶基因中的結合位點特殊性及其相關調控機制還不完全清楚.
因此本文利用劍橋大學NCBI數據庫(http://www.ncbi.nlm.nih.gov)中小鼠ESC與NPC的基因芯片結果及NPC時期的RFX1ChIPSeq數據,在DAVID(the Database for Annotation, Visualization and Integrated Discovery)(http://david.abcc.ncifcrf.gov/home.jsp)數據庫中進行有關RFX1的結合位點及其靶基因功能分類等相關的生物信息學分析.
1材料與方法
11材料
NCBI數據庫(http://www.ncbi.nlm.nih.gov)中小鼠Embryonic Stem Cells (ESC)與Neural Progenitor Cells (NPC)的基因芯片結果及NPC時期的RFX1ChIPSeq數據,在DAVID(the Database for Annotation, Visualization and Integrated Discovery)(http://david.abcc.ncifcrf.gov/home.jsp)數據庫中進行分析.
12實驗方法
表達譜數據信號值使用的是文章已經處理好的數據,Normalized signal intensity in log2;差異表達基因使用samr程序篩選,篩選標準,Pvalue<0.02% (delta=1.8),fold_change>2;RFX1 (peak detection)結合位點掃描使用 MACS程序,篩選標準:Pvalue<10-8,tag>10.
基因注釋及功能分析按照DAVID(the Database for Annotation, Visualization and Integrated Discovery)(http://david.abcc.ncifcrf.gov/home.jsp)數據庫中提供的應用指南進行.
利用服務器,浪潮天梭10 000;具體配置,兩個計算節點,一個管理節點,20個核,40G內存,硬盤146*6 G,CPU XeonE5620,運算速度2 000億次/s;系統,RedHatLinux AS 5.4,對上述數據進行處理分析.
2結果
21NPC的RFX1ChIPSeq數據分析
利用劍橋大學NCBI數據庫中小鼠ESC與NPC的基因芯片結果及NPC時期的RFX1ChIPSeq數據,進行有關RFX1的分析見圖1(a)在圖1中,RFX1ChIPSeq數據在軟件中顯示的RFX1在8號染色體區域的閱讀分布,可以看到RFX1富集峰、較低峰、本地區域的背景;(b)對照組在相同條件下的軟件閱讀圖;(c)RFX1基因在8號染色體上的基因結構與位置,長方體為外顯子、橫線為內含子、兩側短長方體為UTR,預測小鼠基因組RFX1結合位點信息.對基因芯片結果進行初步分析顯示共有45 018個基因,其中下調的有2 432個,上調的有2 713個.對NPC的RFX1ChIPSeq數據分析,將含有RFX1峰值的基因進行了相關的分析,受RFX1調控的基因共有1 166個,其中494個是下調基因,672個是上調基因,RFX1可能在ESC向NPC分化中調控這些基因的表達,從而實現精確分化.
22RFX1調控的基因分析
DAVID生物信息資源,能夠從大量基因列表中對其進行快速、高效、多樣化的功能分析.與GoMiner,Gostat,Ontoexpress,GoToolBox,FatiGO,GFINDer,GOBar,GSEA等同類數據庫相比較,DAVID具有獨特特征和信息容量、集成和擴展的后端注釋數據庫、先進的模塊化富集算法、強大的綜合數據探索能力等優勢.Gene Functional Classification根據基因功能共同存在的注釋術語而非簡單的基因名字將功能相關的基因一起作為一個單元,以較大的生物網絡為平臺,進行探索和查看,而不是集中在單個基因水平上的搜尋.Function Annotation Chart 根據所提交的基因的注釋中提供的與其最為相關的典型的基因術語豐度進行分類分析,包含GO terms, proteinprotein interactions, protein functional domains, disease associations, biopathways, sequence features, homology, gene functional summaries, gene tissue expression等40多種注釋分類.
將RFX1調控的1 166個基因在DAVID(the Database for Annotation, Visualization and Integrated Discovery)(http://david.abcc.ncifcrf.gov/home.jsp)數據庫中進行GO分析,基本注釋涉及到了Fuctional_Categories(其子目錄TERMS共有5項,有3項被檢測到,分別是COG_ONTOLOGY,SP_PIR_KEYWORDS和UP_SEQ_FEATURE),Gene_Ontology(其子目錄TERMS共有23項,有3項被檢測到, 分別是GOTERM_BP_FAT和GOTERM_CC_FAT,GOTERM_MF_FAT),Pathways(其子目錄TERMS共有6項,有3項被檢測到,分別是BBID,BIOCARTA和KEGG_PATHWAY),Protein_Domains(其子目錄TERMS共有18項,有3項被檢測到,分別是INTERPRO,PIR_SUPERFAMILY,SMART)4個方面(表1),將每項注釋進行了詳細分析.
2.2.1RFX1調控的基因功能分類
對這些基因的Fuctional_Categories分析(圖6),“√”標注的選項是經過網站的一些參考值對其進行初步的篩選而優先推薦的功能分類范疇;Chart后柱狀圖長短表示有多少基因參與該分類生物進程,是以百分數的形式顯示.
圖6 Chart中是以PValue值排布的,越小值越可信,排在上面.選取COG_ONTOLOGY分類進行簡單分析,由圖7(在網站中點擊圖6顯示的Chart得到圖7)可知,在COG_ONTOLOGY分類中的基因主要參與了細胞分裂與染色體分離、胞內運輸與分泌、信號傳導、細胞分裂與染色體支架4個生物進程.
在SP_PIR_KEYWORDS分類中的基因參與了近70個生物進程,主要以磷酸化、細胞核形成、乙酰化、選擇性剪輯進程為主;UP_SEQ_FEATURE分類中的基因參與了60個生物進程,主要以遺傳突變、剪接變體為主.很多基因涉及到幾個分類的很多進程.
2.2.2 RFX1調控的基因本體論
在Gene_Ontology中分為23個小類,只有3類被標記為“√”,是網站優先推薦,比較有意義的分類見圖8.其中GOTERM_BP_FAT含有203個分項,以轉錄調控、負向調控為主;GOTERM_CC_FAT含有80個小項,以參與微管支架、胞內非膜綁定細胞器的形成為主;GOTERM_MF_FAT含有59個小項,以參與核酸結合、DNA結合、轉錄因子活化為主.
3結論與討論
利用劍橋大學NCBI數據庫(http://www.ncbi.nlm.nih.gov)中小鼠Embryonic Stem Cells (ESC)與Neural Progenitor Cells (NPC)的基因芯片結果及NPC時期的RFX1ChIPSeq數據,進行有關RFX1的分析,RFX1結合位點富集在1,2,4,5,7,9,11染色體上,Y染色體上最少,其他染色體上比較均衡;以基因轉錄起始位點TSS為參照,距離TSS在-2~1 kb之間的為promoter,距離TSS在-50~2 kb之間的為enhancer,RFX1在基因組中結合位點分布區域主要在基因的promoter區域,約有53.2%,其次是intergentic,占22.5%,在body區域的分布,占13.1%,11.2%分布在enhancer區域.說明RFX1是以結合在基因的promoter區為主要形式對目的基因進行調控.
對基因芯片結果進行初步分析顯示共有45 018個基因,其中下調的有2 432個,上調的有2 713個,結合NPC的RFX1ChIPSeq數據分析,含有RFX1峰值的基因共有1 166個,其中494個是下調基因,672個是上調基因.將這些基因在DAVID Bioinformatics Resources數據庫中進行基因注釋分析,這些基因被網站自動篩選優化分為以下幾類,Functional_Categories(網站篩選分類后優先推薦以“√”標注顯示,分別為COG_ONTOLOGY,SP_PIR_KEYWORDS,UP_SEQFEATURE 3個子類);Gene_Ontology(網站篩選分類后優先推薦GOTERM_BP_FAT,GOTERM_CC_FAT,GOTERM_MF_FAT 3個子類);Pathways(網站篩選分類后優先推薦BBID,BIOCARTA,KEGG_PATHWAY 3個子類);Protein_Domains(網站篩選分類后優先推薦INTERPRO,PIR_SUPERFAMLIY,SMART 3個子類).這些子類又分為Signal transduction mechanisms,membrane,phosphoprotein,transport等等若干TERM描述.
672個上調基因在分類中涉及多個功能重復出現頻率超過40次的有25個基因,下調的494個基因中重復出現頻率超過16次的有50個基因,基因重復次數與重復基因數呈現指數相關.上調基因中在brain的發育與形態建成具有重要的作用,而下調基因中并未發現與brain相關的基因;上調基因中涉及7項、下調基因中涉及3項與cancer相關的TERM描述,分別涉及71,30個基因,包含Ccnd1,Mapk3,Pik3r1,Akt2,Pik3cd,Kras,Sos1等熱點基因.
綜上小鼠NPC細胞中有關RFX1數據的生物信息學分析,顯示了RFX1調控基因的廣泛性及多功能性,為今后RFX1調控機理的研究提供了良好的理論基礎.
參考文獻
[1]REITH W, BARRAS E, SATOLA S, et al. Mach B: Cloning of the major histocompatibility complex class II promoter binding protein affected in a hereditary defect in class II gene regulation\[J\]. Proc Natl Acad Sci U S A, 1989, 86(11): 4200-4204.
[2]XIE X H, TARJEI S, ANDREAS G. Systematic discovery of regulatory motifs in conserved regions of the human genome, including thousands of CTCF insulator sites\[J\]. PNAS, 2007, 24: 7145-7150.
[3]AFTAB S, SEMENEC L, CHU J S, et al. Identification and characterization of novel human tissuespecific RFX transcription factors\[J\]. BMC Evol Biol, 2008, 8: 226.
[4]SIEGRIST C A, DURAND B, EMERY P, et al. RFX1 is identical to enhancer factor C and functions as a transactivator of the hepatitis B virus enhancer\[J\]. Mol Cell Biol, 1993, 13: 6375-6384.
[5]KATAN Y, AGAMI R, SHAUL Y. The transcriptional activation and repression domains of RFX1, a contextdependent regulator, can mutually neutralize their activities\[J\]. Nucleic Acids Res, 1997, 25: 3621-3628.
[6]JOTHI R, CUDDAPAH S, BARSKI A, et al. Genome wide identification in vivo protein DNA binding sites from ChIPSeq data\[J\]. Nucleic Acids Res, 2008, 6(16): 5221-5231.
[7]KATANKHAYKOVICH Y, SHAUL Y. RFX1, a single DNAbinding protein with a split dimerization domain, generates alternative complexes\[J\]. J Biol Chem, 1998, 273: 24504-24512.
[8]IWAMA A, PAN J, ZHANG P, et al. Dimeric RFX proteins contribute to the activity and lineage specificity of the interleukin5 receptor alpha promoter through activation and repression domains\[J\]. Mol Cell Biol , 1999, 19: 3940-3950.
[9]MA K, ZHENG S, ZUO Z. The transcription factor regulatory factor X1 increases the expression of neuronal glutamate transporter type 3\[J\]. J Biol Chem, 2006, 281: 21250-21255.
[10]DUBRUILLE R, LAURENCON A, VANDAELE C, et al. Drosophila regulatory factor X is necessary for ciliated sensory neuron differentiation[J]. Development, 2002, 129: 5487-5498.
[11]SENGUPTA P, XU Y, WANG L, et al. Collagen alpha1(I) gene (COL1A1) is repressed by RFX family\[J\]. J Biol Chem, 2005, 280: 21004-21014.
[12]XU Y, SENGUPTA P K, SETO E,et al. Regulatory factor for Xbox family proteins differentially interact with histone deacetylases to repress collagen alpha2(I) gene (COL1A2) expression\[J\]. J Biol Chem, 2006, 281: 9260-9270.
[13]WANG K R, NEMOTO T, YOKOTA Y. RFX1 mediates the seruminduced immediate early response of Id2 gene expression\[J\]. J Biol Chem, 2007, 282: 26167-26177.
[14]ZHAO M, SUN Y M. Epigenetics and SLE: RFX1 downregulation causes CD11a and CD70 overexpression by altering epigenetic modifications in lupus CD4+T cells\[J\]. Journal of Autoimmunity, 2010, 35(1): 58-69.
[15]ZAJACKAYE M, BENBARUCH N, KASTANOS E, et al. Induction of mycintronbinding polypeptides MIBP1 and RFX1 during retinoic acidmediated differentiation of haemopoietic cells\[J\]. Biochem J, 2000, 345(Pt 3): 535-541.
[16]LIU M, LEE B H, MATHEWS M B. Involvement of RFX1 protein in the regulation of the human proliferating cell nuclear antigen promoter\[J\]. J Biol Chem, 1999, 274: 15433-15439.
[17]NAKAYAMA A, MURAKAMI H, MAEYAMA N, et al. Role for RFX transcription factors in nonneuronal cellspecific inactivation of the microtubuleassociated protein MAP1A promoter\[J\]. J Biol Chem, 2003, 278: 233-240.
[18]YICHAO H, WEICHIH L, CHIENYU K, et al. Regulation of FGF1 gene promoter through transcription factor RFX1\[J\]. J Biol Chem, 2010, 285(18): 13885-13895.
[19]XIE X, RIGOR P. MotifMap:a human genomewide map of candidate regulatory motif sites[J]. Bioinformatics, 2008,25(2):167-174.
[20]FENG Chenzhuo,XU Wenhao,ZUO Zhiyi. Knockout of the regulatory factor X1 gene leads to early embryonic lethality\[J\].Biochemical and Biophysical Research Communications, 2009, 386: 715-717.
[21]JENSEN D R, MARTIN D M, GEBARSKI S, et al. A novel chromosome 19p13.12 deletion in a child with multiple congenital anomalies\[J\].Am J Med Genet A, 2009, 149A(3): 396-402.