轉錄因子“足跡”編碼一部龐大的人類調控“辭典”
調控因子與基因組DNA的結合能夠保護相關的基因序列不被胰脫氧核糖核酸酶(DNase I)剪切,并留下具有核苷酸解析度的“足跡(footprint)”。
Neph等用基因組DNase I足跡法處理41種不同的細胞和組織,檢測了4 500萬個位于調控區的轉錄因子占位事件(代表840萬個不同短序列元件的差異結合)。他們發現這些小的基因組序列區間(粗略估計兩倍于外顯子的長度)編碼了一系列DNA結合蛋白識別的保守序列,使人類順式調控“辭典(lexicon)”的容量幾乎增加一倍。他們還發現影響等位染色質狀態的遺傳性變異體集中在這些“足跡”中,并優先被遮蔽而免于DNA甲基化。高分辨率的DNase I剪切模式反映了進化在核苷酸水平上的保守,并烙下了DNA和蛋白質界面的結晶拓撲學印記,提示在進化過程中轉錄因子結構已經在基因組DNA序列中留下了印記。他們據此發現了一個50 bp的“足跡”序列,該序列能在數以千計的人類啟動子中精確地定位轉錄起始點。最后,他們還揭示了一個宏大的調節因子識別基序的集合,這些識別基序無論是在序列上還是在功能上都高度保守,并且表現出細胞選擇性的占位模式,類似于大部分與發育、分化和多能性相關的調控因子。
Nature, 2012, 489(7414):83-90(張嬋娟)