張經博,李波,楊洋,胡文冉,陳方圓,謝麗霞,范玲
(1. 新疆師范大學生命科學學院,烏魯木齊 830054;2. 新疆農業科學院核技術生物技術研究所,烏魯木齊 830091)
?
陸地棉CAD基因家族的進化和表達分析
張經博1,2,李波2,楊洋2,胡文冉2,陳方圓1,2,謝麗霞2,范玲2
(1. 新疆師范大學生命科學學院,烏魯木齊 830054;2. 新疆農業科學院核技術生物技術研究所,烏魯木齊 830091)
【目的】對陸地棉CAD基因家族成員進行進化和表達分析,了解其在棉纖維發育中的作用。【方法】應用生物信息學方法,從棉花基因組中篩選出21個CAD基因,并對CAD的基因結構、染色體分布、基因倍增模式以及系統進化進行分析。利用深度表達數據分析CAD基因在棉纖維發育各時期的表達。對比觀察擬南芥cad5突變體和野生型根毛表型。 【結果】同源性高的CAD基因復制對之間有相似的基因結構;片段重復和串聯重復是CAD基因擴增的主要方式。進化分析可知,CAD基因可分為七個亞組,且功能相近的基因聚類在相同亞組。利用深度測序表達數據分析可知,CAD基因在棉纖維各個發育時期均有表達。對比擬南芥cad5突變體和野生型根毛發現,突變體相比于野生型有更長的根毛。【結論】CAD基因參與了棉纖維的發育的過程,并對棉花纖維發育起到一定的調控作用。
棉纖維;CAD基因家族;系統進化分析;表達分析;cad5突變體;根毛
【研究意義】棉花是一種重要的經濟作物,在全球100多個國家廣泛種植,由它生產的棉纖維是全球重要的紡織原料之一,具有極其重要的經濟價值[1]。陸地棉(Gossypiumhirsutum)是栽培面積及經濟效益最大的栽培棉種,它貢獻了超過90%的棉花產量。此外棉花還是研究染色體加倍,細胞伸長和細胞壁合成的重要模式植物[2]。棉花纖維是由胚珠表皮單細胞分化而成, 在纖維發育過程初期,纖維細胞以極快的速度同步化延伸,并最終分化成為超長的單一極性細胞[3],棉纖維需要經歷纖維原始細胞的分化和突起、初生壁伸長、次生壁增厚和脫水成熟 4 個依次并相互重疊的過程,一般 45~50 d,涉及上千個基因的特異表達和蛋白相互作用[4]。研究棉纖維發育為棉纖維品質改良提供依據,闡明植物細胞伸長的重要手段,具有顯著的學術理論價值和潛在經濟價值。隨著陸地棉的基因組測序工作已經完成,為在陸地棉中識別不同的基因家族以及了解其在棉花生長發育過程中的作用提供了可能[5]。【前人研究進展】細胞壁是植物區別與動物的主要器官之一。成熟棉花纖維細胞主要的組成部分就是細胞壁,細胞壁的沉積與改變對植物的生長、發育以及對外界環境的響應都有重要的作用,它最終決定了植物細胞的大小與形狀。木質素是高等植物細胞壁的重要組成成分[6]。棉花纖維是單一超長的極性細胞,成熟的棉花纖維細胞壁中存在有木質素,木質素通常在次生細胞壁中積累[7, 8]。肉桂醇脫氫酶(cinnamyl alcohol dehydrogenase, CAD) 是一類參與木質素合成途徑中的酶[9], 通常情況下, 它能夠將木質素前體和木脂素類物質轉化成木質素單體。 因此,CAD基因在植株生長發育過程中的作用尤為重要。CAD蛋白都具保守結構域 ADH_N 和ADH_zinc_N[10, 11]。根據種間核苷酸和氨基酸序列同源性的差異可將CAD基因分成 3 類, 其中第 1 類主要是石松類 、單子葉 、真雙子葉(eudicots) 和裸子植物的CAD基因; 第 2 和第 3 類主要是單子葉和真雙子葉植物的CAD基因。 第一類CAD基因都能夠參與到維管束的發育和和木質素的合成過程,在木質素合成過程中它們將松柏醛和芥子醛還原成相應醇[12], 同第 1 類CAD基因相比第 2 和第3 類CAD基因在木質素合成中的作用并不突出, 可能是第1類CAD基因的冗余基因,也不能排除在植物發育其它方面的功能作用。 【本研究切入點】目前已經在多種植物中對CAD基因成員進行了鑒定[13]。全面的基因家族分析尚未在棉花中研究。隨著陸地棉基因組測序的完成,能夠在全基因組水平上對CAD基因家族進行分析和闡述。【擬解決的關鍵問題】利用生物信息學方法,對陸地棉全基因組的CAD基因進行鑒定和系統進化分析,并對其在棉纖維發育過程中的基因表達模式進行分析,為改良棉花纖維品質等重要農藝性狀提供候選基因,為全基因組水平上的棉花分子育種提供參考和基礎。
1.1 材 料
陸地棉的基因組數據和蛋白質數據均從cotton genome project(http://cgp.genomics.org.cn/page/species/download.jspategory=hirsutum) 處下載,利用本地blastp的方法以擬南芥的CAD蛋白質序列為探針,預測陸地棉的CAD基因家族成員,E值設定 1.2 方 法 1.2.1CAD基因的系統進化分析 將棉花、擬南芥、高粱、水稻、楊樹的CAD蛋白質序列利用Cluster X19進行比對。隨后將比對結果利用MEGA6.0軟件根據比對結果構建系統進化樹,構建系統樹的方法采用鄰接法,Bootstrap 重復次數 (Replications)設置為1 000[16],然后將生成的無根樹提交到ITOL(http://itol.embl.de/) 形成環形進化樹。 1.2.2CAD基因染色體定位和復制共線性分析 利用本地BLASTN從陸地棉基因組數據庫中獲取各CAD基因的染色體定位信息,通過MapDraw 2.2 軟件作圖[17]。隨后根據文獻[18,19]研究方法檢查陸地棉CAD基因的復制情況,根據蛋白序列比對對結果識別同源基因對,經過比對后短序列如果能覆蓋超過長序列70%的區域,認為這對同源基因為重復基因(duplication genes)。利用DnaSp軟件計算重復基因對的ka(非同義突變率)、ks(同義突變率)值,確定其在進化過程中所受何種選擇。 1.2.3CAD基因結構分析 將GhCAD基因的編碼序列和對應的全基因組序列呈送到(http://gsds.cbi.pku.edu.cn/)[20]獲得各基因的內含子、外顯子個數和排布情況。 1.2.4CAD基因在棉纖維不同發育時期的表達分析 為了獲得GhCAD基因在棉纖維發育過程中的表達情況,利用陸地棉標準系 TM-1 纖維的深度測序數據來分析CAD基因在纖維中的表達情況。數據下載與SRA 數據庫(http://www.ncbi.nlm.nih.gov/sra/)。登錄號為:5 dpa(SRX797917), 10 dpa(SRX797918),20 dpa(SRX797919),25 dpa(SRX797920)。隨后利用Tophat將轉錄組數據mapping到GhCAD基因上,然后利用cufflinks估計CAD基因的表達水平[21]。 1.2.5 棉花CAD基因和擬南芥CAD基因的同源性分析 利用進化分析和序列比對的方法,找出GhCAD3和GhCAD6在擬南芥中的同源基因。并利用ClustlX2對三個基因進行同源性分析。 1.2.6 擬南芥純和突變體的篩選和鑒定 擬南芥(Arabidopsisthaliana)野生型(Columbia-0型)和T-DNA插入突變系(Salk_019355)T1代種子由美國俄亥俄州立大學ABRC (Arabidopsis Biological Resource Center)提供。使用三引物法篩選 T-DNA 插入純合突變體(以下簡稱純合突變體)基因型的鑒定需要 3 條引物(LBb1+LP+RP)[22],PCR 所用引物的設計參照 SIAGnAL 的相關資料(http://signal.salk.edu/isectprimers.html),3條引物序列為LP:5' TCACCGCAATCAAATAAAACC3';RP:5' AGGTCAA GAATCAACAGCTGG 3';LBb1:5' GCGTGGA CCGCTTGCTGCAACT 3'。 將購買的突變體cad5 種子播種于盛有蛭石的小缽內,待植株生長 30 d 后,隨機選取 10 株,以 Col 野生型擬南芥為對照,分別提取全基因組 DNA,分別采用LP/RP 和 BP/RP 引物組合,以全基因組 DNA 為模板進行 PCR 擴增, 根據電泳結果判斷該植株是否為純合突變體。LP/RP 和 BP/RP 預期 PCR 產物大小分別為 1 287 bp 和 1 272 bp。 1.2.7 野生型和突變體AtCAD5基因轉錄水平比較 為了獲得野生型和突變體植株AtCAD5轉錄情況信息,取適當生長時期,已初步鑒定的純合突變體和 Col 野生型擬南芥的葉片組織作材料,采用 Trizol 法提取適當組織的總 RNA,反轉錄為cDNA,根據 TAIR 網站(http://www.arabidopsis.org)上公布的擬南芥AtCAD5基因 cDNA 序列, 采用Primer Premier 5 引物設計軟件設計了引物,引物采用Primer Premier 5 引物件設計,序列為:AtCAD5-F: 5‘CAACGGTAAACTTGTTCTACTCGGT3’,AtCAD5-R: 5‘AGATCGAGTAGCAGCCAATGTATTA33’,AtUBQ5-F:5‘GGTGCTAAGAAGAGGAAGAAT3’,AtUBQ5-R:5‘CTCCTTCTTTCTGGTAAACGT3’。進行RT-PCR和Quantitative RT-PCR檢測。 熒光定量PCR使用儀器為BIO-RAD CFX Connect 熒光定量系統。使用試劑Power SYBR Green PCR Master Mix (Applied Biosystems Cat:4367659)。 1.2.8 野生型和突變體植株根毛表型觀察 將生長有擬南芥野生型和突變體幼苗的培養皿置于體式鏡(MZFLlll,LeicaMicrosystem,wetslar,Ge~ay)載物臺上, 對距根尖第2和第3 mm處根上的根毛進行拍照,每個處理重復三次, 每個重復15棵苗,利用軟件MoticIinagesplus2.0分析根毛長度[23]。 2.1 陸地棉基因組中CAD基因的鑒定 利用已知的擬南芥9個CAD基因作為模板,運用本地BlastP, 設E值 2.2CAD基因的系統進化 下載了已經報道了的擬南芥、水稻、高粱以及楊樹的CAD基因的氨基酸序列同棉花的CAD蛋白進行系統進化分析。系統發育樹顯示植物CAD基因家族分成了7個亞組,棉花CAD基因分別屬于其中的五個亞組。圖1 圖1 5個物種CAD基因家族的系統進化 基因名GeneNameGenesymbol氨基酸長度Length(aa)氨基酸分子量MW(Da)等電點pI染色體位置Chr.Location亞細胞定位SubcellularlocationGhCAD1CotAD_13593297319743615At_chr1:86948713-86950083CytoplasmicGhCAD2CotAD_37609247265741556At_chr6:12446631-12447549CytoplasmicGhCAD3CotAD_04135357387986532At_chr8:78305297-78306865CytoplasmicGhCAD4CotAD_31920359390348571At_chr8:12980004-12983001CytoplasmicGhCAD5CotAD_4449335939054641At_chr9:43464845-43467239CytoplasmicGhCAD6CotAD_09220357387066541Dt_chr1:37664020-37665672CytoplasmicGhCAD7CotAD_04873361391913612Dt_chr3:25616682-25619358CytoplasmicGhCAD8CotAD_08476323349625671Dt_chr3:25566390-25569076CytoplasmicGhCAD9CotAD_23999359391779619Dt_chr3:28494614-28497505CytoplasmicGhCAD10CotAD_24215335361577563Dt_chr5:9949917-9951612CytoplasmicGhCAD11CotAD_64737159172548613Dt_chr5:35591335-35592866CytoplasmicGhCAD12CotAD_35578364390769585Dt_chr8:54689117-54693378CytoplasmicGhCAD13CotAD_7628031433656659Dt_chr8:17107622-17108873CytoplasmicGhCAD14CotAD_13395359391792713Dt_chr9:53004860-53007359CytoplasmicGhCAD15CotAD_41347358388125553scaffold1147.1:380188-381917CytoplasmicGhCAD16CotAD_67233362389899646scaffold3203.1:101376-102835CytoplasmicGhCAD17CotAD_67234200221814664scaffold3203.1:105389-106177CytoplasmicGhCAD18CotAD_72093361392312612scaffold3059.1:29884-32559CytoplasmicGhCAD19CotAD_72469151166283529scaffold3050.1:30741-31458CytoplasmicGhCAD20CotAD_74025145158515629scaffold5039.1:19922-20553CytoplasmicGhCAD21CotAD_74026361390652761scaffold5039.1:20945-22416Cytoplasmic 2.3CAD基因在棉花染色體上的分布和基因復制 通過本地blastn獲得了CAD基因在棉花染色體上的分布情況,其中有14個CAD基因被定位在特定的染色體上,還有7個CAD基因未被定位到染色體上,研究表明,CAD基因在棉花染色體上呈現出不均勻分布,棉花的26條染色體上只有八個染色體具有CAD基因。在棉花CAD基因中共有16基因形成19對復制基因,有的基因參與多次基因復制事件,例如GhCAD3、GhCAD7、GhCAD8分別參與三次基因復制。其中確定GhCAD7和GhCAD8為串聯重復基因對,還有5對復制基因確定為片段復制基因對,其余部分基因未能定位到染色體上不能確定是何種復制方式。這19對復制基因中有12對復制基因的ka/ks小于1,說明這些基因在進化過程受到凈化選擇,即都是功能基因且功能保守,因此進化速率較慢。而還有7對復制基因ka/ks大于1,說明在進化過程中受到積極選擇,即可能是功能冗余基因,因此進化速度較快[24]。表2,圖2 表2 重復基因對的ka/ks 圖2 CAD基因在染色體上的分布和基因復制 2.4CAD基因結構 對GhCAD基因的外顯子和內含子排布進行分析,發現復制基因對之間擁有相似的基因結構,這也說明了在進化過程中是由同一祖先基因擴增而來。CAD基因有三種extron-intron類型,三種類型分別有5、5、和6個外顯子組成,其中類型I和II的區別在于3和4號外顯子長度不同,3號外顯子長度長于4號外顯子的屬于類型I[25, 26]。而棉花CAD基因除具有這三種類型的基因結構外還具有3個外顯子組成的基因結構類型。這說明與其他物種相比,棉花CAD基因有更為多樣的基因結構類型。圖3 圖3 CAD基因家族的系統進化和基因結構 2.5CAD基因在陸地棉纖維不同發育時期的表達 對陸地棉標準系 TM-1 中CAD家族基因進行表達分析,深度測序數據選擇棉纖維發育的 4 個時期(5、10、20及 25 dpa)。研究表明,在21個CAD基因中共有14個基因在纖維中檢測到表達。其中GhCAD4和GhCAD9在5和10 dpa兩個發育時期有很高的表達量,GhCAD3和GhCAD6在20和25 dpa,此外GhCAD5,GhCAD8和GhCAD12也在棉花纖維發育中個各個時期或某個時期有較高的表達。圖4 2.6GhCAD3和GhCAD6與擬南芥CAD基因的同源性 根據多序列比對分析,得到GhCAD3和GhCAD6在擬南芥中的共同同源基因是AtCAD5,多序列比對分析顯示三個基因之間有很高的序列相似性。而AtCAD5已經明確為可以參與木質素的合成[27],為將AtCAD5基因作為研究對象提供了理論支持。圖5 圖4 CAD基因家族在棉花纖維不同發育時期表達 2.7 擬南芥cad5純合突變體的篩選 利用三引物法篩選擬南芥cad5純合突變體, PCR鑒定結果顯示野生型植株中只有利用LP+RP引物組合可以獲得1 287 bp左右的PCR產物條帶,而在純合突變體中只有利用LB1+RP引物組合可以獲得1 272 bp的PCR產物條帶(圖6A)。然后再分別以突變體和野生型DNA為模板,利用AtCAD5特異性引物進行PCR檢測,結果表明在野生型中檢測到AtCAD5基因而在突變體中未檢測到AtCAD5基因(圖6B)。這些結果說明獲得了T-DNA插入的純合突變體植株。圖6 圖5 AtCAD5、GhCAD3和GhCAD6的氨基酸序列比對 2.8 擬南芥cad5突變體和野生型植株AtCAD5轉錄水平比較 通過RT-PCR和Quantitative RT-PCR檢測AtCAD5在突變體和野生型植株中轉錄水平。研究表明,野生型中AtCAD5轉錄水平明顯高于突變體。突變體中AtCAD5轉錄水平明顯下降。圖7 圖6 擬南芥Atcad5純合突變體的PCR鑒定 A:RT-PCR結果比較 B: Quantitative RT-PCR結果比較 2.9 擬南芥cad5突變體的篩選和根毛表型觀察 經過PCR篩選的得到擬南芥cad5基因的純合突變體,研究表明,從5 d開始突變體植株的根毛長度逐漸長于野生型植株的根毛長度,而后隨著生長天數的增加時兩者的根毛長度差異更加明顯。圖8 A: cad5突變體和野生型植株不同天數根毛表型觀察。 B: cad5突變體和野生型植株不同天數根毛長度統計。 3.1CAD基因家族鑒定和系統進化 在陸地棉全基因組水平上對CAD基因家族進行了堅定和功能分析。陸地棉中共鑒定到21個CAD基因,是擬南芥該家族成員2倍多,這也說明陸地棉染色體相對于擬南芥染色體經歷了多次全基因組復制事件。利用wolf和targetP對CAD蛋白進行了亞細胞定位預測,發現所有的CAD基因均定位于細胞質當中,這可能和CAD基因的功能有一定的關系。將棉花、高粱、水稻、擬南芥和楊樹的CAD基因進行系統進化分析,CAD基因分為了7個亞組且功能相近的基因在同一亞組中聚集,棉花CAD基因分別屬于其中的五個亞組。其中GhCAD1、GhCAD3、GhCAD6、GhCAD10和GhCAD15同屬于GroupII,這類CAD基因族中的AtCAD4、AtCAD5、AtCAD5、SbCAD2和OsCAD2的基因特性已經明確,參與了木質素的合成過程[24]。擬南芥AtCAD4和AtCAD5具有很高的同源性,當對AtCAD4和AtCAD5進行雙突變后,木質素的含量大量減少[28],棉花中GhCAD3和GhCAD6也具有很高的同源性且在棉纖維20 和25 dpa有很高表達量,而又與AtCAD4和AtCAD5在同一亞組中,這說明GhCAD3和GhCAD6在棉花的木質素合成中發揮作用并且參與棉纖維的發育。GhCAD5、GhCAD14和AtCAD1同屬于一個亞組,AtCAD1已經被報道在擬南芥AtCAD4和AtCAD5雙突變體中,對木質素合成過程中起到功能補償作用[25],這說明GhCAD5和GhCAD14也有相似的功能特性。基因家族中屬于同一亞組的基因之間通常具有相同的功能特點,通過與其他物種的CAD基因進行系統的進化分析有助于了解棉花CAD基因功能,為以后研究棉花CAD基因的功能提供參考。在這幾種植物來說,同屬于單子葉植物綱的高粱和水稻與其他三種植物相比有更近的親緣關系,可以看到親緣關系較近的植物間,CAD基因并沒有顯示出較近的進化關系,這說明CAD基因家族在不同植物中的分布是不保守的。對GhCAD基因家族成員進行基因結構分析發現親緣關系相近的基因擁有相似的基因結構,這些序列相似度極高的基因與基因組進化過程中的串聯重復和片段復制有關,這些復制在基因家族成員擴增中起到重要作用。現代陸地棉由大約150萬年前的兩個祖先種二倍體棉花木本棉(AA)、雷蒙德氏棉(DD)雜交而成[5],研究陸地棉CAD基因的多次復制現象有助于了解棉花多倍化的進程。陸地棉基因組經歷了全基因組重復、染體重排和串聯重復等復雜的進化過程。研究結果表明,染色體大片段復制和串聯重復在CAD基因家族的擴增中起到了重要的作用。在陸地棉中共有15個基因形成19個基因復制對,其中確定GhCAD7和GhCAD8為串聯重復基因對,還有5對復制基因對確定為片段復制,而GhCAD3和GhCAD6是一對復制基因且受到凈化選擇,因此是保守的功能基因,這為將這兩個基因作為后續的研究對象提供了依據。此外從棉花纖維表達數據來看,由同一祖先基因擴增出來的基因表達模式并不相同,這說明在進化過程中表達特性發生了分化。 近年來,對植物CAD基因家族的研究逐漸增多,已經在多種植物中鑒定了CAD基因的數量和中累,其中擬南芥中12個,水稻中12個,高粱中14個,葡萄中18個,苜蓿中17個,楊樹中14個[2]。并且已經確定擬南芥CAD基因家族 中有6個可以催化5種肉桂醛生成肉桂醇,另外3個只有在底物濃度很高時才表現出活性,催化能力很低。擬南芥AtCAD4和AtCAD5具有很高的同源性,當對AtCAD4和AtCAD5進行雙突變后,木質素的含量大量減少[28],而AtCAD1對其缺失的功能有一定的補償作用[29],說明植物體內的CAD基因家族是協同起作用的。 3.2CAD基因家族表達 Han等在研究棉纖維細胞的伸長和次生壁時發現,木質素和木質素類似酚類化合物能夠顯著的影響棉纖維的質量性狀,并且在棉纖維發育后期CAD6的表達量顯著提高,該CAD6與研究提到的GhCAD3同源性最高[30]。木質素是苯丙烷代謝途徑的一種產物,Hovav等[31]在研究棉花纖維發育相關基因的表達時發現,苯丙烷代謝途徑相關基因在參與棉纖維細胞的伸長進程。此外Li等在研究棉花纖維發育相關的QTL時發現,CAD6基因定位在與棉花發育相關的的QTL位點上。由此推測CAD基因家族成員參與到棉花纖維發育的進程當中[32]。 從纖維表達數據發現多個CAD基因在棉花纖維中有較高的表達,其中GhCAD4和GhCAD9在5和10 dpa有很高的表達,GhCAD3和GhCAD6在20和25 dpa中有很高的表達,此外GhCAD5,GhCAD8和GhCAD12也在棉花纖維發育中各個時期或某個時期有較高的表達。這些結果表明CAD基因家族參與了棉花纖維發育進程。木質素的積累通常發生在細胞發育的次生壁時期[7],GhCAD3和GhCAD6在棉纖維發育次生壁增厚期有很高的表達,推斷GhCAD3和GhCAD6可能在棉纖維細胞次生壁增厚期起到重要的作用,觀察對比了GhCAD3和GhCAD6的同源基因AtCAD5突變體和野生型植株根毛長度的差異,發現突變體相較于野生型有更長的根毛,而AtCAD5已經確定可以參與木質素的合成,這些結果說明CAD基因參與了棉纖維的發育進程,并可能對其發育進程有一定的調控作用。 在陸地棉基因組中共鑒定到21個CAD基因,串聯重復和片段重復是CAD基因家族主要的擴增方式,進化分析顯示CAD基因家族可以分為7個亞族,且功能相近的基因在同一亞族。深度測序數據分析顯示,大多數CAD基因均在棉纖維不同發育時期表達,說明CAD基因家族參與了棉纖維的發育,其中GhCAD4和GhCAD9在5和10 dpa兩個發育時期有很高的表達,說明參與了棉纖維細胞的起始和伸長。GhCAD3和GhCAD6是保守的功能基因,也是在棉纖維中表達量最高的兩個基因,且這兩個基因都是20和25 dpa表達量顯著升高,因此這兩個基因應該在棉纖微次生壁增后期發揮重要作用。觀察對比了GhCAD3和GhCAD6的同源基因AtCAD5突變體和野生型植株根毛長度的差異,發現突變體相較于野生型有更長的根毛,而AtCAD5已經確定可以參與木質素的合成,CAD基因參與了棉纖維的發育進程,并可能對其發育進程有一定的調控作用,為利用CAD基因改良棉纖維品質奠定了基礎。 References) [1]Sunilkumar, G., Campbell, L. M., Puckhaber, L., Stipanovic, R. D., & Rathore, K. S. (2006). From the cover: engineering cottonseed for use in human nutrition by tissue-specific reduction of toxic gossypol.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica, 103(48):18,054-18,059. [2] Ruan, Y. L., Llewellyn, D. J., & Furbank, R. T. (2003). Suppression of sucrose synthase gene expression represses cotton fiber cell initiation, elongation, and seed development.PlantCell, 15(4):952-64. [3] Qin, Y. M., & Zhu, Y. X. (2011). How cotton fibers elongate: a tale of linear cell-growth mode.CurrentOpinioninPlantBiology, 14(1):106-111. [4] Hu, G., Jin, K., Yoo, M. J., Grupp, K., Chen, S., & Wendel, J. F. (2013). Proteomic profiling of developing cotton fibers from wild and domesticated gossypium barbadense.InteractiveCardiovascular&ThoracicSurgery, 200(2):570-582. [5] Li, F., Fan, G., Lu, C., Xiao, G., Zou, C., & Kohel, R. J., et al. (2015). Genome sequence of cultivated upland cotton (Gossypiumhirsutumtm-1) provides insights into genome evolution.NatureBiotechnology, 33(5):524-530. [6] Reiter, W. D., & Vanzin, G. F. (2001). Molecular genetics of nucleotide sugar interconversion pathways in plants.PlantMolecularBiology, 47(1-2):95-113. [7] Lerouxel, O., Cavalier, D. M., Liepman, A. H., & Keegstra, K. (2006). Biosynthesis of plant cell wall polysaccharides - a complex process.CurrentOpinioninPlantBiology, 9(6):621-630. [8] Ling, F., Shi, W. J., Hu, W. R., Hao, X. Y., Wang, D. M., & Hui, Y., et al. (2009). Molecular and biochemical evidence for phenylpropanoid synthesis and presence of wall-linked phenolics in cotton fibers.JournalofIntegrativePlantBiology, 51(7):626-637. [9] Mansell, R. L., Gross, G. G., Stckigt, J., Franke, H., & Zenk, M. H. (1974). Purification and properties of cinnamyl alcohol dehydrogenase from higher plants involved in lignin biosynthesis.Phytochemistry, 13(13):2,427-2,435. [11] Grosse, W., & Klapheck, S. (2010). Effects of 1-mcp and ethylene on expression of three cad genes and lignification in stems of harvested tsai tai (brassicachinensis).FoodChemistry, 123(1):32-40. [12] C, Halpin, & W, Schuch. (1992). Identification and characterization of cdna clones encoding cinnamyl alcohol dehydrogenase from tobacco.PlantMolecularBiology, 19(5):793-801. [13] Gasteiger, E., Hoogland, C., Gattiker, A., Duvaud, S., Wilkins, M. R., & Appel, R. D., et al. (2005). Protein identification and analysis tools on the expasy server.ProteomicsProtocolsHandbook, 112(112):571-607. [14] Emanuelsson, O., Nielsen, H., Brunak, S., & Heijne, G. V. (2000). Predicting subcellular localization of proteins based on their n-terminal amino acid sequence.JournalofMolecularBiology,300(4):1,005-1,016. [15] Horton P; Park KJ; Obayashi T; Fujita N; Harada H; Adams-Collier CJ; Nakai K. (2007). Wolf psort: protein localization predictor.NucleicAcidsResearch, 35(Web Server issue):585-587. [16] Ma, & Jun. (2015). Genome-wide identification and expression analysis of TCP transcription factors in cotton. [17] Liu, R. H., MENG Jin Ling ral University, Wuhan, & Chi. (2003). Mapdraw:a microsoft excel macro for drawing genetic linkage maps based on given genetic linkage data.Hereditas, 25(3):317-321. [18] Yang, S., Zhang, X., Yue, J. X., Tian, D., & Chen, J. Q. (2008). Recent duplications dominate nbs-encoding gene expansion in two woody species.MolecularGenetics&GenomicsMgg, 280(3):187-198. [19] Gu Z, Cavalcanti A, Chen FC, Bouman P, & Li WH. (2002). Extent of gene duplication in the genomes of drosophila, nematode, and yeast.MolecularBiology&Evolution, 19(3):256-262. [20] Guo, A. Y., Zhu, Q. H., & Chen, X. (2007). Gsds: a gene structure display server.Hereditas, 29(8):1,023-1,026. [21] Trapnell, C., Roberts, A., Goff, L., Pertea, G., Kim, D., & Kelley, D. R., et al. (2012). Differential gene and transcript expression analysis of rna-seq experiments with top hat and cufflinks.Psychopharmacology, 7(3):562-578. [22] 李敏, 楊雙, 阮燕曄, 等. 擬南芥 T-DNA 插入突變體 atsuc3 的 PCR 鑒定[J]. 植物生理學通訊,2006,42(1):91-94. LI Min, YANG Shuang, Ruan Yan-hua, et al. (2006). Identification of ATSUC3 with T-DNA Insertion by PCR [J].PlantPhysiologyCommunications, 42(1):91-94. (in Chinese) [23] Zhu, C., Gan, L., Shen, Z., & Kai, X. (2006). Interactions between jasmonates and ethylene in the regulation of root hair development in Arabidopsis.JournalofExperimentalBotany, 57(6):1,299-1,308. [24] Morant, M., Hehn, A., & Werck-Reichhart, D. (2002). Conservation and diversity of gene families explored using the codehop strategy in higher plants.BmcPlantBiology, 2(1):1-12. [25] Barakat, A., Bagniewska-Zadworna, A., Choi, A., Plakkat, U., Diloreto, D. S., & Yellanki, P., et al. (2009). The cinnamyl alcohol dehydrogenase gene family in populus: phylogeny, organization, and expression.BMCPlantBiology, 9(1):26. [26] 張魯斌, 谷會, 弓德強, 等. 植物肉桂醇脫氫酶及其基因研究進展[J]. 西北植物學報, 2011, 31(1):204-211. ZHANG Lu-bin, GU Hui, GONG De-qiang, et al. (2011). Research Progress of Cinnamyl Alcohol Dehydrogenase and Its Gene [J].ActaBotanicaBoreali-OccidentaliaSinica, 31(1):204-211. (in Chinese) [27] Ma, Q. H. (2010). Functional analysis of a cinnamyl alcohol dehydrogenase involved in lignin biosynthesis in wheat.JournalofExperimentalBotany, 61(10):2,735-2,744. [28] Sibout, R., & Séguin. (2005). Cinnamyl alcohol dehydrogenase-c and -d are the primary genes involved in lignin biosynthesis in the floral stem of Arabidopsis.PlantCell, 17(7):2,059-2,076. [30] Han, L. B., Li, Y. B., Wang, H. Y., Wu, X. M., Li, C. L., & Luo, M., et al. (2013). The dual functions of wlim1a in cell elongation and secondary wall formation in developing cotton fibers.PlantCell, 25(11):4,421-4,438. [31] Ran, H., Udall, J. A., Hovav, E., Rapp, R., Flagel, L., & Wendel, J. F. (2008). A majority of cotton genes are expressed in single-celled fiber.Planta, 227(2):319-329. [32] Li, X., Yuan, D., Zhang, J., Lin, Z., & Zhang, X. (2012). Genetic mapping and characteristics of genes specifically or preferentially expressed during fiber development in cotton.PlosOne, 8(1):65-65. Fund project:Supported by High-tech research and development program of Xinjiang "Research on the technology innovation of cotton fiber quality molecular Improvement (201111116) and NSFC "The function and regulation mechanism of cotton GhCAD6 gene in the development of cotton fiber" (31460386) Genomi-wide Investigation and Expression Analysis of CAD Gene Family inGossypiumhirsutum ZHANG Jin-bo1,2,LI Bo2,YANG Yang2,HU Wen-ran2,CHEN Fan-yuan1.2,XIE Li-xia2,FAN Ling2 (1. College of Life Sciences, Xinjiang Normal University, Urumqi 830054, China;2 Research InstituteofNuclearandBiotechnologies,XinjiangAcademyofAgriculturalSciences,Urumqi830091,China) 【Objective】 This study aims to conduct for the first time a genome-wide analysis ofCADgene family in cotton.【Method】A total of 21CADencoding genes were identified inGossypiumhirsutum. The phylogenic evolution, chromosome distribution, gene duplication and gene structure ofCADgene family went through phylogenetic analysis.【Result】The result revealed thatCADgene family could be clustered into 7 major subgroups and the genes which had similar functions were in the same subgroup. Both tandem duplications and segmental duplications were found to attribute to the expansion ofCADgene family.CADgene family had expression at different stages of development fiber. TheAtcad5 mutant had a longer root hair than that of the wild type.【Conclusion】CADgenes maybe are involved in developing fiber and play a role in regulating the development of fiber. cotton fiber;CADgene family; phylogenic analysis; expression pattern; cad5 mutant; root hair 10.6048/j.issn.1001-4330.2016.07.001 2016-03-05 新疆維吾爾自治區高技術項目“棉花纖維品質分子改良技術創新研究”(201111116);國家自然科學基金項目“棉花GhCAD6基因在棉花纖維發育中的功能及調控機制”(31460386) 張經博(1991- ),男,新疆人,碩士研究生,研究方向為作物分子生物學,(E-mail)952880259@qq.com 范玲(1958- ),女,新疆人,研究員,博士生導師,研究方向為棉花纖維品質分子改良,(E-mail)fanling@xaas.ac.cn S562;S188 A 1001-4330(2016)07-1177-112 結果與分析










3 討 論
4 結 論