摘 要:鼻咽癌是我國南方及東南亞地區常見的惡性腫瘤之一。通過對鼻咽癌染色體高頻率雜合性丟失區域3p21的表達序列標簽(expressed sequencetag,EST)進行同源性比較分析,運用逆轉錄聚合酶鏈式反應的方法,篩選到一個在41.18%(14/34)的鼻咽癌活檢組織及20.0%(1/5)的鼻咽癌細胞系中表達下調的ESTBC772301;并用Northern雜交方法,檢測了該EST在多種正常成人組織中的表達狀況及其所代表基因的轉錄本大小。在此基礎上,對該EST來源的cDNA克隆(1MACE:4839190)進行直接測序,獲得了一個全長為2377bp的新cDNA序列;經生物信息學分析,發現它與已知基因序列無明顯同源性,屬于一個新基因,定位于染色體3p21.3,被命名為鼻咽癌表達下調基因(NPCEDRC,GenBank登錄號:AF538150)。其編碼的蛋白質含169個氨基酸,與一個已報道的在進化上相對保守、功能未知的人類蛋白Nicolinl(簡稱NICNl)N端170個氨基酸殘基的序列同源性為97%,但缺少NICNl蛋白C端43個氨基酸殘基,可能是nicoUnl基因不同剪接本的編碼產物。
關鍵詞:鼻咽癌;表達序列標簽:全長cDNA;序列分析
中圈分類號:R730
文獻標識碼:A
文章編號:1007-7847(2006)02—0172-06
鼻咽癌(Nasopharyngeal carcinoma,NPC)是我國南方常見的一種惡性腫瘤。目前認為:NPC具有遺傳易感性背景和復雜的遺傳學改變,且與EB病毒感染和環境化學致癌因素相關,其發病遵循典型的多基因一環境交互作用模式。細胞及分子遺傳學研究表明,NPC存在多個染色體部位如:3p、3q、9p、11q、12q、13q、14q和16q等非隨機性的缺失或擴增,尤其是3p的缺失或稱之為雜合性丟失(loss of heterozygosity,LOH)在NPC發病過程中出現最早、發生頻率最高。現已知NPC染色體3p發生高頻率LOH的區域主要為3p12-14、3p21-22和3p25-26,這其中又以3p21-22最值得關注。因為除LOH研究外,利用微細胞介導的單染色體轉移和融合細胞的裸鼠致瘤實驗,已證實在染色體3p21.3可能存在一個與NPC相關的抑瘤基因(tumor suppressorgene,TSG);而我所最近在CancerResearch發表的研究結果,也將3p21確定為一個與家族性NPC連鎖的易感位點。按照Knudson的“二次突變”學說,上述資料為從染色體3p21區域克隆出在鼻咽癌變過程中起關鍵作用的TSG提供了有力的依據。
為此,我們利用現有數據庫中的大量表達序列標簽(expression sequencetag,EST)資源,從位于NPC高頻率LOH區域3p21的EST著手,通過逆轉錄PCR(reverse transcription—polymerasechainreaction,RT-PCR)篩選,鑒定出一個在NPC活檢組織和細胞系中均表達下調的ESTBG772301;在此基礎上,我們運用Noahem雜交方法檢測了該EST在多種正常成人組織中的表達情況及其所代表基因的轉錄本大小,并通過對該EST的cDNA克隆進行直接測序,獲得了一個新的全長cDNA序列,命名為鼻咽癌表達下調基因(NPCEDRG)
1 材料與方法
1.1 鼻咽癌組織及細胞系
收集成年人鼻咽慢性炎癥組織16例(作為正常對照)和鼻咽癌活檢組織34例(其中低分化鱗癌32例,中分化鱗癌1例,泡狀核細胞癌1例),所有組織標本均經病理確診。鼻咽慢性炎癥組織及鼻咽癌組織均取材于中南大學湘雅醫院耳鼻喉科門診活檢標本。活檢組織一分為二,一半用于病理診斷,一半迅速裝入經DEPC處理與高溫消毒的凍存管內,置入液氮中速凍保存備用。5株人鼻咽癌細胞系(HONEl、HNEl、HNE2、CNEl、CNE2)和1株白血病細胞系(HL-60)由本室提供及培養。
1.2 總RNA提取
成人正常鼻咽組織和鼻咽癌組織總RNA抽提:碾缽中先加入液氮預冷,將組織從液氮中取出,迅速放人盛有少量液氮的碾缽內碾碎,再加入1 mL TRIzol試劑碾磨,其余按說明書操作。鼻咽癌細胞系總RNA抽提:Hanks’液洗滌2次,吸盡Hanks’液,加1mL TRIzol試劑振蕩,其余按說明書操作。
1.3 RT-PCR
正常鼻咽組織、NPC活檢組織及細胞系提取的總RNA,先用RNase-freeDNaseI(Roch公司)預處理,然后經苯酚、氯仿抽提,再按逆轉錄試劑盒(Promega公司)說明書進行逆轉錄。取逆轉錄產物1~2μL作為模板,進行PCR反應。PCR每管中同時加入內對照GAPDH和EST引物,總反應體系50μL,反應參數為:94℃變性4min;94℃50 s,58℃50s,72℃1min,30個循環,72℃延伸5min。PCR完畢后,取5℃LPCR產物點樣于1.0%瓊脂糖凝膠,電壓50~80V,電泳20~40min,溴化乙啶染色并照相。
1.4 探針制備與Northern雜交
探針制備:通過電泳回收、純化ESTBG772301和GAPDH的PCR產物,經測序證實無誤后,以之作為模板,采用α-32p-dCTP(北京亞輝公司)和隨機引物標記試劑盒(Promega公司)制備同位素標記探針,操作方法按照試劑盒使用手冊。Northern雜交:采用上述同位素標記的探針,對Clontech公司的MTNTM Blot膜(目錄號:7760-1,含8種正常成人組織總RNA)進行雜交,雜交程序及操作方法參見使用說明書,雜交膜于-70℃放射自顯影3~7d后洗片。通過MTNTMBlot膜的雜交,可顯示ESTBG772301所代表基因的轉錄本大小及其在不同組織中的表達豐度。
1.5 全長cDNA序列的獲得和生物信息學分析
通過EST數據庫查尋,已知一個來源于I.M.A.C.E.Consortium的cDNA質粒克隆(1MAGE:4839190)包含ESTBG772301。從Re-searchGenetics公司購買該cDNA質粒克隆,用質粒純化試劑盒(Qiagen公司)抽提質粒DNA,送上海博亞生物技術公司進行測序,測序結果用DNASTAR序列分析軟件包進行拼接,獲得全長cDNA序列。cDNA序列及其編碼蛋白的氨基酸序列,通過因特網(Internet)上的核酸數據庫(http://www.ncbi.nlm.nih.gov/GenBank)和蛋白質數據庫(http://www.expasy.ch)及其分析程序,進行生物信息學分析。
2 結果
2.1 EST的篩選
進入美國國家生物技術信息中心(NCBl)網站,首先在EST數據庫(http://WWW.ncbi.nlm.nih.gov/dbEST/index.html)輸入3號染色體區帶信息,找到幾十條EST,然后在Genemap(http://WWW.ncbi.nlm.nih.gov/genemap/map.cgi)直接點擊3號染色體相應區帶,查找到幾百條EST。對查找到的所有ESTs利用blastn程序(http://WWW.ncbi.nlm.nih.gov/BLAST)進行同源性比較、分析,剔除代表已克隆基因的EST和來源于同一族的EST。我們選擇EST的標準是:1)與已知基因同源性小于50%,代表未克隆基因;2)序列長度大于400bp;3)盡可能地來源于染色體3p21區域,并有關于染色體定位信息的說明;4)序列中不含Alu重復序列。據此,我們篩選到46個滿足以上條件的EST,選取20個EST進行RT-PCR擴增,對表達下調的EST用PCR產物標記探針,然后進行Northern雜交。
2.2 RT-PCR檢測結果
對EST的部分RT-PCR檢測結果見圖1。結果表明,ESTBG772301在41.18%(14/34例)的鼻咽癌組織和20.0%(1/5株)的鼻咽癌細胞系中mR—NA的表達水平低于成人正常鼻咽組織。此外,在1例白血病細胞系(HL-60)中也明顯表達下調。

2.3 Northern雜交結果
用EST BG772301和GAPDH的PCR產物標記探針,對MTNTMBlot人多種正常組織RNA膜進行雜交,結果發現:ESTBG772301在人多種正常組織中都有表達,相對而言,人胎盤、肺及肝組織中陽性雜交信號較弱,而人心、腦、骨骼肌、腎及胰腺組織均有較強的陽性雜交信號,說明ESTBG772301所代表的基因較為保守。另外,結果還顯示該基因的轉錄本大小約為2.4kb左右,而內對照GAPDH在人多種正常組織中的陽性雜交信號無強弱的差別,表明各泳道RNA量基本一致(圖2)。

2.4 全長cDNA克隆測序和生物信息學分析
我們通過對cDNA質粒克隆(IMAGE:4839190)測序,獲得了一個全長為2 377 bp的cDNA序列,與Northern雜交檢測到一個大小為2.4kb轉錄本的結果基本相符。該cDNA序列含507bp開放閱讀框(ORF),編碼169個氨基酸,起始密碼子ATG位于第43位核苷酸,終止密碼子TAA位于第549位核苷酸,終止密碼子后有加尾信號及polyA尾(圖3)。經blastn程序(http://WWW.ncbi.nlm.nih.gov/BLAST/)對非冗余(nr)數據庫進行核酸序列同源性比較分析,發現該cDNA序列與已知基因序列比較無顯著性相似,屬于一個新的基因。征得人類基因組組織(HUGO)同意,將該基因命名為鼻咽癌表達下調基因(NPCEDRG),Genbank登錄號:AF538150。與人基因組序列進行BLAST分析(http://www.ncbknlm.nih.gov/genome/seq/Hsblast.html),發現該基因cDNA序列與人類3號染色體大規模測序構建的重疊群(contig)序列NT—022439的同源性高達98%-100%,序列NT—022439完全覆蓋了NPCEDRG的cDNA序列,從而將NPCEDRG精確定位于染色體3p21.3;同時,還發現NPCE-DRG的基因組DNA長約6.3 kb,由6個外顯子和5個內含子組成.經blastp程序(http://WWW.ncbi.nlm.nih.gov/BLAST/)進行蛋白質序列同源性比較,發現該基因編碼的蛋白質與一個已報道的在進化上相對保守、功能未知的人類蛋白Nicolinl(簡稱NICNl)N端170個氨基酸殘基的序列同源性達97%,但缺少NICNl蛋白C端43個氨基酸殘基,可能是nicolinl基因不同剪接本的編碼產物。對該基因編碼蛋白的理化特征、結構、功能進行預測分析(http://www.expasy.ch),發現該基因編碼蛋白的計算等電點為8.3,相對分子質量約為19.2kDa,屬于親水性蛋白,富含亮氨酸和脯氨酸,含有兩個蛋白激酶C(PKC)磷酸化位點,一個酪蛋白激酶Ⅱ磷酸化位點。
3 結果
大量研究表明,鼻咽癌(NPC)染色體3p21區域常常發生高頻率的非隨機性雜合性丟失(LOH)。而且,通過微細胞介導單染色體轉移的功能性研究也已證實,染色體3p21.3位點可能存在與NPC相關的抑瘤基因(TSG)。因此,3p21成為我們克隆NPC相關基因的首選染色體區域。但人染色體3p21區域內,僅3p21.3位點就跨越了20cM(centimorgan,cM),相當于200Mb,如何在這么大的范圍內克隆和鑒定NPC相關基因是我們面臨的一個難題。
表達序列標簽(EST)是cDNA克隆的5'或3'端已測定序列,它幾乎覆蓋了所有的人類基因(尤其是未知基因),并代表了基因的轉錄水平。EST的大規模測序是人類基因組計劃(HGP)構建轉錄圖譜的重要組成部分,隨著人類基因轉錄圖譜中EST在數目上的迅猛遞增及其在染色體上的精確定位,EST已成為定位克隆人類新基因(包括未知抑瘤基因)的重要手段。本研究正是采用這一策略,從NPC高頻率LOH區域3p21的EST人手,首先通過RT-PCR篩選,鑒定出一個ESTBG772301在NPC組織及細胞系中均表達下調,然后對該EST進行全長cDNA序列分析,從而克隆到一個新的NPC相關基因。

在鑒定出一個有意義的EST之后,獲取該EST所代表基因的全長cDNA序列就成為進一步研究的關鍵。已知的方法有多種,如利用該EST序列作探針來篩選cDNA文庫,或對該EST序列進行5'和3'cDNA末端快速擴增(RACE)等,但這些方法均較為費時、費力。由于EST本身來源于eDNA克隆的大規模測序,大多數的EST都有其對應的cDNA克隆,而這些克隆中有些已包含有全長的eDNA序列,因此在能獲得EST相應eDNA克隆的前提下,對EST來源的cDNA克隆進行直接測序,不失為一種簡便地獲取基因全長eDNA序列的方法。
對測序獲得的一個cDNA序列,判斷它是否為全長,可以借助生物信息學方法進行分析:5'端,可根據在開放閱讀框架(ORF)的第一個ATG上游有無同框架的終止密碼子,無終止密碼子的則考慮是否有保守的Kozak序列來進行判斷;3'端,可根據編碼框架的下游有無終止密碼子或polyA加尾信號來判斷,無明顯加尾信號的則看是否有polyA尾。當然,生物信息學分析的結果也要通過實驗驗證,如用Northern雜交證實mRNA大小,用逆轉錄產物或在eDNA文庫中進行PCR擴增,確定連續、完整的cDNA全長序列等。
本研究所克隆的新的NPC相關基因,正是在篩選到一個在鼻咽癌中表達下調的ESTBG772301的基礎上,通過對ESTBG772301對應的eDNA克隆(1MAGE:4839190)進行直接測序,獲取了基因全長約2 377bp的cDNA序列。這與用ESTPCR產物作為探針,對MTNTM Blot人多種正常組織RNA膜進行Northern雜交,檢測到2.4kb轉錄本的結果是基本一致的。對該序列的生物信息學分析發現,其含有一個507bp的開放閱讀框(ORF),起始密碼子ATG位于第43至45位核苷酸,符合Kozak序列特點;終止密碼子TAA位于第552至554位核苷酸,終止密碼子后有加尾信號及poly(A)尾。因此,我們認為該序列代表了一個基因的完整eDNA序列,而且BLAST分析表明其與已知基因序列無明顯同源性,屬于一個未被克隆的人類新基因,經人類基因組組織(HUGO)同意,將它命名為鼻咽癌表達下調基因(NPCEDRG)。由于該eDNA序列能被人類3號染色體大規模測序構建的重疊群(contig)序列NT—022439完全覆蓋,因而將其精確定位于染色體3p21.3,并由此分析得知該基因的結構:基因組DNA長約6.3 kb,由6個外顯子和5個內含子組成。該基因編碼的蛋白質由169個氨基酸組成,理論等電點為8.3,計算相對分子質量約為19.2kDa,屬于親水性蛋白,富含亮氨酸和脯氨酸,含有兩個蛋白激酶C(PKC)磷酸化位點,一個酪蛋白激酶Ⅱ磷酸化位點,其與一個已報道的在進化上相對保守、功能未知的人類蛋白Nieolinl(簡稱NICNl)N端170個氨基酸殘基序列高度同源(序列同源性高達97%),但缺少NICNl蛋白C端43個氨基酸殘基,可能是nicolinl基因不同剪接本的編碼產物。目前,對該基因的生物學特性和在鼻咽癌發生發展中的作用及其分子機制,我們正在深入研究中。