趙芳玲 綦鈺瑩 蔡劍平 戴大鵬
高質量的大片段基因組文庫的構建是基于圖譜的基因克隆和物理圖譜構建的必要技術平臺,這極大地方便了基因組學的研究工作,成為人類基因組計劃順利進行的重要支撐[1~3]。最早使用的克隆載體是λ噬菌體,其插入片段為20kb左右,且僅能應用于一般基因的克隆。隨后發展出的Cosmid載體的插入片段增大到45kb,但仍不能滿足于較大的基因簇的研究。20世紀80年代起酵母人工染色體YAC作為最早發展的真正意義上的人工染色體應運而生[4]。YAC能夠構建完整基因組文庫,但其穩定性較差、轉化率低、基因分離難度大。隨后以大腸桿菌F因子為基礎的BAC載體系統迅速發展并被廣泛應用[5]。BAC載體的插入片段最高可達300kb,因以大腸桿菌為寄主故轉化率高,較YAC文庫更容易構建,且復制子來源于F因子,無嵌合現象可穩定遺傳[6]。這些優點使得BAC載體成為基因組文庫構建和較大基因簇研究的主要工具。
BAC載體經研發應用后也不斷被改造優化以更方便基因組克隆。pBeloBAC11載體是第2代BAC載體的代表,其在第1代載體pBAC108L的克隆位點中引入了lacZα基因可通過藍白斑篩選作為重組子選擇標記。但是pBeloBAC11載體是單拷貝復制,且提取質粒DNA時還需進行CsCl-EB密度梯度離心純化[7]。因此很難得到大量高純度的質粒DNA。高拷貝復合載體pCUGIBAC1的出現很好地解決了這一問題[8]。該載體由高拷貝克隆用載體pGEM-4Z與BAC載體plndigoBac536融合連接組成,既保留了BAC載體容納大片段的特性,又顯著提高了質??截悢?進而降低了質粒純化及后續分子克隆操作的難度。
本研究在此原理上將pBeloBAC11與pGEM-3Z兩載體進行改進融合改造,同時增加多克隆酶切位點數目,以方便后期外源基因的接入,最終得到高拷貝復合BAC載體pBAC-BJH。利用該載體本研究將CYP2A6基因大片段DNA導入雙酶切后的線性BAC載體并成功用于單倍型分析。
1.試劑與材料:大腸桿菌(E.coli)菌株DH10B購自北京博邁德基因技術有限公司;質粒pGEM-3Z購自美國Promega公司;質粒pBeloBAC11購自北京諾鑫盛源科技有限公司;NEB bufferr2.1購自美國NEB公司;DNA Ligation Kit購自日本TaKaRa公司;HindⅢ、BamHⅠ內切酶購自北京蘭博利德商貿有限公司;瓊脂糖凝膠回收試劑盒購自北京天根生化科技有限公司;KOD One PCR Master Mix購自日本Toyobo公司。引物由北京擎科生物科技股份有限公司合成。
2.中間載體pGEM-3Z-BJH和pBAC-LOW的構建:合成表1中的退火上游和下游引物,分別稀釋至100μmol/L,各取10μl與2.2μl 10×NEB buffer 2混合,運行如下程序退火:95℃保持3min,90℃保持1min,85℃保持1min,80℃保持1min,75℃保持1min,70℃保持1min,65℃保持1min,60℃保持1min,55℃保持1min,50℃保持1min,45℃保持1min,40℃保持1min,35℃保持1min,30℃保持1min,25℃保持1min,然后冷卻至4℃。退火產物稀釋100倍后取2μl與30~50ng BamHⅠ/HindⅢ雙酶切的pGEM-3Z或pBeloBAC11質粒,TaKaRa連接kit 16℃連接30min后轉化DH10B感受態細胞,并在含100μg/ml氨芐青霉素(pGEM-3Z)或12.5μg/ml氯霉素(pBeloBAC11)的LB固體培養基過夜培養,利用T7和SP6引物進行菌落聚合酶鏈反應(polymerase chain reaction,PCR)篩選陽性克隆。原載體為陰性對照,2%瓊脂糖凝膠電泳挑選條帶增加127bp的菌落并提取質粒,獲得重組中間載體pGEM-3Z-BJH及pBAC-LOW并利用T7進行測序以驗證序列是否正確。

表1 所用引物及序列信息表
3.目的載體高拷貝質粒pBAC-BJH的構建:HindⅢ單酶切pGEM-3Z-BJH及pBAC-LOW 37℃ 2h,酶切產物回收后取60ng pGEM-3Z-BJH與30ng的pBAC-LOW進行連接,連接產物轉化DH10B感受態細胞后均勻涂布于含100μg/ml氨芐青霉素及12.5μg/ml氯霉素抗性的平板并進行藍白斑篩選。挑取藍色菌斑,使用通用引物M13上游引物和M13下游引物進行菌落PCR。由于目標載體內應會含有2段lacZα,陽性克隆擴增后會分別得到一條2909bp和一條166bp大小的條帶。測序驗證后提取目的質粒命名為pBAC-BJH。
4.重組載體pBAC-BJH應用于CYP2A6基因組大片段克隆:使用NCBI網站的Primer-BLAST在線工具設計CYP2A6擴增上游引物(含BstBⅠ位點)及下游引物(含MluⅠ位點),參照STI PCR文獻[9],利用在線工具calGC確認擴增條件為ProgamⅠ,n=10。參照使用說明,利用KOD One PCR Master Mix擴增CYP2A6的啟動子區及全部外顯子區(9576bp),產物經1%瓊脂糖凝膠電泳后,切膠回收目的條帶并使用BstBⅠ與MluⅠ37℃雙酶切2h,酶切產物純化后備用。使用BstBⅠ與MluⅠ雙酶切2μg新構建的pBAC-BJH載體,1%瓊脂糖凝膠電泳后切膠回收7.5kb的BAC載體,并與同樣酶切純化后的CYP2A6 PCR產物連接,熱激轉化DH10B感受態細胞后進行藍白斑篩選實驗,次日挑取白色菌斑,使用克隆篩選引物進行菌落PCR。提取陽性克隆質粒,并使用外顯子1測序引物及外顯子3測序引物對不同克隆中包含的2A6外顯子1和外顯子3進行測序分析,以鑒定CYP2A6樣本包含的不同SNP是否位于同一條DNA鏈上。
1.中間質粒載體的構建:本研究對比分析了兩種市售常用T載體pGEM-3Z和pMD19-T中lacZα基因的蛋白序列,發現氨基酸存在差異的部分集中在N端,據此推測,N端的編碼基因改變可能不會影響lacZα基因功能的正常行使。為此,本研究在克隆載體pGEM-3Z及BAC載體pBeloBAC11的BamHⅠ酶切位點之間加入了SphⅠ、PmeⅠ、SacⅡ、PacⅠ、NheⅠ、MluⅠ、BstBⅠ等7個酶切位點,獲得兩個中間載體pGEM-3Z-BJH及pBAC-LOW,在保證lacZα維持正常功能的同時,增加后續基因操作時的便捷性(圖1)。藍白斑篩選實驗證實,新加入的酶切位點確實未影響lacZα基因的正常功能。

圖1 lacZα編碼基因的改造
2.目的載體高拷貝質粒pBAC-BJH的構建路徑:使用HindⅢ單酶切中間載體pGEM-3Z-BJH及pBAC-LOW并連接,由于兩個中間載體的lacZα基因完全相同,兩者連接可得到lacZα尾尾相連或頭尾串聯兩種類型的重組質粒,但只有lacZα頭尾串聯重組的菌株保持兩個完整的lacZα基因,從而在藍白斑篩選中呈現藍斑。挑取藍斑測序驗證最終得到同時具有高拷貝特性及擴增大片段能力的載體pBAC-BJH(圖2)。

圖2 pBAC-BJH載體構建流程圖

圖3 利用構建的BAC載體對CYP2A6新突變355A>T開展單倍型分析
3.pBAC-BJH可用于大片段DNA的克隆及分型鑒定:為驗證新構建BAC載體的有效性,本研究利用STI PCR方法成功擴增了CYP2A6的啟動子區及全部外顯子區,產物長度為9576bp(圖3A),利用傳統的限制性內切酶酶切與連接的方式,將擴增產物與同樣雙酶切的pBAC-BJH載體連接并化學轉化大腸桿菌(圖3B),通過對獲得的不同BAC克隆進行測序分析,對CYP2A6的不同單倍型進行基因分型解析。前期研究中筆者團隊在1例漢族志愿者中檢測到了一種新的SNP突變355A>T,該SNP位于CYP2A6基因的外顯子3,可引起第119位的氨基酸由絲氨酸突變為半胱氨酸(即S119C),同時PCR產物測序發現,該突變攜帶者在外顯子1還存在另外兩個SNP位點,分別是22C>T及51A>G(圖3C)。隨機挑選4個BAC克隆并進行測序分析,發現全部克隆均攜帶新突變355A>T及51A>G,但并不攜帶22C>T。據此,本研究認為,攜帶者的22C>T、51A>G、355A>T 3個SNP單倍型分析結果為CGT。
BAC載體在基因組文庫構建、物理圖譜制作、基因組測序等研究中有著不可取代的位置[10~12]。BAC載體相較λ噬菌體、Cosmid黏粒以及YAC載體,同時兼備插入片段大、無嵌合現象、轉化率高等優點。但其低拷貝的特性導致BAC質粒提取時需大量培養菌體,且純化過程復雜,制備成本較高[7, 13]。為解決這一問題,Luo等[8]將高拷貝的pGEM-4Z克隆載體與低拷貝的BAC載體pLindigoBac536偶聯,得到高拷貝復合載體pCUGIBAC1。使用時該載體利用EcoRⅠ或HindⅢ單酶切的方式,可將連入的pGEM-4Z部分去除,獲得與低拷貝BAC載體同樣特性的接收載體,用于外源大片段DNA的插入。隨后該載體成功應用于鯊魚、對蝦等物種的基因組測序分析[14, 15]。但另一方面,隨著測序技術的更迭及大規?;蚪M計劃的完成,人們已不再需要將數百kb的大片段基因組DNA克隆入BAC載體進行測序分析,反而需要對僅數kb的片段進行亞克隆,并對其包含的眾多SNP進行單倍型分析。傳統BAC載體通常僅使用EcoRⅠ或HindⅢ等少數幾種內切酶單酶切以用于外源DNA片段的插入,這種方式一方面容易造成載體自連,另一方面可用內切酶的數量稀少,大大限制了不同基因克隆時的應用范圍。為此,本研究對兩個入門的載體pGEM-3Z及pBeloBAC11進行了遺傳改造,在BamHⅠ和HindⅢ之間加入了BstBⅠ等7種酶切位點,大幅提升了BAC載體在大片段基因克隆時的適用性,同時又保證lacZα正常功能的行使,方便利用藍白斑篩選來鑒定載體中是否有外源DNA片段的插入(圖1、圖2)。雙酶切方式的引入,一方面降低了載體自連的概率,同時又提高了外源基因的插入效率,即便使用熱激轉化的低效質粒轉化方式仍然可以獲得較高的陽性克隆效率(圖3)。
細胞色素p450(簡稱CYP或p450)酶系是一類最重要的藥物代謝酶,參與超過80%的臨床藥物的體內代謝,其編碼基因呈現高度遺傳多態性,且在不同種族、不同地域間存在顯著差異,是造成個體間藥物代謝能力差異的最重要原因之一[16]。根據藥物基因變異聯盟PharmVar(Pharmagene Variation Consortium)網站的信息,多數CYP等位基因同時包含多個SNP位點,且新等位基因申請時必須提供攜帶者包含的各SNP的單倍型信息[17]。CYP2A6是CYP2家族中的重要成員,該酶參與約3%臨床常用藥物的體內代謝或活化[16]。與其他CYP基因類似,CYP2A6基因也呈現高度的遺傳多態性,并進一步影響各變異體的藥物代謝活性[18]。
本研究利用新構建的高拷貝復合載體pBAC-BJH,成功對新發現的CYP2A6突變355A>T(非同義突變,可導致S119C變異)的攜帶者進行了單倍型分析,結果表明,該載體及基因克隆和分型策略完全可應用于其他CYP基因的遺傳分型分析。配合其他基因表達載體,該載體未來也可應用于較大基因的克隆和表達分析[19]。需要指出的是,本研究由于采用了熱激轉化的方式將連接產物導入大腸桿菌,雖然降低了使用門檻,無需購置價格高昂的電轉化儀,但獲得的陽性克隆數較少,且存在短片段插入干擾的問題。后期采用電轉化的方式有望進一步提高轉化效率和分型效率。
利益沖突聲明:所有作者均聲明不存在利益沖突。