高俊平
(山東省濰坊科技學院賈思勰農學院 濰坊 262700)
基因組步移(genomic walking)是指從第一個重組克隆插入片段的一端分離出一個片段作為探針,從文庫中篩選第二個重組克隆,該克隆含有與探針相重疊的序列。從第二個重組克隆再分離出末端小片段作為探針篩選第三個重組克隆,如此重復,得到一個相鄰的片段。它是一種重要的分子生物學研究技術,可以有效克隆已知片段側翼的未知序列。
迄今為止,基因組步移主要有兩種方法: 一是結合基因組文庫的基因組步移技術,此方法適于長距離步移,可以獲得某一特定染色體較長連續區段的重疊基因組克隆群;另一個是以聚合酶鏈式反應(polymerase chain reaction, PCR)擴增為主要手段的基因組步移技術,該方法產生的步移距離相對較短,但是操作簡單,尤其適合于尋求已知片段旁側的未知序列。
基因組文庫是指生物體的全部DNA經過合適的核酸內切酶消化或機械切割以后,克隆到合適的載體分子中,所有這些插入了基因組DNA片段的載體分子的集合體,就包含了這個生物體的整個基因組信息,也就成為了此生物體的基因組文庫。它是基因組學研究的重要技術平臺,目前構建基因組文庫的方法主要有兩種: 物理剪切法和限制性內切酶法[1]。
以基因組文庫為基礎進行基因組步移的步驟大體如下: ①用與目的基因連鎖的分子標記為探針篩選整個基因組文庫,鑒定出分子標記所在的大片段克??;②再以該克隆為基因組步移的起點,用外側克隆末端作為探針篩選基因組文庫,分離新的重疊克隆(陽性克隆);③多次重復上述步驟,逐漸逼近目的基因,構建目的基因區域的重疊群;④通過亞克隆文庫獲得含有目的基因的小片段克隆,并對其進行遺傳轉化和功能互補驗證,從而最終確定目的基因的核酸序列。
隨著PCR技術的發明,以該技術為基礎發展了多種基因組步移方法,這些方法按原理可分為兩類: 一是依賴酶切連接介導的PCR法;二是不需要酶切連接的PCR法。
2.1 依賴酶切連接的PCR 此類方法首先對基因組DNA進行酶切,然后把酶切產物連接成環或在酶切產物末端加上相應的接頭。根據已知序列設計的特異引物和接頭上的錨定引物分別作為PCR反應的正反向引物,以此來擴增已知序列的上下游側翼序列。
2.1.1 反向PCR 反向PCR(inverse PCR, IPCR)的原理是對已知序列進行限制性內切酶位點分析,然后選取已知序列中沒有位點的限制性內切酶,對基因組DNA進行酶切并將酶切片段環化自連,然后根據已知序列設計反向引物,擴增已知序列兩側的未知序列。IPCR的優點是操作簡單;缺點是環化過程難以控制,這是因為酶切位點隨機分布,有可能產生較長的片段,從而導致PCR擴增效率下降。鑒于此,科研人員在此基礎上發展了橋連IPCR: 環化的過程中,在酶切位點之間特意加上一段橋連片段,從而能更有效地擴增側翼片段。Chen等[2]通過IPCR技術克隆了小麥花粉特異性基因TaPSG719的啟動子序列。盡管IPCR應用不多,但它開創了利用PCR技術進行基因組步移的先河。以此為基礎,大量應用PCR技術進行基因組步移的方法相繼涌現。
2.1.2 載體PCR 載體PCR(single specific primer PCR, SSP-PCR)是指把基因組DNA酶切片段連接到質粒載體上,并用已知序列設計的特異引物和載體上的通用引物特異擴增目標片段的一種PCR技術。SSP-PCR實驗設計簡單,尤其適合于保存有cDNA或基因組文庫的實驗室,但是其操作較繁瑣,特異性較低,產物仍需做進一步的鑒定。Gowik等[3]運用SSP-PCR技術成功克隆出了一種黃頂菊基因(ppcA1)的啟動子序列。
2.1.3 連接單鏈接頭的PCR 單鏈接頭PCR(panhandle PCR, P-PCR)是連接單鏈接頭PCR的典型代表,因其關鍵環節形成一個鍋柄狀結構,故也稱鍋柄PCR。其原理為: 基因組DNA先用限制性內切酶酶切,然后在酶切片段末端連接上含有自由端的單鏈寡核苷酸鏈(3′端與已知序列中部分片段完全反向互補),這樣含有連接片段的單鏈DNA在合適的溫度下會自身退火形成一個類似鍋柄結構的環,接下來用在已知序列內呈線性排列的3個單引物進行3次PCR擴增,即得到目的片段。P-PCR的優點是特異性較高,但由于單接頭連接效率低,會限制鍋柄結構的形成。在此基礎上,科研人員對其進行了改進,即在形成鍋柄之前在3′末端連接雙脫氧胞苷三磷酸(ddCTP),從而使引物錯配的概率減少,特異性則相對增加。Shang等[4]運用改良的P-PCR技術從靈芝中成功克隆出了羊毛固醇合酶基因的啟動子序列。
2.1.4 連接雙鏈接頭的PCR 雙鏈接頭PCR法主要原理為: 用能夠產生黏性末端的限制性內切酶切割基因組DNA,將酶切好的DNA片段和退火雙鏈接頭用T4連接酶連接起來,最后通過一條特異性引物和一條根據接頭序列設計的引物進行PCR擴增(有時需要進行巢式PCR),即可獲得包含有側翼序列的片段。在實際運用過程中,科研人員根據具體情況發展出捕捉PCR(capture PCR)、抑制PCR(suppression PCR)、T接頭連接的PCR(T-linker-specific ligation PCR, T-linker PCR)等多種步移方式。雙鏈接頭的PCR的優點是特異較好,但由于要進行基因組酶切,所以對基因組DNA的質量要求較高,而且步驟較為繁瑣。筆者曾運用雙鏈接頭的PCR成功克隆了日本沼蝦胰島素樣促雄性腺激素基因和胰島素樣促雄性腺激素結合蛋白基因的全基因組序列(含啟動子區域和內含子區域)[5]。
2.2 非依賴酶切連接的PCR 酶切介導的PCR步移技術無疑都會受到酶切位點的限制,因此研究者開發了非依賴酶切連接的PCR技術,主要有以下幾種:
2.2.1 新Alu-PCR Alu因子是一類僅存在于靈長類基因組中的短片段重復序列,平均大約每4 kb堿基就出現一次。研究者利用這一規律,發明了Alu-PCR。其原理是根據Alu的序列設計引物,來擴增兩個Alu之間的片段區域。新Alu-PCR則是根據已知序列或是外源插入序列與Alu保守序列設計引物,擴增所需的未知側翼序列。因Alu僅存在于靈長類,這也大大限制了Alu-PCR在其他物種的應用。
2.2.2 熱不對稱交錯PCR 熱不對稱交錯PCR(thermal asymmetric interlaced PCR, TAIL-PCR)是非酶連介導的PCR基因組步移技術的典型代表。其基本原理是根據已知序列區域設計三個具有高退火溫度、較長的巢式特異引物,將它們分別和一個具有低退火溫度、較短的(16 nt)任意簡并引物(arbitrary degenerate primer, AD)配合使用,根據引物的長短和特異性差異設計不對稱循環溫度,并通過三級PCR反應得到目的產物。TAIL-PCR技術簡單方便,反應高效靈敏,產物特異性高,多數情況下能夠獲得較為滿意的結果,因而應用非常廣泛,幾乎適用于所有物種的基因組。例如,Song等[6]運用此方法從沙冬青中成功分離克隆了肌醇半乳糖苷合酶基因的啟動子序列。但不容忽視的是,TAIL-PCR也存在AD引物結合位點有限導致擴增產物較短(一般情況小于1 kb)以及整體所需引物組合較多、反應條件設置要求比較精細等問題。鑒于此,科研人員對其進行了改進并建立了高效熱不對稱交錯PCR技術(hiTAIL-PCR)。改進之處在于: 簡并引物序列適當增長(LAD)為33~34 nt,而不是原來的16 nt,且LAD引物的5′端為用于第二輪PCR的基因特異引物SP2序列,這樣就保證了擴增的特異性。因此,hiTAIL-PCR比TAIL-PCR擴增成功率更高,產物也更長(可達3 kb)[7]。
2.2.3 引物退火控制PCR 引物退火控制(DNA walking annealing control primer, DW-ACP)PCR策略的核心在于采用了復性控制引物(annealing control primer, ACP)。ACP有3部分組成,依次為: 3′端的目標核心序列、中間的調節序列和5′端的非目標尾部序列。目標核心序列能和待擴增區域的某一部位特異結合,但位置隨機;非目標尾部序列主要起到調節整條引物Tm的作用;調節序列是其中關鍵部分,它能促進目標核心序列與模板特異性結合而抑制非目標尾部序列與模板的非特異性結合,從而阻礙非特異性擴增。該方法程序較為簡單,擴增特異性高,不足之處在于: ACP引物受專利保護,3′端的目標核心序列尚未公開。Harreither等[8]運用此方法從真菌中分離了纖維二糖脫氫酶基因組全長序列。
雖然測序技術飛速發展,但當前某一物種的全基因組測序價格仍然異常昂貴,因此,基因組步移仍舊是獲取基因組DNA序列的首選途徑。以上介紹的幾種技術是典型的基因組步移方法,每種方法都有其優點和局限性。根據筆者的經驗,在具體的實驗實際操作中,可以通過幾種方式聯合起來進行基因組步移,從而有效地獲取目的基因。同時,隨著分子生物學和基因工程技術的發展,更高效基因組步移方法的出現指日可待。