徐婷婷,齊芬芳,黃世會,牛 熙,李 升,冉雪琴*,王嘉福*,謝 健
(1.貴州大學動物科學學院,貴陽 550025;2.貴州大學農業生物工程研究院,貴陽 550025;3.遵義醫科大學醫學遺傳學教研室,遵義 563000)
絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號通路在細胞增殖、凋亡、分化、運動及基因調控等過程中起關鍵作用[1-2],由細胞因子、生長因子、神經遞質、激素、細胞應激和細胞黏附等多種因素刺激激活,并在所有真核細胞中發揮作用。MAPK信號通路的核心是3種蛋白激酶的聯級反應:活化的絲裂原活化蛋白激酶激酶激酶(mitogen-activated protein kinase kinase kinase,MAP3K)磷酸化并激活特定的 MAPK激酶(mitogen-activated protein kinase kinase,MAP2K),進一步激活MAPK[3]。MAP3K4作為絲裂原活化蛋白激酶家族成員之一,有激酶結構域和蛋白-蛋白相互作用結構域[4-6]。研究表明,MAP3K4基因不僅是原癌相關基因[7-8],還參與草魚腸道免疫應答[9]、細胞炎癥反應[10],調節cAMP反應元件結合蛋白結合蛋白CREBBP(cAMP response element-binding binding proteins)或組蛋白脫乙酰酶6(histone deacetylase 6,HDAC6)控制細胞在上皮和間充質表型之間的轉換[11-12]。本實驗室前期對香豬全基因組進行了重測序,從MAP3K4基因內含子15中檢測到一個結構變異MAP3K4-I15-sv189,本文著重研究該結構變異的群體分布規律及其與基因表達之間的聯系。
香豬1 216頭的血液或組織樣品采自貴州從江粵黔香豬開發有限公司,50頭大白豬血樣和組織樣采自貴州某屠宰場,其中血液樣品用于基因型分析,6月齡的香豬和大白豬組織用于基因表達譜等研究。2×TaqPCR Master Mix、膠回收試劑盒、DL2000 DNA Marker、血液/細胞/組織基因組DNA提取試劑盒購自天根生化科技(北京)有限公司,Revert AidTMFirst Strand cDNA Synthesis Kit為Fermentas公司產品。
根據血液/細胞/組織基因組DNA提取試劑盒說明書方法,提取血液和組織樣基因組DNA,經1%瓊脂糖凝膠電泳檢測,基因組質量良好,分裝成小份量,-20 ℃保存備用。
參照NCBI GenBank中豬參考基因(Scrofa11.1)MAP3K4序列,取結構變異(structure variation, SV)上、下游各500 bp堿基序列,利用Primer 5設計引物PCR-MAP3K4-F/R(表1),引物由生工生物工程(上海)股份有限公司合成。以提取的香豬和大白豬基因組作為模板進行PCR檢測,擴增體系為20 μL:TaqPCR Master Mix(2×)10 μL,上、下游引物各(10 μmol·L-1)0.5 μL,ddH2O 8 μL,基因組模板1 μL。PCR反應條件為:95 ℃預變性5 min;95 ℃變性30 s,57 ℃退火30 s,72 ℃延伸45 s,32個循環;72 ℃延伸10 min。PCR產物經2%瓊脂糖凝膠電泳分離,紫外燈下切取含目的DNA的膠塊,由生工生物工程(上海)股份有限公司進行核苷酸序列測定。

表1 引物信息Table 1 Information of primers
以1 216頭香豬和50頭大白豬的血液基因組DNA為模板,PCR擴增后,取5 μL PCR產物經1%瓊脂糖凝膠電泳檢測,PCR產物測序,與基因參考序列等長的擴增片段命名為正常的I等位基因,比參考序列短的命名為缺失型D等位基因,根據擴增條帶的大小判斷SV的基因型。計算各豬群每種基因型所占比例,等位基因頻率計算公式為:純合子基因型頻率+(雜合子基因型頻率/2),應用IBM SPSS Statistics v26軟件對2個豬品種間進行卡方檢驗,分析二者的等位基因頻率之間是否存在差異。
利用在線軟件Repeat Masker和RegRNA2.0(表2)分析SV區域中是否包含重復元件、以及影響內含子加工的功能元件。

表2 生物信息學分析軟件Table 2 Softwares for bioinformatics analysis
以cDNA作為模板,進行qPCR擴增,qPCR產物經3%的瓊脂糖凝膠電泳檢測,在紫外燈下,切下含擴增產物的膠塊,由生工生物工程(上海)股份有限公司完成堿基序列測定。膠回收目的片段與pGEM-T Vector連接,轉化感受態細胞DH5α,涂布固體LB培養基[13],37 ℃過夜培養,得到單菌落。用滅菌的槍頭沾取單菌落作為模板,進行菌落PCR,檢測目的片段是否轉入大腸桿菌,LB液體培養基170 r·min-1振蕩37 ℃培養過夜,提取重組質粒檢測濃度,將內參GAPDH和目的基因的重組質粒分別作5個10倍梯度稀釋作為模板,進行RT-qPCR以檢測擴增效率。檢測體系為:模板2 μL,引物0.5 μL,SYBR Premix Ex TaqTM(2×)10 μL ,ddH2O 7 μL;反應程序:預變性95 ℃ 3 min,變性95 ℃ 5 s,退火60 ℃ 20 s,延伸72 ℃ 20 s。
采用熒光定量PCR方法檢測MAP3K4基因的表達量。據NCBI公布的MAP3K4基因mRNA參考序列(GenBank No. XM_021 086 227.1),用在線軟件Primer3 Plus(www.bioinformatics.nl)設計定量引物qPCR-F/R(表1),引物跨越第23和25外顯子,預計擴增199 bp。以GAPDH為內參。用TRIzol試劑盒(天根公司)提取6月齡香豬和大白豬組織樣品總RNA,取 1 μL檢測RNA濃度;采用Revert AidTMFirst Strand cDNA Synthesis Kit(Promega公司)逆轉錄為cDNA,反應體系為10 μL:2 μL總RNA,1 μL Random primer(50 μmol·L-1),1 μL dNTPs(10 nmmol·L-1),6 μL RNase-free H2O。qPCR反應體系為20 μL:SYBR Premix Ex TaqTM(2×)10 μL,定量引物各0.5 μL,cDNA 2 μL,ddH2O 7 μL。每種組織或基因型設置3個生物學樣本重復,且每個樣本進行3個技術重復。
以香豬和大白豬的基因組DNA為模板,以特異性引物PCR-MAP3K4 F/R進行PCR擴增(圖1),檢測得到兩種條帶,分別是552 bp和363 bp,兩者相差189 bp,結構變異MAP3K4-I15-sv189處于第15內含子中(圖2)。所獲序列與Ssrofa11.1豬參考基因序列進行比對,552 bp序列與MAP3K4參考序列(NC_010443.5∶6912498-6913049)的相似性為100%,363 bp片段為552 bp片段缺失了SV區域后的片段;SV區域位于Chr15: 6912533-6912721(NC_010443.5),長度189 bp。與參考基因序列一樣的擴增片段(552 bp)定義為I等位基因,將缺失了189 bp的短片段(363 bp)定義為D等位基因。本文建立的結構變異MAP3K4-I15-sv189的PCR檢測方法,可以區分SV的不同基因型。

M. DL2000 DNA Marker;泳道1. II型;泳道2~6. DD型;泳道7. ID型M. DL2000 DNA Marker. Lane 1. Genotype II. Lanes 2-6. Genotype DD. Lane 7. Genotype ID 圖1 結構變異MAP3K4-I15-sv189的基因分型Fig.1 Genotyping of the structural variation MAP3K4-I15-sv189

A.SV位置示意圖;B.MAP3K4-I15-sv189堿基序列A.Diagram of SV; B.Sequence of structural variant MAP3K4-I15-sv189圖2 結構變異MAP3K4-I15-sv189在MAP3K4基因中的位置Fig.2 Position of structural variant MAP3K4-I15-sv189 in the MAP3K4 gene
采用建立的結構變異MAP3K4-I15-sv189檢測方法,檢測香豬和大白豬2個豬群中MAP3K4-I15-sv189的分布。香豬群體中檢測出兩種基因型(DD和ID),且DD型頻率遠高于ID型。大白豬群體中檢測出3種基因型,以DD型為主。比較兩個豬群間的等位基因頻率(表3),香豬D等位基因頻率顯著高于大白豬相應值(P<0.05)。

表3 兩個豬品種MAP3K4-I15-sv189位點基因頻率比較Table 3 Comparison of gene frequencies at the MAP3K4-I15-sv189 locus in two pig breed populations
采用RegRNA2.0預測結構變異MAP3K4-I15-sv189區域中的功能元件,以MAP3K4-I15-sv189的第一個堿基為1進行功能元件的定位(表4)。從結構變異中檢測出10個內含子剪切增強子(intron splicing enhancer,ISE)、1個miRNA結合位點(ssc-miR-342);用Repeat Masker進行分析,得出MAP3K4-I15-sv189含有2個簡單重復元件(simple sequence repeats ,SSR)。缺失型結構變異MAP3K4-I15-sv189將導致這些功能元件的丟失。

表4 SV區域功能元件預測分析Table 4 Prediction of functional elements in SV region
RT-qPCR產物經測序,與NCBI上目的基因的相似性為96%,確認為MAP3K4基因。以內參和目的基因重組質粒的5個10倍稀釋梯度為模板進行RT-qPCR檢測,內參基因與目的基因的擴增效率相近,均在100%±10%范圍內(圖3),由此建立了MAP3K4表達量的RT-qPCR檢測方法。

圖3 GAPDH基因(A)和MAP3K4基因(B)擴增效率Fig.3 Amplification efficiency of GAPDH (A) and MAP3K4 genes (B)
采用RT-qPCR方法檢測香豬DD型MAP3K4基因的組織表達譜(圖4),肺和腦組織中的表達量最高,子宮、脾、腎、心、卵巢中有少量表達,骨骼肌中幾乎不表達。

圖4 香豬MAP3K4基因組織表達譜Fig.4 Tissue expression profiles of MAP3K4 gene in Xiang pigs
選取大白豬II型、香豬ID型和DD型肺組織(香豬沒有II型),提取總RNA,應用建立的MAP3K4 RT-qPCR方法檢測基因的表達量。得出3種基因型的表達量呈現從高到低的規律性變化:DD型>ID型>II型(圖5)。

*. P<0.05;**. P<0.01圖5 肺組織中MAP3K4三種基因型表達量比較Fig.5 Comparison of the expression levels of MAP3K4 in lung with three genotypes
基于本實驗室前期對香豬全基因組重測序數據,在MAP3K4基因第15內含子中發現一個長度為189 bp的結構變異(MAP3K4-I15-sv189),經群體檢測,證實該結構變異在豬群中真實存在,且在不同豬群中表現出豐富的多態性。在基因型上,香豬群體中檢測到DD和ID兩種基因型,且以純合缺失型為主。大白豬有3種基因型(DD、ID和II);在等位基因頻率方面,香豬的D等位基因顯著高于大白豬。組織表達譜檢測顯示,香豬肺和腦中MAP3K4的表達量較高。選擇攜帶3種基因型的肺組織比較MAP3K4基因表達差異,RT-qPCR檢測證實,DD型的表達量顯著高于ID型和II型。對結構變異MAP3K4-I15-sv189中的功能元件進行分析發現,結構變異區域含有10個內含子剪接增強子(ISE)、1個miRNA結合位點和2個簡單重復元件(SSR)。
提示結構變異缺失型個體MAP3K4基因的表達量增加,可能與結構變異中所含特殊元件有關。miRNA是基因轉錄后調控的重要方式之一,廣泛存在于動植物和病毒體內,miRNA與成熟mRNA結合可以使mRNA裂解或者阻礙下一步的翻譯過程[14-15]。蛋白激酶 Cα(protein kinase C alpha,PRKCA)基因的第15內含子中有一個miR-634結合位點,該位點是由特異性的啟動子控制由聚合酶Ⅲ催化獨立轉錄,轉錄產物可降低PRKCA基因的轉錄水平[16];MAP2K4內含子中miRNA-744結合位點可通過同時靶向β-連環蛋白和MAPK信號通路來阻礙MAP2K4的功能,從而減輕MAP2K4的促遷移作用[17];miR-342-3p 可下調前梯度蛋白2(anterior gradient protein 2,AGR2)基因,抑制非小細胞肺癌(non-small cell lung cancer,NSCLC)細胞增殖和遷移[18]。推測MAP3K4-I15-sv189中的miR-342結合位點可能以相似的方式影響MAP3K4基因的翻譯效率。此外,大量研究表明,內含子剪接增強子能結合反式作用因子,調節剪接體選擇性使用剪接位點的能力[19],影響內含子的剪切速度[20]。推測處于內含子中的結構變異可能通過其中的剪切增強子改變MAP3K4基因轉錄后的加工效率。同時,簡單重復元件(SSR)以微衛星形式存在于基因組中,長25 bp[21],內含子中的SSR可調節轉錄頻率[22],其序列長度會影響基因的表達量水平[23-24],過長會導致轉錄水平降低[25]。結構變異MAP3K4-I15-sv189中含有兩個串聯的SSRs,長186 bp,幾乎涵蓋整個SV區域。有研究表明(CA)n序列可影響內含子剪切增強子的作用,(CA)n序列優先結合反式作用因子,從而影響剪切效率[26],例如表皮生長因子受體(epidermal growth factor receptors,EGFR)基因的轉錄過程因21個連續的(CA)而受到抑制[27];將肺表面活性蛋白B(surfactant protein B,SP-B)基因內含子4中的17個連續(CA)敲除,SP-BRNA前體的剪切效率顯著上升[28]。結構變異MAP3K4-I15-sv189的每個SSR序列中含有多個(GT)重復,其互補鏈則為多個(CA)重復,最多之處有連續11個(CA)重復。推測可能是該SV序列中連續出現的(CA)序列,起到了剪切抑制因子的作用,并拮抗內含子增強子的效應,從而降低MAP3K4基因的轉錄水平,DD型肺組織中MAP3K4基因缺乏結構變異,不受CA重復及miRNA的干擾作用,從而表達量較高。由此推測,這兩個SSR可能是阻礙MAP3K4基因轉錄的因素之一。
組織表達譜顯示,MAP3K4基因在腦和肺組織中高表達。MAP3K4基因中含有單核苷酸多態性位點(SNP),是中國東北漢族人群精神分裂癥的易感基因位點[29],推測可能與腦中MAP3K4基因的異常表達有關。目前MAP3K4基因與豬腦部疾病間的關系尚不清楚。有研究表明,MAP3K4基因所屬p38 MAPK信號通路活性在膿毒性肺損傷中升高,p38 MAPK通路受抑制可消除肺部的白細胞浸潤和肺水腫[30];發生急性肺損傷和支原體肺炎時,p38 MAPK/核因子κB(nuclear factor-κB,NF-κB)通路被激活,兩者調控的多種炎癥因子水平顯著上升,如白細胞介素12 (interleukin-12,IL-12)、IL-13和腫瘤壞死因子α(tumor necrosis factor-α,TNF-α);敲除鞘氨醇1磷酸酯受體3(sphingosine 1 phosphate receptor 3,S1PR3)基因、加入脂氧素受體激動劑BML-111(Methyl (5 S,6R)-5,6,7-trihydroxyheptanoate)或應用解毒清肺劑來抑制MAPK信號通路的活性,則可減輕肺部炎癥[31-33];黨參防治急性肺損傷的靶基因主要參與MAPK級聯活化密切相關通路、膜受體蛋白酪氨酸激酶活性、蛋白質結合和ATP結合等生物功能[34]。這些研究結果表明MAPK信號通路的激活與肺部炎癥正相關。香豬MAP3K4基因以DD型為主,同時DD型肺組織MAP3K4基因的表達量最高,已知香豬易發生肺部疾病[35-36],推測MAP3K4基因中結構變異MAP3K4-I15-sv189的有無與香豬肺部疾病易感有關。
豬群中結構變異MAP3K4-I15-sv189具有多態性,香豬群體以DD型為主,且DD型肺組織的MAP3K4高表達,表明該結構變異的缺失導致MAP3K4基因表達量上升,可能是香豬肺部疾病易感的原因之一。