宋志鵬, 陳 露, 逄淑超, 閆 波, 4, 5△
(1山東大學齊魯醫學院, 山東 濟南 250014; 2濟寧醫學院附屬醫院兗州院區, 3山東省心臟病診療重點實驗室, 4濟寧醫學院附屬醫院心血管疾病分子遺傳學中心, 5山東省中美轉化醫學合作研究中心, 山東 濟寧 272000)
急性心肌梗死(acute myocardial infarction,AMI)是心血管疾病的一種危急重癥,5年生存率僅為55%,占心血管疾病死亡量的20%以上[1],主要是由不穩定動脈粥樣硬化斑塊破裂所致,其病理機制主要涉及細胞代謝、氧化應激和內皮功能障礙等。
GATA 結合蛋白5(GATA binding protein 5,GATA5)作為GATA家族的重要一員,可影響骨形態發生蛋白4(bone morphogenic protein-4,BMP4)、腺苷酸活化蛋白激酶(AMP-activated protein kinase,AMPK)和GATA結合蛋白2伴侶蛋白(friend of GATA binding protein-2,FOG-2)等細胞因子的表達來調控機體細胞代謝[2-3]、冠脈發育[4-6]、血管炎癥、氧化應激和內皮功能[7-8]等多個生命過程,在先天性心臟病、房顫、高血壓等心血管疾病的發生發展中具有不可或缺的作用[7, 9-11]。
但目前國內外研究中,尚未見關于GATA5基因啟動子中單核苷酸多態性(single nucleotide polymorphism,SNP)位點與AMI相關性的報道,因此,本研究通過病例-對照研究,探究兩者的相關性,有望為AMI的預防、診療及發病機制提供新的遺傳學基礎。
選擇2012年11月~2017年2月在濟寧醫學院附屬醫院就診并確診為AMI的320位患者作為本次研究的實驗組,男232例,女88例,年齡(63.41±13.17)歲;選擇同期在同一醫院體檢中心體檢健康者340例作為對照組,男215例,女125例,年齡(45.08±13.49)歲。所有AMI患者的診斷依據均符合WHO制定的AMI診斷標準(臨床癥狀、心電圖和心肌壞死生化標志物);存在冠心病、先天性心臟病或其它心血管疾病家族史的個體不納入本次研究。本研究經濟寧醫學院附屬醫院醫學倫理學委員會批準,患者知情同意。
2.1標本采集及DNA提取 抽取各研究對象(AMI患者于治療前采集,健康體檢者于體檢時采集)清晨空腹外周血3 mL,采用密度梯度離心法分離并提取外周血單個核細胞,參考基因組DNA提取試劑盒說明書從單個核細胞中提取基因組DNA(留取濃度>100 mg/L且吸光度A260/280 nm在1.8~2.0的樣本用于后續實驗),樣本置于-80 ℃保存。
2.2引物設計及合成 參照NCBI中人GATA5基因啟動子序列(NCBI, NC_000020.11),GATA5基因啟動子轉錄起始點(transcription start site,TSS)位于g.62475521(+1),選取TSS上游836個堿基對序列,用Primer Premier 5.0軟件設計其引物序列并由上海生工公司合成。GATA5基因啟動子上游引物序列為5′-AGTGCGAGCGGGACACGGTT-3′; 下游引物序列為5′-GAGCACTCACCAGCGGGCAG-3′。
2.3PCR擴增 50 μL PCR反應體系包括:模板DNA 2.5 μL,上、下游引物(50 μmol/L)各0.25 μL,Taq酶0.5 μL,dNTP MIX 8 μL,GC buffer I 25 μL,DMSO 2.5 μL,雙蒸水11 μL。反應條件為:94 ℃預變性5 min;94 ℃變性30 s,62 ℃退火50 s,72 ℃延伸40 s,共35個熱循環;72 ℃延伸5 min,4 ℃暫時保存。挑選合格的PCR產物測序。
2.4基因分型 將PCR產物送至上海生工公司測序。用DNAMAN軟件將測序所得GATA5基因啟動子序列與標準序列進行比對,并通過測序色譜圖驗證后統計每個樣本多態性位點基因型。序列比對及測序色譜圖驗證均由2名不同實驗者進行,意見不一致的樣本重新測序。
2.5雙螢光素酶報告法分析GATA5基因啟動子的功能 利用含有KpnI和Hind III酶切位點的引物[Forward:5′-(KpnI)-AGTGCGAGCGGGACACGGTT-3′;Reverse:5′-(Hind III)-GAGCACTCACCAGCGGG-CAG-3′]構建表達載體。以不含GATA5基因啟動子序列的表達載體(pGL3-Basic)作為轉染效率的陰性對照,海腎螢光素酶的表達載體PRL-TK(Promega)作為轉染效率的內控對照。轉染前1天,把HEK-293細胞 [CRL-1573, American Type Culture Collection (ATCC)]和H9c2 細胞(rat cardiomyocyte line;CRL-1446,ATCC)接種于6孔板中,次日用1.0 μg表達載體轉染每孔中的細胞,轉染完成48 h后,使用雙螢光素酶報告基因檢測系統(Promega Dual-Luci-ferase? Reporter Assay system)檢測轉染細胞的雙螢光素酶活性。GATA5基因啟動子的轉錄活性表示為螢火蟲螢光素酶活性與海腎螢光素酶活性的比值。野生型GATA5基因啟動子的轉錄活性設置為100%。
2.6核提取物的制備和電泳遷移率變動分析(electrophoretic mobility shift assay,EMSA) 用NE-PER?核蛋白/胞質蛋白提取試劑盒(Thermo Fisher Scientific)制備HEK-293細胞和H9c2細胞的核提取液。使用含有SNP位點的生物素化的雙鏈寡核苷酸(30 bp)作為探針[g.62476317G>A,CAGCCTTCGGCGGGG(G/A)CCGGGGCAGGGAGG,g.62476303-g.62476332; g.62476223C>T,AGCCCTCGGCCCGCC(C/T)GTCTAGCTGCAATG,g.62476209-g.62476238]。使用LightShift?化學發光EMSA試劑盒(Thermo Fisher Scientific)進行DNA-蛋白質結合反應。
轉染實驗獨立重復3次,轉染結果用均數±標準誤(mean±SEM)表示,并通過t檢驗分析轉染結果。采用SPSS 19.0軟件(IBM)進行統計分析。計量資料以均數±標準差(mean±SD)表示,使用卡方檢驗分析納入對象是否符合Hardy-Weinberg平衡;使用R×C卡方檢驗分析SNP位點基因型及等位基因頻率在實驗組與對照組中的分布差異;用logistic回歸分析SNPs與AMI的相關性,以優勢比(odds ratio,OR)和95%置信區間(confidence interval,CI)表示;兩組間SNPs連鎖不平衡用Haploview 4.2 軟件分析;使用SHEsis在線軟件(http://analysis.bio-x.cn/myAnalysis.php)進行單倍型分析;使用Transfac在線軟件(https://portal.genexplain.com/)分析SNPs是否改變轉錄因子潛在的結合位點。以P<0.05為差異有統計學意義。
AMI組中男性、吸煙、高血壓和糖尿病的比例及年齡水平均明顯高于對照組(P<0.01);對照組高密度脂蛋白膽固醇水平明顯高于AMI組(P<0.01);受AMI患者飲食習慣改變及服用調脂藥物等因素影響,對照組中體重指數、低密度脂蛋白膽固醇和總膽固醇水平明顯高于AMI組(P<0.01);兩組間收縮壓、舒張壓和甘油三酯水平無顯著性差異,見表1。
測序結果顯示,rs80197101和rs77067995位點既有純合子突變,又有雜合子突變,見圖1;對2個SNPs位點進行Hardy-Weinberg平衡檢驗,結果顯示各SNPs位點在兩組中結果相同且均符合Hardy-Weinberg平衡(AMI組P=0.692;對照組P=0.500),表明樣本來自遺傳平衡的群體,具有良好的代表性。

表1 臨床特征分析

Figure 1.Sequencing chromatogram of SNPs inGATA5gene promoter sequence. Sequence orientations of the SNPs were marked.The top panel showed wild type, the middle showed heterozygote, and the bottom showed cloning DNA sequence. Polymorphism sites are marked with arrows.
圖1GATA5基因啟動子中SNPs的測序色譜圖
基因分型結果顯示,rs80197101和rs77067995位點基因型在兩組中的頻率分布具有顯著性差異(2=7.278,P=0.026;2=7.278,P=0.026);進一步分析發現,rs80197101的GA+AA基因型頻率和rs77067995的CT+TT基因型頻率在AMI組明顯高于對照組(2=6.740,P=0.009;2=6.740,P=0.009);此外,AMI組中rs80197101的A等位基因頻率和rs77067995的T等位基因頻率均顯著高于對照組(2=6.960,P=0.008;2=6.960,P=0.008),見表2。
表2 AMI組和對照組rs80197101和rs77067995位點基因型和等位基因頻率分布表
Table 2.Distribution of genotype and allele frequencies of rs80197101 and rs77067995 loci in AMI and control groups

GenotypeAMI(n=320)Control(n=340)n%n%2Prs80197101G>A GG27886.931692.97.2780.026 GA4112.8247.1 AA10.300.0 GA+AA4213.1247.16.7400.009 G allele59793.365696.5 A allele436.7243.56.9600.008rs77067995C>T CC27886.931692.97.2780.026 CT4112.8247.1 TT10.300.0 CT+TT4213.1247.16.7400.009 C allele59793.365696.5 T allele436.7243.56.9600.008
采用logistic回歸分析SNPs與AMI的相關性,結果發現rs80197101位點的GA基因型與GA+AA基因型(含有A等位基因)均與AMI的發生具有相關性(OR=1.942,95% CI:1.144~3.295,P=0.014;OR=1.989,95% CI:1.175~3.369,P=0.011)。校正年齡、性別、吸煙、高血壓、糖尿病、高密度脂蛋白膽固醇、低密度脂蛋白膽固醇、甘油三酯、總膽固醇等潛在混雜因素后,GA基因型與GA+AA基因型(含有A等位基因)仍與急性心肌梗死的發生具有相關性(OR=2.280, 95%CI: 1.027~5.061,P=0.043; OR=2.312, 95%CI: 1.045~5.116,P=0.039),其致AMI效應分別是GG基因型(不含A等位基因的正常基因型)的2.280倍和2.312倍。rs77067995位點的CT和CT+TT基因型與AMI的發生具有相關性(OR=1.942,95% CI:1.144~3.295,P=0.014;OR=1.989,95%CI:1.175~3.369,P=0.011),校正上述潛在混雜因素后,相關性依然存在(OR=2.280, 95% CI: 1.027~5.061,P=0.043; OR=2.312, 95% CI: 1.045~5.116,P=0.039),其致AMI效應分別是CC基因型(不含T等位基因的正常基因型)的2.280和2.312倍。校正上述潛在混雜因素前后,均未發現rs80197101的AA基因型和rs77067995的TT基因型與AMI之間具有相關性(P=1.000,P=1.000)。
GATA5基因啟動子區域的2個SNPs位點(rs80197101G>A和rs77067995C>T)間呈完美連鎖不平衡(D′=1.000,r2=1.000)。單倍型分析(頻率<0.03的單倍型在分析中被忽略)發現rs80197101G>A和rs77067995C>T共形成兩種單倍型(AT和GC),兩種單倍型在兩組間的頻率分布差異具有統計學意義(P=0.008)。單倍型AT在急性心肌梗死組的頻率顯著高于對照組(OR=1.969,95%CI:1.180~3.284,P=0.008),單倍型GC在對照組中的頻率顯著高于急性心肌梗死組(OR=0.508,95%CI:0.305~0.847,P=0.008)。
根據Transfac在線預測軟件(https://portal.genexplain.com/)的預測結果可知,rs80197101G>A可消除GATA5基因啟動子序列中轉錄因子Krüppel樣因子6(Krüppel-like factor 6,KLF6)的轉錄結合位點,rs77067995C>T可增加GATA5基因啟動子序列中轉錄因子small mothers against decapentaplegic(SMAD)的轉錄結合位點。KLF6在調節細胞分化、增殖和肌肉發育中發揮重要作用[12];SMAD蛋白是轉化生長因子β(transforming growth factor-β,TGF-β)配體途徑中的信號轉導分子家族[13]。
將相互連鎖的兩個SNPs [g.62476317G>A(rs80197101)和g.62476223C>T(rs77067995)]構建為一個表達載體(pGL3-g.62476317A+g.62476223T),與表達載體pGL3-Basic(陰性對照)和pGL3-WT(野生型GATA5基因啟動子)一起轉染到HEK-293細胞和H9c2細胞中。野生型GATA5基因啟動子的轉錄活性設置為100%,由此計算非野生型GATA5基因啟動子的相對轉錄活性。在HEK-293細胞和H9c2細胞中,pGL3-g.62476317A+g.62476223T顯著增加GATA5基因啟動子的轉錄活性(均P<0.001),同時也表明2個SNPs對GATA5基因啟動子的作用不是組織特異性的,見圖2。
EMSA結果顯示,rs80197101消除了某轉錄因子與GATA5基因啟動子的結合,rs77067995促進了某轉錄因子與GATA5基因啟動子的結合,見圖3。因此,這些SNPs可能通過干擾轉錄因子與GATA5基因啟動子的結合來改變GATA5基因啟動子的活性,進而影響GATA5基因的轉錄水平。

Figure 2.Transcriptional activity ofGATA5gene promoter in HEK-293 cells and H9c2 cells. Empty vector pGL3-Basic was used as a negative control. Transcriptional activity of the wild-type (WT)GATA5gene promoter was designed as 100%. Mean±SEM.n=9.*P<0.01vspGL3-WT.
圖2GATA5基因啟動子在HEK-293和H9c2細胞中的轉錄活性

Figure 3.EMSA results of g.62476317G>A (rs80197101) and g.62476223C>T (rs77067995). Free probe was marked with an arrow at the bottom. The affected binding for transcription factors was marked with a hollow arrow. DSV: DNA sequence variant.
圖3 g.62476317G>A(rs80197101)和g.62476223C>T(rs77067995)的EMSA結果
50余年來,心血管界在環境因素對心血管疾病的影響上積極探索,使得心血管病的病死率下降50%以上,但20世紀90年代以來,心血管疾病的診治已進入平臺期,進展緩慢,盡管我們在環境因素方面不斷努力,但心血管疾病風險沒有再進一步顯著降低[14]。AMI遺傳率約為50%~60%[15],但迄今為止,AMI的遺傳原因及其潛在的分子機制仍很不清楚[16]。要解決心血管疾病當前面臨的難題,探究AMI潛在的發病機制,我們必須要在基因與疾病的相關性方面開辟新的道路。繼限制性酶切片段長度多態性(restriction fragment length polymorphisms,RFLPs)和可變數目串聯重復序列(variable number tandem repeats,VNTRs)之后,SNPs是第3類人類DNA遺傳標記,其與疾病之間的相關性既往已有研究[17]。本研究針對GATA5基因啟動子區域SNP位點的基因型、等位基因、單倍型、基因表達調控及轉錄活性進行分析,旨在通過比較人類遺傳信息的相似性和差異性,發現與AMI相關的基因型、等位基因或單倍體,推動精準醫學的發展,為探究AMI潛在的發病機制提供理論依據。
本研究對320例AMI患者和340例健康對照人群進行分析。綜合EMSA、轉染及在線預測結果,我們認為SNPs可能通過干擾KLF6和SMAD轉錄因子與GATA5基因啟動子的結合增加GATA5基因啟動子的轉錄活性,進而通過影響GATA5基因的轉錄水平增加AMI的易感性。我們從基因型、等位基因及單倍型角度進一步分析發現,rs80197101的GA基因型和rs77067995的CT基因型可能是AMI發生的危險基因型,rs80197101的等位基因A和rs77067995的等位基因T可能是AMI發生的危險等位基因,單倍型AT(跨rs80197101和rs77067995)可能是AMI發生的危險單倍型。
綜上所述,GATA5基因啟動子區域的2個SNPs(rs80197101和rs77067995)與AMI的發生具有顯著相關性。本研究尚未發現rs80197101的AA基因型和rs77067995的TT基因型與AMI之間具有相關性,分析原因可能與本研究中樣本量少或存在選擇性偏倚等因素有關,后續我們將進一步擴大樣本量,進行多中心、多樣本、多基因研究,為AMI的發病機制研究提供更多的遺傳學及基因學方面的證據。