楊言軍 霍艷蓓 把玉佩 周立 史典 王瑞娟 任曉宇 甘婷 程寧
先天性心臟病是一種常見的出生缺陷,在世界范圍內約占出生缺陷的三分之一[1],而在中國, 先天性心臟病的發病率逐年上升且已位居出生缺陷的首位,也是導致圍產兒和嬰兒死亡的主要原因之一[2]。導致先天性心臟病發病的病因除了孕婦在孕產期所接觸到的一些環境致畸物、孕期服藥、宮內感染或者孕婦所患一些疾病外,遺傳因素也在其中發揮著重要作用[3-4]。研究發現,大量位于NKX2.5、GATA4和TBX5這三種基因的突變是導致先天性心臟病的原因[5],但是這些研究大多數是針對家族性和綜合征型的先天性心臟病,而現實中,這些非綜合征型的散發先天性心臟病卻占大多數病例,這些病人的遺傳病理機制仍不清楚。測序研究發現,一些散發性畸形和疾病是由新生基因突變引起的,這些新生突變比遺傳變異危害更大[6-7]。近年來,基因測序技術發展為先天性心臟病遺傳因素研究提供了有力的手段,尤其是全外顯子組測序技術,一次性可以覆蓋整個蛋白質編碼的外顯子區域,通過對患兒和父母全外顯子測序來發現新生基因突變,逐漸成為發現散發先天性心臟病候選基因的有效方法。但是目前,國內外針對散發先天性心臟病新生基因突變的研究較少,本研究通過全外顯子組測序技術嘗試捕獲6例室缺伴房缺的嚴重先天性心臟病兒及其父母血DNA外顯子突變,并通過基因庫進行注釋和篩選先天性心臟病患兒有害的新生突變,為散發先天性心臟病患兒遺傳病理機制研究提供依據。
于2014年1月—2018年 4月,從蘭州市婦幼保健院經新生兒科明確診斷為以室缺伴房缺的嚴重先天性心臟病患兒中選取6例為研究對象,而其父母均未有心臟結構缺陷。在獲取患兒家長知情同意并簽署知情同意書后,收集患兒及父母外周血樣,并置于-70℃保存備用。
提取基因組DNA,并通過熒光定量和瓊脂糖凝膠電泳對DNA濃度進行精確定量和質量檢測。質量合格的基因組DNA打斷成主峰是250~300 bp左右的片段,在DNA片段的3′端加上“A”堿基,兩端加上文庫接頭,然后進行線性擴增(LM- PCR)制備成雜交文庫。取適量的雜交文庫與外顯子芯片進行捕獲富集,洗脫掉未富集的片段后進行擴增。
擴增產物經Agilent 2100 bioanalyzer儀器(Agilent DNA 1000 Reagents)和QPCR質控,質控合格使用Illumina HiSeq系列平臺,進行高通量測序,經Illumina堿基識別軟件(Base Calling)轉化為原始序列數據(raw reads)。對原始數據過濾得到高質量的數據(clean data或clean reads)。
使用比對BWA(Burrows-Wheeler Aligner)和SOAPaligner,與人的參考基因組(GRCh37/hg19)比對,用SOAPsnp、GATK、SAMtools和Platypus進行變異檢測(SNP和InDel)。最后,將獲得的變異用VEP和BGI內部數據庫進行注釋(以上所有步驟均由深圳華大基因科技有限公司進行)。
該研究中,約有 58.97 Mb 長的目標區域被芯片捕獲,平均 99.82% 的 reads 比對上參考基因組。目標區域的平均測序深度約為 159.09 X,平均每個樣本有 99.79% 的目標區域被至少1條reads覆蓋,有98.26%的目標區域被至少10條reads覆蓋。在整個分析流程中,對過濾后的測序數據、比對數據和變異結果均做了嚴格的質控(QC),如果某些質控項標準不滿足,則重新測或者其他有效方式來改善數據質量,保證高質量的數據。
1. 家系分析:按照AD模式即假設在常染色體顯性遺傳方式進行分析,即表示家系成員中的患者都攜帶致病基因型,正常人都不攜帶致病基因型。篩選時,先篩出該遺傳模式下共分離的記錄,即AD:YY:1:2:0,再根據隨機森林模型預測的結果找出真陽性的新生突變(De novo)。
2. 等位基因頻率:選擇公共數據庫(如KG、ESP、EXAC、CG、HapMap、Wellderly)等位基因頻率均小于等于0.005的位點。
3. 芯片閾值:針對不同的芯片選擇閾值進行篩選,留下符合條件的記錄,此次本研究選擇華大推薦閾值20,即留下小于等于20的記錄,去除系統假陽性變異。
4. 質控信息(filter):擇質量較高位點即在目標區域(TR)且通過GATK過濾條件(PASS)。
5. 轉錄本影響程度(IMPACT):選擇IMPACT選項中HIGH和MEDIUM。
6. 突變所在區域:篩選出功能影響比較大的位點,比如在蛋白質編碼區和剪切位點。
如圖1所示,僅當以上條件均滿足時才作為候選的基因突變。

圖1 有害的新生突變的篩選流程圖Figure 1 Screening flow chart for deleterious de novo mutations
通過Sanger測序對篩選出的新生突變基因進行家系驗證,PCR產物用ABI3730XL測序儀進行序列分析(由深圳華大基因科技有限公司進行)。測序結果用chromas軟件進行查看。
此次測序平均每個樣本有65 899 918 bp的靶向區域被捕獲,捕獲效率平均為79.05%,SNP為121 825,indel為32 375,具體各個樣本詳細信息見表1。
如表2所示,按照篩選方法本研究發現4個符合篩選條件的新生突變,涉及到基因和位點分別為FHDC1(c.1977G>C;p.Gln659His)、BRD4(c.3797A>C;p.Glu1266Ala)和HK3(c.397C>G;p.Leu133Val),SPRED2(c.373+1G>T),其中FHDC1、BRD4、HK3為錯義突變,而SPRED2突變位置在剪切位點其有可能改變外顯子剪切方式從而影響基因功能,另外FHDC1與BRD4基因突變在dbsnp庫中無對應記錄。通過多種預測軟件對這些變異的功能和保守性進行預測,雖相應預測軟件并未發現FHDC1(c.1977G>C)為有害突變,但SPRED2(c.373+1G>T)有三個功能預測軟件分別為GERP-plus、PhyloP與PhastCons預測為有害突變,而GERP-plus功能預測軟件同樣發現BRD4(c.3797A>C)位點的變異是有害的,而FATHMM、GERP_plus與PhastCons預測出HK3為有害突變。對篩選出的新生突變進行用Sanger測序驗證,結果顯示患兒存在突變,其父母不存在該突變,表明本研究發現的FHDC1(c.1977G>C)、BRD4(c.3797A>C)、HK3(c.397C>G)、SPRED2(c.373+1G>T)為新發突變,如圖2所示。

表1 全外顯子組測序捕獲結果Table 1 Whole exome sequencing capture results

表2 基因突變的篩選定位結果Table 2 Screening and mapping results of gene mutations

圖2 患兒及其父母突變基因Sanger測序Figure 2 Sanger sequencing analysis of the mutated gene in patients and their parents
心臟的發育是一個連續動態的過程,而心臟轉錄因子對調控心臟發育起著關鍵作用,研究發現心臟轉錄因子ZIC3、NKX2.5、TBX5、GATA4、TFAP2B、TBX1和FOG2與 先天性心臟病發病有密切關系[8],這些轉錄因子發生突變可能影響其蛋白質功能從而導致先天性心臟病發生,尤其是NKX2.5、GTAT4、TBX5這幾個核心的轉錄因子[9],NKX2.5、GATA4的雜合突變是家族性ASD的致病原因之一[10],TBX5突變與Holt-Oram綜合征有關[11],但本研究并未發現心臟轉錄因子的新生突變。而國內的一項病例對照研究發現在224名先天性心臟病兒童中有13.40%患兒有GATA4的突變,且病例與對照差異有意義,而NKX2.5的變異與對照比差異無統計學意義[12],也有研究認為心臟轉錄因子NKX2.5與GATA4的突變在散發性先天性心臟病的作用有限[13]。而一項Meta研究表明,NKX2.5(63A>G與606G>C)的多態性與散發性先天性心臟病關系不大[14]。這些心臟轉錄因子與家族性先天性心臟病關系密切,但對于散發性先天性心臟病,這些變異具體作用仍存在爭議。
除了心臟轉錄因子外,研究發現eNOS(rs7830)、BMP4(rs762642)多態性會增加中國人群先天性心臟病發病風險[15-16],病例對照研究發現DLC 1(Met360Lys、Glu418Lys和Asp554Val)這些預測軟件為有害的變異是與先天性心臟病有關的基因突變[17],Watkins等[18]通過對患兒與父母一家三口人群的全外顯子測序分析發現纖毛相關的基因突變在 先天性心臟病患兒中明顯富集。而本研究發現有四個與先天性心臟病有關的新發突變FHDC1(c.1977G>C;p.Gln659His)、SPRED2(c.373+1G>T)、BRD4(c.3797A>C;p.Glu1266Ala)、HK3(c.397C>G;p.Leu133Val),其中FHDC1與肌動蛋白絲形成有關,另外它還是細胞骨架調節蛋白[19],這些蛋白通過協調細胞骨架動力學來影響纖毛的裝配過程,而細胞表面的纖毛起著傳遞信號的作用,其過度表達會導致纖毛長度增加從而影響細胞之間信號轉導[20]。Li 等[21]對先天性心臟病小鼠全外顯子測序發現有34個纖毛相關基因,16個纖毛有關的基因突變與 先天性心臟病有關。SPRED2可抑制MAPK信號通路來發揮膜相關的酪氨酸受體激酶的調節劑的作用[22]。而Ras-MAPK通路是細胞生長和分化的重要信號通路。Wright和Kerr綜述了Ras-MAPK通路中可能導致家族性綜合征型 先天性心臟病的基因突變[23]。有研究發現SPRED2是一種心臟自噬調節因子,其異常會導致心功能不全、心率失常[24]。因此,本研究猜測SPRED2可的突變可能通過MAPK通路來影響心臟發育導致先天性心臟病。BRD4是心肌細胞肥大過程中病理基因轉活化的關鍵共激活因子,在心房壓力上升的內皮細胞中過表達[25],但該基因與先天性心臟病的關系并沒有相關報道。HK3基因編碼己糖激酶3,是糖代謝途徑一種重要的酶,是本研究第一次發現該基因突變與先天性心臟病有關。
本研究局限性在于納入的家系比較少,后續可能還需要進一步加大樣本量來進行研究。此外,通過全外顯子測序發現的可能與先天性心臟病發育有關的基因突變,需要今后通過相應的實驗研究來進一步驗證與深入探討相應的致病機制。