金帆
二十一世紀臨床遺傳學最顯著的進展無疑是高通量全基因組檢測技術在遺傳性疾病診斷中的大規模應用和推廣[1]。以比較基因組雜交芯片(array comparative genomic hybridization,a-CGH)和單核苷酸多態芯片(single nucleotide polymorphism array,SNP array)為代表性的染色體芯片(chromosome array,CMA)[2]以及基于新一代 DNA 測序技術(next generation sequencing,NGS)的染色體拷貝數變異測序(chromosomal copy number variation sequencing,CNV-seq)[3]均可以診斷各類常染色體非整倍體及不平衡的染色體結構重排。這些方法不僅沒有染色體核型分析對受檢材料活性的苛刻要求和制備分析的繁雜過程,而且能夠精準檢測核型分析無法檢出的各類染色體微缺失、微重復綜合征,其中SNP array和高深度CNV-seq還可用于以雜合性缺失(loss of heterozygosity,LOH)為特征的單親二倍體的檢測。高通量全基因組檢測技術具有快速、自動化等優點,已經成為篩查智力低下、生長遲緩、結構畸形等出生缺陷兒遺傳學病因的重要方法。因檢測不再依賴細胞增殖活性,故各類流產、引產或病故患兒組織均可用于檢測,各類染色體微小片段缺失和重復構成的致病性拷貝數變異(copy number variation,CNV)不斷被發現,多種長期原因不明的出生缺陷被確認為染色體微缺失、微重復或單親二倍體基因印記性疾病[4]。我國許多產前診斷中心已將SNP array和CNV-seq作為胎兒遺傳學診斷的常規選項,歐美部分發達國家已將SNP-array作為胎兒細胞遺傳學診斷金標準。
基因病是指一類因致病基因DNA單個堿基變異、一個或數個堿基缺失或插入導致的疾病。單基因病種類眾多,目前已知有4 000余種,部分單基因病的致病基因非常龐大,如進行性肌營養不良致病基因DMD全長可達百萬堿基對;部分單基因病的發生可由不同基因突變所引起,如遺傳性多囊腎候選致病基因有PKD1、PKD2、PKHD等。傳統經典的DNA測序采用雙脫氧核苷酸末端終止法,又稱Sanger四色熒光鏈終止法測序,雖然準確性高,但單次DNA測序長度通常在150堿基對以內,測速慢,篩查確定單基因病突變效率低,曾長期制約單基因病的DNA突變確定及其再生育防止。
NGS又稱高通量測序技術,包括模板制備、序列檢測和數據分析等過程。NGS包括多個技術平臺,如大規模平行測序、焦磷酸測序、合成測序、鏈接測序、離子半導體測序、DNA納米球測序、基因組擴增轉錄子測序等。各技術平臺測序原理盡管各有不同,但其共同點是能同步進行幾十至幾百萬條短DNA分子大規模平行測序,獲得海量的序列信息,并利用強大的生物信息學工具進行分析。通過疾病相關基因DNA片段單核苷酸變異、插入缺失、CNV等分析,既可經目標序列捕獲測序快速完成臨床診斷,明確單基因病致病基因全外顯子和(或)全序列的突變檢測[5];又可依據臨床癥狀,實施癥候群所有疾病候選基因(基因套餐)[6]、全外顯子組(外顯子組測序,whole exome sequencing,WES)[7-8],乃至全基因組DNA(全基因組測序,whole genome sequencing,WGS)[9]的突變檢測,篩出致病突變,經傳統測序確定,反向完成疾病的臨床診斷。NGS的應用大幅降低了單基因病家系突變篩查的難度,使多種單基因病的精準基因的診斷和產前診斷技術得以快速普及。
多基因病是由多個基因與環境因素交互作用后發病的。上世紀八九十年代,人們曾試圖使用Sanger測序等傳統方法分析糖尿病等遺傳度較高的多基因病的遺傳因素,但均未獲得確切結論。但自大規模組學技術涉入該領域工作后,人們發現部分多基因病實為表現度較低或外顯不全的單基因病,部分為染色體微缺失、微重復,或某些染色體片段LOH。這些具有明確染色體拷貝數和DNA序列改變的患者可采用SNP-array或DNA突變檢測完成診斷和產前診斷,從而降低此類遺傳學出生缺陷兒的再出生風險。NGS結合功能基因組分析還揭示了多種常見疾病的致病相關基因,闡明了這些基因相互作用導致缺陷兒出生的遺傳學基礎,為相關遺傳病的產前診斷提供了可能[4]。
建立在體外受精-胚胎移植(in-vitro fertilization and embryo-transfer,IVF-ET)技術之上的植入前遺傳學檢測(preimplantation genetic testing,PGT)可將遺傳學檢測提前到胚胎植入子宮內膜前,可預防遺傳性疾病妊娠的發生。但受限于植入前胚胎活檢材料的有限性(1~數個細胞),PGT-非正倍體篩查(PGT for aneuploidy screening,PGT-A)和 PGT-染色體結構重排檢測(PGT for structural rearrangement,PGT-SR)長期依賴熒光原位雜交技術(fluorescence in situ hybridization,FISH),后者一次只能檢測數個位點,提供極其有限的染色體異常信息,使胚胎宮內移植后著床率偏低。現活檢材料先行全基因組擴增(whole genomic amplification,WGA),后續行CMA或CNV-seq全染色體組檢測,顯著改變了PGT-A和PGT-SR治療周期的臨床結局[10]。
PGT活檢材料僅含一個或數個靶基因模板,因此等位基因脫扣(allele drop-out,ADO)一直是影響單基因病PGD(PGT for monogenic disorder,PGT-M)成功的技術瓶頸。現通過家系突變基因連鎖SNP單倍體型分析,活檢材料經WGA后,應用NGS完成10~20個以上SNP位點的同步檢測分析,可將PGT-M的診斷準確率提高到99.5%以上。加上WGA產物的同步CNV-seq拷貝數分析,同時剔除染色體檢測異常胚胎,PGT-M檢測胚胎移植后妊娠率、健康嬰兒出生率均有大幅提升。應用NGS檢測第5天囊胚腔液或胚胎培養液的游離DNA,進行微創/無創PGD成功的報道[11]也已發表。
探索開展母親外周血中胎兒源性細胞或DNA的非宮內侵入性胎兒遺傳學診斷技術是產前診斷工作者數十余年來不懈的追求。如今應用NGS檢測血清中游離DNA,分析胎兒源性占比,已可非常高效地檢測21-三體綜合征,對13、18-三體綜合征也有很好的檢出率。由此無創產前診斷技術(non-invasive prenatal testing,NIPT)進入臨床應用階段[12]。按國家衛健委的技術規范,目前NIPT仍為局限于胎兒13、18、21-三體綜合征篩查的產前篩查技術。但實際應用中,NIPT檢測其他染色體非整倍體和部分不平衡結構異常也有許多成功的報道。通過測序密度調整,可以篩查所有染色體數目異常、常見染色體不平衡結構異常和數種微缺失綜合征的NIPT-plus試劑盒已經開發,并正在臨床推廣驗證。目前NIPT/NIPT-plus仍然不能替代產前宮內侵入性診斷,但比較傳統的母親血清生化二聯/三聯染色體非整倍體篩查,NIPT/NIPT-plus的篩查效率是極為高效的,相信通過進一步的技術完善和成本降低,最終將會取代母親血清生化篩查。
雖然NIPT應用于單基因病的診斷已見報道,但此項技術對家系突變明確、后代出生患兒高風險家系是否必要存有很大責疑。不過,將其應用于單基因病產前(胎兒)篩查的前景卻是現實可行的。目前已有部分生物基因公司正在開發適用于部分地區相對高發單基因病的產前篩查NIPT試劑盒,若開發成功,則產前胎兒篩查僅限染色體非整倍體的歷史將宣告結束,取而代之的將是產前非整倍體和單基因病篩查技術的同步開展[13]。
相對于目前仍處于技術探索階段的單基因病NIPT技術,通過基因套餐、WES或WGS篩查夫婦單基因病突變攜帶,發現同一常染色體隱性疾病基因突變攜帶的夫婦或X-連鎖隱性基因突變攜帶的女性[14],后續產前或著床前單基因病基因診斷[15],已成為目前國內外部分產前診斷中心和輔助生殖中心推薦的孕前或產前檢測項目,目前該技術實際已具臨床應用的可行性。
任何技術的發展均具有兩面性,以SNP-array和NGS為代表的現代基因組學診斷技術在快速推進出生缺陷遺傳學病因診斷及再出生防止工作進步的同時,也產生了許多新的問題和挑戰。首先是檢出CNV和基因DNA變異的致病性和良性變異的確認。人類能夠真正閱讀自己整個基因組堿基序列還不到20年,我們對如宇宙一樣浩瀚的基因組DNA信息的認識才剛剛開始,已經報道并在各基因網站登記的許多致病性/非致病性的位點仍需要進一步驗證,對不斷增加的意義未明的變異/突變位點的解讀已成為目前進行臨床遺傳學診斷的重大難題,亟需大規模數據整合、人群調查、功能驗證,以提供同時反映基因外顯率、表現度、表型差異等影響因素的綜合信息,以更有效地指導和實施臨床診斷和再出生預防。在大規模基因組學技術推廣應用的今天,仍有部分遺傳性疾病無法檢出明確的致病基因,結合以基因修飾、基因表達調節為目標的表觀基因組學和功能基因組學,最終闡明疾病的基因組學改變,是遺傳學工作者的另一重大科學任務。
目前NIPT才起步不久,無創PGD仍處于幼兒期,由于兩者檢測的胎兒/胚胎游離DNA來源于絨毛/胚胎退行脫落凋亡的細胞,此類細胞為非正倍體嵌合細胞的可能性會顯著高于正常生長的胎兒/胚胎細胞,其檢測假陽性的風險可能增高。同時NIPT診斷范圍和診斷致病性仍然局限[15],進一步積累數據,調整測序密度和深度,實現NIPT的全染色體組檢測無疑將成為產前診斷的真正革命。
上世紀80年代提出,90年代開始實施的人類基因組計劃,聯合了美國、英國、日本、德國和中國的科學家,歷時15年,耗資30億美元,完成了人類第一張基因組DNA序列的草圖[16]。2007年,人們用了200萬美金,完成了DNA雙螺旋發現者之一Waston博士的全基因組測序。今天,如果你想完成這樣一次自身全基因組檢測可能只需1萬元人民幣左右,快至數周即可收到檢測報告。北大三院課題組依據極體活檢,已經成功完成一個卵母細胞的全基因測序工作[17],這標志著人類已能夠從卵子和受精胚胎誕生之日起,就了解自己的遺傳物質的組成,不僅能防止遺傳性疾病的發生,而且可用于遲發性、成年性疾病的易感性分析,進行個體基因型和表現型的選擇。全基因組檢測技術在倫理學方面的挑戰同樣是巨大的,建立和完善相應的法律規范顯然也是出生缺陷兒遺傳學診斷和再出生防治的任務之一[18]。
(本文由浙江省醫學會推薦)