羅芳 李昊旻
(1.浙江大學醫學院附屬第一醫院兒科,浙江杭州 310003;2.浙江大學醫學院附屬兒童醫院,浙江杭州 310052)
隨著新生兒或兒童重癥監護相關醫療技術的發展,感染、營養、早產等疾病的診治已有了長足的進步,新生兒或小嬰兒遺傳性疾病所致死亡或預后不良的發生比例凸顯。遺傳性疾病中的單基因疾病目前估計6 500余種,且每年以200種的速度增加[1‐2]。據相關研究報道北美新生兒/兒童重癥監護室(NICU/PICU)和兒童心胸外科重癥監護室中因遺傳性疾病導致的死亡高達15%[3‐4]。一方面由于此類疾病病情惡化迅速,未及時診治常致預后不良,快速進行病因診斷并針對性給予干預措施,可為患兒提供最佳的臨床管理決策,促進經驗治療向精準治療的轉型,實現診斷率的提升和病死率的下降;另一方面對于預后差的一些遺傳疾病,快速診斷也有助于做出臨終照顧的決定,從而減輕痛苦并減少醫療資源的浪費。可見基因診斷在NICU/PICU的開展具有迫切性、高需求性和適合性。
目前臨床上常用的基因檢測主要有基因芯片、panel篩查、全外顯子測序(whole exome sequencing, WES)等,但各自提供的信息不夠全面,在診斷時長、診斷率方面也存在不足。全基因組測序(whole genome sequencing, WGS)則涵蓋包括點突變、拷貝數、內含子區域的結構及重組變異等更為全面的信息[5‐6]。隨著測序成本的不斷降低,其臨床接受度不斷提高。但測序數據獲取后需要極高專業的判讀和解釋,常規的基因組測序、數據分析和遺傳診斷報告需要數周才能返回臨床,無法滿足臨床診治病情快速發展的遺傳性疾病的需求。針對WGS現有的局限性,科研工作者從2012年起在測序及診斷時長上不懈努力:2012年5月Saunders等[7]采用快速全基因組測序(rapid whole genome sequencing, rWGS)技術在50 h內診斷新生兒遺傳疾病;2015年10月該團隊將此技術的診斷時長縮短至26 h[8];2019年4月該團隊的進一步研究成果發表[9]:建立了人工智能快速全基因組自動分析診斷系統,并完成其回顧性驗證和前瞻性研究。該系統中全基因組測序時長為15.5 h,系統的另一關鍵組件提供自動分析數據功能解決數據獲取后的解讀,使得整個診斷流程可在24 h之內完成,也被稱為超快速全基因組學測序(ultra‐rapid whole‐genome sequencing, urWGS),從時間上和功能上解決了常規基因組測序解讀周期長及解讀專業依賴的現狀。本文介紹rWGS在NICU/PICU的臨床應用并簡述人工智能快速全基因組自動分析診斷系統的相關技術。
2012年Saunders等[7]采用rWGS在50 h內對NICU中疑似遺傳性疾病患兒做出了基因診斷,其中回顧性明確了兩名已知病因患兒的基因診斷(1例Tay Sachs病,1例Menkes病);并前瞻性對5例未確診新生兒中的4例做出了診斷:1例GJB2基因相關重癥皮損,1例BRAT1基因相關的致死性新生兒強直和多灶性癲癇綜合征,在1個家系中鑒定了BCL9L為一新的隱性內臟異位基因,排除了1例患兒已知的候選基因。所采用的軟件是癥狀和體征輔助的基因組分析(symptom‐and sign‐assisted genome analysis, SSAGA)軟件,該軟件為遺傳性疾病的診斷提供了1個診療框架:即由醫生輸入患兒的臨床表型,根據表型軟件列出與之相關的候選致病基因列表,從而加快基因分析進程,在后續的一些文獻中被稱為表型驅動的WGS。在2012年該軟件已經囊括了當時591種遺傳病相關的227個臨床術語,診斷的敏感性達到了77%~96%,特異性高達99.5%。
2015年該團隊采用升級后的rWGS技術,包括Illumina HiSeq 2500快速運行模式下18 h的全基因組測序,Edico DRAGEN序列比對和變異檢出,以及三款軟件(VIKING、RUNES和SSAGA)聯合對數據進行分析,該技術將診斷的敏感性和特異性提高到99.5%以上[8]。同年一項回顧性研究[10]比較了在NICU、PICU內重癥患兒常規基因檢測和rWGS在診斷率、診斷時間、臨床管理兩者之間的差異。結果顯示35例患兒中20例(57%)通過rWGS明確了基因診斷,32例患兒中3例(9%)通過常規基因檢測方法明確診斷,兩者差異有統計學意義。在接受rWGS診斷的20例患兒中,13例(65%)被認為具有及時的臨床指導價值,4例(20%)被認為對臨床治療管理具有非常有利的指導意義,6例(30%)確診后開始接受姑息治療。根據研究對象的隨訪結果,120 d病死率達到57%(12/21),揭示了在NICU和PICU中采用rWGS的方法診斷遺傳疾病的高需求性和迫切性。
2018年一項部分雙盲隨機對照試驗的研究[11]結果發表,納入對象是NICU和PICU中4月齡以下的患兒,試驗組采用rWGS +常規基因檢測,對照組僅采用常規基因檢測。由于兩組之間診斷率的嚴重失衡,研究提早結束。在這項納入了65例嬰兒的隨機對照試驗中,28 d內rWGS的診斷敏感性為31%,而常規基因測序為3%,認為對于病因不明的危重癥嬰兒,rWGS可作為首選的一線診斷檢測方法。
之后這一技術也被推廣應用于較大年齡PICU中的危重癥患兒,在一項由38例4月齡至17歲的接受了rWGS檢測的PICU患兒組成的回顧性隊列研究中,17例(45%)患兒經rWGS明確了基因診斷,其中4例(24%)因基因診斷直接導致管理策略改變,9例(53%)臨床上并無畸形特征或發育遲緩[12]。結果提示早期的基因診斷影響到患兒和/或其家庭在住院期間或出院后的臨床管理,部分患兒避免活檢,部分患兒采取了替代治療,部分患兒進行了疾病相關后遺癥的監測。另一項回顧性研究也證實了24例平均年齡為16月齡的危重癥患兒中有42%的兒童明確了基因診斷[13]。可見對于PICU中潛在的病因不明確的患兒也同樣受益于入院早期的rWGS診斷。需要提及的是超過70%的病例是由重癥監護室醫生提出并進行測序的,這表明臨床醫生有能力識別出具有高度疑似攜帶疾病相關突變基因的兒童,已確定的變異涉及廣泛的疾病范圍,包括癲癇、腦病、心肌病、室性心律失常、自身免疫、免疫和炎癥性疾病[14]。
自2012年起,將全基因組學用于臨床的系列研究,顯示WGS在重癥患兒中遺傳性疾病的診斷率從42%上升到57%,改變了30%~72%的醫療管理及 24%~34% 病例的預后[7‐8,10,15‐16]。2018 年一項回顧性隊列研究[15]利用專家咨詢法(Delphi法)進行成本分析,并采用平行比較的方法進行評估(之前曾有類似的病例在該醫學中心診斷過,或者有醫療成本和治療費用價目呈現的既往病例)。該研究發現基于rWGS的診斷讓醫療成本降低了80萬美元,并將住院時間縮短了124 d;認為對重癥監護室中疑似患有遺傳病的患兒進行rWGS診斷,不但能夠挽救患兒的生命,而且具有良好的成本效益。經過rWGS診斷后43%的患兒獲得了診斷,節省醫療保健費用近13萬美元;其中11例患兒避免了并發癥,4例患兒避免了嚴重并發癥。
2019年rWGS進一步發展,與人工智能有機結合,組成了人工智能快速全基因組自動分析診斷系統[9],也被稱為urWGS。該系統所采納的數據一是來源于血標本的rWGS產生的測序數據,二是來源于患兒臨床資料的電子病歷(electronic health record, EHR)。在自動分析的過程中集成了目前在基因組測序、人工智能領域的多種新興技術[17‐19]:美國Illumina公司的Nextera DNA Flex Library Prep Kit直接從血樣或干血斑(常規應用于新生兒疾病篩查)中快速制備基因組文庫,之后采用NovaSeq 6000測序儀搭配S1型流動槽,在平均15.5 h內完成基因組測序;DRAGEN Bio‐IT生物信息分析平臺可在20 min內完成1個人類基因組的30X測序數據的分析,并自動將所讀序列與參考基因組對齊,識別和分析核苷酸變異。英國Clinithink公司的臨床自然語言處理平臺CliX ENRICH可在20 s內梳理患者的EHR并自動提取關鍵表型信息,并將EHR中提取的表型特征從臨床術語概念自動轉換為可直接服務于遺傳報告分析的標準人類表型術語;Diploid開發的MOON系統自動解析基因組,并對疑似致病變異進行自動過濾和篩查;深度集成現有遺傳性疾病知識庫和自然語言處理醫學文獻驅動基因變異的自動解讀,可在5 min內在全基因組450萬個基因變異中篩選致病變異。上述技術流程有機結合可最終在24 h內為疑似遺傳病重癥兒童提供快速診斷。
利用該系統,研究人員針對圣地亞哥兒童醫院的101例患有105種遺傳病的患兒開展回顧性分析,在表型提取階段,臨床自然語言處理技術提取的患者表型數據比專家提取的表型數據多27倍,同時比在線人類孟德爾遺傳(Online Mendelian Inheritance in Man, OMIM)數據庫中匹配遺傳疾病的預期表型特征高出4倍,顯示臨床自然語言處理技術提取表型的高效率和高的覆蓋率。以專家診斷結果作為參照,該自動化診斷系統的精確度為99%(93/94),查全率為97%(94/97)[9]。為進一步驗證診斷系統的有效性,研究人員利用該系統在7例重癥嬰兒中開展了前瞻性研究,其中3例患兒診斷為遺傳性疾病,均通過人工分析方法和Sanger測序證實。第1例女,7周齡,因酮癥酸中毒入住PICU,在血標本送檢及EHR建檔后19.2 h,自動診斷系統識別出了胰島素基因中先前未報道的雜合錯義變異(c.26C>G,pPro9Arg)與常染色體顯性永久性新生兒糖尿病(OMIM疾病記錄606176)相關。第2例是1個既往健康的17月齡男孩,因敗血癥性休克、代謝性酸中毒、壞疽性膿腫和低丙種球蛋白血癥住院。單例、先證者、快速測序和自動解釋鑒定出存在布魯頓酪氨酸激酶基因中的致病性雜合突變(c.974+2T>C)與X‐連鎖的無丙種球蛋白血癥(OMIM #300755)相關。為大劑量靜脈注射免疫球蛋白和6周抗生素治療提供了治療指導和治療信心。第3例為3日齡男孩因反復驚厥并家族史收住NICU。自動診斷系統鑒定為鉀離子電壓門控通道kqt樣亞家族成員2基因中可能致病的雜合變異(c.1051C>G),該基因與常染色體顯性良性家族性新生兒癲癇(OMIM 121200)發作相關,診斷時長為20.9 h。
人工智能rWGS的診斷效率在后續開展的第二項隨機對照試驗中[20]也得以體現。該試驗的研究結果在2019年10月發表:213例嬰兒中24例(11%)因病情嚴重直接給予urWGS檢測,其余隨機分為rWES組95例,rWGS組94例。后兩者的診斷率分別為19%和20%,診斷時長的中位數分別是11.0 d和11.2 d,無明顯差異。但在分析可能影響蛋白功能的變異和ClinVar數據庫收錄的致病性/可能致病性的變異上,rWGS的分析性能明顯優于rWES。而在這一組病例中urWGS診斷的比例(11/24,46%)高于rWES及rWGS,且診斷結果時間更短(平均4.6 d),提示urWGS在臨床應用上的良好前景。
綜上,人工智能快速全基因組自動分析診斷系統的開發為促進基因測序技術成為兒童尤其是NICU/PICU重癥患兒的一線診斷檢測手段提供了強有力的技術支持。診斷流程的自動化有助于減少經驗稀缺的臨床醫學遺傳學家的人工分析和數據解釋的需求,減少臨床診斷中數據分析和解讀的耗時,消除WGS臨床應用的障礙。但該系統向臨床的推廣仍會面臨一些障礙,自動化的平臺需要進行一定程度的改裝才能在不同的醫院體系中實施,特別是針對不同文化和環境,其中部分技術還不完善,中文環境下的患者表型自動采集將是首先面臨的困難。其次,進行rWGS檢測的最佳時機也有待進一步探索,開展rWGS所需的費用昂貴也將是推廣應用的一個障礙。再就是該項技術應用于臨床所面臨的倫理問題[21‐22]:從樣本的選擇性送檢、家長的知情同意到以rWGS診斷為基礎決定是否姑息治療或是積極救治的疾病管理過程均涉及到倫理問題,是該項技術發展必須面臨且需要不斷討論的問題;而且關于在NICU/PICU環境下對嬰兒進行rWGS的潛在風險的數據尚收集或預估不足等[23]。但毫無疑問早期快速的基因診斷對危重癥患兒臨床管理決策、家庭治療選擇、遠期預后評估及醫療系統的資源調配具有重大或決定性意義,相信危重癥患兒早期快速精準診療的時代即將到來。