1987年,當研究人員第一次用基因組學這個詞來描述新近發展的DNA圖譜學科時,埃里克?格林(Eric Green)剛剛從醫學院畢業。幾年后,他參與了當時尚為年輕的這一領域的標志性登月項目——人類基因組計劃(HGP)的前沿工作。為了引導國家參與全球協作,1989年,國會批準建立國家人類基因組學研究所(NHGRI)。
1990年,整個人類基因組的測序工作開始進行,歷時13年完成。2009年,格林成為該研究所的負責人。那時,NHGRI的任務已經包括將基因組學擴展到醫學。這意味著會資助和協調旨在精確定位導致遺傳疾病的基因突變的項目,開發遺傳疾病的檢測手段以及療法。從更廣義上來講,這意味著會產生證據,證明DNA數據可以有效改善結果,甚至對并未真正罹患罕見疾病的人來說也是如此。
為了幫助描述這一過程,格林的任務之一就是定期整合該領域的戰略遠景。為了慶祝進展,確定技術差距,并激勵科學家去追求最具影響力的研究領域,他的團隊在2020年10月發表了最新預測。格林和他的同事首次為2030年人類基因組學可能實現的成果列出了10個大膽預測。其中包括:高中生將在科學展的活動中展示基因分析;在診室里進行基因測試將成為與血液檢測一樣的常規工作。
測序競賽開始后的30年,我們可能已經到達早期基因組學時代的終點。這是技術爆炸增長的時期,實現若干突破,如第一條狗、雞和癌細胞的測序,廉價的家庭DNA測試。這個領域已經如此成熟:基因組學幾乎存在于所有生物學領域——從對抗入侵的大黃蜂到釀造口感更好的啤酒。基因組醫學也不再是純理論,但它尚未廣泛普及。雖然科學家已經繪制了人類基因組圖譜,但他們還沒有完全弄懂。在接受《連線》雜志采訪時,格林談到了基因組學的下一個10年。

2020年10月進行了人類基因組計劃30周年慶典。當您環顧如今的現狀時,該項目對醫學產生的影響是否達到了您曾經的期望?
我從一開始就參與了人類基因組計劃,我必須強調,當時我們并不知道自己在做什么。我們有一個大膽而冒險的目標,就是讀出人類“基因說明書”中的30億個字母,但我們當時并沒有相應的技術。我們沒有方法,我們那時甚至沒有高效的互聯網,沒有參考樣本。因此,作為參與了此項目的一名年輕醫生,我可以想象有一天基因組學可能會成為臨床護理的一部分;但我真的沒有想到這會在我的有生之年發生。
如果我們回到10年前,根本沒有人在醫療健康方面真正使用基因組學。我們曾經幻想:病人站在我們面前,我們不知道問題在哪,我們對其基因組進行測序并找出問題所在。這在2011年還只是假設,而現在已成為常規手段,起碼對懷疑患有罕見基因疾病的人來說是這樣。
這太令人吃驚了。但這與人類基因組計劃設想要完成的目標還有相當大的差距。2000年,弗朗西斯?柯林斯(Francis Collins)在白宮發表講話時說,可能需要15到20年的時間實現“治療醫學的徹底轉化”,為從癌癥到精神疾病的所有疾病提供個性化治療。顯然,這并沒有實現,為什么?
部分原因是基因組信息的復雜性。如果醫生準備使用這些信息,而病人準備采取行動,那么投資1 000美元來測序基因組,在我們終身醫療的宏偉計劃中都是微不足道的。所以,我認為這不是癥結所在。問題的癥結是:對于一個普通的健康人來說,我們不知道這些信息該如何處理。這也是我自己沒有進行基因組測序的原因。
你還沒有嗎?
還沒有。因為,雖然我們有能力進行測序,并且測序的質量會很好;但是,有這些數據和弄清這些數據的意義存在鴻溝。這就是為什么我們的大膽預測之一是:知道每一個人類基因的生物學功能。我們正在取得進展,但這一進展可能需要幾十年而不是幾年。
您能否指出任何正在加速縮小這一差距的新興技術?
我只需要說說2020年的諾貝爾化學獎:CRISPR技術。很多時候人們聽到CRISPR就會想到應用于人的治療方法。但到目前為止,CRISPR更大的用途還是在實驗室。有了CRISPR,我們可以對DNA的片段進行編輯,這些小片段不會進入人體內——它們會進入細胞系或細菌中,然后我們對這些細胞系或細菌進行測試,來檢測這些編輯是否會造成功能性的影響。基因組編輯和基因組合成方法的結合越來越好,再加上越來越好的計算工具,將真正改變生物學發現的步伐?,F在,我們總是依賴于發表的一篇論文,這篇論文只能提供我們關于基因變體的丁點信息。
這根本不成規模。所以,我們必須要達到這樣一個程度,我們要做出數以百萬記的改變,產生大量的數據,然后我們就有希望使用人工智能來訓練計算機尋找模式。到那時,我們甚至不需要做實驗,因為我們可以根據過去的1 000次實驗來預測某一突變意味著什么。展望未來,這些才是可能會帶來改變的工具。
就數字化和所有生物數據分析而言,這似乎是巨大的進步。
在我們面對的巨大挑戰中,至少有一半與計算相關。這是個好問題。從某些方面來講,我們是自身成功的受害者:我們通過測序消除了眾多技術障礙,而現在最大的障礙就是如何處理這些數據。科學發展的速度比我們計劃這些事情的速度要快得多,即使是在美國國立衛生研究院(NIH)這樣的地方也是如此。如果今天我能重新組織NIH,我會設立引領數據科學的單獨機構??墒乾F在,我們還沒有這樣的機構。
未來10年,還有哪些障礙會成為我們面臨的挑戰?
我們現在面臨的一個問題就是:并不是所有的保險公司都愿意為基因組序列買單,這對患有未確診的罕見疾病的人來說是個問題。我們在癌癥領域已經取得很大成功,基因檢測已經成為主流,在產前檢測方面也是如此。大約有六七百萬的孕婦在2020年接受血液測試來篩查胎兒的遺傳缺陷。
面臨的另一個問題是:這項技術的應用不均衡。在斯坦福、哈佛和貝勒等大學,罕見遺傳疾病患者的測序和診斷都非常好。但在蒙大拿州的農村地區,這類工作進展卻十分不理想。因此,那里的障礙就是找到這樣的醫生:他們不在主要的學術醫療中心工作,在農村地區執業、受過良好教育、對基因組醫學沒有偏見。我們面臨的風險是現有的健康差距的進一步擴大。如果只有最富有和最杰出的人能夠獲得基因組學方面的醫療益處,那將是一個悲劇。這些曾經假設的挑戰現在正變得非?,F實。
NHGRI將如何應對這些挑戰?
當然,這很復雜。這些問題涉及社會的許多方面。但在2021年,我們要做的一件事是公布一項行動議程,創建更加多樣化的基因組工作團隊——包括研究和臨床方面。如果工作團隊能更加多樣化,那么基因組學在醫學領域的應用就會更加統一。這就是即將要做的事。
我們支持的另一個項目是努力獲得參考基因組,用以捕捉人類各種維度的多樣性。我們現有的東西無法做到這一點。如果我們從亞洲中部找一些人,對他們的基因組進行測序,我們想要將他們的變異與適當匹配的對照組進行比較,這樣我們就可以評估:健康問題背后或導致健康風險的的任何罕見變異。如果我們所能進行比較的只有一種標準參照——就像我們現在所擁有的那樣——碰巧是基于歐洲人的DNA,那么它就會具有誤導性。因此,這項泛基因組研究的目標就是找到一組適當的、血緣匹配的數據集,并用于醫學解釋。實現這一目標也是我們的大膽預測之一。
你提到有些方面基因組學已經成為主流醫療健康的一部分,你認為基因組學醫療健康在哪些方面最難達到?
最難的方面是預防常見疾病——高血壓、糖尿病、心血管疾病、哮喘、自閉癥、阿爾茨海默氏癥等。我們正在開始為這些開發多基因風險評分,但是我們仍然不知道其預測的真實性如何。
所以,這是一種將成千上萬的微小基因變異的所有微小影響疊加的方法,你可以用它來估計某人罹患這些常見疾病的風險。
你說得對。我們投資一些重大項目,旨在研究多基因風險評分,看看多基因風險評分的預測能力如何,以及專業醫護人員和患者對這類信息有何反應。另一個重大問題就是他們是否將采取行動——如果你的基因得分顯示你患高血壓的風險更高,或者有早期心臟病發作的征兆,那么,這會讓你注意飲食和鍛煉、少攝入鹽嗎?
你的醫生可能會在獲得這些信息后,囑咐你從35歲開始每年做一次心電圖,可是你會預約并去做嗎?這才是真正的考驗——基因組學是否真的能改變人們的行為。
那么關于基因組學和傳染病呢?我記述過國內外為挖掘基因數據而付出的巨大努力,以便更好理解為什么冠狀病毒會在不同人群身上引發如此廣泛的癥狀。你如何看待這一領域對幫助我們擺脫這種流行病的貢獻?
這些重要研究說明了為什么現如今基因組學會涉及生物醫學的幾乎所有領域?;蚪M學在幫助我們解讀人們的基因遺傳在多大程度上影響了他們對COVID的反應方面至關重要。
但我認為,人類基因組計劃最重要的遺產之一就是它永久改變了科學家共享基因數據的方式。如果您留意了本次疫情的時間線,那么就知道對該病毒的首次報告是在2019年12月下旬。在那之后的兩周內,病毒的序列即被公之于眾。
我記得的,那實際上是我寫的第一篇關于冠狀病毒的文章——關于它如何成為公共衛生的一次真正的勝利。
沒錯兒!這個序列立刻被用來對病毒進行測試。這正是疫苗開發的第一步,現在已經被證實是有效的。如果你回到人類基因組計劃啟動之前,這簡直就是聞所未聞。研究人員會對病毒進行測序,寫一篇論文,提交并發表,幾個月后,當論文見刊后,他們才會公布該序列。
這就是我們曾經的做法,直到我們提出:讓人們盡早接觸不完美數據比之后接觸完美數據要更好。許多科學家擔心這會有損他們獲得資金的信譽。因此,我們還必須召集期刊編輯和資助者,讓他們創造并執行一種新的規范。這對我們來說非常重要,因為人類基因組計劃并不是傳統的科學項目。我們創造了一種社區資源,所以我認為,基因組學在改變一些其他領域(比如傳染?。┑奈幕幏斗矫婀Σ豢蓻]。它影響力最持久的遺產之一是它真正改變了科研規則。
資料來源 Wired