
自打實現第一個人類基因組測序以來,科學家們已經花費10年的時間,耗資30億美元,好不容易完成了人類基因組中24條染色體的全部測試,這讓世界各地的媒體歡欣雀躍,不約而同地稱贊此次成功是“科學家破解生命‘天書’”之舉。然而來自英國的雷蒙德·麥考利,卻從中看到了人類基因組計劃所帶來的更高的機遇和挑戰(zhàn)。他開始致力于下一代測序技術,探測在未來的幾年將測序時間成功縮減至1~2天,甚至將成本降低到1000美元乃至100美元。除此之外,他還開啟了個性化測序和診療計劃,希望讓每個人都能測定自己的基因組順序,并且從而發(fā)現可能的基因異常以及健康風險。媒體將雷蒙德·麥考利的舉動稱為“讓普通人都能讀懂‘天書’”計劃。
一場DNA的革命
在人類基因組計劃設立初期,科學家的目的是檢測人類基因組中所包含的30億個堿基對,記錄人類幾乎所有的遺傳信息,并搞清楚這些堿基的序列。然而要完成這個目標其實并不簡單,傳統(tǒng)的測序技術,需要摻入經過標記、能夠阻斷DNA鏈繼續(xù)延伸的人工核苷酸,然后以目標DNA序列為模板合成一系列末端為人工核苷酸的長短不同的DNA鏈。這些DNA鏈經過電泳分離后,再經過掃描和讀取,才能獲得序列的信息。而且在真正測序之前,科學家們還必須將生物體本來的DNA長鏈打斷成合適長度的片段,并一一封裝在細菌和酵母中保存。于是人類基因組計劃耗費了數十億美元和15年以上的時間,而這些資金與時間實際上有很大部分消耗在了對測序樣品的前處理上。
不過隨后測序技術有了一定的提升,這要歸功于弗雷德里克·桑格這位諾貝爾獎獲得者。而且他的貢獻不僅限于此,他還為后期基因組研究奠定了重要的基礎,不過此技術照現在來看著實還是效率很低。
而后期高通量測序技術開始出現,這是對傳統(tǒng)測序技術的一次革命性改變,一次對幾十萬到幾百萬條DNA分子進行序列測定,因此又被稱為下一代測序技術,足見其劃時代的改變;同時,高通量測序使得對一個物種的轉錄組和基因組進行細致全貌分析成為可能,所以又被稱為深度測序。在高通量測序中,科學家們可以檢測到所添加的不同堿基所釋放的不同信號,從而在DNA鏈合成的同時讀出DNA序列。不僅如此,高通量測序能夠一次性讀取上億條DNA鏈延伸的數據,因此,雖然讀取的每條DNA鏈的長度不及傳統(tǒng)測序,但數量上的優(yōu)勢依然使得高通量測序的速度較傳統(tǒng)方法提高了數萬倍。由于前處理的簡化和速度的提高,測序的成本也大為下降——相較于人類基因組計劃,高通量測序只需要幾個月和數千美元,就能獲得質量相當的測序數據。其實高通量測序技術的來臨已經為測序領域帶來了革命性的變化,而且這對于研究機構來說,幾個月和數千美元的投入已經完全可以承受,但是麥考利卻希望能使DNA測序變得更加快捷且費用低廉。那就是說如果測序所需的時間可以減少到數天,成本可以低到1000美元甚至100美元,那么人們就可以像接受普通體檢那樣來對自己的基因進行檢測了。
于是麥考利開始著力于研發(fā)和推廣更低成本和更快捷的測序技術。也就是名為基于單分子DNA測序的所謂第三代超高通量測序技術,他認為這很有可能帶來一場新的DNA革命,并且最終帶來全人類的個性化測序和診療。
讓普通人都能讀懂“天書”
從事計算機和電子工程專業(yè)的麥考利,在大學期間選修了生物學,這樣的選擇為其后來的個性化測序和診療計劃奠定了基礎。當時,人類基因組計劃剛剛啟動,得知消息的麥考利很快意識到,這是個極具前途的發(fā)展方向,于是他將自己的計算機和生物專業(yè)知識結合到了一起,開始進行生物信息方面的研究和實踐。
麥考利研究發(fā)現,高通量測序技術本身得到的只是一串由四種堿基組成的數據序列,最多再加上極為有限的一些特殊DNA位點信息。想要讓人人都能測定自己的基因組序列,從而發(fā)現可能的基因異常以及健康風險,需要個性化測序和診療。但是要想真正把個性化的測序服務帶到人們的生活中,還得讓消費者們了解這串字符背后究竟包含著怎樣的信息才行。于是麥考利開始解讀測序信息,他利用計算機程序,自動快速地從DNA序列中篩選到一些和性狀相關的位點,并在二者間建立聯(lián)系,于是在研究中他開始發(fā)現一些基因位點和癌癥的關系,并且還找到不少癌變的根源,都與特定基因位點的變化有關。
也許是受到麥考利研究的啟發(fā),德國的凱杰公司發(fā)明了基因檢測試劑以及與其相匹配的儀器。其中最有名的例子就是在2013年5月中旬,好萊塢影星安吉麗娜·茱莉做出的一項轟動全球的決定:切除雙側乳腺。支持她進行價值4000美元的基因檢驗的,就是這家凱杰公司。這家公司在檢測安吉麗娜的樣本時發(fā)現她體內攜帶有BRCA1型基因突變,這個肉眼不可見的基因雖然不會影響她的美艷動人,但是會不聲不響地增加其乳腺及卵巢癌變的可能。
除此之外,科學家還發(fā)現,基因看似個體很小但是差異巨大,還會影響藥物的治療效果。一個令人驚愕的數據是,在所有被服用的抗癌藥物中,只有25%起作用,而另75%幾乎被浪費。原因在于,藥物對不同個體的療效差異達300倍,一個不起眼的基因突變往往會使具有高度靶向性的抗癌藥物完全無效。
于是一種被稱為個性化醫(yī)療的基因檢測技術應運而生。一個典型的例子就是,美國每年會新增10萬例結直腸癌患者。而治療結直腸癌有一種藥物叫愛必妥,對帶有Kras野生型基因的病人較為有效,但是如果病人攜帶的是Kras突變型基因,藥效就會急劇下降。
而Kras野生型基因在患者中的比例約為60%。這意味著,如果所有病人都使用愛必妥的話,就會有40%的藥物被白白浪費,而一個療程的愛必妥價值超過5萬美元。比經濟賬更重要的是患者可能因此延誤有效治療機會,并且徒增藥物副作用的痛苦。
于是利用基因檢測技術,凱杰公司研發(fā)出一種名為Kras的檢測技術,只需300美元,即可判斷患者是否適合使用愛必妥治療。目前在中國每年也有8到10萬人接受EGFR基因檢測,這種價格在3000元左右的基因檢測,可以用于判斷病人是否可以用特效藥艾瑞沙來治療肺癌。中國每年新發(fā)肺癌病例超過70萬,個性化醫(yī)療發(fā)展空間巨大。
對醫(yī)生們而言,其一生都在追求“為每個病人找到最適合的治療方案”,而個性化醫(yī)療顯然有助于提高治療的精確性。美國加州大學醫(yī)學院教授約翰·穆雷(John F Murray)曾幽默地表示:“我在醫(yī)學領域工作了超過60年,努力通過各種方法為病人尋求診療方案。你可以想象一下這樣的場景:當你走進醫(yī)院,醫(yī)生通過專業(yè)軟件閱讀你身體總量達到30GB的基因組信息,然后告訴你,用哪種藥就可以藥到病除——這會成為無論是西方醫(yī)圣希波克拉底,還是東方神醫(yī)華佗、扁鵲們都夢寐以求的真正‘辨證施治’。”
由此看來,新測序技術的出現,讓生物信息技術有了更大的發(fā)展空間。測序儀和軟件可以一次性篩選出數萬個基因位點,同時計算出這些位點與潛在的疾病之間的關系;而對于RNA的測序,甚至可以知道自己體內基因實時的表達情況。如果說前者可以在發(fā)病前很早就進行預測,那么后者則可以精確地實時反映人體的健康狀況。
麥考利希望有一天,人們能夠隨時將自己即刻的測序結果通過軟件進行分析,從而得知自身的健康狀態(tài),進而采取個性化、有針對性的對策。
測序技術:好戲仍在繼續(xù)
高通量測序技術能為人類帶來的好處不僅限于此,其實還包含很多。
高通量測序技術揭秘人類自體免疫病的發(fā)病根源
英國倫敦大學瑪麗皇后學院及倫敦大學的研究者通過對迄今為止出現的人類疾病進行的大批測序,來調查6種自體免疫疾病的遺傳學基礎,并將研究結果刊登在了國際權威科學雜志《Nature》上。
這些疾病包括自體免疫性甲狀腺病、脂瀉病、克羅恩氏病、銀屑病、多發(fā)性硬化癥及Ⅰ型糖尿病等。在這項研究中,研究者使用高通量測序技術來尋找新的基因突變,包括罕見的以及潛在的高風險突變基因,研究者在將近42000名個體中鑒別出了25個此前鑒別出的風險基因。研究者表示,這些疾病的遺傳風險很有可能包括成百上千的弱效應突變,而這些突變在人群中卻是非常常見的。
高通量DNA測序法可繪制全腦神經連線圖
美國神經科學家扎多教授的團隊正在用現有的高通量基因組測序儀可讀的數據格式,來呈現神經元的連接。為此,他們開發(fā)了一種被稱為“單個神經元連接條形碼”(BOINC)的新工藝。BOINC方法由三個步驟組成。首先,每個神經元都用特定的DNA條形碼標定。僅包含20余個隨機DNA“字母”的一個條形碼,就可標定1萬億個神經元,這個數字已超過了小鼠大腦中存在的神經元數量。第二步著眼于由突觸連接的神經元,并將其條形碼與另一個聯(lián)系起來。做到這一點的方法之一是利用一種病毒,如偽狂犬病病毒,它能跨越突觸移動遺傳物質。為了共享跨突觸的條形碼,病毒必須被設計成在其基因序列中攜帶這個條形碼。病毒跨突觸擴散后,每個神經元以條形碼包的形式有效終結,這個條形碼包中包含有自身以及來自突觸耦合伙伴的代碼。第三步則是將突觸連接神經元的條形碼連起來,形成一個單獨的DNA片段,然后用現有的高通量DNA測序方法讀取。這些雙條形碼序列經計算分析,就可顯示出大腦突觸接線圖。扎多表示,如果BOINC目前正在進行的概念論證測試能獲得成功,其將提供一個顯著廉價和快速的方法來組裝神經元連接體,甚至是哺乳動物復雜的大腦。
結合生物技術,基因測序技術能走得更遠?
新一代基因測序技術讓試管嬰兒健康幾率更高
2014年5月18日,一個名叫康勒·萊維的男嬰在美國賓夕法尼亞州出生。康勒和他的父母是威爾斯博士關于新一代基因測序技術研究應用的首個受益家庭。目前已有7周大的康勒十分健康,各項身體指標都顯示正常。康勒的父母是威爾斯試驗的首批志愿者。他們將體外受精獲得的僅有5天大的13個胚胎細胞交給威爾斯,由他利用相關儀器設備對從胚胎細胞中提取出的單個細胞內DNA片段的遺傳代碼進行解碼,篩查染色體數目是否正常。經過檢測,13個胚胎細胞中僅有3個染色體數目正常。最終正常的胚胎被選擇移入康勒母親的子宮內,確保了嬰兒出生后擁有較高的健康幾率。
威爾斯博士稱,新一代基因測序技術允許在同一時間、同一表面進行更多的測序反應。與先前的基因測序技術相比,其最大優(yōu)點是效率高,將有效降低體外受精技術的成本,大約能比目前同類的基因篩查技術費用低1/3左右。未來隨著技術的不斷進步,成本還可能進一步降低。除了染色體篩查,該技術還有可能應用于遺傳病的篩查。
除了醫(yī)療領域,測序和生物信息的結合,在其他領域也將發(fā)揮強大的作用。例如,利用測序技術“復活”滅絕物種。在科幻電影《侏羅紀公園》中,恐龍被克隆了出來,給人們留下了深刻印象。但現實中,像恐龍這種已經滅絕6500多萬年的生物是沒辦法克隆的,只有那些剛滅絕不久的生物才有希望通過這種方式重生,因為DNA是有保質期的。
“猛犸象”這個物種是很有希望通過克隆“復活”的,還有一些不那么出名的物種,例如“袋狼”,一種身披花紋、像狗一樣大小的動物,曾經生存在澳大利亞、塔斯馬尼亞島和新幾內亞地區(qū),后來由于人類過度捕殺而于1936年完全滅絕。
正如古生物學家Michael Archer所指出的那樣,如今陳列在博物館中的袋狼樣本可以用來提取可用遺傳物質DNA。得到這些DNA片段的序列僅僅是第一步,還要想辦法把這些序列拼接起來得到完整的基因組,這是一項復雜而具有挑戰(zhàn)性的工作。如果袋狼的整個基因組序列被測定了,下一步的挑戰(zhàn)就是如何得到這個物種的問題。Archer提議,首先把實驗室得到的攜帶有袋狼全序列基因組的核酸,植入到袋狼的近親物種袋獾的去核卵細胞中,然后植入袋獾的子宮中進行發(fā)育,在順利的情況下,就能誕生一只小袋狼。
與此同時,對農作物和禽畜進行的基因組測序分析還會對新品種的研發(fā)起到重要的指導作用;除此之外,對基因組的了解還將推動合成生物學的進步——所謂合成生物學,就是在清楚各種不同基因的結構、功能、行為模式后,像模塊一樣加以組合拼裝,從而生產出具有新特性的改良生物體,甚至“人造生命”。有人預測,在未來這種“人造生命”會像19世紀的機械制品和20世紀的電子制品一樣得到廣泛的應用。
其他基因技術突破性研究
基因重組技術培育出綠光蠶寶寶
日本研究人員利用一種基因重組新技術,能讓蠶發(fā)出綠光。日本廣島大學教授山本卓等人開發(fā)的這種基因重組新技術名為“PITCh法”,主要利用了能夠切斷基因組中特定基因的酶以及生物機體修復受損DNA(脫氧核糖核酸)的機制。
用DNA定做護膚品
英國倫敦帝國學院教授克里斯把他發(fā)明的微芯片基因快速測序儀用到了新領域——按每個人的DNA來定做護膚乳清,這或許將成為最佳抗老化美容品。這種護膚乳清名為Geneu,經18個月的臨床實驗證明,它能在12周內減少細紋和皺紋達30%。這也是科學家第一次為個人“量身定做”專屬的抗老化護膚品,有可能徹底變革人們的護膚習慣。
基因剪輯技術“刪除”艾滋病毒
一旦艾滋病病毒(HIV)侵入人體細胞,就會一直留在那里,HIV病毒會將其致命的基因組嵌入感染者的脫氧核糖核酸(DNA)中,迫使感染者不得不在余生都要接受治療。美國費城坦普爾大學醫(yī)學院的研究人員通過剪輯技術,首次找到了一種將艾滋病病毒從人體細胞中徹底清除的方法。這一突破標志著從人體細胞中清除潛在HIV-1病毒的努力首次獲得成功——這還可以用于治療其他潛在感染。但目前還不能進入臨床應用。
基因技術改變蚊子性別構成
英國倫敦大學帝國理工學院研究人員與美國、意大利同行合作開發(fā)出一種轉基因技術,可大幅改變蚊子后代的性別構成,讓雄性占絕大多數,最終致使蚊群在數代后無法繁衍,從而阻斷瘧疾的傳播途徑。
基因技術讓免疫器官“返老還童”
英國愛丁堡大學再生醫(yī)學中心的研究人員利用基因技術使老年實驗鼠的重要免疫器官“胸腺”功能得到恢復。通過改變一種基因的表達就能改善整個器官的功能,這一結果“令人興奮”。不過要將這一技術應用于人類,還要克服一系列困難,比如必須確保免疫系統(tǒng)不會“過度活躍”,以免其攻擊自身機體。