2 0 2 0 年1 月2 1 日,全球頂級雜志《自然》(Nature)發表綜述文章,“Technologies to watch in 2020”,請七位行業思想領袖預測技術發展將在今年產生的重大影響。
在兩到三年中透射式冷凍電子顯微鏡(cryogenic electron microscopy,cryo-EM)將成為解密大分子結構的最強大工具。這些結構對于理解生化機制和藥物開發至關重要,而更有效地解析它們的方法可以加快此類工作。
在cryo-EM中,將生物樣本快速冷凍在液氮中有助于保留水分,減少用于成像的高能電子對分子的損害。但是標本的準備工作是目前一個主要的瓶頸。沒有好的標本,就無法成像。生物樣本通常含有蛋白質,這些蛋白質會在冷凍過程中在薄液表面散開。
為了防止這種情況的發生,研究人員正在開發能在施加液滴之前將蛋白質錨固在二維材料(例如碳晶格石墨烯)上的方法。這樣,液滴更小,并讓蛋白質遠離空氣—水界面。有的實驗室將納米級別的樣品直接放在表面上,而不是使用舊方法從大液滴中吸走多余的液體。有的使用聚焦離子束將冷凍的細胞切成100納米以下,使研究人員能夠在細胞環境中研究分子。
使用cryo-EM解析分子結構通常需要收集和分析多達一萬張圖像,這代表了數周至一個月的工作。許多圖像是不完美的,因此研究者必須丟棄它們。理論上,幾十張照片就足夠了,收集和分析工作將花費不到一天的時間。增加的通量可以幫助我們了解疾病的機制并更有效地開發藥物。
我一直在關注并使用適配體的發光RNA鏈進行RNA長讀長測序和活細胞成像。這些技術日趨成熟,并在未來一兩年內發生重大變化。
短讀長測序改變了RNA生物學。例如,它可以告訴你哪些RNA序列包含經過生物化學修飾的殘基。但是,長讀長測序則可以幫助確定特定修飾在細胞中的普遍程度,以及RNA分子之間的變化是否互相關聯。
發光適配體是在實驗室中開發的與熒光染料結合的單鏈DNA或RNA分子,是在某些海洋動物體內產生的綠色熒光蛋白的RNA類似物。當這些適配體與染料結合時,它們的熒光強度會增加。使得研究人員能夠跟蹤研究,例如導致神經退行性疾病的細胞內RNA簇的形成等。
早期的發光適配體并不可靠,它們的信號微弱,有時根本不起作用,因為與靶RNA融合時序列會錯誤折疊。但是有幾個小組開發出了新型熒光RNA。我在論文和演講中看到了其中的巨大推進,以提高現有適體的亮度,并創造出可以發出不同顏色的變體。
我的實驗室已經在使用化學足跡法來研究細胞中RNA的折疊。許多疾病都與RNA結構的變化有關,但這確實很難分開?,F在,我們借助長讀測序和發光適配體,研究癌癥、代謝綜合征和阿爾茨海默病等疾病中的RNA蛋白聚集體。通過這些技術,我們可以更好地將細胞死亡和其他疾病特征與細胞中RNA分子中發生的情況聯系起來。
在過去十年中,對微生物群落進行基因測序已經探查了人類微生物組的組成。最近,科學家試圖通過整合有關基因、轉錄、蛋白質和代謝產物的信息來了解微生物組的功能。代謝物特別有趣。它們可以提供微生物組如何影響人類健康最相關的信息,因為許多宿主與微生物組的相互作用是通過細菌產生和消耗的代謝物發生的。
微生物組和代謝組學研究呈現爆炸式增長。例如通過宏基因組測序來研究一組糞便樣本,鑒定每個樣品中存在的物種及其豐度,使用質譜法和其他技術測量不同代謝物的濃度。將這兩種方面結合起來,了解微生物組正在做什么,從而了解特定微生物是否決定了某些代謝物的水平。
但是這些數據是復雜的多維數據,可能存在一整套的相互作用,涉及最終產生一組代謝產物的多個物種和途徑??茖W家已經發表了計算方法以關聯微生物組和代謝組數據。這些方法包括簡單相關性的分析,以及使用現有微生物組—代謝組數據集,來預測新微生物群落中的代謝組或恢復微生物—代謝物關系的復雜機器學習方法。
我們的實驗室采用了不同的策略,沒有使用統計方法來發現微生物與代謝物的關聯,而是建立了特定微生物組成如何影響代謝組的機制模型,并將其用作分析的一部分。我們設問,根據基因組和代謝信息,對每種微生物產生或吸收特定代謝產物的能力了解多少?然后,預測給定微生物集合產生或降解特定代謝物的潛力,并與實際代謝組學數據進行比較。我們也證明了這種方法避免了簡單的相關分析的缺陷,將在未來幾個月內發布新版本的分析框架。
這樣的研究,可以通過識別產生過多有害代謝物或太少有益代謝物的特定微生物,來改善微生物組的療法。

1869年創刊的《自然》是世界上最早的國際性科技期刊,以報道科學世界中的重大發現、重要突破為使命,要求科研成果新穎,在學術界享有盛譽
我們看不到癌癥形成的過程,只能看到它的終點。腫瘤達到臨床可檢測的程度時,我們才對它進行采樣。那時,我們只有應對歷經突變的腫瘤。
我們的團隊建立了一個計算模型,在考慮組織空間結構的同時探索腫瘤進展的動力學。使用此模型,我們可以模擬各種情況,生成具有模擬患者數據的突變模式的“虛擬腫瘤”。通過將模擬數據與實際基因組數據進行比較,可以推斷出哪些參數可能導致了患者的腫瘤。
我很高興看到,通過新興條形碼和記錄法來直接測量腫瘤譜系和表型來補充這些推論方法。過去兩年,不斷發展的CRISPR條形碼,可以記錄哺乳動物發育過程中細胞的命運。再如,通過RNA原位表達使用圖像的DNA條形碼檢測,從而捕獲細胞譜系、空間鄰近性和表型。
在一項模擬結腸癌腫瘤生長的研究中,我們使用腫瘤序列數據和機器模擬來研究原發性和轉移性腫瘤之間的關系。推論分析表明,當原發腫瘤包含僅100000個細胞時,絕大多數癌癥就已經擴散,這時的腫瘤太小了,無法通過結腸鏡等標準診斷方法進行檢測。
由于具有更高的靈敏度和可擴展性,建模和測量方法的結合可以跟蹤腫瘤形成過程中的譜系和空間關系,從而洞悉癌癥的起源,比如特定的突變如何影響細胞適應性并導致疾病的發展。
我們已經進行了約15年的大規模實驗,繪制增強子和其他調控DNA序列的圖譜。這些序列控制著細胞和器官如何讀取基因。盡管完成這些圖還需要更多工作,我們仍可以更精確地控制基因組。
在2019年10月伊利諾伊州芝加哥市舉行的神經科學協會年會上,我主持了一個會議。會議重點是確定增強子序列并使用它們控制大腦中特定細胞類型中的基因表達。一種方法是將工程化的病毒傳播到大腦中,以測試數千種增強子的目標基因表達譜。2019年,華盛頓州西雅圖市艾倫腦科學研究所的研究人員使用這種策略,在人腦特定皮質層中尋找增強子。來自馬薩諸塞州劍橋市哈佛大學的一個研究小組使用RNA測序的方法來發現在某些中間神經元起作用的增強子。
一旦確定了增強子序列,科學家就可以使用它們來驅動特定細胞類型的表達,從而進行基因治療。在基因拷貝失活或缺失而引起的疾病中,CRISPR–Cas9基因編輯工具可以將轉錄激活因子靶向該基因的增強子,從而提高工作拷貝的表達。對老鼠的研究表明,這些方法可以糾正肥胖和脆弱X綜合征、Rett和Dravet綜合征等疾病的基因表達缺陷,后者是我實驗室正在研究的一種嚴重的癲癇病。2020年我們仍會進一步在老鼠身上開展研究,希望我們可以使用這些方法來改變人類基因治療的方式。
我對如何更快、更方便地為患者提供藥物感興趣。所需的技術是多方面的。一方面是發現,例如單細胞測序方法。另一方面是制造,我們需要將技術帶給患者。這特別適用于罕見病或患者少的藥物,甚至適用于滿足已有藥品的全球可及性。
在發現這方面,我們與麻省理工學院合作,開發了一種便攜式廉價平臺,用于高通量單細胞RNA測序。但是要獲得足夠的分辨率以區分具有不同作用和抗原特異性的免疫細胞亞型,仍然是一項挑戰。過去一年,我們用多種方式增強了單細胞基因組測序。首先,我們提出了一種更有效地檢測低表達轉錄本的方法。特別是針對T淋巴細胞,我們設計了一種方案,將每個細胞的基因表達譜與其獨特抗原受體的序列聯系起來。
同時,位于馬薩諸塞州波士頓的達納法伯癌癥研究所的一個研究小組,發布了一種巧妙的文庫篩選策略,確定特定的T細胞受體識別哪種抗原。
我與麻省理工學院的合作者Alex Shalek等人一起,創立了一家名為Honeycomb Biotechnologies的公司,將我們的單細胞RNA測序平臺商業化。不必將細胞放在離心機中離心,而是將其粘貼在試管中,然后將其冷凍在液氮中,可以運送一系列單細胞大小的孔,如USB大小。這可以使在全球任何地方對幾乎所有樣本的單細胞存儲和基因組的分析成為可能。
當你從一端到另一端伸展單個細胞的DNA時,它的長度約為2米,但它能夠被直徑小于大頭針直徑的細胞核容納。而折疊模式不能是隨機的,染色體形成必須在生物的整個生命周期中對其進行3D結構的時空調節。
隨著過去十年中基因組學和成像技術的發展,我們現在可以創建基因組折疊方式的超高分辨率圖?,F在最大的問題是,每個折疊模式的功能是什么?它們如何控制基因表達、DNA復制和DNA修復等基本過程?
幾種合成生物學方法可以使我們在一定長度和時間范圍內折疊和探測基因組。一種方法,CRISPRGO,可以將DNA片段攜帶到細胞核上或細胞核中的特定區室。這將使科學家們能夠研究DNA序列的核內形態如何控制基因功能。
另一個是我們實驗室的光激活動態環狀結構化(light-activated dynamic looping,LADL)工具,該工具使用光和CRISPR-Cas9可以根據需要在長距離上將特定的DNA束縛在一起。這可以使增強子直接與數千個甚至數百萬個堿基的靶基因直接接觸,因此我們可以直接評估調節序列的功能。其靶基因的表達會上升還是下降,以及上升到什么程度?該技術可以對基因表達進行精確的時空控制,這在許多疾病中都受到了嚴重破壞。
第三種系統CasDrop 使用另一種光激活的CRISPR-Cas9系統將特定的DNA片段拉入亞核無膜“冷凝物”。自幾年前被發現以來,它們在細胞中的功能一直引起激烈的爭論。
深受啟發的是,我們可以將這些3D基因組工程工具與基于CRISPR的活細胞成像方法結合起來,以便我們可以在細胞中實時工程化和觀察基因組。
功能可驅動結構,或結構可驅動功能。這些工程工具將解開這個很大的謎。