潘鋒
2017年11月2日,中國科學院科技戰略咨詢研究院等單位在北京舉辦“研究前沿:合成生物學專題論壇”,論壇邀請中國科學院院士、中國科學院上海生命科學研究院趙國屏研究員做了題為《合成生物學——工程化的科學研究,“會聚”的創新范式》的主題報告。趙國屏研究員在接受記者采訪時表示,合成生物學是一門新興的交叉學科,其顛覆性的技術創新和工程化研究的概念,不僅讓人類“可以像組裝機器一樣裝配新型生命系統”的理想變為可能和現實,更因生命科學研究進入“大數據”時代數據密集型范式的機遇,形成了“會聚研究”的革命態勢,為人類追求自身、環境乃至社會健康發展拓展了能力提升的廣闊空間。
生命科學的三次革命
趙國屏研究員說,從宇宙的角度看,生物和生命活動所涉及的空間和時間尺度都是那么的“微不足道”;然而從人類的角度看,自然界與自身息息相關的那部分都是“有生命”的,這就是生物學最基本的研究對象。從生物學領域向微觀延伸,便是化學所要研究的分子、原子以及物理學所要研究的基本粒子;向宏觀延伸,則涵蓋了天文學和地學兩大學科。與各門學科一樣,生物學起步于觀測和描述。由于生命現象自身的復雜性,20世紀之前雖然人們在對細胞的形態觀察、對遺傳的規律認識、對生物進化的概念理解上有所突破,但生物學整體上未能實現向研究其普遍的構成本質及運動規律的“生命科學”的飛躍。20世紀以來,微觀層面的生物化學、細胞遺傳學、細胞生物學和發育生物學,以及宏觀層面的生態學和進化生物學等相繼得到發展,推動了生物學從以分類描述為特征的傳統科學,向以機制研究為核心的現代生命科學的轉變。以此為基礎,20世紀中葉以來,生命科學研究在技術、認知和能力方面爆發了三次革命。
趙國屏研究員介紹,生命科學的第一次革命是分子生物學。1953年DNA雙螺旋結構的解析,不僅在分子水平上明確了遺傳物質,而且迅速確定了DNA自我復制傳承遺傳信息,和“從DNA到mRNA到蛋白質”的這一遺傳“中心法則”。同時,一系列可用于精準操控核酸的酶與載體的發現及其相關轉化技術的發明和應用,最終促成了以遺傳的中心法則以及DNA重組技術為標志的分子生物學革命,由此極大地推動了人類對生命運動規律的認識。20世紀70年代起,結合對基因表達調控的認識,實現了在一定程度上對生命過程的模擬或改造,形成了以分子生物學技術為基礎的新一代生物工程。
生命科學的第二次革命是基因組學。鑒于肯尼迪“向腫瘤宣戰”計劃的失敗,Renato Dulbecco于1986年發表具有歷史意義的《腫瘤研究的轉折點:人類基因組測序》一文,提出“如果我們想更多地了解腫瘤,從現在起必須關注細胞的基因組”的科學假說,以及“從對人類細胞基因組測序入手”的研究策略,由此啟動的人類基因組計劃及其成功實施,標志著生命科學第二次革命的到來。這次革命的直接成果是對生命本質的認識從單個基因或單個分子功能層面,上升到了對整個生命體或生命過程整體認知的基因組層面;而對生命科學的研究體系而言,則是引入了除“實驗-分析”之外的“數據”,以及與獲取數據、分析數據和利用數據相關的一系列“生物信息技術”,并由此形成生物信息學、計算生物學乃至理論生物學等新興學科。特別值得一提的是,20世紀90年代形成了綜合(干)與實驗(濕)兩類數據,在系統科學“自上而下”分析理念指引下研究生物體和生命運動規律的系統生物學。
生命科學的第三次革命是會聚研究。世紀之交,利用基因元件,在工程學“自下而上”理念指導下,設計并構建基因線路(生物開關、振蕩子以及自動調節的負反饋線路)獲得成功,標志著工程科學與生命科學的融合,產生了合成生物學。2011年,美國麻省理工大學發布《第三次革命:生命科學、物理科學和工程學的會聚》;2014年,美國國家科學院發布《會聚:促進生命科學、自然科學、工程等領域的跨學科整合》報告。與前兩次革命聚焦于技術與知識的顛覆性突破不同,“會聚”革命的核心,則是能力的提升,是人類自身智力、體力乃至整個社會能力的提升。以著名的NBIC來表述:如果認知科學家(Cogno)能夠想到它,納米科學家(Nano)就能夠制造它,生物科學家(Bio)就能夠使用它,信息科學家(Info)就能夠監視和控制它。
趙國屏研究員簡要回顧了中國科學家在生命科學發展史的三次革命中曾經作出的貢獻。1956年舉行的青島遺傳學會議為中國科學家日后迎接分子生物學革命奠定了基礎。1958~1965年,中國科學院上海生化所和有機所以及北京大學的生物化學家與有機化學家,共同完成牛胰島素全人工合成。這不僅是中國科學家在合成科學領域完成的一件領先全球的成果,對分子生物學革命的直接貢獻,也體現了中國生命科學家有組織大科學計劃的決心和能力。改革開放之后,我國于1992年啟動水稻基因組工作。1993年,在談家楨和吳旻先生支持下,國家自然科學基金委啟動“中華民族基因組中若干位點基因結構與功能的研究”,該項目由強伯勤先生和和陳竺先生主持,標志著中國人類基因組研究的起步。中國人類基因組計劃的啟動不僅有力支撐了中國科學家及時參與了由發達國家啟動的大科學計劃,同時還保證了中國在生命科學的第二次革命中從“跟跑”步入了“并跑”的地位。
合成生物學帶來全新思維和方法
趙國屏研究員說,對合成生物學內涵的理解至今依然是“見仁見智”,但是其核心應該是工程化的生命科學研究,即以創建新生命體系目標為導向的、“自下而上”的在工程學研究理念指導下的生命科學與生物技術研究;以及生命科學研究的工程化,即在生命科學研究中實施基于系統科學的計算與設計,基于合成科學的基因組與生物分子操作,基于計量科學的對生命元件到體系的檢測與測試三位一體循環,提升優化的研究模式。
合成生物學以構建“工程化的生命”為目的,為生命科學研究帶來了全新的思維、戰略和方法,是相對于傳統的“格物致知”方法學的一場革命。生命起源、生物進化(演化)、生物體復雜的結構-功能等生命科學前沿問題,有望在“建物致知”理念的引導下取得突破。合成生物學在“生命的工程化”理念指導下,正在顛覆傳統的生物工程和代謝工程。在標準化元件模塊的基礎上,人工設計復雜系統并在人工底盤上實現可重復、可定量、可調控的合成構建。利用“建物致用”理念指引下發展起來的合成生物學技術,有望用于應對人類社會面臨的各種挑戰,并在醫學、制藥、化工、能源、材料、農業等領域都有著廣闊的應用前景。endprint
趙國屏研究員說,合成生物學的發展,離不開使能技術創新及工程化“工具包”的優化共享。這類顛覆性技術創新和工程平臺創新不僅包括對基因組操作及合成構建的“編/寫”能力,還包括從生物元件的標準化到從頭創制非天然生物分子;當然,更離不開基于系統生物學知識的從元件到通路,從模塊到網絡,從調控到底盤優化的設計、合成及測試??梢?,是工程學與生命科學的融合催生了合成生物學,而合成生物學的發展又促進了物理學、化學、納米科學、信息科學等一系列學科與生命科學的融合乃至它們之間的相互融合。這種“融合”已超越了原先意義上“學科交叉”的范疇,而是科學、技術、工程乃至自然科學與社會科學的“會聚”。
大數據時代的
生命科學“會聚研究”
趙國屏研究員說,“會聚研究”革命是科學史上源于學科交叉、高于學科交叉,真正以研究能力提升為導向的突破。這一革命得以出現的科學技術前提,除了以合成化學為代表的合成科學外,最主要的是在分子生物學和基因組學兩次革命基礎上建立起來的使能技術和檢測技術(包括大規模測序技術)的突破,以及系統生物學知識的極大豐富。從本質上說,首先是基因組學革命成功地在生命科學的研究體系中引入了“數據”這一重要的組分,進一步會聚物理、化學、信息、計量、計算等科學及相關工程技術的創新,生命科學數據便迅速地提升到了大數據層級,即EB級(如果結合醫學,則正在向ZB級發展)。這也意味著生命科學研究正在從傳統的實驗科學范式,迅速跨越尚欠成熟的“理論科學”和“計算科學”階段,進入到了“數據密集型科學”的“第四范式”。
趙國屏研究員說,在高技術轉化成工程化平臺服務和大數據的開源共享兩大推手的助力下,“會聚”所提升的人類研究能力可能形成生命科學研究民主化的趨勢,其雛形從現在已經比較常見的“眾包”場景中已可窺見一斑??梢灶A見的是,在不遠的將來,越來越多的青年科學工作者雖然擁有的資源不多,但只要具有一定科學基礎的創新思想火花,都有可能在公益性的技術和信息共享的平臺上驗證思路并進一步開展研究和轉化成果。
同時,轉化型研究將成為生命科學研究一個最主要的平臺。轉化型研究不僅僅是傳統意義上的科研成果的產業化,還體現于醫學與生命科學的緊密結合,因此也常被稱之為“轉化醫學”,它強調的是以人為研究的直接對象,將臨床問題轉化為實驗室課題,將實驗室研究成果及時在臨床驗證或應用的實踐。轉化醫學為在“組學”基礎上形成的系統生物醫學研究體系搭建起了與臨床結合的平臺,它將大批生命科學家的眼光從“象牙塔式”的實驗室轉向臨床需求,同時也讓醫學“無縫”對接科學,培養出一批研究型醫生。利用轉化醫學平臺可以有效提高生物醫學大數據的獲取、共享及挖掘分析能力,使研究人員有可能在臨床實踐中隨時隨地把轉化醫學的成果直接服務于患者,實現“精準醫療”。在大數據時代,人們已經有可能更迅捷、更精準地把生物醫學的數據提取成信息,把信息轉化為知識,再把知識轉化為醫生的智慧和健康醫療機構的工程,開辟了以4P(個體化personalized、干預preemptive、預測predictive、參與participitory)為特征的轉化醫學實踐。
夯實生物醫學大數據基礎
趙國屏研究員認為,生物醫學大數據超越了傳統意義上大數據的四V特征(速度Velocity、體量Volume、種類Variety、真性Veracity),不僅速度更快、體量更大,其“狀態”的復雜性遠超物理、天地乃至工程等各種非人文學科,從根本上說是由生物醫學研究對象在時空軸上定位的高度復雜性所決定的。
一方面,這種多層次的時空范疇,各有其特征性的運動規律,尚不能用統一的數學模型利用計算科學的方法加以確切的描述;另一方面,即便在同一時空層次上,由于生命活動的特殊性,物質與物質運動的規律依然呈現多維轉換的復雜性和交錯混合的非結構性。所幸的是,生命科學研究數據,無論是基礎科研的實驗數據還是組學和系統合成生物學的研究數據,一般都是在設計的試驗下形成的,大多經過重復驗證或/和互相旁證,因而具有較好的結構性且內涵豐富,可以與多層次的數據在一定標準下交互使用;而以動物實驗為基礎的比較醫學和以隊列研究、流行病學研究、藥物臨床研究和循證醫學研究等為基礎的轉化醫學研究,也大多是經過設計,有對照、有質控的高質量結構化數據,這些數據組成了生物醫學大數據的質量“脊柱”。
生物醫學大數據的“真態”即保證數據的可信性也有其特殊性,特別是對于來自臨床和自然人群的數據,即所謂的“真實世界(real-world)”數據,不僅數量巨大,而且基本上是人自身的數據。雖然人是生物醫學研究很好的研究對象和最終的服務對象,但是來自人“自述”的數據往往帶有人文乃至社會學科的特征,因此,必須做好數據采集的規范化和數據本身的標準化,盡可能保證其真實性或采用適當的技術,排除不真實有偏見的數據。由此可見,為了真正發揮生物醫學大數據的作用,必須克服現時數據無匯交機制,存儲碎片化;管理分散,無安全保障;無標準化質控,難有效共享;資源無規模,難形成有效知識等局限。因此,有必要并且急需建立統一的、有規模、有權威的國家生物醫學大數據基礎設施,集中精力做好安全、優質、高效整合與公平共享的服務工作。
趙國屏研究員介紹,經過20多年的努力,與人類基因組研究并行,我國在生命科學和生物技術平臺建設方面已經奠定了相當的基礎,其中一個典型的成功范例就是上海張江高科技園區。該園區規劃于20世紀80年代,始建于1992年7月。25年來,堅守發展信息技術(IT)和生物技術(BT)的“初心”,已建起了一批產生生物醫學大數據的、從人類基因組等生命“組學”到藥物研發及臨床轉化的研發機構。今天的張江,已經具備了建設生物醫學大數據基礎設施的一切條件;而這一設施的建設,也必定是保證將張江建成國家自主創新示范區,支撐上海建設具有全球影響力的科技創新中心的決定性部署。
趙國屏研究員認為,抓住大數據時代生命科學“會聚研究”第三次革命的機遇,及時建立國家生物醫學大數據基礎設施及相應的數據服務體系,扎扎實實承擔起符合大數據時代形勢的數據積累、數據提升的基礎性工作,實現數據的安全、優質、高效整合與公平共享,是我國在生物醫學領域實施“彎道超車”戰略的一大機遇,機不可失,時不再來,必須團結起來,積極行動起來,以優異的創新成果為人類健康科學事業做出新的貢獻。
專家簡介
趙國屏,中國科學院院士、中科院上海植物生理生態研究所研究員,分子微生物學家。現任中科院上海生科院生物醫學大數據中心首席科學家,中國科學院合成生物學重點實驗室專家委員會主任,國家人類基因組南方研究中心上海市疾病與健康基因組重點實驗室主任,復旦大學生命科學學院微生物學和微生物工程系主任;兼任中國生物工程學會理事,上海生物工程學會理事長。曾任中國微生物學會理事長、名譽理事長。近年來積極開拓系統合成生物學研究領域,在微生物代謝調控研究方面做出了開創性工作;參與組建和/或領導了一系列生物技術企業、中科院研究院所、國家及上海研究中心和工程研究中心,不斷探索科技體系運行模式、科研機構體制機制、科研成果轉化和科技企業建設等方面的改革創新。endprint