金力

基因測序和表型測量是遺傳學研究的基礎。在人類基因組計劃的助推下,生命科學領域開啟了遺傳研究的新紀元,系統解析基因和表型之間的關系成為新的前沿方向。
1911年,丹麥哥本哈根大學遺傳學家約翰森(W. Johannsen)提出“表型”(phenotype)概念。1996年,美國加州大學珈藍(S. Garan)首次提出“表型組學”(phenomics)的概念。經過多年的探索和實踐積累,筆者研究團隊將表型組(phenome)定義為由基因、表觀遺傳、共生微生物、飲食和環境暴露之間復雜的相互作用而產生的一系列可測量特征,包括個體和群體的物理特征、化學特征和生物特征[1]。
表型組具有復雜性、跨尺度和動態性特征。基因組與表型組之間具有復雜的調控網絡關系,包括單基因調控、多效一因(即多個基因調控同一表型)和一因多效(即一個基因調控多個表型)等。同時,表型組囊括從微觀到宏觀的所有表型,涵蓋轉錄、蛋白、代謝、細胞、器官、心理等多個層面。另外,表型組具有隨著時空動態變化的特征,即伴隨著生物體出生、成長發育到衰老死亡的整個生命周期,以及海拔、溫度、濕度等環境變化而呈現出明顯的動態變化。
表型組學作為一門日益興起的新交叉學科,致力于全基因組水平上的系統性表型研究,是后基因組時代生物醫學領域的重要引擎[2]。
六國科學家共同參與、提前完成的人類基因組計劃
1980年代,美國科學家逐步提議開展人類基因組測序研究和表型關聯研究。1990年10月,人類基因組計劃(Human Genome Project)正式啟動,目標是精確測定30億堿基對構成的人類基因組。1996—1999年,英國、德國、日本、法國和中國先后加入人類基因組計劃,組成國際基因組測序聯盟。中國承擔了人類基因組計劃的“1%計劃”,即3號染色體堿基測序任務。2000年6月,人類基因組序列草圖初步完成。2001年2月,人類基因組測序成果發表。2003年4月,凝聚著國際合作力量的人類基因組計劃宣告提前完成[3]。
人類基因組計劃的意義
人類基因組計劃是人類探索自身奧秘的歷史性里程碑,將生命科學研究帶入了基因組時代,推動了高通量基因測序成本不斷降低,促進了蛋白質組、代謝組等組學研究的發展,為從分子層面進行疾病研究、健康管理等提供了突破口。作為生命科學領域的首個國際大科學計劃,人類基因組計劃涵蓋科研、產業、倫理、社會等層面,為開展國際大科學計劃的團隊建設、管理機制等樹立了典范。
中國作為參與人類基因組計劃的唯一發展中國家,在基因組測序、基因多樣性等方面做出了突出貢獻。這為中國繼續參與重大國際合作項目,如國際人類基因組單體型圖計劃(International HapMap Project)等,以及籌備發起大科學計劃奠定了重要基礎。
盡管人類基因組計劃極大地促進了生命科學領域的發展,但從基本的基因組信息到解析人類健康圖譜和疾病機制,依然非常艱巨。以精神病研究為例,科學家們一直在尋找穩定、精確的表型指標,然而,通過基因研究篩選有價值的表型和精神病鑒定標準卻充滿了挑戰[4]。
開展人類表型組研究成為后基因組時代科學界共識
人類基因組計劃完成后,生命科學研究進入了大樣本、大數據、大科學、大發現的新時代。科學家們將目光聚焦在大科學光芒下基因研究的同時,也在期待下一個新時代[5]。
經典遺傳學研究通常有兩種策略:一是從表型到基因型的研究策略,即正向遺傳學,側重基于家族或不同個體間的研究;二是從基因型到表型的研究策略,即反向遺傳學,通常受限于模式生物而難以大規模使用遺傳編輯技術評估轉基因結果,尤其涉及倫理問題而無法在人類研究中開展[6]。然而,通過表型組研究策略如全表型組關聯研究,有助于為健康和疾病研究提供全新的視角[6]。
繼人類基因組計劃之后,人類表型組研究的重要性已引起廣泛關注,開展人類表型組研究已經成為國際學術界的共識。
在完成人類基因組計劃后,美國科學家們首次提出人類表型組計劃(Human Phenome Project)一詞,但因當時科學技術的限制,其表型測量與研究主要以醫療電子檔案、臨床實驗室檢測為主。

2012年,美國國家生物技術信息中心啟動建設公共數據庫ClinVar,開展人類遺傳變異與表型關系的研究。2014年,美國系統生物學研究所開展“百人健康計劃”(Hundred Person Wellness Project),主要就100名自然人群志愿者的睡眠、生理活動等進行連續監測的系統研究[7]。2015年,美國提出“精準醫學計劃”(Precision Medicine Initiative)并籌備發起“我們所有人研究計劃”(All of Us Research Program),目標是建立國家隊列,測量100萬人并建立健康數據庫。
2003年,英國政府提議發起的“英國生物樣本庫研究計劃”(UK Biobank)正式啟動。該項目通過英國國家醫療服務體系(National Health Service)采集50萬志愿者信息,包括血液樣本、遺傳和生活方式等數據,探究影響常見疾病的基因與環境暴露之間的復雜關聯[8]。2012年,英國帝國理工大學依托倫敦奧運會興奮劑檢測實驗室相關設施成立表型組中心(MRCNIHR National Phenome Centre, NPC),通過血液、尿液等進行相關代謝研究。其表型組研究主要依托于分散在英國各地的不同機構中心,側重于疾病與代謝表型研究。
2018年,德國投資建立國家研究數據基礎設施(National Research Data Infrastructure,NFDI)。2020年,歐洲分子生物學實驗室、德國癌癥研究中心等成立聯盟,將德國人類基因—表型檔案(German Human Genome-Phenome Archive)作為NFDI提案的一部分正式啟動,旨在提供基礎設施并保證個人數據安全等。
2019年,澳大利亞莫道克大學牽頭成立國家表型組中心(Australian National Phenome Centre),依托表型測量平臺構建了由多家大學、醫院等組成的西澳大利亞健康轉化網絡(Western Australian Health Translation Network),通過測量代謝相關表型來研究糖尿病、癌癥、孤獨癥等疾病。
此外,日本、冰島、盧森堡、芬蘭、法國、加拿大、瑞典、荷蘭等國,也開展了基于大型人群隊列的表型組研究項目。國際企業包括谷歌等也積極開展聚焦健康的相關表型研究。
總體而言,繼人類基因組計劃后,國際上尤其以發達國家為主,相繼開展了國家或地區層面的人類表型研究或大健康計劃,積極開拓人類表型組研究的新時代。然而,這些表型研究工作局限于分散的表型測量平臺,或側重于特定人群或類型的表型,缺乏系統化、規模化、標準化的表型測量平臺、表型組整合研究,以及人類表型測量標準。相對而言,我國是最早系統地布局人類表型組研究的國家,經過多年建設和積累,開拓了跨尺度、多維度、全景式的表型測量和研究工作,為籌備發起人類表型組計劃做出了重要貢獻。
為什么要研究表型組
基因與表型之間的關聯是非常復雜的,通過基因組學研究難以解釋因環境暴露并涉及大量基因參與的諸多復雜疾病,如糖尿病、癌癥等。需要通過表型組研究,深入探究基因的重要功能以及對健康和疾病的影響。隨著基因測序技術和分析技術日趨成熟、價格日益親民,生命科學研究的限速步驟逐漸從基因測序轉向了表型測量[4]。
通過表型測量和海量的基因信息,可以更好地比較個體間的特征差異。基于電子病歷的表型數據和流行病學數據,可開展以臨床疾病和社區人群為基礎的表型組研究,探究遺傳變異對于表型的影響[9]。在當前全球新冠疫情肆虐的背景下,表型組與環境研究被建議列入實現精準醫學的七大機會之一[10]。通過表型組研究,有利于完善醫療診斷,提供更合理的疾病治療和防控方案。
表型、表型組與健康的關系
表型組研究涉及測量各種多組學參數,研究其在個體層面和群體層面對于健康和疾病的影響以及預測治療效果。對于表型組研究來說,理解“正常表型”“健康表型”以及“疾病表型”之間的區別,包括界定這些表型之間的關聯和過渡是非常具有挑戰性的。比如,對于肥胖表型而言,身體質量指數(Body Mass Index, BMI)大于30千克/米2被認為是不正常范圍,但卻不一定導致代謝疾病;對于某些被認為正常的自然人群,卻可能具有代謝性肥胖的健康問題[11]。
通過深度表型測量(deep phenotyping)和表型組研究,理解相關表型的動態變化特征,檢測重要信號轉變和鑒定相關的分子標記物[12],有助于指導科學的個性化健康管理和疾病治療干預。
表型組研究成果已落地應用
在生命體由健康狀態到疾病狀態的過渡過程中,常常受到衰老、環境暴露的影響。通過表型組研究,逐步落地實現基于表型組大數據的個性化健康管理、疾病標志物篩查等應用,為中國和全球健康目標的實現提供科技支持與保障。
美國系統生物學研究所胡德(L. Hood)院士團隊基于深度表型測量研究了衰老相關疾病和健康網絡,結合多組學生物標記物提供生活方式指導[13]。復旦大學華山醫院丁玎、崔梅研究員團隊及復旦大學人類表型組研究院陳興棟研究員團隊發現,代謝物水平變化與老年癡呆發生風險關聯,對于癡呆癥早期診斷和干預具有重要研究意義[14]。
基于泰州人群隊列的表型組研究,筆者團隊等發現,對于結直腸癌、食管癌、肝癌、肺癌和胃癌等5種常見腫瘤,可由無創血液檢測早于常規診斷的癌癥早期篩查,這對癌癥生物標志物的篩選具有重要應用價值[15]。
澳大利亞莫道克大學尼科爾森(J. Nicholson)院士團隊探討了新型冠狀病毒引起的深度代謝擾動,認為表型研究對于測量和監控包括新冠肺炎等多種疾病的系統性病理過程非常有效,應該被列為分子研究和大規模篩選的重要工具[16]。
人類表型組研究的重要意義
通過人類表型組研究,尤其通過全球大協作的人類表型組計劃,將實現科學策源、精準健康和產業培育等方面的多重成效。
在科學策源方面,通過對人群樣本開展跨尺度、全周期的人類表型精密測量,獲得海量的表型組大數據并進行分析,大規模發現基因—表型—環境之間、微觀表型與宏觀表型之間的跨尺度關聯及相互作用,為解析復雜生命過程的機理繪制出相關人群的表型組參比圖譜。這將提供新一代“導航圖”,探究表型間的強關聯及其相關機制,驗證科學假說,進一步提升生命科學領域的原始創新策源。
表型組研究及相關科研成果的應用與轉化,將為生物醫藥產業變革和大健康產業的新興增長點提供持久的創新動力。人類表型組研究將發現一批全新的表型標志物,整量級獲得藥物新靶點、新機制,為新型診斷試劑和產品、下一代原創新藥、個性化健康管理裝備、智慧醫療器械與設備等提供超級引擎;形成高精度的生物與健康大數據庫,為培育和發展基于“表型組+大數據”“表型組+人工智能”的大健康產業提供豐富、堅實、多元的數據基礎。
此外,我國建成世界首個跨尺度、多維度人類表型精密測量平臺和自主研發的全過程、自動化表型組大數據平臺,通過表型組研究推廣表型測量和分析等相關的國際標準,積極融入全球創新網絡,促進個性化健康管理和診斷助手研發,引領大健康產業的跨代發展。在繼人類基因組計劃后啟動生命科學領域矚目的人類表型組國際大科學計劃,將從科學、產業、社會等多方面推動全球科技創新與進步,對實現個性化醫療、精準預防和主動健康管理等具有根本性意義。
我國率先布局人類表型組研究
中國具有56個民族的多樣性人類遺傳資源,對于建立代表性人群隊列和表型組研究具有重要意義。我國的人類表型研究從1980年代起步建設。自2014年起,復旦大學開始籌備發起人類表型組國際大科學計劃。2015年,科技部基礎性工作專項支持啟動全球首個大規模人類表型組研究項目“中國各民族體質人類表型特征調查”。2016年,上海市科委對表型組研究給予了優先啟動支持;同年,“國際人類表型組”被國務院批準列入需布局的重大科學基礎工程。2017年,上海市首批市級科技重大專項“國際人類表型組計劃(一期)項目”立項。為引領布局人類表型組國際大科學計劃,我國初步探索包含平臺建設、數據系統、協同網絡、科研攻關在內的“四位一體”基本構架。
同時,我國舉辦了系列人類表型組國際學術研討會,在人類表型組領域具有國際話語權和學術影響力。2015年,在“國際人類表型組學研究”為主題的香山科學會議上,與會國內外專家取得共識,一致建議發起人類表型組計劃。2016年,首屆國際人類表型組研討會在復旦大學召開,倡議啟動國際人類表型組研究計劃。2018年,在上海舉行第二屆國際人類表型組研討會,明確人類表型組國際大科學計劃的實施路線圖、合作機制和組織架構,中國人類表型組研究協作組(Human Phenome Consortium of China, HPCC)宣布成立,由國內33家高校、22家三甲醫院構成人類表型組國內協同網絡;筆者、尼科爾森和胡德共同倡議成立人類表型組國際協作組(International Human Phenome Consortium, IHPC),與18個國家的23家著名研究機構開展國際合作。2019年,復旦大學牽頭舉辦新型研發機構——上海國際人類表型組研究院,推動國內外人類表型組研發協同網絡的建設和標準化工作。2020年,通過線上舉辦第三屆國際人類表型組研討會,人類表型組國際協作組的各國科學家,就人類表型組大科學計劃近期優先聚焦的三大方向達成共識,包括“新冠肺炎和其他重大疾病的表型組學研究”“表型組研究技術體系與科研基礎設施構建”,以及“表型組學研究中的標準操作程序(SOPs)”。2021年,在線召開的IHPC第三次理事會通過了表型數據共享原則,并公布了初步繪制的全球首張人類表型組導航圖,為實施人類表型組國際大科學計劃指明了方向。
隨著人類表型組計劃的國內外協同創新網絡逐漸發展和優化,中國人類表型組研究協作組集聚了含30位院士在內的77位委員;人類表型組計劃國際協作組匯聚了歐美主要發達國家和“一帶一路”沿線國家的主要研究力量,吸引了含10位來自中、英、美、德等國科學院院士在內的23位國際著名科學家參與人類表型組研究,為人類表型組研究的全球公共技術平臺和學術交流中心構建了國內外協作機制。
推進人類表型組研究需要多層面協作
人類健康問題是全球性問題,不受國家、地理等因素的限制,尤其對于發展中國家,由疾病引發的健康威脅不斷上升。目前,通過國際大科學計劃匯聚全球力量解決人類健康領域的共同關鍵問題,已成為主要的科學組織模式。人類表型組計劃是一項系統化、集成化、工程化的項目,需從平臺建設、科研治理等層面的國際科學創新合作來實施,推進人類表型組的研究工作。
德國、美國、英國、中國、澳大利亞先后建設了人類表型組研究平臺。為更好地利用分散在全球的人類表型組平臺資源,平臺建設、表型測量和分析標準等方面的全球協作至關重要。人類表型組計劃協作組設置了技術與標準委員會,旨在統一平臺的表型測量與分析技術標準,確保數據真實、準確、可比,最大化利用已有平臺、項目等資源,為人類表型組研究提供核心基礎。

人類表型組研究涉及生物學、醫學、數據科學、倫理學、公共事務、信息共享及安全等多學科交叉領域,參與的國家和組織具有多樣性和復雜性,需要健全管理架構和運行機制,包括決策咨詢、監督評估、風險防控等,實行資源和成果分享、優勢互補、風險共擔,從經費籌措、知識產權、社會倫理、數據安全、人才匯聚與培養等方面,全方位為人類表型組計劃的實施保駕護航。
人類表型組研究需要全社會支持與參與
人類表型組研究以個體或特定群體為研究對象,需要公眾、科學界、產業界等全社會力量的支持與參與,從而有序地進行人類表型組計劃項目的規劃、建設和運營。
人類表型組研究需要公眾作為受試志愿者參與支持,從個體水平開展縱向的深度表型測量,對于從健康狀態到疾病狀態轉變的科學研究和個人健康管理具有重要意義;基于特定人群的隊列研究,從群體角度揭示統計性分布及影響因素,為個體化治療和精準預防提供科學證據。人類表型組研究還涉及相關倫理、法律、隱私等社會問題,需要公眾參與監督和共同完善。
此外,人類表型組研究需要科學界、企業界等的持續參與和聯動。人類表型組研究將為科研領域和健康產業等提供創新源泉,推動基礎理論研究、新型診斷試劑、原創新藥、新技術和設備等應用方面協同發展。
結 語
隨著后基因組時代的到來,表型組研究的重要意義日益顯著,通過籌備發起人類表型組計劃,將突破生命科學領域和醫療革新的瓶頸,全面解讀人類生命健康密碼,引領探索人體小宇宙的未來征程,助力實現人類衛生健康共同體的美好愿景。
[1]Jin L. Welcome to the Phenomics Journal. Phenomics, 2021, 1(1): 1-2.
[2]Bilder R M, Sabb F W, Cannon T D, et al. Phenomics: the systematic study of phenotypes on a genome-wide scale. Neuroscience, 2009, 164(1): 30-42.
[3]Henry C. Human genome project finished—International consortium announces, all original goals met, plans for future. Chemical & Engineering News, 2003, 81(16): 12.
[4]Bilder R M. Phenomics: building scaffolds for biological hypotheses in the post-genomic era. Biol Psychiatry, 2008, 63(5): 439-440.
[5]Scriver C R. After the genome—the phenome? J Inherit Metab Dis, 2004, 27(3): 305-317.
[6]Hebbring S. Genomic and phenomic research in the 21st century. Trends Genet, 2019. 35(1): 29-41.
[7]Diamandis E P. The hundred person wellness project and Googles baseline study: medical revolution or unnecessary and potentially harmful over-testing? BMC Medicine, 2015, 13(1): 5.
[8]Tutton R, Kaye J, Hoeyer K. Governing UK Biobank: the importance of ensuring public trust. Trends Biotechnol, 2004,22(6): 284-285.
[9]Pathak J, Kiefer R C, Bielinski S J, et al. Applying semantic web technologies for phenome-wide scan using an electronic health record linked Biobank. J Biomed Semantics, 2012, 3(1): 10.
[10]Denny J C, Collins F S. Precision medicine in 2030-seven ways to transform healthcare. Cell, 2021, 184(6): 1415-1419.
[11]Kim H Y, Chang W K, Chang D L, et al. Can "healthy" normal alanine aminotransferase levels identify the metabolically obese phenotype? Findings from the Korea national health and nutrition examination survey 2008-2010. Dig Dis Sci, 2014, 59(6): 1330-1337.
[12]Chen R, Mias G I, Li J, et al. Personal omics profiling reveals dynamic molecular and medical phenotypes. Cell, 2012, 148(6): 1293-1307.
[13]Trachana K, Bargaje R, Glusman G, et al. Taking systems medicine to heart. Circ Res, 2018, 122(9): 1276-1289.
[14]Cui M, Jiang Y, Zhao Q, et al. Metabolomics and incident dementia in older Chinese adults: The Shanghai Aging Study. Alzheimers Dement, 2020, 16(5): 779-788.
[15]Chen X D, Gole J, Gore A, et al. Non-invasive early detection of cancer four years before conventional diagnosis using a blood test. Nat Commun, 2020, 11(1): 3475. DOI: 10.1038/s41467-020-17316-z.
[16]Nicholson J K. Molecular phenomic approaches to deconvolving the systemic effects of SARS-CoV-2 infection and post-acute COVID-19 syndrome. Phenomics, 2021. 1(4): 143-150.
關鍵詞:基因組 表型組 人類表型組計劃 健康 ■