徐書華,中科院上海生命科學院計算生物學研究所研究員、研究組長、博士生導師。近5年在混合人群的遺傳結構、環境適應和基因定位策略研究方面取得了連續性的研究成果。他系統研究了混合人群的遺傳結構和連鎖不平衡,構建了首張歐亞混合人群的基因定位圖譜,并在全基因組水平量化分析了漢族人群的遺傳結構及其對關聯分析的影響,系統研究了單基因疾病和復雜疾病基因的特征;在人群混合與環境適應性方面,建立了檢測混合人群自然選擇的新策略,從全基因組水平揭示了美國黑人及藏族的環境適應性;在遺傳混合與人群歷史研究方面,從基因組水平揭示了亞洲人群的精細遺傳結構和混合模式,是迄今為止最全面的研究;他發展了利用遺傳混合和重組信息研究人群歷史的方法,首次從遺傳學角度估計了亞太地區人群的基因交流和擴張時間。
中國人口最多的民族漢族,本身就是一個最大的“混血”人群,在漢族人群的基因組中可以鑒別出不同程度的周圍少數民族的遺傳成分。
混血兒常常給人留下深刻印象,如高爾夫球星泰格?伍茲、F1賽車手劉易斯?漢密爾頓、美國總統貝拉克?奧巴馬、奧斯卡獎得主哈里?貝瑞等。曾經一項有趣的調查研究發現,混血面孔在“極具魅力臉孔”打分中占據壟斷地位。另一方面,大多數人都認為混血兒似乎只是個體行為,即使中國到了今天這么開放的時代,若是誰家女兒嫁給了外國人生了一個混血兒,依然是一件很希奇的事情。而實際上,現代人類在其漫長的歷史長河中,曾發生過不同規模的群體性“混血”事件,留下了如今各地廣泛存在的“混血”人群,典型的如大家熟識的美國黑人、拉丁美洲人群、中東和東南亞人群以及我國新疆的維吾爾族、哈薩克族等。徐書華就是鐘情于這類人群遺傳學研究的一位青年科學家。
位于上海市岳陽路320號的中國科學院上海生命科學研究院,有一個由中科院和德國馬普學會共同建立的計算生物學研究所。徐書華是該所的研究員、博士生導師和研究組長。想要了解他,就得先認識他的研究領域—群體基因組學。據徐書華介紹,群體基因組學是從基因組水平揭示群體的遺傳結構和多樣性特征并進而研究基因組微觀進化機制的一門學科,也可以簡單地理解為是群體遺傳學在基因組時代的延續和擴展。徐書華的主要興趣就是研究“混血”人群(也叫混合人群)的群體基因組學。
徐書華與“混血”人群結緣是偶然的,他對“混血”人群的研究可以追溯到其博士研究生階段。他的博士論文是利用高密度的常染色體單核苷酸多態性數據研究現代人群的遺傳結構,在分析數據的過程中,徐書華注意到了美國黑人的特殊遺傳結構,尤其對“混血”人群的連鎖不平衡形成機制產生了興趣,于是對其做了一系列專門分析并寫成英文手稿。“當我把論文手稿拿給金力老師看時,得到了他的高度贊賞”。徐書華至今回憶那段經歷時仍然感到自豪。關于美國黑人的研究是他第一次與“混血”人群結緣,完成此次研究后,他很快意識到亞洲的“混血”人群基因組研究尚未受到關注,于是便一鼓作氣對新疆維吾爾族進行了系統的研究,這也是關于歐亞“混血”人群的第一項群體基因組學研究。最終,關于“混血”人群的研究成為他博士論文的重要組成部分,其中有三章內容是研究美國黑人和新疆維吾爾族的“混血”遺傳結構特征和連鎖不平衡產生機制。相關研究結果最終分別發表在分子進化領域最具影響力的學術期刊《分子生物學與進化》和人類遺傳學領域最具影響力期刊《美國人類遺傳學雜志》上。隨后他的博士論文也入選復旦大學、上海市優秀博士論文以及全國百篇優秀博士論文。
發現現代人群“混血”普遍性
2006年,徐書華進入中國科學院上海生命科學研究院工作,繼續致力于“混血”人群研究。在金力老師的引薦下,他作為課題組長參與了10個國家共同發起的國際合作計劃—“泛亞SNP計劃”,在研究設計和科學問題的探討方面作出重要貢獻,并獨立承擔了幾乎全部的數據分析任務和研究報告撰寫。2009年相關研究結果最終發表在美國著名綜合學術雜志《科學》上。這項研究被《科學》同期配發的新聞評論文章認為是“迄今關于東亞和東南亞人群遺傳多樣性最全面的研究”。
對徐書華來說,研究中最大的收獲是發現了亞洲人群間普遍存在的基因交流,即“混血”的普遍性。這意味著“混血”不是只出現在某些少數人群中的一個特例,而是現代人類群體的常態。為此,盡管《科學》雜志對論文摘要的字數有嚴格限制,徐書華還是特地在其中強調了該發現,也得到了其他共同作者的支持。雖然在這篇主題為亞洲人群遷移歷史的文章中,“混血”的發現似乎被人們忽略,但卻更加堅定了徐書華投身“混血”人群研究的決心。
實際上,徐書華在其博士論文中就已經注意到中國人口最多的民族漢族,本身就是一個最大的“混血”人群,在漢族人群的基因組中可以鑒別出不同程度的周圍少數民族的遺傳成分,徐書華后續的一系列研究工作正是建立在這一理解上。同年,徐書華與金力教授在《美國人類遺傳學雜志》發表了關于漢族人群遺傳結構的研究結果,該研究被列為雜志當期“亮點文章”得到編輯的專門點評。
研究“混血”人群的環境適應
“從基因組多樣性和遺傳結構的角度,你完全可以把‘混血’人群看成是一個新的人群。”徐書華解釋道,“混血人群一般是由彼此隔離分化的祖先人群在近期大規模基因交流產生的。隔離分化幾萬年的人群,從原世居地遷移到數千里之隔的新地域,他們以及后代必然面臨新環境的壓力,經受自然選擇,也就是混血人群必然要有一個適應環境的過程。”
實際上,新建立的人群如美國黑人,在遺傳結構上顯著不同于其祖先人群,并且在新居住地新的環境中經歷了上十個世代的適應性演變,成為研究現代人類適應新環境可遇而不可求的天然素材。徐書華正是意識到了混血人群的這一特點,與他指導的博士研究生一起,建立了一種檢測自然選擇的新方法,利用合作者提供的全基因組數據,首先對典型的近期混合人群美國黑人進行了研究,發現像美國黑人這樣的混血人群在混血前后都受到了明顯的自然選擇。徐書華課題組的研究不但檢測到自然選擇信號更為可靠,并很好地解釋了美國黑人經歷的歷史和自然環境的變遷。他們發現,很多受自然選擇的基因與美國黑人的高發疾病相關,推測這些高發性疾病可能和美國黑人的非洲祖先最近經歷的巨大環境變化有關。
另外,該研究還發現,很多抵抗瘧疾的等位基因頻率在美國黑人中明顯降低,這反映了北美和非洲的不同病原體在人類基因組中留下了顯著的但不同的烙印,同時也提示人類生存環境中的微生物群落和體內的病原體可能是自然選擇發生的重要推動力之一。相關結果作為方法性論文于2012年3月正式發表在國際著名學術期刊《基因組研究》上。
利用“混血”人群遺傳結構特征估計人群遷移和擴張時間
徐書華近期的代表作之一,便是利用混血人群的遺傳結構特征和基因組重組信息,首次從遺傳學角度估計了亞太地區分布最廣的人群—南島人群的擴張時間。
南島人群是一個根據語言學角度界定的人群,其使用的語言都屬于南島語系。他們在地球上分布極為廣闊,東達南美洲西部的復活節島,西到東非外海的馬達加斯加,南抵新西蘭,北至我國臺灣省。
從生物學的角度說,與南島人群相關的科學研究都會牽涉整個亞太地區現代人類的起源和進化,以及現存人群遺傳多樣性和表型多樣性的形成機制等一系列關鍵且錯綜復雜的問題。因此,這個龐大人群的起源和遷移,一直以來都是眾多考古學家、語言學家、遺傳學家關注的焦點。
早在2009年,徐書華與合作者就在發表于《科學》雜志上的論文中,揭示了南島人群在遺傳學上的共同屬性。所謂共同屬性,就是指南島人群共享一種特有的遺傳組分,并且相較于外部人群,南島人群內部的遺傳親緣關系更為緊密。
但徐書華告訴記者,在生物進化和人類起源及遷移歷史研究的首要任務—時間的確定上,有關南島人群擴張的時間數據和證據,都來自考古和語言學界,盡管遺傳學家也進行了大量的遺傳學研究,卻鮮有強有力的聲音。
徐書華說:“這主要是因為人類在廣袤地域上的多方位、多次反復遷移和基因交流,使得根據基于單一遺傳座位(如Y染色體和線粒體DNA研究)明確估計人群擴張的時間變得很難。而常染色體由于重組,增加了估計基于突變數據信息時間的難度。人群之間基因的交流和基因組的交換重組,也給人群歷史的研究設置了重重障礙。”
不過,徐書華課題組利用人群遷移過程中,由于基因交流而產生的特殊遺傳結構,通過計算生物學的手段,推斷基因組中的重組信息,巧妙地利用這些“障礙”,首次從遺傳學的角度確定了南島人群在東南亞一帶的擴張時間,大約為4000年前。為確保結果可信,徐書華的德國合作者又使用另一套獨立數據和不同方法對進行了進一步驗證,與考古學和語言學的研究結果吻合。相關研究成果于2012年3月正式發表于《美國科學院院報》上。
新視角,新機遇,新挑戰
“你可能難以想象,我國的藏族也是一個混血人群”。徐書華興致勃勃地講起了關于西藏人群研究的故事。“從Y染色體的研究結果來看,藏族人群中至少存在兩種主要的Y染色體單倍群,我們用D和O代表。這兩個單倍群起源于不同祖先人群,且時間上相差幾萬年。如果在性染色體上有這么明顯的混合跡象,完全有理由相信整個基因組都是混血的。因此,可以肯定藏族是一個典型的混血人群。”徐書華試圖更透徹地解釋這其中的邏輯推理,“其實漢族這么大一個人群,也是一個混血人群,我在博士論文研究時就已經發現并指出。因此,可以看出混血是多么的普遍,但是這一點往往被人忽視。對于這些我們以為熟知的人群,實際上還有太多我們未知的東西,從不同角度看待他們,就會發現新的問題。從混血的角度探索這些人群的起源、遺傳多樣性形成和微觀進化機制,有深遠的進化生物學和醫學意義。但一旦決定從新的角度看待和試圖解決問題時,將有更多新的挑戰等待你。”徐書華補充道。
我國擁有研究“混血”人群遺傳的資源優勢,除了考慮到這個思路在國內外仍屬空白之外,徐書華更看中的是研究所帶來的重大科學意義和價值。未來,他將在總結自身學術背景、研究興趣和前期工作的基礎上,把“混血”人群的環境適應和基因相互作用作為今后5年著重的研究方向,并向國家自然科學基金委和科技部提交了申請。徐書華主要是通過計算分析的手段進行研究,雖然他的研究組已經有十幾位成員,但都只從事“干性”(計算和理論分析)研究,他近5年還沒有建立“濕性”實驗室(實驗觀測和產生數據等)的計劃。他希望先以“干性”研究為主,再通過國內外同行合作,最后做到“干濕”結合,從而系統地研究和解決感興趣的問題。
“在計算生物學研究所的框架下,很難像其他‘濕性’實驗科學那樣爭取到足夠研究經費來收集樣本和產生自己的數據,人們總是認為計算生物學研究只要有計算機就夠了。”徐書華顯得有些無奈,“在這方面,我的導師金力教授一直給予我很大支持,我很感謝他。但他自己也有一個龐大的研究組需要維持,團隊中那么多年輕人都需要發展空間,大家的研究興趣和方向不一樣,關注的問題和側重點也不一樣,我不能期望都按照我的思路來設計實驗和產生我需要的數據。目前,我的研究組主要依靠馬普學會提供的經費在運轉。今后,一方面我會爭取更大的國家和地方項目支持,另一方面,我也會尋求更廣泛的國際國內合作。”
對于未來,徐書華顯得躊躇滿志:“我現在已經開始受益于之前國際合作項目建立的網絡關系,目前許多研究課題的樣本和數據都是國外如德國、印度、馬來西亞和韓國等國家的合作者提供的,這種合作關系和范圍在不久的將來應該會進一步擴大,也一定會顯示出其影響力和優越性。”
積跬步,至千里
從2006年進入中科院工作至今,徐書華在“混血”人群的遺傳學研究道路上,已經跋涉了近6個年頭,如今他不僅建立了自己的研究團隊,還被德國馬普學會和中科院選中,成為迄今唯一一位沒有海外留學經歷的“馬普青年科學家小組”組長。德國馬普學會是國際知名的從事基礎研究的機構,通過與中國科學院30年的合作,德國馬普學會已成為中科院對外合作的一個重要伙伴。“馬普青年科學家小組”組長的遴選遵循公開、公平、公正的原則,這種人才選拔機制為引進海外優秀留學人員以及促進中科院科研體制改革發揮了重要作用,也為各相關研究所培養了一批青年學術帶頭人,現任同濟大學校長的裴鋼院士就是第一位“馬普青年科學家小組”組長。
“一個‘土鱉’博士,在自己的祖國拿著德國人提供的薪水和研究經費進行獨立的科研工作,自由探索感興趣的問題,對我個人來講是一種榮譽。”徐書華半開玩笑地說,“希望多年以后我的經歷,也能成為一個勵志故事,得到社會的關注,激勵更多的年輕人留在國內工作,同時希望政府在吸引‘海龜’的同時,也給于我們這些‘土鱉’們更多支持。”
徐書華年僅34歲,卻已經是上海市遺傳學會理事、多家外國研究機構的學術顧問、教育部自然科學獎一等獎的獲得者。他擔任過中科院、上海市、國家自然科學基金委等多個項目的負責人,以及國際合作項目“泛亞SNP計劃中”的課題組長,完成了一批有影響力的科學研究課題,為他的研究生涯寫上了重要的一筆。他的研究成果以第一或通訊作者發表在美國《科學》、《美國科學院院報》、《基因組研究》、《人類分子遺傳學》等國際著名專業期刊上,受到國際同行的關注。
徐書華多次受邀到韓國、新加坡、德國、意大利等多個國家的國際會議作學術報告,他獲得過諸多針對青年人才的學術獎勵和榮譽,包括中國科學院盧嘉錫青年人才、日本明治乳業生命科學獎、法國賽諾菲—安萬特優秀青年人才、上海市青年科技啟明星、中科院上海分院杰出青年科技創新人才、2012年度中科院“青年科學家獎”等。這些榮譽對徐書華來講,是一種肯定,也是一種激勵。
荀子說,不積跬步,無以至千里。累累碩果和光環的背后,沒有人知道徐書華為此做過多少次嘗試、熬過多少夜、投入了多少時間和精力、又經歷過多少次失敗。人們總看到你最終的成果和光環,卻往往忽視你背后付出的努力和遭遇的挫折。這句話用來形容徐書華,最好不過。