
深圳華大距機場60公里,那是由舊鞋廠改造的一座小樓,小樓里的條幅說“數據才是硬道理”,小樓后面的山上,這群建筑的二期工程正在施工。3年前,考察過這個地方后,《經濟學人》在報道中寫下:“基因組學的下一個進步將發生在中國。”不過,直到今天,出租車司機們大多還不認識這個地方。
訪談在論文墻(張貼了六十幾篇頂尖雜志的學術論文)背后的會客室進行——論文墻上多是頂尖學術雜志的封面,這是從這里曾發表過的五百多篇論文中精選出來的。王俊穿件個印有“華大”字樣的紫紅色Polo衫,平頭,高個,語速快,精力充沛,籃球場上,這是個得分型選手。根據這位37歲的華大基因研究院院長的微博,這些日子,他先是在舊金山跟人討論“預測天氣與預測乳腺癌患者存活時間哪一個更準”,然后在網上提醒到四川地震災區參與救助的華大技術人員“警覺任何可能發生的疫情,也要注意水源、食物的監控”,之后上飛機回國,一早到深圳,把行李丟在自己的卡座,去開院務會議,中午接受采訪,下午先處理文件,然后飛杭州,去機場的路上參加一場電話會議,飛機上修改PPT,第二天在一場關于流行病學的杭州Workshop上講課。
這位生物信息學家認為,基因組學研究其實只有3件事:讀、懂、應用。對于測序,他說:“這本身只是個技術,這個技術希望達到的目的是對人類自身和我們身邊的世界在基因水平上的認識”。這種基于基因序列的認識與過去如此不同,“如果說傳統育種技術是在魚塘里釣到了魚,或是拉網捕魚;我們則是把水放干,讓大家看到所有的魚。”
去年12月,王俊入選《自然》雜志評出的“2012世界科學界年度十大人物”,他是惟一的華人。《自然》把相關報道文章定名為:“Genome Juggernaut”,旁白說:“中國測序研究重地的領導者,展示了華大基因在基因組研究方面的雄心抱負。”如何翻譯“Genome Juggernaut”?王俊自己認可的譯法有點奇怪:“基因組劍圣。”
王俊與基因組學研究結緣,是個無心插柳的故事。
時光回到1999年,像往常一樣,王俊在操場上打籃球,一個名叫楊煥明的人來到北大進行講座。講座結束,楊煥明和北大生科院博導李松崗教授進行交流,并希望有既懂計算機又懂生物的年輕學生參與到自己的項目中來。李松崗教授想到了自己的學生王俊,這位讀研究生二年級學生基礎課已修完,正要選擇研究題目。
楊煥明準備加入人類基因組計劃。那是與曼哈頓原子彈計劃和阿波羅計劃并列的三大科學計劃之一,該項目計劃花30億美元、十多年時間測出人類的所有基因,像醫學里畫解剖圖一樣,畫出人類的基因地圖,以有助于我們認識疾病、長壽、衰老等生命現象的機制,為疾病治療提供科學依據。同年,北京華大基因研究中心成立并代表中國參加人類基因組計劃。
當李教授找到王俊的時候,這個年輕人仍在球場上。據王俊回憶,最初他對去遺傳所人類基因組中心并沒有顯示出特別的興趣,后來,“李老師激將,你想去人家還不一定要呢”,就去了。
“我這人,請將不如激將。”王俊說。在這個大項目中,既有生物背景又有計算機和數學能力的王俊迅速找到了自己的位置,這個20歲剛出頭的研究生成了這里生物信息平臺的主力。
到了2001年,華大所承擔的人類基因組任務已進入尾聲,目光移向了水稻。水稻是最重要的糧食作物之一,它的基因組是禾本科糧食作物中最小的,易于進行遺傳操作,是禾本科植物基因組研究中最常用的“小白鼠”。對這個作物的測序,既有經濟意義,又有科學價值。
當時的不利條件之一是,日本牽頭的“國際水稻協作組織”剛剛宣布年底將完成水稻基因組草圖。在這個發展飛快、競爭激烈的基因研究領域,比對手晚一步,“價值就會大打折扣。”根據《科學》雜志的報道,“用74天的時間,華大完成了水稻的測序,數據迅速送往信息分析團隊……”最終,比對手提前了約一個月,華大發表了自己的結果。
在對這個團隊的特寫中,《科學》提到了實驗室中那些“年輕而不知疲倦”的面孔,那些寫著“速度、速度、速度”的橫幅,以及杭州華大計算機室一角的一把鋤頭,意思是“數據挖掘”。
中國的實驗室令來自西方的記者吃驚,他寫道,“這里的實驗室氛圍更像大賽前的美國中學。”在那篇報道中,一位普度大學的教授評價:“中國人展示了人類能做到多快”,幾乎負責籌建了杭州華大的王俊形容:“像投入戰斗一樣。”
在《水稻基因組序列草圖》近百位作者中,王俊是第三位并列第一作者,這個尚未畢業的學生第一次顯露了他在基因研究領域的潛質——根據當時的測序方法,整條的基因被隨機地切成數百個堿基的片段,只要片段的數目足夠多,切得足夠隨機,就可以借助片段頭尾的相互覆蓋把它們拼接起來——當然,這只是理想的情況,實際情況是,大量的重復序列會導致錯拼。而王俊所負責的生物信息部門,就是主要負責這些片段的拼接和分析。為了解決這些重復序列,這個團隊想了很多辦法,使得拼接接近了理想狀態。
為什么王俊會脫穎而出?王俊的導師李松崗講了個故事。剛進華大的時候,王俊被分配去完成一個任務,去四川康定采集蟲草。“當時幾乎過了采集的季節,同去的另一個人覺得反正采不著了,就放棄了。王俊認為,還沒有到過那個地方,沒有盡到自己最大的努力,不能就此放棄。”長途跋涉后,他采回了可用的樣本。
一位在華大工作過的研究人員告訴本刊:事實上,正是像王俊這樣的年輕人百折不撓、不達目的不罷休的個性在華大的成長中起到了重要作用。

之后進行測序的,包括SARS病毒、家蠶基因組、第一個東亞人基因圖譜、大熊貓基因組,海量的數據涌來,用生物信息室的“鋤頭”進行“數據挖掘”,尋找它們的生物學意義和價值就成了最重要的事情。
對于這些完全不同于我們過去認知的基因信息,要尋找數據中能用的知識并不是件易事。把基因信息看作一種語言,你就會發現其中的難處,就像你被空投到了另一個世界,這里的人在說話,你知道那些話對你很重要,卻聽不懂。惟一的辦法是聽、觀察、篩選——哪些是常用詞,哪些是特別的詞,哪些詞意味著疾病與死亡,哪些詞可以逆襲。
這就是不斷需要進行基因測序的原因,王俊說:“要在很大數據樣本的基礎上,才會出現一些規律性的東西。”“比如我們做的水稻的項目,先是水稻的基因測序,然后是水稻的表型和基因的關系,再然后,水稻未來的育種……事實上,這是一個很大的科學設想,就像從人類基因組計劃走到基因和疾病,往往當你看一個片段時,總覺得這只是個簡單的片段,但長遠來看,每一步都在一個大的設想之中。”
依靠國家開發銀行的一筆10年15億美元的貸款,2010年1月華大基因訂購了每臺單價數十萬美元的128臺高通量測序儀HiSeq2000,這是有史以來對測序儀所下的最大的一筆訂單。到今天,華大已經擁有137臺高通量測序儀,測序能力是全球總測序能力的一半以上。而這種“神機”的速度,一位工作人員介紹:“測一個人的基因組,人類基因組計劃用了13年,用升級后的新測序儀只需27小時。”
對購買這些測序儀的理由,在辦公的那個臨窗卡座上——在這個平均年齡只有23歲的研究院,院長并沒有專門的辦公室,只有一個雜志和資料堆成山的卡座——王俊解釋:“我們只是順勢而為,并沒有刻意要成為全球最大或什么的。想做的事情,倒推過來需要這樣一種測序能力和分析能力,最終規模就變成了今天的樣子。”
當時的一篇報道中,曾是人類基因組計劃奠基人之一的華盛頓大學教授Maynard Olson對這個機構評價道:“這是應對基因科技這樣極速發展的科學領域的中國式的解決辦法,時間會證明(它的效果)。”而“底線是華大必須給科學界帶來真正令人興奮的東西”。
這一年1月,華大啟動了“1000種動植基因組計劃”,開始從科學界征集測序物種提案;3月,《自然》雜志以封面故事著重介紹了由中國深圳華大基因研究院主要承擔的“人體腸道菌群元基因組參考基因集的構建工作” ……這個機構開始逐漸把研究方向集中于與農業和健康相關的基因科學上,并開始邁向社會化。
測序工作的外包是否會成為相關科研領域的趨勢?王俊的答案是:會兩級分化。一方面,測序儀會越來越容易操作和“用戶友好”,一些實驗室的測序工作可以很容易自己來做;另一方面,對于另外一些數據量巨大的測序工作,大型測序中心有存在的必要性。就在今年,華大完成了對生產測序儀的CG公司(Complete Genomics)的收購。
在健康領域,華大能做什么?一位華大員工舉了幾個例子。正如世界上沒有完全相同的兩片樹葉,每個人在基因組上都是存在差異的,在給病人制定治療方案時,不同的基因型對于治療方案、藥物的效果是不一樣的,我們可以通過對病人基因型的檢測來指導治療方案的制定,以達到更好的治療效果,同時把副作用減到最小,這也是最近大熱的量基因型給藥的“個性化醫療”。另一個公眾認知度更高的例子是對遺傳疾病的“產前篩查”,很多已知的疾病是由基因直接決定的,很多發育缺陷的嬰兒,如唐氏綜合癥,原因就是21號染色體多出了一條,在受孕初期就可以通過檢測孕婦血液中的游離胎兒的基因片斷,從而通過干預措施避免發育缺陷患兒的出生。
在水木社區的生物信息學版塊,一群學生正在討論是否要在畢業后選擇華大,一位過來人評價:“華大最大的優勢并不是提出問題,而是解決問題。但面對大規模測序技術,有很多問題都是自然浮現的。”談話者舉了個例子,從人群間基因組差異這個出發點開始,把焦點集中在“如何分類人群”這一點上,很容易提出非常多的問題,例如人種間差異,運動能力差異等。這場討論,最終的結論是:在這個領域,還有很多事情可以做。

人物周刊:你對自己的現狀滿意嗎?
王俊:我沒考慮過這個問題……不過,對于我們想做的事情來說,今天(的成績)還遠遠不夠,從這個角度來講,華大距離希望成就的那份事業,還有一定距離。
人物周刊:你今天取得的成就,有什么心得可以與他人分享?
王俊:我對現狀還不那么滿意,還談不上成就。如果你想做的事情只是發表一篇高水平的論文,論文發表了,你就很有成就感;但如果想做的事情有點大有點遠,現在就還處于一種奮進的過程中。
人物周刊:對你父母和他們成長的年代,你怎么看?你理解他們嗎?
王俊:我們所做的工作,我父母應該知道吧。我們做的這些項目,如果普通人完全不知道,不能服務于這些人,那也做得太陽春白雪了。我們希望我們所做的東西能對他們有用,我父母也知道我在做一件偉大的事情。
人物周刊:你對這個時代有什么話不吐不快?
王俊:中國一直在談戰略轉型,生命科學領域應該是個機會。中國在這個領域有很多方向都是一流的水平,國際上看,這個領域的很多新的發現都是由華人來做的。而這方面也有民生需求的帶動,如果從政府到各個機構共同努力,在生命科學相關的領域上,是有些路子可以走出來的。
人物周刊:你覺得你同齡人最大的問題是什么?
王俊:我覺得年輕人有年輕人的優勢,不說問題吧。我們華大的年輕人平均年齡不到二十六歲,科學部分的平均年齡不到二十三歲。這些年輕人是些非常有創造力的個體。給他們機會、好的平臺和充分的信任,他們能夠出一些非常好的成果。
人物周刊:你認為什么樣的人稱得上有領袖氣質,在當下的人中,你最欽佩的是誰?你的同齡人中夠得上青年領袖的還有誰?
王俊:從來沒想過。有遠大目標的年輕人,愿意為了這個目標去持之以恒地努力奮斗,更愿意團結一批人為這個目標而努力奮斗,團結的人多了,就是領袖了。事業和目標本身夠遠大,團結的人多,這種氣質就自然形成了。周圍,有領袖氣質的人很多。
人物周刊:權利、責任和個人自由,你最看重哪一個?
王俊:對我來說,肯定是責任更重要。想做的事情這么大,管著這么大的團隊,要排序的話,肯定是責任第一位。
人物周刊:對你影響最大的一本書、或者一部電影?
王俊:我在不同時間段會受不同的書和電影的影響,你要問我在過去37年受了哪一本書或者一部電影的影響,我還真舉不出來。如果一定要說,某一類書吧,我比較喜歡人物傳記。電影,我更喜歡那種引人思考的電影。
人物周刊:對你來說,什么是最重要的?
王俊:重要的是利用基因科技造福人類。不管是誰最終引領,生命科學這個浪潮都會往前走,我更希望我們能夠在其中起到引領作用。
人物周刊:你幸福嗎?有沒有什么不安?現在最大的擔憂是什么?
王俊:警覺是隨時會有,但還談不上恐懼和擔憂。
幾天前,安吉麗娜·朱莉的手術也許是基因診斷時代的一個里程碑,而王俊所從事的就是與基因有關的研究。1999年,23歲的王俊參與了人類基因組測序,之后是水稻、家蠶以及炎黃基因,去年, 作為中國測序研究重地的領導者,他被選為《自然》的“世界科學界年度十大人物”。他說:“不管是誰最終引領,生命科學這個浪潮都會往前走,我更希望我們能夠在其中起到引領作用。”