

契合大眾對(duì)于理科生的一般想象,葉田田留著一頭短發(fā),穿著格子襯衫,臉上時(shí)常露出靦腆、溫和的微笑。她說(shuō),自己的工作很簡(jiǎn)單,基本是對(duì)著計(jì)算機(jī)和數(shù)據(jù),像獵人一樣從十幾億個(gè)DNA堿基對(duì)中尋找到與優(yōu)良性狀相關(guān)的基因。正如她的名字所攜帶的意象,這些單調(diào)、重復(fù)的數(shù)據(jù)具有無(wú)窮的生命力,編織著生命的“基因密碼”。
2022年6月14日,浙江省第十家省實(shí)驗(yàn)室湘湖實(shí)驗(yàn)室在杭州蕭山成立。一年后,葉田田從美國(guó)學(xué)成歸來(lái),加入了湘湖實(shí)驗(yàn)室淡水水產(chǎn)核心種源創(chuàng)制團(tuán)隊(duì)。她說(shuō),自己想為家鄉(xiāng)的水產(chǎn)行業(yè)和國(guó)內(nèi)的生物基因工作開發(fā)、驗(yàn)證好的工具和方法。
加州大學(xué)河濱分校位于南加州的洛杉磯以東,以杰出的農(nóng)學(xué)研究聞名全球。在讀博期間,葉田田專攻生物信息的數(shù)據(jù)分析,分析的對(duì)象很多,包括人類、小鼠、擬南芥、酵母等。不過(guò),她最想要“捕獵”的基因之一,藏在老家湖州的羅氏沼蝦里。帶著“能不能回國(guó)做點(diǎn)事”的想法,2023年7月她回到了國(guó)內(nèi)。
相較于周期更長(zhǎng)、不確定性更強(qiáng)的傳統(tǒng)育種方式,湘湖實(shí)驗(yàn)室開發(fā)的新一代育種技術(shù)“全基因育種”,能夠通過(guò)基因芯片技術(shù)把天然攜帶優(yōu)良性狀的基因提取出來(lái),再結(jié)合人工繁育苗種、人工養(yǎng)殖、人工配合飼養(yǎng),就能形成一個(gè)更高效和優(yōu)質(zhì)的產(chǎn)業(yè),可以有效靠捕撈滿足大眾的消費(fèi)需求。
舉個(gè)江浙人可能有感知的例子:這兩年,育種技術(shù)的提升直接反映在我們的餐桌上。翹嘴鲌,又名太湖白魚、銀刀,是一種生活在太湖里的淡水魚類,因肉質(zhì)細(xì)膩肥美,享有“天下第一鮮”的美譽(yù)。這道百姓桌上的珍饈,野生價(jià)格為每斤二三十元。通過(guò)人工繁育,價(jià)格降到每斤十元左右。
因此,像葉田田這樣能掌握基因挖掘精準(zhǔn)定位技術(shù)的人才,無(wú)論是在水產(chǎn)領(lǐng)域還是其他養(yǎng)殖領(lǐng)域,都非常稀缺。被聘為湘湖實(shí)驗(yàn)室首席專家之前,顧志敏在浙江省淡水水產(chǎn)研究所工作了38年,當(dāng)了12年的所長(zhǎng),研究方向一直圍繞著新品種開發(fā)、健康養(yǎng)殖等方面。談到葉田田,他不吝贊美之詞:“她很厲害!之前在浙江大學(xué)竺可楨求是班就讀,又到哈佛大學(xué)完成了本科畢業(yè)論文,之后在加州大學(xué)河濱分校完成計(jì)算機(jī)碩士和生物信息學(xué)博士學(xué)位。我們很需要這樣的人才!”
和葉田田差不多時(shí)間加入湘湖實(shí)驗(yàn)室的還有一批“90后”科研人才。“團(tuán)隊(duì)包含1名科研骨干和5名博士后,靠他們挑大梁。”顧志敏說(shuō)。
除了和數(shù)據(jù)打交道,擔(dān)任副研究員的葉田田、博士后揭育鹍負(fù)責(zé)采集樣本,對(duì)羅氏沼蝦進(jìn)行抗病研究;副研究員嚴(yán)軍軍負(fù)責(zé)基因編輯,劉翠專攻飼料營(yíng)養(yǎng)。
“他們的研究方向涉及整個(gè)產(chǎn)業(yè)鏈,意味著新品種出來(lái)以后,馬上就可以應(yīng)用。”顧志敏介紹,這個(gè)團(tuán)隊(duì)研發(fā)的羅氏沼蝦、紅螯螯蝦兩種液相基因芯片在全球范圍內(nèi)都屬首次,也順道打破了國(guó)外的“卡脖子”技術(shù),“借助新的液相基因芯片,水產(chǎn)新品種的培育時(shí)間能縮短一半,效率提升40%以上。”
在數(shù)以億計(jì)的堿基對(duì)里解開“基因密碼”
生物的性狀主要是由基因決定的,了解了基因,就等于找到了深入了解并且改造生物的一把鑰匙。水產(chǎn)品的育種,關(guān)鍵在基因。只不過(guò),基因測(cè)序只是“第一步”。羅氏沼蝦有30多億個(gè)堿基對(duì),鱖魚有7億多個(gè)堿基對(duì)。從大量基因中初步篩選出相關(guān)性基因,依舊是個(gè)不小的數(shù)字,如何進(jìn)行進(jìn)一步精準(zhǔn)定位?這就輪到葉田田出場(chǎng)了。她的日常工作就是建立數(shù)據(jù)模型,用計(jì)算機(jī)進(jìn)一步解開一段段“基因密碼”,將相關(guān)性基因準(zhǔn)確地挖掘、定位出來(lái)。
“我們通過(guò)建立數(shù)據(jù)模型,進(jìn)行基因檢測(cè)分析。比如說(shuō),通過(guò)分析,我們檢測(cè)到長(zhǎng)得高大的個(gè)體中,有幾個(gè)基因出現(xiàn)頻率比較高,就可以認(rèn)為這幾個(gè)基因可能跟生長(zhǎng)性能相關(guān)。”她說(shuō)。精準(zhǔn)定位特定基因后,就可以根據(jù)育種目標(biāo),利用基因編輯技術(shù),“敲掉”或者“植入”相關(guān)的基因片段,以改良品種。
說(shuō)起來(lái)簡(jiǎn)單,但想要精準(zhǔn)捕捉到特定基因,通常要花費(fèi)數(shù)以月計(jì)甚至年計(jì)的時(shí)間。“難點(diǎn)在于水產(chǎn)基因組的重復(fù)序列相對(duì)較多,尤其是蝦類,一整套基因組上可能有很多片段是重復(fù)的,這會(huì)讓測(cè)序拼裝面臨很大的挑戰(zhàn)。”葉田田說(shuō)。
除了工作時(shí)間,葉田田會(huì)花大量的時(shí)間閱讀文獻(xiàn):“我們需要了解國(guó)際上最新的算法和發(fā)展,包括現(xiàn)在用人工智能去做基因組相關(guān)的研究,這些技術(shù)的發(fā)展速度非常快,我們必須跟進(jìn)。”
在她看來(lái),人工智能在對(duì)自然語(yǔ)言的處理、與人的對(duì)話這些方面的發(fā)展已經(jīng)非常領(lǐng)先,但對(duì)基因組還處于探索應(yīng)用的階段。“基因組和人類語(yǔ)言的差別是很大的,所以不能照搬,但我們希望利用大模型和人工智能,進(jìn)行基因組算法的訓(xùn)練。”她期待,有一天能實(shí)現(xiàn)對(duì)基因功能的預(yù)測(cè),通過(guò)一個(gè)片段預(yù)測(cè)它的功能,包括基因編輯方向,用大模型判斷靶標(biāo)與基因編輯酶結(jié)合、編輯的效率等,以此更好、更快地篩選合適的靶標(biāo)。
從對(duì)人類、小鼠的研究轉(zhuǎn)向相對(duì)冷門的水產(chǎn)研究,葉田田依舊充滿熱情,她想要做一些好的、重要的、有影響力的工作,可以為水產(chǎn)學(xué)科進(jìn)一步開發(fā)、驗(yàn)證好的工具和方法。在她看來(lái),水產(chǎn)學(xué)科方向,研究人員相對(duì)較少,未知更多,也更具挑戰(zhàn)性,國(guó)內(nèi)發(fā)展也是領(lǐng)先于國(guó)際的,反而能取得更大的成就。
“好奇心強(qiáng),想要探索未知,所以才來(lái)搞科研嘛!”“90后”科研人葉田田如是說(shuō)。