翁任楠 馬晉平/編譯
為科學(xué)發(fā)現(xiàn)而共享數(shù)據(jù)
翁任楠 馬晉平/編譯

馬克·弗雷澤
● “隨著帕金森病研究不斷深入,生物標(biāo)記物將發(fā)揮重要作用,而帕金森病相關(guān)生物標(biāo)記物的發(fā)現(xiàn)則是建立在科學(xué)家數(shù)據(jù)共享基礎(chǔ)之上的。”邁克爾·福克斯基金會資深副總裁馬克·弗雷澤(Mark Frasier)說道。
針對帕金森病的藥物研究目前正以史無前例的速度發(fā)展,這主要得益于多個基因靶點的發(fā)現(xiàn)以及針對其他疾病的藥物的成功轉(zhuǎn)化。臨床試驗證明,有許多研究成果能有效延緩甚至停滯帕金森病的發(fā)展。然而,臨床試驗?zāi)壳懊媾R一個大的挑戰(zhàn),科學(xué)家缺乏可靠的工具來評估帕金森病的病情進展,因而難以對不同病程的患者進行選擇和分層,結(jié)果他們也不清楚這些藥物能否對帕金森病的某一病程起作用。事實上,由于缺乏對帕金森病病程進行客觀檢測的方法,科學(xué)家?guī)缀醪豢赡苋ヅ袛嗄囊环N藥物是真正對治療帕金森病有效的。
被業(yè)界證實的帕金森病相關(guān)生物標(biāo)記物寥寥無幾,這并不是由于缺乏相關(guān)研究的數(shù)據(jù)。實際上,大量的觀察性研究和干預(yù)性試驗已經(jīng)提供了豐富的數(shù)據(jù)集,通過這些數(shù)據(jù)集挖掘生物標(biāo)記物的信息甚至復(fù)制出相關(guān)分子綽綽有余。問題在于,大多數(shù)科研團隊的數(shù)據(jù)和樣本的信息是互相保密的。10年來,生物醫(yī)學(xué)研究者對數(shù)據(jù)分享的態(tài)度越來越開放,然而這種態(tài)度的轉(zhuǎn)變在帕金森病研究領(lǐng)域內(nèi)才剛剛開始。帕金森病的研究者和基金資助方已經(jīng)習(xí)慣于從事短期的、以假設(shè)檢驗為中心的科學(xué)研究。“把精力放在信息數(shù)據(jù)庫平臺的長期搭建上”這種長遠的考慮已經(jīng)不復(fù)存在,也沒有基金愿意這樣做,數(shù)據(jù)共享更無從談起。
大多數(shù)生物標(biāo)記物的發(fā)現(xiàn)源于對疾病病理生理的理解。以阿爾茨海默病的研究為例,科學(xué)家在認識了淀粉樣物質(zhì)和Tau蛋白在患者大腦中聚集的機制后,以此為基礎(chǔ)鑒定出這兩個蛋白分子,進而促進了阿爾茨海默病的藥物研發(fā)。在帕金森病的研究中,針對多巴胺神經(jīng)元的影像學(xué)分子標(biāo)記物的研究已有所突破,但這種影像學(xué)標(biāo)記只能實現(xiàn)對病情發(fā)展的二級監(jiān)測,而不能直接反映根本的致病因子的變化。為了發(fā)現(xiàn)并證實更好的帕金森病相關(guān)生物標(biāo)記物,我們必須對疾病有更深入的了解:包括帕金森病的一系列癥狀和臨床表現(xiàn),發(fā)病前后的一系列分子變化以及這一系列分子改變對腦結(jié)構(gòu)和功能的影響。
有幾項研究正致力于研發(fā)新的帕金森病相關(guān)生物標(biāo)記物,這幾項研究包括:美國國家神經(jīng)性疾病與卒中研究所的帕金森病生物標(biāo)記物項目(PDBP),邁克爾·福克斯基金會資助的帕金森病病程標(biāo)記物計劃(PPMI),英國的帕金森病相關(guān)認知障礙發(fā)生率隊列研究與前瞻性評估(ICICLE-PD)。這些研究收集了帕金森病患者和他們的配對對照者的信息;PDBP項目和PPMI項目將數(shù)據(jù)上傳到網(wǎng)上實現(xiàn)實時共享。通過可穿戴設(shè)備、影像學(xué)掃描、血液樣品和腦脊液樣品的化驗等手段,研究者可以獲取患者的臨床數(shù)據(jù)以及醫(yī)生對患者的臨床評估。對這些數(shù)據(jù)集進行挖掘或許可以揭示帕金森病不為我們所知的病理生理特點,從而為生物標(biāo)記物的發(fā)現(xiàn)和驗證提供重要的參考依據(jù)。
目前,許多研究項目(包括了大多數(shù)臨床試驗)的數(shù)據(jù)集被儲存在大學(xué)或者公司的服務(wù)器中,這些數(shù)據(jù)庫猶如一個個有待挖掘的知識寶庫。臨床研究者是不會無緣無故去共享他們的原始數(shù)據(jù)的——要知道這是一個非常麻煩的事情,既要獲得研究對象的知情同意,又得解決共享數(shù)據(jù)的歸屬問題,還要對研究對象的個人信息進行數(shù)據(jù)加密。大學(xué)和公司里面的科研工作者對于數(shù)據(jù)共享有著相似的顧慮:數(shù)據(jù)的質(zhì)控問題,共享數(shù)據(jù)庫挖掘成果知識產(chǎn)權(quán)的歸屬問題,基于共享數(shù)據(jù)庫的研究發(fā)表造成的數(shù)據(jù)庫的貶值問題等等。當(dāng)然這些問題都有解決的方法,數(shù)據(jù)共享將是一個不可避免的趨勢。
在美國,人們大多樂于向科研機構(gòu)匿名分享他們的數(shù)據(jù)。科研工作者更應(yīng)該效仿這種做法。具體到實際行動中該如何實現(xiàn)數(shù)據(jù)共享呢?首先,項目資助者必須從項目開始就提出原始數(shù)據(jù)共享的要求,確保獲取研究對象知情同意后開啟基礎(chǔ)數(shù)據(jù)庫的建設(shè);第二,科研工作者應(yīng)當(dāng)通過適當(dāng)?shù)耐緩椒奖闼双@取同一標(biāo)準(zhǔn)的數(shù)據(jù)庫實體;第三,政府應(yīng)該出臺數(shù)據(jù)庫相關(guān)的政策來保證數(shù)據(jù)得到合理的加密(去身份化)并得到安全的數(shù)據(jù)保護。
這些措施的實現(xiàn)要滿足一個先決條件,那就是科研機構(gòu)應(yīng)該在分類法和命名法上達成共識。全球非營利組織——臨床數(shù)據(jù)交換標(biāo)準(zhǔn)聯(lián)盟正在研究實現(xiàn)醫(yī)學(xué)研究數(shù)據(jù)共享的通用術(shù)語,顯然,在帕金森病領(lǐng)域通用術(shù)語的標(biāo)準(zhǔn)化更加迫在眉睫。研究人員還需要尋找新的方法實現(xiàn)數(shù)據(jù)整合與分析并確定數(shù)據(jù)合并的類型(比如分子檢測、影像學(xué)數(shù)據(jù)和主觀的臨床報告的合并)。科學(xué)家還需要探索將多個研究的標(biāo)準(zhǔn)化數(shù)據(jù)進行匯總的方法。充分結(jié)合政府的金融和智力資源、實現(xiàn)公私合作伙伴關(guān)系的建立將改變科研的范式,讓人們對數(shù)據(jù)共享充滿期待。
數(shù)據(jù)共享在帕金森病的研究中正逐漸得到人們的重視。然而,這還遠遠不夠。隨著藥物研究的快速發(fā)展,對帕金森病的靶向生物標(biāo)記物的研究更加緊迫。基于已有的數(shù)據(jù)進行建庫和數(shù)據(jù)挖掘是高效研發(fā)相關(guān)生物標(biāo)記分子的前提。科研組織、政府、大學(xué)和產(chǎn)業(yè)的強強聯(lián)合勢在必行。比如,作為中立方,邁克爾·福克斯基金可以邀請利益相關(guān)者對數(shù)據(jù)庫基礎(chǔ)建設(shè)進行投資,促進資源共享和生物標(biāo)記分子的研發(fā)。只有通過合作才能盡快為數(shù)以百萬的帕金森病人研發(fā)出新的治療手段。
[資料來源:Nature][責(zé)任編輯:彥 隱]