喬若靜/編譯
大數據與癌癥研究
喬若靜/編譯
抗癌之戰中的大數據開發利用還處于初始階段,但這一前沿陣地正在不斷向前推進。

北卡羅萊納大學的諾曼·沙普利斯(Norman Sharpless)正在利用沃森計算機系統分析DNA數據
癌細胞突變分類基因組圖譜目錄包含有大約250萬字節數據,這一由美國國立衛生研究院(NIH)開展的一個龐大的研究項目,極大地提高了我們對各種形式癌癥的理解。但對于提供樣本患者的臨床治療經驗,我們了解的還相對太少。
在癌癥治療鏈的另一端,電子健康檔案中包含有豐富的個案信息,如充分加以利用,可極大地提高癌癥治療的水平。但實際情況是,這類病史記錄往往都被封存在各個醫院和醫療診所內。結果就是,“研究人員與大多數病史都失之交臂?!奔o念斯隆-凱特琳癌癥中心專攻乳腺癌的腫瘤學家克利福德·胡迪斯(Clifford Hudis)說道。
為提高癌癥治療水平,胡迪斯和其他許多研究人員合作,正在努力開發如何來利用醫療科研、病人護理和臨床試驗中產生的大量數據的方法。大數據催生的許多機會,已擴展到醫學界的大多數領域中,而“癌癥研究更是走在了最前列。”美國馬里蘭州一家醫療保健咨詢機構的醫療顧問林恩·伊瑟雷吉(Lynn Etheredge)說道。但是,多樣化的致命癌癥意味著,雖然研究取得了很大進展,但障礙依然多多。
伊瑟雷吉在2007年寫的一篇很有影響力的文章中提出了大數據處理的“快速學習系統”,他認為,我們已進入了一個新的癌癥研究和治療的歷史時期?!拔覀冎溃┌Y是一種與基因相關的疾病,而我們擁有對癌癥進行分析的數據基礎和計算能力?!彼f。
懷著對盡早成功開發個性化癌癥藥物的希望,腫瘤學家和計算機專家正在共同努力,充分利用數字化信息,并將其運用到臨床診療實踐中。然而,面對這樣的一項新興事業,他們需要克服隱私、數據所有權以及可持續商業模式等方面的困難和障礙。“大數據既是一種研究工具,也是一種專營商品?!币辽准f道,“這一領域仍處于早期發展中,我們需要解決的問題還有很多?!?/p>
在美國,許多機構組織通過將大數據運用到癌癥臨床實踐中,使其在癌癥治療的一些方面走在了世界前列。這其中有四個決定性的因素:快速成長的新興公司;專業的項目計劃;強大的計算機能力;以及一個以癌癥研究為中心的學術網絡。
2009年,馬薩諸塞州劍橋博德研究所的科學家們創辦了一家基礎醫學公司,專門從事對腫瘤學家提交的病人組織樣本進行基因測序和分析,然后與公司龐大的數據庫以及其他公共數據庫中的數據進行對照,從中篩選辨認致癌基因?;A醫學公司數據庫中的數據來自50 000以上癌癥患者的資料。
“公共數據庫與谷歌不同,腫瘤學家沒法通過簡單的途徑搜索與自己病人所患腫瘤相關的致癌基因?!被A醫學公司首席執行官邁克爾·帕利尼(Michael Pellini)說道,“我們對組織樣本進行分析,然后將分析結果反饋回治療實踐,或以美國食品藥品管理局(FDA)批準藥物的形式反饋,或是以臨床實驗的形式反饋。”
對于一些疑難病癥,腫瘤學家也可以在基礎醫學公司的客戶網絡端咨詢,以期獲得可能的建議。帕利尼說道,網站會在72小時內作出回應,將一些數據綜合匯總發送給醫生,咨詢者可以從中權衡,哪一種特定藥物或治療方法有可能會是有效的。公司的宗旨是盡可能地將客戶數據運用于更廣泛的臨床實踐和醫學決策中。
2015年1月,瑞士制藥業巨頭羅氏公司以10億美元的價格,收購了基礎醫學56%的股權,以推動個性化癌癥診療和相關藥物開發。
2015年底,美國臨床腫瘤學會(ASCO)預計將推出CancerLinQ平臺,這個平臺旨在通過對成千上萬腫瘤治療案例中獲得的電子健康檔案進行分析綜合,為醫生們提供更多臨床實踐經驗——腫瘤學家通過訪問CancerLinQ平臺,從中可以了解特殊案例的治療效果,然后對照己有的治療方法,為進一步開發新的治療方案開拓思路。
“我們所知道的癌癥治療案例來自于登記注冊的臨床試驗,而這些案例只占癌癥確診患者的3%?!痹贑ancerLinQ平臺理事會任職的胡迪斯說道,“有了CancerLinQ平臺,我們可以從97%以上未直接參與研究項目的腫瘤學家那里獲得更多的經驗?!?/p>
迄今,已有15個規模不等的小組開始了這方面的實踐,預計到2016年ASCO將擁有50萬份癌癥患者的醫療檔案。研究者和臨床醫生能夠通過查詢這些病史記錄將其與患者的治療效果進行比較。如此龐大數量的數據,可有助于明確某種特定藥物或治療方案的有效程度。
“CancerLinQ所做的最重要的事情是報告治療結果,例如,接受了某種特定治療方案的患者生存期更長,或病情發展得到緩解等。”ASCO質量研究所醫療主任、腫瘤學家羅伯特·米勒(Robert Miller)說道。
2013年,在一項針對17萬乳腺癌患者進行的研究中,通過了CancerLinQ平臺的一個原型測試。據米勒稱,未發表的一些數據表明,該系統可以突顯不同醫療實踐提交數據的特點和效果。例如,他們是如何通過刺激產生更多紅細胞來治療化療后貧血的。
CancerLinQ平臺從電子健康記錄中提取病人數據,對數據進行匿名化處理,然后將它們與其他類型的數據信息,包括醫生的筆記和生物標記等整合在一起。其目的是當醫生在對病人進行診斷和治療過程中有疑問而難以決斷時,這些數據將能夠支持他們及時做出決策。
CancerLinQ平臺的運行目前還是依靠捐贈,但米勒說道,隨著時間的推移,這個平臺將通過出售有效性報告和數據研究工具而獲得更獨立的生存能力?!拔覀冋诳紤]與CancerLinQ平臺合作開發相關的一系列產品和服務,以幫助降低系統的運營成本。”米勒說道。
大數據需要龐大的計算能力,2013年IBM成立了一個獨立的業務單元:“沃森健康部門”(Watson Health unit),為結合了自然語言和學習能力的沃森認知計算機系統提供更多的商業機會。沃森儲存的生物醫學知識包括:公共醫學(PubMed)數據庫中的所有摘要、美國國家癌癥研究所(NDI)的藥典(批準藥物和臨床試驗數據)、癌癥體細胞突變的完整目錄數據庫以及其他多種來源的數據。
沃森認知計算機系統于2011年在美國電視智力競賽節目Jeopardy中以擊敗人類冠軍而出名。IBM沃森健康部門與十多個醫療機構、癌癥中心和研究機構都建立了合作關系,IBM研究在紐約的計算生物學中心主任艾杰·羅伊魯(Ajay Royyuru)說道。
例如,紐約基因組中心需要借助沃森計算機系統對膠質母細胞瘤患者的DNA突變進行篩選。膠質母細胞癌是一種會致命的腦癌。
紀念斯隆-凱特琳中心和得克薩斯州休斯頓MD安德森癌癥中心的醫生們,正在升級沃森系統成為一種臨床支持工具,一種能夠在電腦上展示匿名假設病例的程序。例如,一位患者的腫瘤細胞測試中,發現其STK11的基因缺陷呈陽性,可用糖尿病藥物二甲雙胍醫治,羅伊魯解釋道。但沃森可能不會推薦二甲雙胍,因為這是一個標示外的藥物?!巴ㄟ^這個實例我們知道,需要教會沃森更多的東西,將網撒得更大?!绷_伊魯說道。
安德魯·塞德曼(Andrew Seidman)是紀念斯隆-凱特琳中心的乳腺癌專家,他補充book=42,ebook=43