Marcello Ienca,等 著,劉 暉,黎 莉 編譯
普適計算和醫療信息學的興起使大規模收集、共享、匯總和分析前所未有的大數據量成為可能,這種現象被稱為“大數據”。本文回顧了關于癡呆癥大數據研究的現有文獻,以及該領域的商業可用移動應用程序。分析表明,癡呆癥研究和護理的大數據方法有望改進目前的防治和預測模型,揭示病因,實現早期診斷,優化資源分配,并為具有特定疾病進程的患者提供更多量身定制的治療方案。但是,這種承諾的前景尚未完全實現,并引發了一些技術、科學、倫理和監管方面的挑戰。本文對這些挑戰進行了評估,并為研究、倫理和政策的未來發展規劃了路線。
未來幾十年,癡呆患病率可能會增加三倍,醫療系統和護理人員將承受難以控制的壓力。因此,人們對癡呆癥的防治及早期認知衰退檢測工具的研發有迫切渴望。阿爾茨海默病(AD)生物標志物的鑒定對于早期防治十分重要。綜合多生物標志物和病因學路徑的多維模型比基于單因素假設的還原學方法更有前途。最近,全球對大數據研究興趣激增,蔓延到包括癡呆癥在內的許多醫學和健康領域。
基因組數據、電子健康記錄(HER)、裝有傳感器的移動設備及可穿戴裝置、手機應用程序、信用卡等多種手段使得預測醫療將成為因大數據將產生變革的領域之一。生物醫學研究產生大量數據,通過各種數據庫和生物庫存儲和共享及二次使用,合成能夠提供一個人的健康狀態的多維信息,即我們的“數字表型”,隨之引入“數字健康”的概念。前所未有的大量數據產生使得醫療領域可能形成新的突破。
利用大數據的收集、匯總和預測分析可以重啟癡呆癥的防治和護理研究。大數據具有為病因學帶來新亮點的潛力,可實現更及時的診斷和預防,并可能克服當前的治療局限性。通過實現EHR,分子生物標志物,神經影像生物標志物和移動健康(mHealth)數據的整合,這一潛力更有可能實現。
2017年10月,以“大數據”和“癡呆癥”為關鍵詞搜索PubMed,獲得了九篇同行評審文章和一篇會議論文。這些文獻的數據來源包括EHRs、互聯網搜索和基因數據,不包括移動健康數據。對Google Play和iTunes的平行搜索表明,目前有35款移動應用幫助衛生專業人員篩選AD和認知能力下降。進一步的篩選表明,大數據方法對癡呆癥的研究進行分析。例如,AD的DREAM處理:①預測認知評分在初始評估后2年的變化;②理解對淀粉樣蛋白病理學的適應力的生物學基礎;和③使用神經影像將個體分類為診斷組。這些成果利用了大數據集,如阿爾茨海默病神經成像倡議組織的數據庫,并利用包括遺傳學、神經影像學、認知評估和人口統計學信息在內的多種數據來源。
另外,在2013年至2015年期間,經濟合作與發展組織發布了五本政策文件,闡述癡呆護理和研究中大數據趨勢帶來的承諾和挑戰。
大數據可能在未來有助于揭開AD的病理難題,揭示AD的病因。大數據可以跨越不同類型和尺度,實現多模式(具有來自綜合數據源的不同數據采集模式)和多標量(從分子到行為和人口規模)的統計數據關聯,這可能會解決目前不同數據整合缺失的問題,有助于“瞥見大局”。研究人員利用了多種數據源,包括神經影像學、手勢跟蹤和視網膜掃描,開發了智能算法來檢測在癥狀發作之前的結構(例如腦結構的變化)或功能性異常,其中一些研究顯示預后和預測潛力。與此同時,一些手機應用聲稱能夠通過游戲行為或心理檢查來發現認知能力下降的早期跡象。正如經合組織的一份報告所述,從不同規模尺度(從分子到整個人群)和信息類型(從神經生理到行為)的數據整合可能有助于開發精準藥物解決方案。
大數據和移動應用程序以簡化認知衰退早期跡象的檢測。這些工具的普遍性和易用性幫助自我檢測的同時也導致假陽性診斷的數量增加。過度診斷和醫療對衛生系統和患者都有影響。后者面臨保險和就業歧視、污名化和心理傷害的風險,而衛生體系可能應對不必要的經濟和組織成本。
移動健康應用程序在癡呆癥中的這些下游效應說明專門的法規監管十分必要,美國食品和藥物管理局、英國醫藥和保健品監管機構等監管機構已經著手參與。同時,我們觀察到一些應用程序沒有其產品有效性的足夠信息,或者他們處理客戶個人數據的方式。消費者需要有效的激勵和懲罰措施來確保其利益。大數據研究建立大規模的個人數據庫,導致數據管理、保護、匯總、交互性、隱私以及收集、使用和共享此類數據的知情同意方面的監管面臨挑戰。這些問題目前正在倫理和監管部門進行辯論。
除此之外,由于部分臨床試驗中涉及的電子病歷、移動設備數據和經濟數據等的使用和獲得也是一個緊要問題。在像癡呆這樣的恥辱化情況下,利用多重數據而發現認知功能下降的早期跡象,給患者帶來了特殊的倫理挑戰,至少應該讓患者(或其法定代理人)了解此類活動并給予選擇退出的選項。
為了克服上述結構性挑戰并確保癡呆癥大數據研究的成功,在研究方法、數字基礎設施和融資以及倫理和監管方面都需要綜合方法。
在科學層面上,需要明確劃分大數據驅動研究的闡釋力。通過分析工具進行大規模數據收集和進一步挖掘,從而在異質數據源之間建立可靠的統計關聯。專家呼吁將大數據方法與基礎神經科學相結合,將大數據分析建模和模擬相結合可能會克服單獨分析生物標記物的還原主義生物學方法的不足,解決目前癡呆癥研究的局限性。
癡呆癥研究和護理的數字基礎設施需要升級。數據存儲,處理和訪問的安全基礎設施需要維持并加強,并保證不同數據庫的互用性(例如遺傳生物庫、神經影像庫和電子衛生保健數據平臺)。政府和企業之間的積極合作是一種可行策略。然而,大型ICT公司占用衛生數據可能會引起公眾不安。
目前,對于收集和共享個人健康數據的穩健倫理指導方針將有助于大數據研究,同時保持公眾信任并保護數據主體。但現有的監督機制(如倫理審查)和傳統的知情同意模式似乎不適合大規模數據收集。就涉及結構化和非結構化數據的大規模儲存庫的研究而言,新型數據分析工具來評估研究協議的臨時標準十分必要。此外,目前形式的知情同意不利于數據主體(或其代理人)充分控制關于其認知狀態的個人信息。這是人們將數據提供給研究人員的首要障礙。人們正在探索新的機制,使客戶能夠進行更細化的數據控制,例如通過實施數據可移植性權利,或引入電子同意管理機制和參與式數據治理。然而,由于大數據和真實性研究的縱向性質,從認知功能可能隨時間減弱的受試者那里獲得的初始同意是否一直有效存在疑問。因此,需要特別的監督機制(例如前瞻性的指導),在保護這些患者的權利和受益的同時促進科學進步。
就隱私和數據安全而言,研究人員和監管機構需要承認,即使深度表型數據的匿名化也不足以保護隱私權。考慮到關于認知數據的敏感性及頻發的大量的數據泄露,加強有效監管和技術手段來支撐數據安全至關重要。隱私保護技術(如加密和塊鏈)需要納入當前數據傳輸的數字基礎設施,以促進和維持個人在數據收集和共享方面的信任。