趙小文
醫學大數據的架構具有很強的擴展性,在獲取人體的基本數據以后,不僅可以構建人體的解剖結構和生理結構,而且可以從分子層面去構建微觀模型。例如,基于一些復雜的數學模型,可以從DNA序列推演到mRNA結構,最后構建這段DNA序列表達的蛋白結構。近年來包括醫學在內的多種學科不斷交叉融合,學術界的交流以及創業公司都在努力推動多種技術的融合。在醫學上不僅僅牽涉到臨床醫學,同時涉及生物學、分子生物學、細胞生物學、化學等等,以及自動化,包括檢測、統計、分析、影像等方面都會涉及。當然,數學肯定是最基礎的,建立數學模型、復雜的算法都跟數學基礎息息相關。新興的大數據即數據科學,也離不開基礎的計算機科學。所以,未來醫學是眾多學科融合的綜合科學,大數據的價值是眾多領域量化的數據融合,這就是技術趨勢。
市場需求是重要驅動
去解決實際臨床問題更多依賴于醫生的經驗,不論是生理層面還是分子層面許多都還沒有被完全的量化,而是記錄在醫生的經驗當中。醫院也已經采集到很多數據,存放在不同的計算機系統中,但是基本以數據孤島的形式存在,并沒有被充分利用和挖掘,而這些其實就是做基礎研究最重要的數據。
醫學大數據發展有三大價值驅動力,首先是生活質量的提高,人們對生命質量或者是健康質量的不斷追求和高標準的要求;其次是在高品質生命健康需求下促使成的生命科學技術的進步;最后是基于生命科學技術進步的臨床手段不斷豐富,臨床治療質量不斷提高,這就是整個醫學大數據價值驅動的核心。此外,巨大的患者人體組織器官替換的市場需求也是重要的驅動因素。
整個再生醫學行業的大背景是全球每年大概有8000多萬的各種組織器官的需求,包括臟器器官、軟骨、胰、顱頜面、眼膜等,目前只能通過捐獻滿足,而捐獻所能滿足的需求是非常有限的。所以,眾多科學家希望可以獲得除了捐獻以外的方式來替代和滿足大量的需求。脫細胞異體移植是正在研究的一種方法,即從供體上取出的組織脫細胞后,種植受體的細胞進行培養,然后再移植到新物體上。比如豬或牛跟腱組織取出來進行脫細胞處理,然后異體組織移植。自體移植的方法可能會造成二次創傷,而異體移植也可能因為分子層面未被認知的部分影響生物的生存。所以,眼下的科學家研究采用人工合成、天然高分子或者生物仿生等材料,構建人體組織器官的結構,如骨骼的結構,把細胞種植在上面,然后再做培養骨骼的移植,目前大量的實驗證明這種方法是可行的。每個人的人體骨骼從頭到腳的結構都不一樣,不同骨骼的功能也不一樣,有的是起支撐作用,有的是為神經和血管等提供營養供給載體,有的起保護臟器的作用。因此需要針對每個患者的骨骼等受損組織器官的微結構進行精準構建,而組織器官微結構的精準構建需要通過艾科賽龍進行精準的解析并構建,然后才能提供給臨床去做治療。在中國通過捐獻方式獲得器官移植的每150萬人當中,只有1萬例獲得捐獻,其余的因未能得到及時治療而死亡。癌癥、新發腫瘤、心腦血管疾病等患者數量,再加些意外創傷、事故等患者人數,再生醫學技術的需求將越來越大,并且日趨緊迫。
國內對精準醫療的理解主要是停留在基因層面上,而精準醫療的概念在外科領域最早被提出,精準醫療其實是針對個體化治療的、針對個性化各器官的醫療服務。例如,骨組織的修復,完整的骨組織功能重建,需要匹配生理環境,這也是精準治療的范疇。重塑精準醫療的整個流程首先是基礎數據的采集,這是醫學大數據的挖掘的基礎,數據的采集方式很多,包括臨床經驗數據、自動化設備的影像數據(CT、MRI)、基因測序數據等。其次是數據的解讀與分析,通過建立相應數學模型、采用機器學習等技術對醫學數據進行挖掘。接下來是臨床治療和技術支持,把數據解讀和分析的結果變成實用、落地的產品或方案,用于臨床治療或技術支持,如個性化解決方案、手術導航板及個性化植入物等。再者結合個性化治療的量化指標,跟蹤隨訪、復診,形成精準醫療的閉環。最后,將匯聚眾多的臨床經驗、數據進行完整的解析與融合,形成精準醫療完整的路徑和思路,從而建立巨大的精準醫療系統。這個系統不僅包含外科,也會涵蓋內科。借助這樣一套巨大的系統,將骨骼等外科以及臟器等內科學所涵蓋的組織器官量化解析,從數據開始重塑整個精準醫療體系。
數據融合讓結論更精準
人體生理環境下各種數據是有相互關聯性的,單個數據拿出來,如影像數據與血液的檢測數據,與單個細胞或者干細胞是什么關系?在人體外的彼此間的關系不大,所以必須構建彼此之間相互關聯的系統,模仿人體真實環境。搭建這樣的系統涉及的數據非常龐大,通常需要通過多層的運算,應用較為普遍的人工神經網絡。人工神經網絡的架構與人體神經系統有些類似,通過計算機模擬神經網絡的運行方式來構建,據說谷歌已經可以建立50到100多層的神經網絡運算,而通常應用只有幾層。在實際應用中,艾科賽龍沒有建立那么復雜的關系,但會經過多個環節的處理以達到更好的效果。人工神經網絡的單神經元通常由計算單元、連接單元和計算結果組成,再由多層神經元建立神經網絡。計算單元對外面獲取的信息進行計算,獲得信息分配的權重,也是經驗值,對計算結果再進行加權、綜合等處理,經過多層的運算,就形成人工神經網絡的基礎架構。
擁有海量數據和建立分析的系統架構后,利用相關專業的算法和分析的數學模型進行挖掘,從而獲取最終結果。海量數據和龐大的工作量,需要有效利用計算機的計算與運算能力,通過機器學習和深度學習賦予計算機一定的智能,并結合人工神經網絡實現自動化架構。
建立這樣一套架構的目的是要經過大量數據對機器進行訓練,使得機器可以相對獨立地計算與判斷,并得出相對精準的結論。艾科賽龍做的骨科學領域,基于幾萬例的數據不斷地對機器進行訓練,機器現在可以獨自進行計算與判斷,并得出相當精確的結論。基于深度學習和人工神經網絡架構運算,得出的數據和結果是結構化的。這個結果就是結合臨床和醫學,進行定量計算、結構解析、判別細胞毒性和癌癥病變等,以及對腫瘤標識和藥物篩選,甚至是組織構建和再生。所以量化與解析的目標就是解析人體的組織的微環境及微結構。骨骼結構可以看做脫細胞之后的物理結構,微環境就是組織生存的復雜的生理環境,最終的目標就是要解析組織的微結構和微環境,具體表現為細胞與細胞之間、細胞與組織之間、組織與組織之間的相互作用。例如解析血管的微環境和微組織,需要清楚認識血管細胞與構成管壁的肌細胞,甚至脂肪細胞之間的關系,即細胞與細胞之間的關系,以及組織與組織之間的關系,血管的毛細血管網絡化以后,如何向組織滲透營養、輸送營養等。最后將多領域的數據融合,經過缺失量化和精準構建,可以做到精確統計、精確預測,最終精確地輸出一個產品或者是一個結論。
再生醫學技術是用醫學、生物學、化學等多個學科與工程學相結合的方式,重新構建或修復人體或動物失去功能的組織、器官,使其具備正常的生理功能。具體包括多功能干細胞誘變、細胞遷移、組織再生修復,組織替代等。修復組織結構和生理結構以后,再生醫學技術最終目的是要恢復生理功能。再生技術最重要的環節是干細胞,幾種有代表性的干細胞定向誘變,如iPS、MSCs等在技術和實驗中已經比較成熟。再生技術與干細胞的結合的路徑首先是通過種子細胞培養獲得組織細胞。然后通過對組織器官的精準解析和構建,并結合生物3D打印構造仿生的微結構和微環境。接著將培養的組織細胞與仿生微結構在微環境下進行活性的培養,激活構建的組織器官的功能。活性培養完之后就構建了具備相對完整功能的組織器官,從而可以繼續進行臨床治療。經過整個過程的治療,患者能夠最大限度地恢復缺失的組織生理功能,從而真正提高患者治療質量。