辛均益 胡海翔 董靜靜 鄭樂一
人口老齡化、慢性病、新發突發傳染病等因素給我國人民健康帶來了巨大挑戰。利用人工智能、大數據、5G等前沿科學技術賦能醫療健康,構建最優化的大健康生態體系,提供優質、高效、經濟的新型醫療服務,成為解決我國醫療供需矛盾、推動醫學發展提供有效的技術手段。現代人工智能中深度機器學習、視覺圖像識別、自然語言處理等技術已經廣泛應用于大健康、潛在疾病探索等領域上,未來人工智能和醫療領域相結合是必然趨勢。據估計,全球醫療人工智能市場的價值將從2018 年的20 億美元增長到2025 年的36 億美元,年增長率達到50%。從2016年開始,世界發達國家和地區在人工智能方面發布了相關的戰略規劃。本文首先介紹了人工智能的基本概念和人工智能在當前醫療健康領域的一些主要應用和研究熱點,最后通過對人工智能應用和研究分析提出一些可以推廣和促進人工智能在醫療健康領域應用的建議和對策。
(一)人工智能的歷史和國內外情況
1956年,在達特茅斯會議上,由McCarthy等人提出了 “人工智能”的概念 。經過50多年的發展,成為了一門多領域交叉學科。人工智能的本質,就是利用計算機硬件和軟件等技術,模擬出和人類相類似的,具有識別能力、思維能力和反應能力的高級機器智能。其研究的領域包括了從弱人工智能的大數據分析預測,到自然語言處理、視覺圖像識別、甚至是最高級別強人工智能的智能推理等。
在國外,發達國家及地區非常重視人工智能的發展,出臺了人工智能的發展戰略。美國政府2016年發布《國家人工智能研究和發展戰略計劃》,2019年發布總統令《加速美國在人工智能領域的領先地位》等。英國發布了《人工智能:未來決策的機遇與戰略意義》(2016)、《在英國發展人工智能》(2017)等。日本發布了《人工智能的研究開發目標和產業化路線圖》(2017)、《人工智能科技戰略》(2017)等。歐盟發布了《2014—2020歐洲機器人技術戰略研究計劃》(2013)、《歐盟機器人研發計劃》(SPARC,2014)、《人工智能時代:確立以人為本的歐洲戰略》(2018)等政策。
在國內,國家層面也出臺了較多的關于人工智能方面的政策,如圍繞人工智能在醫療健康領域的應用頒布了《國務院辦公廳關于促進和規范健康醫療大數據應用發展的指導意見》(2016)、《國務院關于印發新一代人工智能發展規劃的通知》(2017)、《促進新一代人工智能產業發展三年行動計劃(2018—2020年)》(2017)、《國務院辦公廳關于促進“互聯網+醫療健康”發展的意見》(2018)等文件。
(二)人工智能技術介紹
1.人工智能的機器學習
人工智能的機器學習是通過分析海量數據中學到統計規律,從而用于解釋數據或者預測未來,是醫療人工智能研究的關鍵技術。深度學習源于人工神經網絡研究的概念,通過模擬人類的大腦,建立一個能夠進行學習和迭代的神經網絡,最終通過大量高質量的數據學習,模仿人腦來解讀文本、圖像或者聲音等數據。根據IDC Digital的預測,到2020年,醫療數據量將達到40萬億GB,其中包含了巨量的病患健康數據、臨床診療數據、生物醫療數據和藥物研發等數據,將有意義的數據標注并作為機器學習的素材,具有深度挖掘與研究的價值。
2.人工智能的視覺圖像識別
人工智能的視覺圖像識別是利用計算機及相關硬軟件設備,模擬人類視覺神經的識別模式,通過對采集的圖像信息進行特征信息提取,然后對圖像進行相應的后續處理,其核心技術包含圖像處理、模式識別和圖像理解。在醫療衛生領域的應用,主要是通過大數據分析進行影像識別和輔助診斷。
3.人工智能的自然語言處理
人工智能的自然語言處理是計算機先通過對文本信息的特征字詞短語信息進行提取,然后再對提取出的特征字詞短語進行語義識別的一項技術。在醫療方面的應用主要集中在對一些非結構化的醫學文本數據進行處理,如癥狀描述的數據、遺囑描述數據等,通過基于規則、詞典、自然語言處理、語義關系提取算法等進行處理,使描述更為標準和統一。
(一)人工智能在醫療領域的現狀
1.智能藥物研發
傳統手段的藥物研發過程是漫長且昂貴的,根據塔夫茨藥物研發研究中心數據統計,藥物的研發到投入使用時間長達12年,并且90%在臨床試驗的最后兩個階段中失敗了,研發成本高達26億美元,尋找成功的新藥變得越來越困難。目前,人工智能在藥物研發方面的應用,主要是通過對各種醫學文獻進行自然語言的處理來實現的,在海量的醫學文獻,還有基因組學數據,蛋白質組學數據,代謝組學數據,脂質組學數據等數據源當中自動提取候選的藥物靶點,篩選已知化合物用于新的治療應用,從而縮短研發、臨床等時間并提高藥物研發的成功率。根據美國國家醫學院數據統計,初創公司在2019年籌集了超過15億美元的資金投入基于人工智能的藥物發現。加拿大的Cyclica公司將其軟件用于數百萬個分子與大約150,000種蛋白質的生物物理結構和生化特性進行匹配,以發現可能與目標蛋白結合的分子以及應避免規避的分子。
2.醫學影像識別
利用機器學習、卷積神經網絡等人工智能技術識別和解讀影像,使得AI醫學影像是當前醫療人工智能最為成熟的應用領域之一。人工智能在一些疾病影像的識別率和準確率上已經和人類非常接近,甚至表現更優。美國的醫學影像數據公司Response Data,在2018年進行的一項調查中表明,美國已經有84%的影像診所,已采用或計劃采用人工智能協助醫技人員進行醫學影像的識別工作。人工智能在醫學影像運用,極大的提升疾病篩查和臨床診斷的能力。如:北京市海淀醫院放射科的王娜娜等,探索了基于CT影像的人工智能(Artificial Intelligence,AI)輔助診療系統在新型冠狀病毒肺炎診療中的應用,取得良好效果。Mendel K等又利用了計算機深度學習能力,對大量的高質量的數字乳腺斷層合成(DBT)圖像與常規數字乳房X線圖像(FFDM)之間的區別進行比較和迭代學習,最終能夠在實際中進行乳腺癌的篩查。
3.人工智能輔助診療
基于海量的醫療數據,利用自然語言處理、深度學習、圖像識別、認知學習、自動推理等技術獲取病癥,模擬醫生的臨床診斷思維,為醫生診斷疾病和醫療提供輔助支撐。全球較為著名的IBM Watson人工智能輔助診療系統,可以通過分析大量的已有的醫學文獻和臨床資料,再結合病患的電子醫療記錄,最終對病患提出一個適當的治療方案,這項技術已經在國內一些醫院落地應用。如:醫準智能在河南某縣人民醫院和北京醫準智能科技有限公司的合作中,應用肺結節智能輔助檢測系統進行肺癌早期篩查,病灶檢出率高達99%。何曉等通過使用人工智能算法來洞察阿爾茨海默氏病。Bera K等利用AI和機器學習工具應用到臨床腫瘤學,提出了精準腫瘤學未來潛在的機會。醫療機器人也是人工智能輔助診療的應用場景之一,主要包括有達?芬奇手術機人、腸胃檢查與診斷機器人(如膠囊內窺鏡、胃鏡診斷治療輔助機器人等)、康復機器人(針對部分喪失運動能力的患者)及其他用于治療的機器人(如智能靜脈輸液藥物配制機器人)。
4.健康管理
人工智能在健康管理方面的應用,主要是利用物聯網醫療設備、可穿戴智能設備全方位的獲取人體生命體征和健康數據,并與就診數據、基因組學、心理狀態、生理狀態等醫療健康數據進行深度挖掘,從而給出個人健康管理方案。當前,衛生智能硬件主要有血壓、血糖等病患智能監測設備,其中較為杰出的代表是美國WellTok公司與IBM公司聯合打造的智慧醫療平臺。該平臺通過大數據分析,融合醫療硬件、健康內容以及健康應用等,加強個人健康管理和改善生活習慣。此外,英國的Babylon Health公司研發的健康虛擬助理應用系統,通過將真正的醫生與人工智能“助理”有機結合,利用智能便攜設備為消費者提供7*24全天候個性化的醫療保健服務。
5.醫院管理
通過建立人工智能體系,優化醫療資源配置和彌補醫院管理漏洞,促進醫院管理。醫療人工智能利用病歷、就診、用戶反饋等大數據,從宏觀層面協調資源的分配,節省醫療人力成本,改善就診體驗,最大程度滿足患者訴求。目前,美國的Qventus公司、LeanTaaS公司等公司通過AI監測患者的流量,有針對的對病房、設備、時間等資源進行計劃、組織、協調、控制,減少患者平均就診時間、手術等待時間、患者就診沖突概率,充分利用醫院現有資源,實現醫療效用最大化。
(二)人工智能在醫療領域的挑戰
雖然醫療人工智能應用熱火朝天,資本市場投資不斷涌入,但我們認為人工智能在醫療領域的應用還面臨著多方面的挑戰。
1.政策法規倫理方面
醫療人工智能作為當前科技發展的新事物,關于醫療人工智能的相關標準、規范都處于空白階段。其應用的法律滯后性所帶來的問題也暴露了出來。如醫療健康數據的個人隱私泄露問題、倫理道德問題、不被患者接受以及利用人工智能醫療服務過程中造成的醫療事件責任主體認定問題等。
2.健康醫療數據方面
人工智能在醫療領域應用的基礎是健康醫療數據,人工智能的訓練需要大量的已經標注好的醫療數據。健康醫療大數據標準、數據質量、數據安全性和共享等方面的問題直接影響著人工智能的發展。目前,關于醫療健康數據的歸屬和使用都尚無明確的規定,因此,醫療人工智能公司在開發系統過程中,如何獲得海量的醫療數據進行集中訓練就存在挑戰。另外,各醫療機構的醫療信息系統標準不統一,導致機構、地區以及國家之間的數據共享也存在較多障礙。
3.人工智能人才方面
人才決定了醫療人工智能的發展。2020年,我們隨機調研40家浙江省內衛生健康行政管理部門、大型醫療機構、公共衛生機構和醫療信息化企業。2021-2025年被調研單位對本科醫療人工智能人才年需求量在246-540人,呈逐年上升趨勢,企業單位的需求量更旺盛(從2021年每家單位19.5人逐年增加)。我國的工業和信息化部發布的《人工智能產業人才發展報告(2019-2020年版)》當中指出,目前我國人工智能的人才缺口高達30萬,而高校每年培養出來的畢業生約2000人,可見醫療人工智能人才需求與供應的不平衡。
4.人工智能算法方面
人工智能所做出的分析和預測都是基于算法模型和數據,工程師在設計算法時會滲透著其主觀特質,用于人工智能訓練的數據也可能存在著某種風俗習性或價值偏好,算法和數據的偏見都很可能產生系統性的決策偏見。
(一)加快醫療人工智能相關政策法規制定
隨著醫療人工智能的快速發展,應加快醫療人工智能方面的政策制定,在立法過程中需要考慮醫療人工智能創新、安全和信任之間的平衡。
1.建立醫療數據的資源質量、標準和利用條件等約束性政策,提升大數據可關聯度和數據質量。2.明確數據歸屬和權益。充分清洗個人標識性和人身性屬性后,積極考慮數據財產性權利,對于擁有海量數據沉淀的健康機構通過立規和立法,規范數據歸屬權利,維護個體權益。通過行業協會等機構先行探索匿名使用,授權使用及有償讓渡等機制。3.健全大數據共享、流通法規體系,規范數據共享授權與審批制度。4.強化醫療健康大數據安全管控,明確數據全生命周期內的責任主體、范圍邊界和具體要求。健全醫療健康大數據應用有關的法律法規,明確個人隱私保護的具體診療信息內容,明確各個主體在收集、存儲、應用等環節中的法律責任。5.建立統一從基礎環境、應用水平、服務效能等方面的人工智能應用評價體系,以評價促發展。
(二)加強醫療人工智能人才培養
目前,我國醫療人工智能人才缺口巨大,應該加強醫療人工智能方面人才的培養。2008年,《高等學校人工智能創新行動計劃》(教技〔2018〕3號)文件提出了加快和加強人工智能應用領域的人才培養指導方針。鼓勵各大高校建設“新工科”,推動培養“人工智能+X”的復合類專業的新模式。高校及科研院所應該開展醫療人工智能碩士、博士的培養。同時,應該發揮醫療人工智能領域企業的力量,開展醫療人工智能相關培訓,不斷壯大我國醫療人工智能領域方面的人才隊伍。
(三)推動醫療健康數據生態建設
監管方、醫療機構、人工智能企業等多方通力合作,加快建立醫療健康數據生態系統,用大數據、人工智能、區塊鏈技術建設健康大數據平臺。一是要構建和完善相關數據使用規范,理清醫療健康數據的使用權、所有權以及使用要求。二是要落實健康大數據標準的執行(如醫療標準化數據集、醫學標注標準等),提高數據的數量和質量。融合人口基本信息管理、衛生醫療服務和保障、藥品供應、社會綜合管理等數據資源的共享、互聯互通乃至業務協同,為人工智能訓練提供可靠的數據來源。以統一技術規范的居民電子健康碼和居民身份證號為個人健康服務識別信息,逐步實現醫療健康服務信息、檢查數據、費用清單、處方、病歷、結算記錄等便民服務。
(四)客觀對待醫療人工智能
人工智能正處在火熱的時代,我們要正確客觀的對待醫療人工智能,既不能輕視也不能盲目。通過人工智能技術建立患者和醫生之間的信任橋梁,最終目標是讓人工智能為人類醫療活動提供輔助性幫助,而不是取而代之。
綜上所述,人工智能在醫療健康領域擁有廣闊的應用前景,也遇到了一些挑戰和瓶頸。我們需要把握機遇,加強理論知識學習和強化技能,為迎接智慧醫療時代的到來做好準備。
作者單位:杭州醫學院信息工程學院
基金項目:浙江省科學技術協會學會服務科技創新與科學素質提升(2020年軟課題項目)(CTZB-2020050332);浙江省高等教育“十三五”第二批教學改革研究項目(項目編號:jg20190551)