■文 /王 浩
王浩,復星醫藥互聯網業務發展部副總經理。
人工智能必將深刻改造我們的醫療產業。
生物技術與信息技術的發展,特別是兩者的結合發展拓寬了人類未來的發展空間。新技術的不斷涌現為醫療的發展注入了源源不斷的動力,成為醫療變革的推動引擎。互聯網、物聯網、大數據、人工智能、AR/VR等技術正迅速滲透到醫療領域,成為新醫療時代的催化劑。其中,最具突破性的技術非人工智能莫屬。
當醫療遇上人工智能,許多傳統的醫療痛點開始找到解決方案,譬如,人工識別影像效率低、成本高、質量難以提高的問題,基層醫生診療水平有限的問題,新藥研發周期長、成本高的問題,慢病有效管理難的問題……互聯網醫療在這些難題上“撕開了一道口子”,人工智能將是這些難題的終極解決方案。
人工智能在醫療領域的實踐已有很多,最熱門的應用便是輔助診斷,此外還有輔助治療、語音識別輔助醫囑錄入、慢病管理、新藥研發、知識圖譜輔助分級診療等多個領域的相關應用。其中,人工智能輔助診斷的發展相對成熟,而醫療知識圖譜構建相當于智慧醫療體系的基礎設施建設。

人工智能概念最早于1956年在美國達特茅斯會議上由知名數據家約翰·麥卡錫(John McCarthy)提出,此后,人工智能的熱潮在學界和產業界逐漸興起,并在1970年前后熱極一時。然而,盡管當時已經提出了神經網絡算法,人工智能算法也已經能夠證明數學原理中的大部分定理,但是,由于算法及計算設備本身能力的限制,人工智能并沒有在語音識別、文字識別、學習記憶等領域取得突破。第一次達特茅斯會議的共同發起人馬爾溫·明斯基(Marvin Minsky)在其著作中對神經網絡局限性的描述,客觀上促使第一次人工智能熱潮進入冬天。
第二波人工智能浪潮在20世紀90年代達到高峰。1997年IBM公司的深藍(Deep Blue)戰勝國際象棋大師卡斯帕羅夫引發的那波狂熱,至今讓人記憶猶新。深藍實際是計算機硬件高速發展的產物,它采用暴力窮舉法,對棋盤上所有的可能性進行計算并選擇最優的步驟,與AlphaGo戰勝李世石的深度學習原理完全不同。
AlphaGo引發的第三波人工智能熱潮的主要特點是深度學習。從邏輯上講,深度學習是機器學習中的一種算法類型,而機器學習則是人工智能的一個技術分支。與傳統的基于邏輯構建的計算機程序不同,機器學習基于統計學原理來評判并做出選擇。大數據使得機器學習有了足夠的學習樣本,計算機硬件水平的持續提高則為機器學習提供了強大的運算支持。今天,在某種意義上,深度學習就代表了人工智能。
此次人工智能復興與之前兩次相比最大的不同便是其已經具備了可落地性。人工智能在多個產業領域里表現出了強大的應用能力,豐富多樣的商業模式開始形成。
人工智能在醫療領域最熱門的應用便是輔助診療了,IBM公司的沃森健康幾乎成了輔助診療的代名詞。沃森健康可以廣泛地閱讀和腫瘤相關的文獻,并根據患者的個體數據匹配出最合適的治療方案。2016年,日本《東京新聞》報道了在東京大學醫學研究院的一位患者,該患者被眾多醫生診斷為脊髓白血病但治療效果一直不佳,最終被沃森健康診斷為患有一種罕見的白血病并找到有效治療方案。
沃森健康在癌癥診療領域頗有建樹,其對皮膚癌的識別準確率超過了98%,遠高于普通皮膚科醫生的75%,也高于專家的95%。如果這種技術能夠運用到基層醫院幫助缺乏經驗的基層醫生早診斷、早篩查皮膚癌患者,許多人的生命將因此得到挽救。
沃森健康是一個集自然語言處理、信息檢索、知識表示、自動助理、機器學習等開放式問答技術的應用于一體的人工智能機器人。對患者做診療時,沃森健康首先會分析患者的病歷,理解臨床記錄和報告中的結構化和非結構化的數據含義。接著,它會基于內部病例資料庫進行初步檢索并形成初步的治療方案。最后,依據外部研究數據,它會對治療方案打分并給出最終診斷及準確率估計。目前,沃森健康已經廣泛地應用于多家醫療機構,如紀念斯隆-凱特琳癌癥中心、耶魯癌癥中心、東京大學醫科學研究所等,并在2016年正式進入中國。
IBM公司是人工智能輔助診斷領域的先行者,但它是否能夠始終占據“頭把交椅”卻未可知。美國的谷歌公司、微軟公司以及國內的互聯網巨頭百度公司、阿里巴巴公司、騰訊公司也在紛紛搶占這個巨大的市場。2017年年初,谷歌公司在《自然》(Nature)雜志上發表了一篇關于人工智能識別醫療圖像的科技文章,文章指出,谷歌公司已經能夠利用深度卷積神經網絡技術(一種深度學習技術)對皮膚癌圖像進行識別。在使用129 450張臨床圖像對人工智能進行訓練之后,谷歌公司比較了21名資深皮膚科醫生和人工智能對圖像的識別水平,結果顯示人工智能的水平不低于人類專家。從結果上看,谷歌公司的皮膚癌診斷水平還略低于沃森健康,但是,考慮到谷歌公司是最近幾年才剛開始進入這個市場,能夠取得這樣的成績,發展速度已經非常驚人。
谷歌公司將該技術通過開源的人工智能學習平臺Tensorflow開放給了智能手機。現在,普通的皮膚科醫生只要用手機對患者疑似癌變皮膚拍照就可以借助人工智能來診斷是否患有皮膚癌了。除了谷歌公司外,很早就在人工智能領域布局的百度公司也開放了自己的人工智能平臺,將語音識別、圖像識別、自然語言識別等作為標準功能開放給了平臺用戶。
除了IBM公司,巨頭們的思路大體是一致的,致力于為用戶提供平臺性的服務而不是具體場景。IBM公司“擼起袖子自己干”,提供基于人工智能的產品給用戶。IBM公司選擇這種方式與其本身的“基因”不無關系,IBM不是一家互聯網公司,它是從為企業提供解決方案中獲得商業利潤。
總體來說,巨頭們的平臺戰略設定為許多中小型創新企業創造了機會,這些企業基于巨頭們的平臺為具體場景提供解決方案。
人工智能不只用于輔助診斷。中國醫療體系的一大難題是基層醫生由于多方面的原因整體水平與大醫院的醫生有較大的差距。這種差距促使患者向大醫院流動,基層醫生因此沒有足夠的患者來積累診療經驗,水平提高緩慢,整個診療生態進入一種惡性循環。國家分級診療體系的訴求之一便在于打破這種惡性循環,將大部分普通疾病患者導流回基層診療,大醫院聚焦復雜疾病的診療。在我國體制建設推進的同時,如何提高基層醫生的診療水平和診療效率成為關鍵,知識圖譜正是其中一種解決方案。

三元組知識圖譜架構的示意效果圖
簡單來說,知識圖譜是一種將知識結構化的方法,它旨在描述真實世界中存在的各種實體或者概念。譬如,在“患者有既往高血壓病史,最高達180/100毫米汞柱,口服‘北京降壓靈、利血平’治療,有腦梗死病史,遺留語笨及左側肢體無力”這句話中,就存在“患者、高血壓病史、180/100毫米汞柱、北京降壓靈、利血平、腦梗死病史、語言障礙、左側肢體”這樣8個實體,知識圖譜用屬性來描述實體,并用關系來連接兩個實體。例如,“患者”就有姓名、性別、年齡、病史等多種屬性,而“患者”和“疾病”兩個實體之間存在關系。這種描述方法也叫三元組。
雖然這種圖譜型的表達方式使人工理解變得更復雜了,但對于計算機來說,理解這種圖譜卻比較容易。譬如,如果在自動問答中,患者問到“三叉神經痛的癥狀都有什么”時,自然語言處理能夠幫助從中分離出“三叉神經痛”和“癥狀”兩個實體,機器就能自動從知識圖譜中搜尋三叉神經痛節點,并找到其癥狀屬性中的描述內容,再通過語義將描述內容包裝模擬成人類能夠理解的語言表達方式來告知患者。
知識圖譜不僅能通過常識性問題自動答復來幫助基層醫生解決常見問題,還能夠輔助基層醫生培訓。完整而有效的知識圖譜能夠覆蓋基層需要用到的大部分知識,如醫學名詞、全科臨床指南、醫患問答參考、醫生經驗、相似病例等。
人工智能在醫療領域里的潛在應用場景還有很多,如何借助人工智能解決健康管理的問題?如何借助人工智能將醫療機構的數據信息化、結構化?如何輔助基因測序為患者提供精準治療?這些問題的解決過程將不斷豐富人工智能醫療的應用場景,釋放人工智能的潛力。2011年,人工智能領域的全球投資僅為2.82億美元,而到2015年已經飆升至24億美元。人工智能此次歸來,必將深刻改造我們的醫療產業。