王戈
人工智能的走紅,Google阿爾法狗起到很大的作用。深度學習、深度神經網絡也是近期開始成為媒體熱門話題。
AI的應用的場景,隨著近年的發展,在不同細分領域都有落地的部分,如金融科技、手術機器人、人臉識別、醫療服務機器人等。從圖右看全球AI在精準營銷、醫療健康、BI投資最集中的,原因有三有數據源、后續能發展成為閉環、存在大幅度的增長的可能性。
從醫療行業與人工智能結合來說,可以從過去和現在、未來的時間維度對比來看,過去我們根據醫生提供產品來看病看,現在的患者需求是體現個性化服務,實時性和導向性要求比較高。在目前醫療資源供不應求的背景下,醫生壓力非常大,用人工智能進一步提高醫療的精準率,對減輕醫療的負擔有很大的幫助。在過去幾年隨著算法的進步和數據儲存成本大幅度的下降,人工智能變得可行,未來在好的模型驅動下人工智能可以貼近現實應用,讓醫生實實在在得到有效幫助。
結合國科嘉和過往在這個領域經驗,和大家分享一下AI+醫療的代表應用場景和代表企業,第一是AI教學,比如教學過程中像醫科大學做心臟結構教學,可以用AI、VR技術提供服務;第二是指研究方面,在美國研究公司已經跑出來進行藥物篩選基本布局,幫助藥廠人員降低研發成本,這部分本身很有價值,在對市場大小上業內有不同看法;第三是終身護理,這部分也是現在多個創業企業在做的,離實際應用比較近,包括在機器上用人工智能,做服務機器人,特別是在康復機器人和醫學學科特殊場景這部分進展非常快;第四是治療方面,比如我們投資的連心醫療,IBM的沃森,比人精準的識別能力,特別是在城鄉差異化很大,分級診療并不很完備情況下,能對二三線城市的醫療起到明顯作用;第五是健康管理,還搭配可穿戴設備對接慢病管理,比如腦卒中康復有一些布局;第六是早期分析。
醫療AI應用和大數據應用也是經過幾個大的波浪,從目前情況來看,我們把它分成三層:應用層、技術層、基礎層。從我們現在看的來講基礎層架構是全球化,像IBM等其他主要的玩家都是大的布局,這一部分介入或者我們創業者、投入來講并不多,原因是巨頭集中在這里,把門檻拉的很高,通用級的平臺一般門檻比較高;第二是技術層,例如大家經常看到的深度學習、自然語言處理、語音語義理解,更主要的是在醫療行業本身能夠形成壁壘,盡管這個壁壘是強壁壘還是弱壁壘可以進一步探討,但毫無疑問這是機會。
從我們來看應用層是今年、明年、后年未來很大的發展方向,在每個場景垂直細分的領域,有一些冒出新公司容易的地方。從醫療輔助機器人一直到虛擬助手、工作流程優化、甚至搜索醫療保險、反欺詐這個部分在中國不下十家公司都在進行布局,這一塊形成很多細分的跑道,我們認為都有機會。
我們下面看一下在整個醫療跑道布置的巨頭公司,大家看大的布局,不太建議一般的創新公司參與,全世界巨頭的公司瓜分,IBM、Google、百度、Microsoft,門檻很高。全球創業公司的分布大概分如下幾類:
以病患數據與風險分析為例,這是現在最多的企業聚集的領域,因為病患數據長期有效,而且經過不斷積累會越來越大,但這個領域存在一個大的問題,從我們看來,病患數據和風險分析這一塊數據源是最根本的問題。現在很多企業說我有數據源,但仔細細分有很大的問題,原因在于數據本身來講是不是結構化數據,即便在美國病歷結構化也不是很高。在國內各個科室雖然一直提倡標準化,但實際上很難統一的,另外還存在的問題是數據拿來的合法性,坦率里講沒有很好的辦法解決醫療數據的合法性,盡管網信辦出了一些文件,在實際上數據的穩定性、合法性是重要的因素。其他領域由于時間關系不展開多講。
回到國內,講一講國內跑到前面的所有公司,醫療大數據比如連心醫療,連心醫療是我們去年投資,在醫療影像學、放射規劃跑的比較快,其他創業企業各有各的優勢。機構信息化方面包括趣醫網、騰龍數據等。醫學影像類幾大公司本身也并購國內的一些企業,過去一年大概看醫療影像學領域跟醫療影像學數據包括三維建模不下20個,但是做的好比較少見,在技術上有一定的門檻。其他有醫藥研發類、健康管理、基因測序。
基因測序比如華大基因已經上市了,大家可以看到:干的苦活基本封閉了,沒有太多機會,現在在云端,基于大數據的應用,比如基因數據的圖譜加工是投資機構關注的比較多的領域,例如碳云科技,估值已經40、50億。整體來講基礎設施上的創業空間已經很少,后續的基因數據分析、基因編輯、下一步針對癌癥治療,在今年到明年都是投資熱點。
我們認為后續的AI+醫療領域的投資機會,重點關注的地方:
第一是醫療影像。數據源產生非常重要,如果沒有TB量數據的話,人工智能都不行,沒有足夠的標簽談何人工智能,接著還要找標桿,沒有100個頂級醫生做樣本的對比、對照,其實不能形成公司。判斷一個創業公司在這個跑道行不行,看里邊醫學人員有沒有,數據有沒有。識別技術已經比較成熟,核心問題在于打標記后邊算法和建模。
第二輔助醫療現在機會比較大。
第三藥物挖掘,原來我們10年前藥物上有個“雙十”一十年十億美元一個藥物。現在新藥研發投入還是越來越高,10億美元不夠了,這個情況下醫療大數據包括藥庫、化學庫等可以大幅度降低前端的投入。
第四健康管理也是勢在必行,現在很分散最主要的非結構化數據,傳統健康管理不成熟,后續包括診療、包括健康小屋形成分級診療,和大醫院掛鉤容易形成閉環。
國科嘉和是中國科學院直屬的基金,在對投資核心要素的要求上跟我們的偏好有關系。我們偏好技術,我們不擅長模式型創業公司。我們第一關注數據源,沒有大量數據源和標簽的話很難;第二關注計算能力,算法和計算成本是我們關注的要素,這些關聯起來可以知道公司建多大核;第三個框架和算法,任何技術不可能從石頭縫蹦出來,一定有積累,但是在框架和算法一定在醫學、在醫院里邊出。如何真正理解應用場景,需要與技術方面的專家結合,原來單一計算或者單一的規劃很難駕馭現在復雜的醫學應用。
在人工智能+醫療這一領域我認為會出很多世界級的項目和大的獨角獸企業,人工智能最容易突破現有布局。國科嘉和基金傾向于投資工程類技術和應用類技術,我們很有信心,我們利用應用層牽引,利用未來三到五年積累,希望建立個大系統。同時在應用層,以應用層為主反向拉動創意。我們也看重生態圈的結合,整個生態圈才是人工智能+醫療最終的方向。endprint