潘玉穎,崔偉峰,馬笑凡,范軍銘
(河南省中醫藥研究院,河南 鄭州450004)
醫生診療疾病是一個嚴謹的邏輯推理過程,從采集病史、診斷疾病到臨床治療、預測轉歸,醫生需要把所有信息在大腦中篩檢、融合、匯總、分析。因西醫診斷疾病標準清晰,“同病同方”,自20世紀開始已有不同疾病的醫學診療模型指導診斷治療。但與此相對的中醫診療,其智能化發展相對滯后,多數研究僅停留在名老中醫經驗的整理和數據分析,因此,構建中醫人工智能診療模型,實現智能診療是中醫藥現代化發展的關鍵。
西醫應用人工智能技術開發的智能診斷模型、專家系統已應用于臨床,而中醫診療智能化的發展與臨床實用要求還有很大差距。
自1959年LEDLEY等首次應用計算機輔助診斷的數學模型診斷出一組肺癌病例,計算機輔助診斷應運而生,如今人工智能技術在醫學診療領域的應用日益廣泛[1]。日本三菱公司研制的“人工網膜基片”能快速精確地識別海量醫學圖像信息,其速度是傳統識別系統的數萬倍。人工智能在腫瘤性疾病和心臟病、糖尿病視網膜病變等疾病的臨床診斷中已廣泛應用[2]。西醫智能診療系統已越來越多地應用于臨床,反觀中醫,比較深入的研究出現在20世紀90年代,研究也多集中在根據模糊判別模式模擬臨床經驗進行中醫辨證[3-7]、采用協同分布式方法進行中醫診斷[8-9]、廣泛采用神經網絡模型建立中醫辨證系統[10-15]、應用數據挖掘技術和決策樹方法進行中醫證型分類[16-18]、采用基于信息熵的決策樹算法[19]等。但是這些研究都沒有系統引進人工智能先進的理論、方法和技術,使研究內容與臨床應用相互分離,限制了中醫診斷思維機制的實現效果。
中醫診療智能化的主要難點在于中醫辨證論治的思維難以轉化為線性邏輯,中醫診療輸出信息多,高維度的數據難以計算分析。
目前國內外有關中醫診斷智能方法與技術的研究開發,主要是一些具體方法和技術的分散研究,其無法系統集成的原因主要有兩個方面。第一個方面是沒有解決中醫辨證論治思維方法中的形式化描述問題。中醫臨床診斷多是在許多模糊、非定性、獨立于生化指標外的情況下進行辨證論治,依托數理模板、經典邏輯及其推理技術無法從根本上解決這一問題,成為中醫診斷智能化發展的瓶頸。第二個方面是中醫輸入輸出信息量巨大,高維度的信息阻礙計算效率。中醫證候因人而異,證型繁多,用藥隨癥加減沒有固定標準,無法用簡單的符號算法代替。大量信息不經降維處理難以計算分析,海量信息直接應用于模型會造成系統崩潰。傳統的專家系統主要是采用符號計算方法構建,系統規則一旦形成,難以更新,導致系統內容不能適應不斷變化的環境。因此,如何利用人工智能技術,使之具有自學習、自適應的功能,成為開發先進智能中醫診斷系統的關鍵。中醫診療病歷數據的數字化、網絡化積累了海量的數據資料,這些數據資料的維數已經對目前大多數據挖掘算法的效率造成了嚴重的阻礙,這種阻礙被稱為“維數災難”[20],所以處理高維數據必須進行降維。降維是一種將輸入空間的樣本線性或非線性地投影到低維空間,以求獲得一個關于原數據集的緊致的低維表示方法[21]。醫學研究中最常見的數據格式之一是矢量數據,隨著醫學實驗水平的發展,對個體的觀察指標變得越來越多,描述的內容也變得越來越豐富,數據集的維數也不斷增高。海量數據的降維是醫學大數據研究的基礎和關鍵。在醫學數據中降維方法的選擇應用及開發新的有效的降維方法是本課題擬解決的關鍵問題。四診合參是中醫診療的核心,也是收集疾病信息的主要途徑。近年來,人機對話技術、面部自動識別技術、嗅覺傳感器技術與圖片處理技術的高速發展,為中醫四診信息的自動化采集識別、智能化處理分析提供了方法學上的支持。脈象儀記錄脈象信息和舌象儀記錄客觀舌象信息解決了中醫望診智能化信息的獲取問題。舌脈象的智能化、客觀化不僅是未來中醫互聯網醫療所需要的,更是中醫智能化診療所必需的。
名老中醫辨證施治、遣方用藥準確靈活,拓制名老中醫診病思維是智能診療的核心,將最新的人工智能技術與中醫結合能夠高度模擬名老中醫的診療思維。
傳統中醫學是中華民族應用千年的寶貴財富,名老中醫診療經驗是中醫理論、前人經驗與當今臨床實踐的高度結合,是長期臨床實踐的積累,是中醫學術創新發展的源泉。將名老中醫的臨床經驗高效地保存傳承,成為中醫藥現代化發展的關鍵。傳統中醫診斷脫離現代病理檢測,具有經驗性、模糊性、不確定性等特點,諸多非客觀指標嚴重制約了中醫的發展和應用。目前,中醫辨證診斷過程無法做到規范化、客觀化、定量化,如何將經驗性、模糊性的中醫辨證過程變的具有可計算性是中醫現代化研究的主要問題。中醫的精要在于辨證論治,以往根據經驗和文獻直接定性的方法難以得到客觀的辨證分型。不客觀的辨證分型使證候的命名及描述帶有很強的主觀性和隨意性,得出的結果就不能反映中醫診病的思路。目前關于中醫證候分類研究的方法繁多,但沒有一個某種單一技術模擬中醫證候辨證的應用,因此借鑒先進的人工智能技術和方法進行中醫智能診療研究成為可能。在人工智能技術指導下模擬診療思維模型,這個模型包括了中醫望聞問切、生化指標和處方用藥。用臨床病歷訓練模型,調整隱含層各參數,通過臨床自學習功能進一步提高診療準確性,這樣既避免了探索性研究的煩瑣,也最大程度保持與臨床實踐的一致性。
現代人工智能技術多種多樣,其中人工神經網絡能夠模擬人類思維,具有自學習、自適應等功能,成為人工智能領域的主流技術。其深度增強學習算法通過大樣本的訓練和獎勵樣本的重復學習能夠較好地解決中醫診療的模糊性、高維度性、經驗性等問題。
中醫智能化診療是未來醫療發展的趨勢,目前中醫智能化診療的關鍵在于中醫診療的經驗性、不確定性、模糊性難以轉化為線性邏輯。隨著人工智能技術發展日益成熟,多種模型可模擬人腦進行黑箱操作,處理非線性信息并可適應學習。目前人工智能領域較先進、應用較廣泛的核心技術是深度神經網絡,并逐漸成為人工智能領域的主流技術。人工神經網絡(ANN)是用來模擬腦神經系統的結構和功能,是由大量處理單元經廣泛互連而組成的人工網絡。ANN根據樣本進行訓練,訓練時,樣本的輸入值傳給ANN的輸入層節點,ANN接受這些輸入值并與權值進行運算,在輸出層節點產生輸出模式,若輸出模式與樣本的目標模式有誤差,ANN對權值進行調優,這樣的訓練過程將迭代進行許多次。后期通過應用ANN能夠自動適應輸入信息調整參數,并從中學習,具有自學習、自適應和聯想記憶等功能。MLP算法即多層感知器,是一種前向結構的ANN,映射一組輸入向量到一組輸出向量,是常見的ANN算法,它由一個輸入層、一個輸出層和一個或多個隱藏層組成。深度增強學習(DRL)是深度學習范疇的一個分支,近年來發展迅猛。DRL是實現從perception感知到action動作的端對端學習的一種全新的算法,是將深度學習與增強學習結合,從而解決計算機從感知到決策控制的問題,進而實現通用人工智能。通用人工智能是要創造一種無須人工編程而自己學會解決各種問題的智能體,最終目標是實現類人級別甚至超人級別的智能。DRL可類比人類認知,輸入感知信息如視覺,然后通過深度神經網絡直接輸出動作,中間沒有hand-crafted工作。DRL具備使機器實現完全自主學習的一種甚至多種技能的潛力。深度學習把原始數據通過一些簡單、非線性的模型轉變為更高層次、更加抽象的表達,其實質是一種特征學習方法。深度學習擅長發現高維數據中的復雜結構,因此它被應用于中醫證候診斷方面[22-23]。增強學習強調模型在與環境的交互中學習,利用環境的評價性反饋信號修正行為、選擇策略,成為求解復雜決策問題的一種可行性手段[20,24]。2016年Google推出的AlphaGo使計算機的圍棋水平達到甚至超過了頂尖職業棋手的水平,引起了世界性的轟動。AlphaGo的核心在于使用了DRL的最新算法,使計算機能夠通過自對弈的方式不斷提升棋力。將DRL應用到中醫智能化治療模型,將會為解決中醫診療的經驗性、不確定性、模糊性等問題帶來重大突破,將克服傳統智能技術的不足,為中醫智能診療系統的研發開辟新思路、新途徑。