胡曉娟 ,崔驥 ,屠立平 ,姚興華 ,許家佗
1.上海中醫藥大學上海中醫健康服務協同創新中心,上海 201203; 2.上海中醫藥大學基礎醫學院,上海 201203
中醫脈診通過脈象“位、數、形、勢”四要素的重要屬性信息反映人體健康與疾病狀態[1]。脈搏搏動圖(以下簡稱“脈圖”)是脈象的客觀化表現和客觀診斷依據,也是脈診現代化研究的代表性成果。中醫脈診現代化研究根據研究路線主要分為中醫脈診理論梳理、中醫脈診信號感知、中醫脈象智能分析、中醫智能脈診臨床應用及各個環節所涉及的中醫脈診標準化研究。中醫脈診現代化研究已經開展近半個世紀,取得一定進展。基于脈圖的中醫脈象智能分析是指針對脈象傳感器獲取的信號進行智能分析的過程,具體包括脈象信號預處理、特征識別、模式分類。目前中醫脈診信號感知涉及的脈象傳感器和采集設備主要集中于單點、單部采集,正在向陣列式的多點、多部脈圖方向發展。基于中醫脈診信號感知現狀,本文針對中醫脈象智能分析的研究進展與發展趨勢,從單點、單部及多點、多部兩類脈圖進行綜述。
一個典型的脈圖及其常用參數見圖1[1],主要由主波、重搏前波、重搏波組成。單點、單部脈圖智能分析主要包括數據預處理、特征識別和模式分類。
圖1 脈搏周期圖及常用參數特征
通過脈象傳感器和采集設備獲得的脈圖原始信號中存在的噪聲、漂移和異常值會影響特征提取效果。因此,幾種經典濾波器如高通、平均平滑、小波濾波器及幾種濾波器級聯的濾波方法用于噪聲消除[2-4]。小波、經驗模態分析等方法用來處理由呼吸或抖動產生的基線漂移,小波變換技術因其計算量少而效果佳的特點可更有效消除漂移。針對噪聲消除和漂移消除技術無法檢測和處理失真信號引起的異常值問題,研究者引入了基于動態時間扭曲的方法,通過計算單個脈圖段與所有其他脈圖段的扭曲路徑距離來識別異常脈圖波形[4]。Garg等[5]通過曼哈頓距離和堪培拉距離獲得更好的異常值檢測,并提出實時脈圖信號質量評估框架以估計波形異常。Jiang等[6]研究基于多傳感器融合的脈圖質量評估框架。異常波處理是數據預處理的重要內容,目前就如何區分身體功能異常和失真信號導致的波形異常的方法尚無有效解決方案,還需進一步深入研究。
單點、單部脈圖分析方法從時域、頻域到時頻分析,從線性分析到非線性分析,諸如小波變換、傅里葉變換、樣本熵等各種譜分析變換后的譜能量、諧波等[7-8]。時域分析通常基于單一周期脈圖或幾個分段周期進行平均,以獲得“平均脈圖周期”。研究者對脈圖提取的參數有差異,主要脈圖參數見表1[1,9-10]。
表1 主要脈圖參數
幾種主流時域特征提取方法及其優缺點見表2。目前主波提取準確性較高,但因波形復雜,重搏前波、重搏波在實際應用中的檢測效果較差,提取上有一定難度,因此重搏前波、重搏波提取方法還需深入研究,以進一步闡釋脈象的機制。
表2 脈圖時域特征提取方法分析
雖然當前很多脈象智能分析避開了時域特征提取這一環節,但筆者認為時域特征依舊是脈圖智能分析的基礎,尤其是主波的提取,不僅是脈型和疾病診斷的重要特征,也是脈搏波周期分段的依據,同時重搏前波和重搏波也代表重要的生理意義。
20世紀80年代研究者開始研究脈圖頻域、時頻和非線性特征識別方法。頻域特征反映脈圖整體特征,典型分析方法包括功率譜分析和倒譜分析。時頻分析是把一維信號或系統表示成一個時間和頻率的二維函數,時頻平面能描述出各個時刻的譜成分,時頻分析可從時間、頻域角度反映脈圖的特征。常用的方法有短時傅里葉變換和小波分析。非線性特征多用于臨床特定病證的脈圖分析[11]。典型的頻域、時頻分析及非線性分析研究見表3。
表3 不同脈圖特征分析方法比較
已有研究顯示,時域、視頻、非線性脈圖特征在臨床中有其各自的表征意義[12-13],因此具體特征提取方法研究應與臨床應用結合,挖掘不同維度特征提取方法是后續研究的基礎。
脈圖模式分類從早期的人工讀圖識別開始,發展至20世紀80年代后開始計算機識別脈圖。目前對于常見脈象的(平、弦、滑、遲、數、虛、實、浮、沉脈等)及高血壓等常見疾病的單點、單部脈圖分析已取得一定成果。
從句法分析指導的模糊識別和相似度度量方法[14-15],到以支持向量機(SVM)為代表的傳統機器學習方法[16-19],再到目前人工智能領域應用較多的深度學習為方法。基于統計的模式分類方法雖然依賴于輸入的特征,但其白盒子的特點便于理解和應用,如張嘉琪[20]利用馬爾可夫決策與蒙特卡羅搜索算法設計脈象分類方案,可縮減訓練時間和資源,并可保留完整的經驗軌跡,在提高脈象識別準確率的同時,還可解決處理過程中的“黑箱”問題。深度學習在其處理和挖掘潛在特征方面有其優勢,但制約深度學習方法實際應用的一個因素在于小脈圖數據集。脈圖數據集通常不夠大,使其難以訓練用于脈圖分析的魯棒模型。
人工智能技術的發展為中醫脈象智能分析提供機遇,醫生指下屬于無數傳感器的多源多部位信號,單點、單部信號單一、信息有限。因此,研究者們也在思考解決途徑,獲取多點、多部脈圖對其進行智能分析或可部分解決此問題。多個脈診研究團隊研發可采集寸、關、尺三部脈圖的裝置[21-23]。廣州、遼寧、北京等多地研究機構從“三部九候”理論到現代化應用等多個層面對多點、多部脈圖進行了研究。
研究者首先驗證多點、多部脈圖的研究必要性;在此基礎上,多點、多部脈圖數據預處理多沿用單點、單部脈圖處理方法。
單點、單部脈圖分析從原始信號濾波、去基線、特征提取分析及模式分類均進行了系統的研究,但目前與臨床應用尚有一定距離。研究者就單部脈圖與多部脈圖的信息學差別進行研究,結果顯示多部脈圖獲取的信息量較大;Li等[10]采用時頻、頻域、時頻分析等方法,研究了寸、關、尺位腕部脈象特征的相關性和差異性,利用每個位置的66個特征指標,詳細計算了寸、關、尺位置及雙手之間的Spearman相關系數,從定量和定性兩方面研究了脈象采集位置之間的關系,結果表明,不同部位之間的特征有差異,為脈象的客觀診斷和脈象信息的全面揭示奠定了基礎。
多點、多部脈圖特征識別以單點、單部脈圖為基礎,主要有2種分析思路。一種是先將多點、多部脈圖看作多通道單點脈圖,首先處理單點、單部脈圖特征,然后對多通道的特征進行綜合分析。如Wang等[19]使用主成分分析和最小二乘法等方法結合時域特征分析寸、關、尺三部脈圖,并在脂肪肝和肝硬化數據上獲得了較好的效果。另一種思路則將多點多部看作整體,分析其整體特征。Chu 等[24]根據寸、關、尺三部時空特征,并比較浮、中、沉的不同,區分了健康弦脈和高血壓弦脈,Chung等[25]基于3×4的12 點陣脈象傳感器,利用離散模型和曲面擬合模型定義陣列式脈圖特征,比較三部一起按和關部單按脈圖的關系。基于曲面擬合定義5個陣列式脈圖參數(見圖2):曲面峰值最大值(Vppmax)、脈長(Length)、脈寬(Width)、收縮期(AS)和舒張期(DS)面積。其中Vppmax定義為曲面擬合的最大值;Length、Width、AS、DS根據擬合后圖形曲面的坐標軸定義。
圖2 離散模型與曲面擬合模型示意圖
上海中醫藥大學許家佗團隊提出不同時刻的脈圖容積(APV)系列特征[26-28],并通過健康與高血壓脈圖陣列脈搏波分析表明,APV能可靠地反映中醫脈搏特征。APV是指單位時間(1個周期)內脈搏波波動的平均體積。按照傳感器的位置組織成3*4列二維數組,數據F為12個點幅值高度,利用線性插值對3*4=12個點的F進行插值到N*N,實驗中取N=1 000,即3*4列二維數組變為的1 000*1 000矩陣M,M可看成多個點幅值,目的是組成一個面(見圖3),不同時刻的體積,即X軸(脈寬)、Y軸(脈長)、Z軸(幅度)圍成的圖形體積[25]。
多點、多部的脈圖模式分類主要以融合分析為主。從特征融合角度,Lu等[29]提出一種多尺度特征提取模型,該模型包含三部分:卷積神經網絡用于提取單周期脈圖的空間特征和多周期脈圖的節奏特征;遞歸神經網絡用于保留脈圖的長期依賴性特征;最后,使用推理層通過提取的特征進行分類。該模型在連續無創血壓數據集上進行心血管疾病分類精度達到96%。Lin等[30]將脈圖數據轉換為二維圖像,將獲得的特定特征值轉換為多維數組,并在SVM分類器中進行訓練,分析正常人和慢性病患者脈圖二維圖像的差異,分類精度高于基本時間特征,實驗結果表明,使用特定特征挖掘算法進行疾病檢測是可行的。Zhang等[18]基于三部脈圖提出基于圖的多通道特征融合方法,通過應用堆疊稀疏自動編碼器和小波散射生成2種不同的特征,將一個腕部脈圖樣本的每個特征視為與其相應特征向量相關聯的節點,并用于構建一個候選圖,通過開發圖卷積網絡,取得較好效果。Jiang等[31]提出決策級脈圖融合框架,使用Karhunen-Loeve多重廣義判別典型相關分析將脈圖多種特征融合到一個特征向量中,對每種類型的融合特征訓練支持向量機分類器,框架采用決策級融合方法將這些分類器結合進行脈搏信號分類,以解決異構特征融合問題。
多點、多部脈圖的預處理多沿用單點、單部分析方法;整體性特征分析較少,多點、多部脈圖智能化分析方法集中在融合方法本身,缺少理論指導下的融合分析方法。中醫生診脈時根據“三部九候”“位、數、形、勢”信息,獲得與疾病或狀態相關的主要信息,找到問題的主要矛盾,從寸關尺部位、浮中沉空間等多個方面綜合分析,得出最終的脈象分析結論。由于脈象分類具有“多維”“綜合”的特點,此過程的多維有效信息融合問題,尚未得到有效解決。符合臨床意義的脈象包含“位、數、形、勢”多維信息,目前基于脈圖的脈象分類研究主要集中在單點、單部脈圖,并且已取得進展;但是,基于“三部九候”理論的脈象分類研究尚不成熟。目前“三部九候”脈圖分析方法大多因為信息局限而簡單堆砌,未能很好地處理各部脈圖間關系,無法滿足臨床脈診的全面需要[32]。
脈象全域特征(時間、節律、頻率及寸關尺部位、浮中沉空間、定性和定量的波形特征等)分析需要對各部脈圖進行有效的融合處理以給出綜合決策,綜合決策不僅是信息的簡單堆積,其本質是基于多維信息融合的屬性判別問題。融合分析方法可為解決脈象全域特征分析提供借鑒。在信息研究領域,融合是一種形式框架,其過程是用數學方法和技術工具綜合不同信息,目的是得到有用信息或進行綜合的決策融合技術,可分為數據層、特征層和決策層融合。就多部脈圖而言,數據層融合是指將原始的時間序列數據直接作為融合方法輸入;特征層融合為提取各部脈圖特征作為輸入;決策層融合是將各部脈圖的分類結果作為融合方法的輸入,最后給出綜合結果。貝葉斯網絡、神經網絡、SVM等機器學習方法[33],根據其各自的優勢都被應用到數據層和特征層的融合分析中,用來挖掘多源信息的內在聯系。而決策層的典型方法是適用于處理多源不確定性信息的D-S證據融合模型,其優點是可將證據(輸入數據)之間細微的差別累加起來,當這些差別累積到一定程度就能進行區分,達到提高綜合決策準確率的效果,但它需要知道每個輸入的先驗概率,而大多數情況是不容易獲得的。
隨著人工智能和深度學習技術的發展[34-37],深度神經網絡也被應用于信息融合領域。如Ren等[38]通過多通道深層神經網絡進行多源圖像數據的融合,取得了一定的效果,其結果也在標準數據集中進行驗證,同時表明深層神經網絡在多信息融合分析方面的優勢。金林鵬等[39]在卷積神經網絡結構基礎上,通過構建的導聯卷積神經網絡模型實現多導聯心電圖融合分析,通過大數據驗證該模型有明顯優勢。從信號角度,脈圖與心電圖都具有周期性的特征,且多部之間都具有相似的結構。
基于此,本文提出以中醫脈診理論、信息融合理論為指導,關注顯性整體特征,利用深度學習挖掘隱性特征,構建脈圖融合分析模型分析“位、數、形、勢”全域特征;構建脈圖全域特征表達模型,從而找出表征脈象或身體狀態的主特征結合,并通過臨床驗證的中醫脈象智能分析研究新思路(見圖4),以期提供多點、多部脈圖智能分析研究的可行途徑。
圖4 中醫脈象智能分析研究新思路
中醫脈象智能化分析方法主要集中在單點、單部脈圖分析中,基于多點、多部脈圖的研究主要集中在多點、多部脈圖必要性分析、整體特征分析及融合分析方面,正在發展階段。現階段脈診的現代化研究成果在實驗室范圍均取得較好效果,但是在實際臨床中應用較少。面向臨床應用是脈象智能分析研究的重要內容。本文以中醫“三部九候”脈診理論為指導,基于多點、多部脈圖數據,從“位、數、形、勢”角度利用深度學習與信息融合方法相結合進行脈圖全域特征融合分析的新思路,為中醫脈圖智能化分析提供可行途徑,有望解決脈診現代化研究中關鍵技術問題,為實現“三部九候”中醫脈診的數據化、規范化、標準化提供方法學突破。