田紫微,賈蕓芳
南開大學 電子信息與光學工程學院,天津 300350
中醫的目標不僅是治愈疾病,中醫更注重人體的氣血調和[1]。中醫四診(“望聞問切”)中的脈診在診治病情過程中是非常重要的一環[2]。因為脈為血府,全身氣血都要通過血脈流向身體的各個部位,當機體受到內外因素的刺激時,就必然會影響到氣血的運行,隨之脈搏發生變化,因此中醫醫師可以通過按觸人體脈搏來體察脈象變化,然后結合中醫辨證理論推斷出病癥并給出診斷結果和治療方案[3]。然而這一過程較為依賴醫師的主觀感受和知識儲備,隨著近年來西方檢驗醫學的引入,現代的診斷方法十分依賴于各種昂貴的診斷儀器,傳統的“望聞問切”診斷體系面臨著巨大挑戰,中醫“上工治未病”[4]的思想難以在臨床實踐中得以實施,為解決這一問題,應恢復脈診在中醫診斷中的主導作用。因此,中醫脈象儀的研究受到了中醫醫師、養生保健人群和企事業單位的普遍關注。脈象儀將脈搏信息數字化與傳統中醫的脈象理論相結合,快速為用戶提供脈診結果,對于推廣中醫脈診,實現未病先防和既病防變具有積極意義和商業化潛力[5]。
脈象儀的研究以脈搏采集為基礎,借助多種傳感裝置采集脈搏信號,實現脈象的獲取、傳遞、處理和利用[6-7]。中醫醫師和科研工作者們投入了大量的時間和精力,相繼研制出了多種脈象儀,例如,TD-Ⅲ型中醫脈象采集分析儀、ZM-300 型智能脈象儀[8]等。傳感器采集到脈搏信號后利用現代信號處理方法和人工智能算法提取脈搏信號中的脈象信息,實現脈象診斷[9-10]。其中脈象智能分類算法在脈象儀中具有關鍵作用,對提高脈象儀的準確性和智能化水平,實現更加精準的中醫診療具有重要意義。
隨著數據挖掘和人工智能技術的迅速發展,大量基于機器學習(Machine Learning,ML)算法的脈象智能分類算法已經被研究出來以提高脈象分類的準確度,并且逐漸應用于脈象儀的研究中。這些算法可分為基本ML 算法、神經網絡(Neural Network,NN)算法、集成學習算法,雖然有不同的側重點[11],但都能進行脈搏信號的處理、分析和識別。在綜述文獻的基礎上,本文從脈搏信號預處理、脈搏特征參數提取和分類模型建立3 個層次,總結和分析了不同算法在脈象智能分類方面的研究現狀,并分析了它們的優點和缺陷,為進一步提高脈象儀的準確度和智能化提供了理論參考。
目前應用的脈象儀主要采用的脈象分析方法可概括為3 個步驟,即信號預處理、提取脈搏特征、建立分類模型,其中脈搏信號預處理是精確提取特征參數,有效提升脈象分類準確度的關鍵步驟。信號預處理主要包括兩部分內容:濾除脈搏信號的噪聲與識別脈搏信號的多個特征點。
脈搏信號預處理的主要目的是去除信號中的噪聲,噪聲主要來源于周圍的電磁干擾、呼吸和肌肉抖動[12]。電磁信號的頻率為50 Hz,相對于脈搏信號的頻率范圍0.3~20 Hz 來說屬于高頻噪聲[13],因此可以通過低通濾波器[14]抑制周圍電磁干擾產生的工頻噪聲;脈搏波信號微弱,在采集脈搏信號過程中人體的呼吸和輕微的肌肉抖動都有可能造成脈搏信號的基線漂移,因此需要通過信號處理來消除此部分噪聲。常見的基線漂移噪聲的去除方法有高通濾波法、中值濾波法[15]、均值濾波法[16]、多項式趨勢法[17]、包絡檢波法[18]、小波閾值去噪[19]、經驗模態分解和小波的聯合去噪[20-21]等。由于基線漂移本身屬于一種低頻信號,因此只要找到合適的截止頻率,使用高通濾波[22]將基線漂移去除是完全可行的。但由于脈搏信號本身就屬于低頻信號且頻率范圍較窄,使用高通濾波會將低頻段區域的大量有用信號一同濾除,因此這種方法不適用于脈搏信號的處理。中值濾波法[15]和均值濾波法[16]均須對原始信號進行分段處理,使用中值或均值取代分段內全部數據,當應用于基線漂移較輕的脈搏信號時具有較好的去噪效果,但對于基線漂移噪聲較為嚴重的信號,可能使得原始信號中一些重要拐點與峰值模糊化,導致脈搏信號中的有用信息被濾除。多項式趨勢法[17]和包絡檢波法[18]的核心思想均是基于脈搏信號的多個起始點利用多項式擬合出基線漂移噪聲,擬合出的信號即噪聲信號。該類方法簡單,原信號與噪聲信號相減即可得到去噪后的信號,在消除基線漂移噪聲時不易損失有用信號,但對于n次多項式趨勢的基線漂移難以估計該多項式的具體參數[18]。小波閾值去噪[19]和經驗模態分解與小波變換方法相結合的去噪方法[20-21]均是將原始脈搏信號先進行分解,得到不同的分量,然后在各個分量中分別進行閾值量化處理,最后將處理后的分量進行重構得到去噪后的脈搏信號。其中,單純的小波閾值去噪方法依托于小波基函數將信號分解,而經驗模態分解與小波變換相結合的方法則依據信號自身時間尺度特征將其逐級分解為多個分量,完整保存了信號的性質,解決了分解過程中信息丟失的問題。此外,針對脈搏信號中隨機異常值引起的信號失真問題,有研究者引入了基于動態時間扭曲[23]的方法,通過計算單個脈搏波形段與所有其他脈搏波形段的扭曲路徑距離來識別異常波形。異常波形常見于脈搏信號中,目前就如何區分身體功能異常和外界因素引起的信號失真導致的波形異常尚無有效解決方案,還需進一步研究。
脈搏信號具有周期特性[24],但各周期又并不完全相同。因此,即使是同一脈搏信號,不同周期提取出的特征也可能存在差異,這也是脈搏信號具有復雜性特點的原因之一。通常為了得到相對統一的脈搏特征并利用這些特征進一步對脈搏信號分類,需要進行以下操作:① 需要準確地識別出多周期脈搏信號的多個起始點,并將相鄰的兩個起始點作為一個周期進行分割;② 對分割后的周期信號通過重采樣或補零等方式使得各個周期數據長度一致,更有利于脈搏信號特征點的識別和特征參數的提取[25];③ 將多個周期信號進行疊加求得一個平均波形,進而繼續后續的特征提取與分類。常見的特征點識別方法有峰值檢測、谷值檢測、局部最小值、局部最小值斜率、一階導數等[24]。
脈搏特征是指能夠代表信號波形特點的可量化指標,主要包括線性特征,如時域特征、頻域特征、時頻域特征以及非線性的擬合特征等,其中,頻域特征主要指諧波頻率、諧波幅值、譜能比、諧波面積之比等[26-28];時頻域特征主要指信號在不同頻譜范圍內的能量及譜能比[29];擬合特征[17-18]主要指擬合函數的各個參數;時域特征[24]主要包括波形的波峰波谷高度及時間間隔,具體如圖1 所示[30]。其中,h1代表主波高度,主要反映左心室的射血功能和大動脈的順應性;h3為潮波高度,主要反映動脈血管張力和外周阻力狀態;h4為降中峽高度,反映動脈血管外周阻力的大小;h5為重搏波高度,反映了大動脈的彈性(順應性)情況[31]。t1為脈搏信號波形起始點到主波峰頂的時間,對應左心室的快速射血期;t4為脈搏信號起始點到降中峽之間的時間,對應左心室的收縮期;t5為降中峽到下一個脈搏周期起始點之間的時間,對應左心室的舒張期;t為脈搏信號起始點到下一個脈搏周期起始點的時間,即一個心動周期;W代表主波1/3 高度的寬度,相當于動脈內高壓力水平狀態所維持的時間[31]。α為上升角或稱U角,是主波升支與基線的夾角,反映血管彈性與血液黏性;θ為主波角或稱P角,是主波升支與降支的夾角,反映血管彈性和血流狀況。

圖1 脈搏信號常用測量指標示意圖
不同類型的脈搏特征需要采用不同的提取方法。如頻域特征主要通過傅里葉變換方法將多周期的脈搏信號變換到頻域,并計算信號的功率譜、倒譜和傳遞函數譜等[27,32],據此得到頻域特征。時頻域特征常用的提取方法有小波變換[32]、經驗模態分解(Empirical Mode Decomposition,EMD)[21,33]和希爾伯特黃變換(Hilbert-Huang Transform,HHT)[34]。其中小波變換通過小波基函數將去噪后的脈搏信號分解到不同尺度上,得到高頻和低頻小波系數分量,而后計算小波系數的能量值作為特征[35];EMD[21]和HHT[34]則是先基于EMD 方法獲得脈搏信號一系列的固有模態函數(Intrinsic Mode Function,IMF)分量,然后對每一個IMF 分量進行HHT 得到Hilbert 譜,綜合所有IMF 分量的瞬時頻率并在時間軸上積分即可得到信號的Hilbert 邊際譜,由此計算特定頻率處的譜能比作為信號的時頻域特征。擬合特征通常指高斯擬合參數[18],該方法使用混合高斯函數模型擬合多峰脈搏信號,并基于非線性最小二乘法獲取高斯擬合參數。時域特征主要反映了脈搏信號的形狀特點[36],首先需要利用閾值法、極值法或滑動窗口法等識別出可反映脈搏信號形狀特點的波形特征點,如起始點、主波峰點、重博波峰點等,隨后統計脈搏信號的時域特征。有時為了更好地反映信號特征的變化和臟腑的健康狀態,可采用各參數的相對比值作為信號的特征。
中醫理論從位、數、形、勢4 個方面將脈搏信號分為28 種[37],在臨床上還出現多種類型脈搏信號相兼的復合信號。傳統分類方法主要依賴于脈搏信號的多種特征值,采用簡單閾值判據對脈搏信號進行線性分類,但對脈搏波高精度的測量要求以及算法本身高的實現復雜度限制了該類方法的實際應用。隨著人工智能技術的發展,ML 算法為解決脈象分類等非線性問題提供了新思路[38]。ML 算法通過學習現有知識內容,挖掘出各類脈搏信號中隱藏的相關性并建立非線性分類模型,克服了傳統分類方法采用簡單閾值判據進行線性分類所帶來的不利因素[39-40],使得脈搏信號的識別和分類具有智能處理的色彩,大大提高了脈搏信號的分類效果。常見的建立分類模型的ML算法大致可分為3類,即基本ML算法、NN 算法以及集成學習算法。
基本ML 算法是指使用統計學、線性代數、優化算法等數學方法,從已有數據中學習并構建模型,進而用于對未知數據的預測和分類[41]。常見的基本ML 算法包括決策樹[42,43]、樸素貝葉斯[44]、K-近鄰(K-Nearest Neighbor,KNN)算法[45]、支持向量機(Support Vector Machine,SVM)[46]等。
決策樹是一種基于樹結構進行決策判斷的模型,它通過多個條件判別過程將數據集分類,最終獲取需要的結果[42]。決策樹中每個內部節點表示一個屬性上的測試,每個分支代表一個測試輸出,每個葉節點代表一種類別。通過學習樣本的屬性和類別,可以建立一個能對新數據進行正確分類的分類器[43]。決策樹算法能同時處理數據型和常規型屬性,且對缺失值不敏感;此外,還能夠在相對短的時間內針對大型數據做出可行且效果良好的結果。Wang[42]將決策樹算法與歸一化信息增益相結合,構建了“常、實、虛”3 種脈象的分類模型。文中提取了脈搏信號的時域特征參數作為決策樹算法的輸入,并采用欠采樣多數類技術對不平衡的數據集進行校正;實驗結果表明,建立的基于決策樹的脈象分類模型的平均識別準確度為90.32%,但決策樹模型并沒有考慮脈搏特征之間的相互關系。
樸素貝葉斯方法的研究基礎是貝葉斯定理和特征條件獨立假設[44]。對于分類數據集,利用特征條件獨立假設學習輸入/輸出樣本的聯合概率分布;訓練好的模型利用貝葉斯定理對未知樣本計算后驗概率,其輸出標簽為最大后驗概率所對應的類別。該方法對缺失數據不敏感,所建立的模型具有穩定的分類效率,對小規模的數據表現很好,且能處理多分類任務。由于脈搏波信號具有非平穩和不確定的特性,樸素貝葉斯方法在脈象分類研究上也有較多應用。Wang 等[47]基于樸素貝葉斯算法建立了脈搏信號和脈象分類之間的映射關系,根據提取的15 個特征參數,分別用于訓練與脈位深淺、脈率、節律、強弱和流利度相關的5 個貝葉斯網絡,對“虛、實、浮、沉、緩、數、結、歇止、滑、澀、弦”等11 種脈象的平均識別率達84%,但此方法須假設所有特征同等重要,無法處理特征數據之間的依賴關系。
KNN 算法的核心思想是“物以類聚,人以群分”[45]。選取K個未知樣本和最近的已知樣本,將未知樣本和已知樣本比較,與未知樣本最相似的樣本的類別就是未知樣本的類別。KNN 天然可以處理多分類問題,適合對稀有事件進行分類,與樸素貝葉斯算法相比,對數據沒有假設,準確度高。Zhang 等[45]基于實際懲罰編輯距離(Edit Distance with Real Penalty,ERP)和KNN 分類器方法,開發了一個ERP 誘導的內積和一個高斯ERP 核,并將其嵌入到差分加權KNN 分類器中,提出了兩個新的基于ERP 的分類器即基于ERP 的差分加權KNN 分類器(ERP-based Difference-Weighted KNN Classifier,EDKC)和基于高斯ERP 核分類器的核差分加權KNN 分類器(Kernel Difference-Weighted KNN with Gaussian ERP Kernel Classifier,GEKC),以解決脈沖模式的類內變化和局部時移問題。此外,該研究還構建了一個包含2470 個脈沖波形的數據集,用于EDKC 和GEKC 模型的訓練和測試。其中,EDKC 和GEKC 方法對“緩、滑、澀、芤、緊”等5 種脈象類型的平均分類率均超過90%,但該算法在不同訓練樣本上識別度不穩定,且穩定性有待提高。
SVM 本身是針對二分類任務設計的,但經過推廣后可用于多分類任務[48]。由于SVM 出色的泛化能力,SVM及其改進方法被廣泛應用于文本分類、手寫字體識別、面部識別、圖像分析、生物醫學信號處理等領域。史紅斐等[49]采用小波分析方法提取了脈搏信號(40 例)的時頻域特征,之后基于SVM 算法建立了“滑、弦、細、澀”等4 種單脈的自動識別模型,其中測試集的識別準確度達87.5%。Zhang 等[50]則首先應用聚合經驗模態分解對脈搏信號進行去噪處理;然后利用多重分形去趨勢分析法提取去噪后脈搏信號(140 例)的多重分形譜特征;最后將提取的特征作為基于粒子群優化算法的SVM 算法的輸入,實現“滑、弦、洪、細”4 種單脈的分類,其平均識別準確度為87.5%。由于SVM 在使用大規模數據時訓練速度較慢,因此在選擇SVM 作為分類算法時須考慮數據集的規模。
相較于基本ML 算法,NN 算法由具有適應性的基本單元構成,可以自動從數據中學習特征,并通過調整單元節點間的鏈接關系完成對輸入信號的動態響應[51]。目前常用的NN 模型主要有反向傳播神經網絡(Back Propagation Neural Network,BPNN)[52-57]、卷積神經網絡(Convolutional Neural Network,CNN)[58-59]、時序卷積網絡(Temporal Convolutional Network,TCN)[60]等,其中BPNN 是應用最廣泛的模型之一。陳雷等[54]采用BPNN 與分形理論相結合的方法實現了脈象分類,該研究首先基于分形理論提取了脈搏信號的時頻域特征分數維,并以此作為信號的重要特征輸入到BPNN,經學習和訓練建立了“滑、數、弦、細”4 種單脈的分類模型。該模型對未訓練樣本的平均識別準確度達到81%,其中對弦脈的分類識別準確度達到了90%。在此基礎上,Chen 等[55]基于遺傳算法(Genetic Algorithm,GA)和Levenberg-Marquardt (LM)算法對BPNN 做了改進,將提取的4 個頻域特征和6 種小波尺度能量特征信息作為三層GA-BPNN 輸入;然后,經訓練集學習和訓練后確定了模型的權重和偏置等參數,建立了可識別常脈、弦脈、滑脈、細脈的分類模型。結果顯示,基于GABPNN 建立的分類模型識別準確度可達到95%。雖然分類模型在識別脈搏信號方面顯示了很高的準確度,但是由于數據量巨大,導致模型的訓練時間過長。針對這個問題,盛雅蘭等[56]在開源云計算平臺Hadoop 環境的基礎上改進了BPNN,實現了MapReduce 分布式的計算,提高了BPNN 對海量脈搏數據的處理速度。該方法中脈搏信號的特征值是BPNN 的輸入,采用動量-學習率自適應調整快速BPNN 進行訓練。結果顯示,到達相同精度的誤差區間時,MapReduce 鏈式并行處理模式所用時間為4 min,遠少于傳統串行模式所用時間(1 d),且在訓練集(75%,35890 條數據)中,單機模式預測的準確度為81.22%;MapReduce 并行改進的BPNN 模式預測的準確度為99.86%。該數據表明與傳統BPNN 相比,基于Hadoop 環境的MapReduce 分布式計算方法改進的BPNN 模型在時間性能和準確度上遠遠優于傳統的串行處理方式。盡管上述方法提升了NN 模型處理數據的速度,然而較大的數據集輸入容易導致模型過擬合。因此,張詩雨等[57]提出根據Gini 指數對脈搏信號的特征進行重要性排序,從而在確保分類準確度的同時減少輸入特征的個數。文中提取了脈搏信號常用的時域特征、頻域特征、時頻域特征以及高斯特征共93 個,并根據Gini指數分別確定了平脈、實脈、弦脈、滑脈適合的特征類別。隨后,又采用序列前向選擇算法改變輸入特征維度,實驗顯示,當選用前15 個特征時,BPNN 精度最高,相比篩選前分類精度提高了12%;當選用前13 個特征時,SVM 精度達到最高,相比降維前精度分別提高了13%。由此可見,可以通過改變輸入特征種類及維數可提高脈象分類模型的識別準確度。
上述脈象分類實驗方案均是先人工提取脈搏特征,再利用ML 算法建立脈搏信號分類模型,雖然展現了較高的分辨準確度,但是人工提取的特征很難完整體現脈搏信號的特點,可能導致部分細節信息的丟失,從而降低識別的準確度。近年來,得益于深度學習算法的快速發展,更高效的CNN 被開發出來。與NN 相比,CNN不僅具有多層感知器,還通過局部感受野、權重共享和降采樣3 種策略,降低了網絡模型的復雜度;同時通過卷積操作提取局部特征,減少了單獨提取特征的片面性,獲得了更好的分類和識別效果[58]。有研究將脈搏信號的時頻域特征提取與CNN 相結合,實現了脈象分類[59],文中首先利用小波變換理論和集成經驗模態分解對脈搏信號中的噪聲進行去除,提出了一種基于差分閾值法的特征點檢測方法,實現了特征點的精確定位和時域值的提取,最后,建立并利用一維CNN 模型對數據進行訓練,得到10 種脈象的平均準確度為94.12%。CNN 的應用可能使脈搏波信號在脈象識別準確度方面上升了一個臺階,但復雜的網絡結構和高強度的訓練使得算法在臨床應用中還存在一定限制。有學者考慮到脈搏信號本身就是時間序列信號,于是采用能夠直接處理時間序列的網絡,即TCN 來處理脈搏信號,由于TCN 使用了殘差連接和批歸一化技術,因此能夠并行執行卷積運算以提高脈象分類模型的訓練速度[25,60]。文中首先對脈搏信號進行預處理以獲得長度一致的脈搏信號時間序列;其次在TCN 的殘差塊中加入兩層參數相同的膨脹因果卷積網絡,這種新型卷積結構增加了卷積層的感受野,能夠更好地捕捉時間序列中的長期依賴關系;然后,在每個卷積層后進行正則化處理以抓取該序列內的特征信息并防止過擬合;最后利用改進的深度學習網絡實現對時間序列的特征提取,并通過訓練集進行學習和訓練建立脈象信號分類模型。結果表明,通過網絡自學習提取的特征多數具有顯著性差異,7 種脈象(滑脈、平脈、細脈、弦脈、細滑脈、細弦脈、弦滑脈)的平均識別準確度達到了85.76%。
為了進一步提高ML 算法形成模型的泛化能力,有學者提出了集成學習思想[61]。首先選擇合適的基礎學習器,如決策樹、BPNN、SVM、CNN 等,通過訓練獲得相應的分類模型;然后利用投票法、學習法、平均法等將訓練模型有機地結合起來。該方法在泛化性能上與單一學習器相比往往有明顯提高。常見的集成學習算法有梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)[62]、極值梯度提升(Extreme Gradient Boosting,XGBoost)[63-64]、隨機森林(Random Forest,RF)[27,40]等。GBDT 主要是一種決策樹升級算法,該算法的迭代是在梯度方向上重新建立決策樹,迭代的次數生成決策樹并輸出結果,其優勢主要在于所有分類的廣泛應用[62]。由于脈搏參數比較多,不同數值段的每個數據代表不同的脈沖特性,因此選擇GBDT 進行脈沖分類更為合適。此外,由于樣本量小,GBDT 不會影響分類和識別,也不會由于樣本量的不平衡而影響其準確度。Li 等[62]采用GBDT分類方法對中醫脈象進行分類,首先,采用時域分析和血流動力學方法提取和分析脈搏參數并選擇特征;然后,輸入訓練集數據建立GBDT 模型實現脈搏分類。結果顯示,通過優化特征參數后,采用GBDT 分類方法對滑脈、結脈、弦脈和平脈的識別準確度分別為90.33%、83.52%、97.74%和78.60%,均高于SVM 方法的識別準確度。
XGBoost 由GBDT 發展而來,但XGBoost 的運算速度和算法精度都優于GBDT[63]。相比與GBDT,XGBoost 的基礎學習器既可以是決策樹也可以是線性分類器,并且支持并行生成。此外,XGBoost 的代價函數中額外引入了可用于控制模型復雜度的正則項,即“正則化提升”,正則項會降低模型的方差,使學習出來的模型更簡單且不易過擬合,這是XGBoost 相比GBDT的優勢所在[64]。張詩雨[64]應用集成學習Boosting 方式中的XGBoost 算法進行脈形要素分類模型的訓練和測試。研究中首先提取48 維特征組成特征數據集,然后對脈形要素分類模型進行訓練。結果顯示,脈形要素分類器在測試集上對實脈和非實脈(包括“平、滑、弦、細”等不具有實脈特征)的樣本的分類準確度為91.67%;將細脈樣本從數據集中剔除后,分類準確度提升為92.73%。
RF 是一種以決策樹為基礎學習器的分類器,主要基于Bagging 方法從數據集中隨機選取樣本作為決策樹的訓練集[40],在RF 的訓練過程中,每個決策樹會隨機選擇一部分特征進行節點分裂,從而避免了過擬合現象的發生;同時,對于每個節點,算法會選擇最優的特征作為分裂依據,以最小化劃分不純度,并獲得最佳的分割。決策樹的投票結果被平均,以得出最終的分類結果。金陳玲[27]使用RF 對脈象特征的重要性進行分析,并建立了單脈和相兼脈象的分類模型。首先根據Gini 指數貢獻率排名等要素刪去部分重要程度低的脈象特征,降維至53 項特征作為脈象分類的依據,對“實、細、弦、滑、平、細弦、細滑、弦滑”8 類脈象進行分類模型訓練,RF 方法在脈象分類實驗中展現了優越的分類性能,其平均分類準確度為81.75%。
為了更全面地比較各個ML 算法在脈象分類上的效果,本文列舉了上述不同脈象分類方案的分類準確度,如表1 所示。表中列出了不同脈象分類策略中所使用的ML 算法、數據集大小、脈搏信號類別數量以及識別率。

表1 不同脈象分類方法的比較
本文總結分析了當前ML算法在脈象分類上的應用,包括基本ML 算法、NN 算法以及集成學習算法。基本ML 算法主要采用人工提取的脈搏特征作為ML 算法的輸入來建立脈象分類模型。因為脈搏信號復雜,人工提取的特征很難從多個角度體現脈搏信號的特性,導致部分細節信息可能會丟失。此外,僅僅依靠有限的特征參數訓練的脈象分類模型并不具備中醫個性化診斷的特點,若想進一步應用于臨床或進行商業化生產以實現個性化醫療還需改進算法和方案。與此相比,NN 算法可以通過自學習特征來建立分類模型,并減少對人工提取特征的依賴,從而有效促進分類效果,為建立脈象分類模型提供新方向。另外,集成學習算法可以通過選擇基礎學習器將人工特征和自動提取的特征相結合,為提高脈象分類的準確度提供了新思路。總之,利用ML 技術實現脈象分類是可行的。隨著NN 結構中模塊的不斷改進和融合以及集成學習算法的引入,將有望發掘出脈搏信號中更深層次的相關性,獲得更高的識別率。但目前仍有一個難題,即無法得知分類模型中脈象特征和脈象類型的歸類機理與中醫對于脈象的定義是否一致。為了解決這個問題,研究者仍需要進一步探索和研究。
目前,脈象儀結合智能穿戴設備和應用程序可實現日常的自我檢測,智能脈象儀采集脈搏信號,應用程序生成診斷和養生報告,幫助用戶改善身體狀態。但這僅可滿足用戶最基本的養生需求,還遠遠不能預防疾病或防止病情進一步惡化。因此,未來將致力于改進脈象儀,并增加“望聞問”三診,實行四診并用以更全面地了解病情,同時結合中西醫理論,建立一個數據庫來匹配病癥及相應的診療方案。這不僅需要在脈象儀中增加新的功能和集成新的技術,如拍照觀氣色的人臉識別技術、錄音聽聲息的語音識別技術、能夠識別氣味的氣體傳感器以及ChatGPT 智能語言處理技術等,還需要脈象儀具備高精度的信息匹配和計算能力。然而,這一過程必然面臨許多挑戰,需要中醫、西醫和科研工作者們共同努力,創造一個高效、精確的中西醫信息系統。