999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于神經網絡和支持向量機的中醫體質辨識模型研究*

2020-08-07 09:22:06潘思行周蘇娟黃展鵬
世界科學技術-中醫藥現代化 2020年4期
關鍵詞:特征模型

潘思行,林 育,周蘇娟,黃展鵬

(1. 廣東藥科大學公共衛生學院 廣州 510310;2. 廣州中醫藥大學臨床藥理研究所廣州 5100063. 廣東藥科大學醫藥信息工程學院 廣州 510006)

中醫體質指的是體內陰陽、氣血、津液盛衰變化引起的一種的反應狀態[1],是體現機體對外界因素反應性、易感性、傾向性的個性特質。體質的變化可以直接影響病證的形成、轉變和轉歸,是制約疾病發生、發展和變化的重要因素。舌受體內氣血津液的滋養,是反映人身體狀態的一扇窗戶。舌象表現也是中醫體質分類最易掌握、最易客觀化的一項[2]。隨著計算機科學的發展,采用計算機輔助實現中醫舌診的客觀化研究已成為中醫現代化發展的熱點之一[3]。張季等利用數字化舌象多重分形譜特征參數,構建出自動辨識舌象苔質特征的神經網絡分類器,取得了良好的識別效果[4]。張新峰通過粗糙集理論融合舌象的特征,構建出基于概率輸出的體質識別支持向量機分類器,為中醫舌象的輔助診斷提供了量化依據[5]。然而形體特征作為機體體質的另一種外在表現形式,在體質辨識研究中甚少論述。本文通過提取數字化舌象、形體特征并構建人工神經網絡(Artificial Neural Network,ANN)和支持向量機(Support Vector Machine,SVM)兩種中醫體質自動辨識模型,探索中醫以舌辨質的高效自動識別方法,為中醫體質辨識客觀化、規范化研究提供科學依據,為中醫藥現代化的傳承和發展奠定了理論基礎。

1 數據來源

選取自愿參與舌圖像數據采集和中醫體質測定的受測者231 人,其中男100 人、女131 人。在光源恒定的現場采集舌圖像、測量形體數、收集體質數據,同時由兩名中醫師根據《中醫體質分類與判定自測表》確定其體質類型,再對采集的舌圖像進行特征分析,取得客觀化的舌象數據,經相關性分析后建立基于舌象和形體特征的輔助中醫體質辨識模型,并選擇分別用人工神經網絡和支持向量機兩種模型進行比較分析,在人工神經網絡識別模型中分別采用單網絡多類輸出值網絡和一個網絡一個輸出網絡兩種,具體研究思路如圖1所示。

圖1 融合舌象和形體特征的中醫體質辨識模型研究思路圖

圖2 舌圖像的特征分析

2 舌象和形體特征的分析處理

在體質辨識中,采集的舌圖像需要進行分析處理,取得舌象的顏色特征、紋理特征和齒痕特征的數據,以和形體特征一起作為體質辨識模型的輸入,在體質辨識中融入舌象和形體等客觀化的信息。

2.1 舌苔和舌質的分割和特征的提取

研究在已經提取舌所在區域的圖像上,采用最大類間方差法將舌圖像分割成舌質和舌苔兩部分[6-7]。最大類間方差法先確定圖像的灰度閾值,然后用該圖像的所有像素點的灰度值與該閾值進行比較,小于閾值的則直接將該像素的灰度值賦值為0,大于該閾值的則直接將該像素點的灰度值賦值為255,由此便可將圖像劃分為兩類區域,通過不斷地調整閾值,找到使區域的類間方差達到最大或者類內方差最小的閾值,從而達到區域劃分成舌質和舌苔的目的,其舌質和舌苔的分析效果如圖2 所示,圖2(a)為舌圖像的原圖,圖2(b)和圖2(c)分別為用最大類間方差法分割后的舌苔和舌質圖,以便用于舌苔紋理特征分析和舌質與舌苔的顏色特征分析。

2.2 舌象的顏色特征分析

在分割了舌苔和舌質的基礎上,需要分析舌象的顏色特征。傳統RGB(即紅綠藍三原色)色彩模式是工業界的一種顏色標準,通過改變紅色(Red)、綠色(Green)、藍色(Blue)三種顏色深淺變化和疊加程度得到各式各樣的顏色。由于R、G、B 三個分量之間相關性高,且RGB 彩色空間色彩均勻性較差,無法用空間距離來度量兩種色彩的相似性,而HSI(Hue-Saturation-Intensity,HSI)色彩空間用色調、飽和度和亮度來描述色彩,亮度分量與色度分量是分開的,比傳統RGB 色彩空間更符合人的視覺特性,適合于彩色特性檢測和分析。因此在舌象的顏色特征表示上選擇HSI顏色空間計算其色調和飽和度分量的值,這兩個分量與患者舌象的色彩特征聯系緊密。RGB空間轉化為HSI空間的公式如下:

上述式中的R、G和B分別表示RGB顏色空間中紅色、綠色和藍色分量的值。

利用式(1)、式(2)和式(3)將已經分割的舌苔和舌質彩色圖像變換到HSI 顏色空間,然后計算色調和飽和度分量的均值,以此作為舌苔和舌質的顏色特征值。

2.3 舌苔的紋理特征分析

依據分割后的舌質和舌苔區域,依據中醫體質辨識主要依賴舌質和舌苔的顏色以及舌苔的紋理等情況,根據式(1)和式(2)分別計算舌質和舌苔的色調和飽和度值的均值,而舌苔的紋理特征通過分析舌苔區域的亮度均值和平滑度來描述。舌苔的亮度均值計算公式:

其中,zi是表示亮度的一個隨機變量,p(zi)是一個區域中的灰度級的直方圖,L為可能的亮度級數。

舌苔的平滑度計算公式:

2.4 舌象的齒痕特征分析

齒痕是指舌體邊緣見牙齒的痕跡,多因舌體胖大而受齒緣壓迫所致,其對臨床辨證論治有很大的指導意義,因此將齒痕作為舌象特征引入體質辨識,采用基于道格拉斯-普克法刪除冗余頂點的舌齒痕個數提取方法,該方法能有效保持原曲線大波峰而過濾小波峰,有利于舌齒痕特征的提取[8]。其基本思路是:對每一條曲線的首末點虛連一條直線,求所有點與直線的距離,并找出最大距離值dmax,用dmax與限差D 相比:若dmax<D,這條曲線上的中間點全部舍去;若dmax≥D,保留dmax對應的坐標點,并以該點為界,把曲線分為兩部分,對這兩部分重復使用該方法,將統計的齒痕的數目作為中醫體質辨識中舌象特征的一個重要指標。其分析結果如圖2(d)所示,綠色為齒痕的區域,圖中紅色正方形為算法識別的齒痕,據此統計齒痕的數目。

2.5 形體特征的提取

形體研究中形體特征采用身體質量指數(Body Mass Index,BMI),數據采集過程中,身高和體重分別用卷尺(研究對象直立靠墻壁,三角板壓頭皮,測量裸足腳底距三角板的距離,精確至0.001 m)和電子體重秤測量(精確至0.1 kg),用體重公斤數除以身高米數平方得出的數字即為受測者的BMI值。

2.6 數據的歸一化處理

基于上述步驟的計算,分別得到了舌苔和舌質的色調和飽和度值,舌苔的亮度均值和平滑度,以及齒痕數目和代表形體特征的BMI 值,由于這些值差異較大,為了使上述8個屬性值具有相同的權重,本文采用高斯歸一化方法進行歸一化處理。設V=[v1,v2,v3…vN],為V的均值,σ為V的標準差,歸一化處理:

對大于1 和小于-1 的值分別取1 和-1,以保證所有值均落在[-1,1]的區間,使得上述屬性值在中醫體質辨識中具有同等的權重。

3 神經網絡和支持向量機的中醫體質辨識模型

3.1 人工神經網絡模型

人工神經網絡是由多個相互關聯的神經元連接構成的網狀系統,該系統可以根據現有信息不斷自主學習并自動完善自身結構。人工神經網絡利用自帶的學習函數將每一條樣本數據構造成一對“輸入值/目標輸出值”的映像關系[9],并通過這種充分的訓練獲得對該類數據的自動識別能力。根據神經元之間的不同連接方式(拓撲結構),人工神經網絡可分為:單網絡多類輸出值網絡(All Class in One Network,ACON)、一個網絡一個輸出網絡(One Class in One Network,OCON)兩種。

3.1.1 ACON神經網絡模型

其網絡包括三層:輸入層、中間層(隱藏層)和輸出層,網絡訓練算法常見的是誤差反向傳播算法。訓練過程主要分為計算輸出值和調整網絡權值兩個過程。1.計算輸出值:網絡接收輸入層的所有舌象和形體的特征向量,并在隱藏層給每一個向量分配初始權值和閾值再通過運算得到四種體質的輸出值。2.調整網絡權值:網絡將輸出值與目標輸出值進行比較,計算各層的輸出誤差并通過該誤差調整輸入層和隱層、隱藏和輸出層之間的連接權值和閾值。然后重新開始計算新的四種體質的輸出值(反復迭代的過程),直到網絡的實際輸出與目標輸出之間的誤差達到了可以接受的范圍或者迭代的次數達到了預先設定的最大值為止。ACON神經網絡中醫體質辨識如圖3所示。

3.1.2 OCON神經網絡模型

研究中該網絡由四種體質預測網絡組成,通過一系列運算構造輸入特征向量與體質輸出之間映像關系,從而實現體質的辨識。每個網絡結構與ACON 類似,但只有一個輸出值,即每一種體質都單獨創建一個網絡。由于單個網絡輸出少,每個網絡結構更簡單、運算更快捷、更容易訓練,但需要針對每種體質構建一個中醫體質識別模型,其中醫體質辨識模型如圖4所示。

3.2 支持向量機模型

支持向量機是一種二元分類器,其結構大致可以分為輸入層、核空間和輸出層。其原理是統計學習理論的VC 維理論和結構風險最小原理,追求在現有信息下的最優解的過程。支持向量機通過映射函數將低維特征向量映射到高維空間里,然后尋找一個最優的超平面將向量充分分割,使分割后的兩部分數據點離平面的距離最遠。分類過程的關鍵是利用核函數把復雜的分類過程通過映射轉化成一個線性可分問題[10]。

支持向量機算法的原理就是找到一個分割超平面,它能把數據正確的分類,并且間距最大,線性可分的支持向量機模型如圖5 所示,H 為分類面,H1 和H2上的點為分類的支持向量。對于非線性可分的數據,采用徑向基核函數為內積核函數,是一種沿徑向對稱用于計算空間中任一點到某一中心間歐氏距離的單調函數,本研究采用高斯徑向基函數核,對于每種中醫體質分別建立支持向量機辨識模型,利用現有舌象和形體特征以及中醫體質數據進行訓練,然后辨識模型可識別測試的數據是否為該體質。

4 結果

根據采集的舌圖像、形體和性別數據,以及對應的中醫體質辨識結果,利用Matlab 編寫程序,對舌圖像的顏色特征、紋理特征和齒痕特征進行分析處理,取得對應的特征值并進行歸一化處理,用SPSS對中醫體質與上述特征的相關性進行分析,以篩選有用的特征量用于體質辨識,再導入Matlab 編寫的神經網絡模型和支持向量機模型進行中醫體質辨識。神經神經網絡的隱含層的神經元節點個數為10,訓練函數為附加動量的梯度下降法;支持向量機采用二次核函數,其它參數為默認值。

圖3 ACON神經網絡結構中醫體質識別模型示意圖

圖4 OCON神經網絡結構中醫體質識別模型示意圖

圖5 支持向量機的分類模型示意圖

由于體質分布的差異,采集的樣本中陽虛質、痰濕質、濕熱質、血瘀質和特稟質等五種體質的樣本數量低于30 例,模型的訓練和測試的穩定性較差,剔除上述五種體質后剩余樣本共184 例,其中平和質90例,氣虛質45 例,陰虛質62 例和氣郁質50 例,因中醫體質存在兼質,四種體質的樣本例數之和大于剩余樣本總數。在對平和質、氣虛質、陰虛質、氣郁質四種體質與性別、形體質量指數和舌象特征進行相關性分析的基礎上,利用人工神經網絡和支持向量機進行中醫體質自動辨識研究。

表1 中醫體質類型與性別、舌象和形體特征的相關系數

4.1 相關性分析結果

相關系數是變量之間線性相關程度的指標,取值范圍在[-1,1]之間,正數為正相關,負數為負相關,本文采用皮爾遜相關系數,其定義為兩個變量之間的協方差和標準差的商。本研究對各變量歸一化后值與四種體質做相關性分析,結果顯示,中醫體質與舌象和形體特征存在一定的相關性,其舌的齒痕特征、身體質量指數和舌苔的色調的相關性較大,如表1 所示。舌質的飽和度分量與四種體質的相關性太低,在后續的中醫體質模型辨識中不予納入。

4.2 支持向量機和人工神經網絡的中醫體質辨識結果

為保證最終分類科學性、準確性和可重復性,本研究采用隨機抽取樣本并多次訓練的方法,最終預測結果取平均值。每次隨機抽取70%的樣本訓練,剩余30%樣本用于預測,重復10 次訓練,取所有預測結果平均值作為最終辨識的結果。對于ACON神經網絡模型,體質數據分別用不同的值代表不同的體質,將所有訓練數據導入模型進行訓練,然后利用模型根據輸入的測試數據中的舌象和形體特征數據進行體質辨識;OCON 神經網絡模型則需要為每種體質建立一個模型,然后將訓練數據中屬于該體質的體質類型值設為1,其它為0,對模型進行訓練,再用測試數據中的舌象和形體特征數據作為輸入對所有的模型進行測試,以此計算其準確性;支持向量機模型的訓練和測試方法與OCON 神經網絡模型類似,需要對每種體質建立模型,測試也需要將輸入導入所有模型得到其辨識結果。由表2 可知,支持向量機在測試的四種體質中總體表現優于人工神經網絡,故可見在樣本量不大的情況下進行輔助中醫體質辨識,支持向量機的總體準確率較高。

表2 基于支持向量機和人工神經網絡的中醫體質辨識準確率比較/%

5 討論

現代中醫體質學在中醫治未病領域,將體質分為平和(健康)體質和偏頗體質兩大類,主張在疾病發病前糾正偏頗體質狀態,以達到預防疾病、防患于未然的效果[11]。此外,深入剖析偏頗體質在疾病產生對應證型的過程中所起的從化作用,可以從體質角度闡明同一疾病在不同個體間存在證型差異的原因,發揮中醫個性化“治未病”獨特優勢[12]。袁尚華等[13]分析正常高值血壓人群中醫體質與血壓值相關性,發現復合偏頗體質多見,為開展中醫高血壓“未病”體質干預提供科學依據。基于傳統以望診、問診為主的中醫體質辨識方法受主觀化影響較大的特點,客觀化的辨識技術為中醫診療現代化開拓了新的出路。

舌診是中醫辨識體質的常用望診方法之一。臟腑之寒熱虛實、氣血之興盛衰敗,皆可由舌象變化間接顯現。黃婧文等[14]分析糖脂代謝病患者體質類型及舌象特點,發現患者以氣虛質居多(40%),舌象以淡紅舌薄白苔為主。羊琪琪等[15]采用舌面一體儀分析學齡前兒童體質類型與舌色色調的關系,發現不同偏頗體質者舌質的紅色、綠色、藍色和色調各有不同(P<0.05),兩者之間存在明顯的相關性。形體主要指人體高矮胖瘦的身形體態特征,是人體體質狀況的另一種間接反映,與人體體質關聯緊密,引入客觀化的形體特征有利用提升中醫體質辨識的客觀化水平。綜上,融合舌象特征和形體特征的客觀化診斷技術,在中醫體質輔助辨識中具有較好的研究價值。

人工神經網絡是一種模擬生物神經系統原理的新型智能信息處理系統,擁有并行分布式處理、自學習、良好容錯性等特點[16],現已普遍用于中醫藥領域。田艷鵬等運用徑向基和多層感知器人工神經網絡分別構建高血壓病痰濕壅盛證診斷模型,測試準確率均超過90%[17]。羅悅等采用人工神經網絡,構建中醫體質與體檢指標關聯模型,學習誤差可以控制到0.001[18]。趙書穎等采用多層感知器、徑向基函數人工神經網絡建立高血壓病陰陽兩虛證診斷模型,測試正確率達到93.9%、96.3%[19]。人工神經網絡的主要優點有:1.對高維數據的分類更準確、更高效;2.建模前不需要考慮變量間的交互作用、線性和非線性關系[20]。其缺點是:1.對網絡構建需要有一定的先驗知識基礎,涉及結構選擇問題,局部極小值問題,過度擬合問題等。2.當樣本量過大、隱含層層數或神經元個數過多時,會使網絡復雜化,訓練時間延長。

支持向量機是近年興起在中醫藥領域的基于統計學風險最小原理分類預測算法,可以根據有限信息在簡化模型和保證學習能力之間尋求全局最優方法,具很好的推廣性[16]。許明東等運用支持向量機算法探討高血壓中醫證候與血脂、血尿酸、空腹血糖的關系,最終總體識別準確率高達90.8%[21]。闞紅星等根據2型糖尿病3 種證型的舌象特征,提取舌體、舌苔及舌質的顏色、裂紋和胖大特征值,實現2型糖尿病的中醫證型識別,其靈敏度達到93.85%[22]。支持向量機的優點是不需要先知經驗,通過目標向量從低維空間向高維映射的方法,將復雜分類轉化成簡單的線性可分問題。很好地解決小樣本、非線性、高維數和局部最小等實際問題[5]。支持向量機的缺點是這種二次型尋優算法,面對大樣本時模型訓練的速度會變慢,適用性會受到影響。

本研究中人工神經網絡和支持向量機的辨識結果顯示,舌象、形體特征在中醫體質臨床辨識中起到重要作用,有利于提升中醫體質識別的客觀化水平。人工神經網絡是受生物神經網絡啟發而構建的算法模型,其需要大量數據進行訓練;支持向量機是一種有堅實理論基礎的新穎的小樣本學習方法,最大化分類邊際的思想是支持向量機方法的核心,支持向量機的最終決策函數只由少數的支持向量所確定。研究結果也表明,在樣本量不大的情況下,支持向量機的體質辨識效果要優于人工神經網絡,而人工神經網絡網絡中又以單網絡多類輸出值網絡更優。分析結果中存在的陰虛質的支持向量機識別率較低的原因可能與陰虛質的體質特征區分度不高相關,導致支持向量確定的支持向量難于有效地區分是否為陰虛質。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 免费在线视频a| 精品国产香蕉在线播出| 久久精品国产电影| 国产人在线成免费视频| 婷婷六月激情综合一区| 亚洲av无码人妻| 四虎AV麻豆| 国产精品专区第一页在线观看| 亚洲精品欧美日本中文字幕 | 亚洲福利视频一区二区| 亚洲国产综合精品一区| 久久九九热视频| 国产午夜福利亚洲第一| 国产美女91视频| 四虎影视库国产精品一区| 丝袜高跟美脚国产1区| 欧美日韩另类在线| 在线播放真实国产乱子伦| 精品福利网| 国产乱人乱偷精品视频a人人澡| 91成人免费观看| 精品视频第一页| 99在线观看精品视频| 露脸国产精品自产在线播| 亚洲品质国产精品无码| 亚洲毛片一级带毛片基地| 在线播放精品一区二区啪视频| 亚洲人成电影在线播放| 99久久精彩视频| 色婷婷啪啪| 欧美三級片黃色三級片黃色1| 丝袜亚洲综合| 99色亚洲国产精品11p| 老司国产精品视频91| 97国产精品视频人人做人人爱| 久久久久人妻一区精品色奶水| 亚洲第一成网站| 最新精品久久精品| 亚洲色成人www在线观看| 亚洲va精品中文字幕| 日本人妻丰满熟妇区| 日本一本在线视频| 激情视频综合网| 成人一区专区在线观看| 亚洲欧美日本国产综合在线| 青青操国产| 最新国语自产精品视频在| 尤物精品视频一区二区三区| 国产国语一级毛片在线视频| 精品成人一区二区三区电影| 婷婷六月综合网| 青青青国产视频手机| 经典三级久久| 欧美特黄一免在线观看| 亚洲精品国产精品乱码不卞| 色综合久久久久8天国| 免费国产一级 片内射老| 在线观看视频一区二区| 国产区成人精品视频| 精品欧美一区二区三区久久久| 亚洲高清中文字幕在线看不卡| 男人天堂亚洲天堂| 国产麻豆91网在线看| 国产后式a一视频| 日本福利视频网站| 亚洲第一视频网| 久久一日本道色综合久久| 大陆国产精品视频| 91福利在线看| 国内自拍久第一页| 午夜欧美理论2019理论| www精品久久| 国产97公开成人免费视频| 99热这里只有免费国产精品 | 日本免费精品| 日韩无码黄色| 欧美午夜在线播放| 国产xxxxx免费视频| 免费不卡视频| 中文无码精品a∨在线观看| 亚洲欧美日韩久久精品| 日韩精品亚洲一区中文字幕|