999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度神經(jīng)網(wǎng)絡的原發(fā)性肝癌證型診斷分類預測模型*

2020-04-09 06:43:52章新友劉莉萍牛曉錄郭永坤
關鍵詞:肝癌分類模型

丁 亮,章新友**,劉莉萍,牛曉錄,郭永坤

(1. 江西中醫(yī)藥大學計算機學院 南昌 330004;2. 江西中醫(yī)藥大學藥學院 南昌 330004)

原發(fā)性肝癌病(Primary Liver Cancer,PLC)是臨床上特別常見的惡性腫瘤疾病之一,據(jù)最新數(shù)據(jù)報告顯示,中國的原發(fā)性肝癌病的新增患者人數(shù)和死亡人數(shù)均居世界首位[1-4],且發(fā)病率和死亡率呈逐年上升形勢。因此,積極的預防原發(fā)性肝癌病的發(fā)生,提高原發(fā)性肝癌病的治療效果是當下亟待解決的難題。當今對肝癌病的治療均以手術治療、放化療、分子靶向藥等現(xiàn)代化醫(yī)療手段結合為主[5-10],但其臨床效果卻并不理想。近年來,有研究者發(fā)現(xiàn),中西醫(yī)結合治療原發(fā)性肝癌病在臨床上起到了意想不到的效果[11-15]。傳統(tǒng)中醫(yī)診療疾病方法均講究的辨證論治,而“證”則是中醫(yī)診療的核心內(nèi)容,但是現(xiàn)行原發(fā)性肝癌病的中醫(yī)辨證方法眾多,證型分類不規(guī)范,中醫(yī)癥狀、體征以及四診信息等缺乏標準化,這些問題阻礙了原發(fā)性肝癌病治療效果的提高。因此,為了更客觀、更準確的反應疾病的特征,提高中醫(yī)臨床的辨證論治的準確性,本研究根據(jù)中醫(yī)癥狀、體征和四診信息等證型相關因子與證型之間的非線性關系,建立了深度神經(jīng)網(wǎng)絡證型診斷分類預測模型,旨在為臨床診療提供相應的技術支撐,以提高中醫(yī)證型分類的準確性和科學性。

1 研究對象

本文收集了2014 年1 月-2019 年6 月就診于江西省中醫(yī)院1176例肝癌病患者(首次就診)的病歷資料,其病歷資料包含了中醫(yī)癥狀、體征、舌象、脈象和治則治法等詳細信息。其中976例將作為訓練集,200例作為測試集,本文將依據(jù)訓練集建立神經(jīng)網(wǎng)絡證型分類預測模型。

表1 976病歷中證型相關因子(中醫(yī)癥狀和體征)統(tǒng)計表

表2 976病歷中證型相關因子(舌質(zhì)、舌苔和脈象)統(tǒng)計表

2 研究方法

2.1 原發(fā)性肝癌證型的分類及證型相關因子的確定

為使該模型能對臨床病歷數(shù)據(jù)中的中醫(yī)癥狀等信息進行有效分類,首先需要建立原發(fā)性肝癌的證型分類判定標準。因為模型的判定標準涉及到中醫(yī)癥狀、體征以及四診等信息數(shù)據(jù),因此將上述數(shù)據(jù)統(tǒng)一命名為證型相關因子。

本文依據(jù)《中醫(yī)診斷學》《中醫(yī)癥狀鑒別診斷學》以及相關資料文獻的基礎上,結合中醫(yī)專家經(jīng)驗,形成《原發(fā)性肝癌病中醫(yī)癥狀調(diào)查表》,并對976 例原發(fā)性肝癌病患者進行證型相關因子(中醫(yī)癥狀和體征)統(tǒng)計,共計96個,選取出現(xiàn)頻次最多的前40個(表1),通過統(tǒng)計分析不難發(fā)現(xiàn),除去慢性病患者常見的寐差、納差、乏力之外,原發(fā)性肝癌病患者最常見臨床表現(xiàn)為口干、口苦、腹脹、腹痛、脹痛和脅痛。再分析976例病歷可知,舌質(zhì)可分為淡紅等;舌苔可分為薄白等;脈象可分為弦等(表2)。

本文以《新藥(中藥)治療原發(fā)性肝癌臨床研究指導原則》《原發(fā)性肝癌診療規(guī)范(2017 年版)》、衛(wèi)生部“十二五”規(guī)劃教材陳家旭鄒小娟主編的《中醫(yī)診斷學》和張伯禮和薛博瑜主編的《中醫(yī)內(nèi)科學》等[16-18]為主要依據(jù),確定原發(fā)性肝癌的證型分類及證型相關因子(表3、圖1)。

2.2 證型因子的量化

本文結合文獻所記載的方法[19-21],并采用模糊數(shù)學(Fuzzy mathematics)對四診信息和中醫(yī)癥狀進行量化處理。首先從收集的病歷中得知,原發(fā)性肝癌的的辯證分型共有8 種,將這些證型分別記為L1,L2,L3,L4,L5,L6,L7,L8,其次再根據(jù)上文中對每個證型的主要的診斷標準,共統(tǒng)計出74 個證型因子,并將其分別命名為W1,W2,W3...W74,但同一證型的不同證型因子對該證型的影響程度是不同,所以本文采用專家賦值的方法對證型的證型因子進行權重評定(表4)。

以濕熱蘊結證為例,其臨床表現(xiàn)為:口苦W1,口干W2,惡心嘔吐W3,腹脹W4,胸悶W5,小便少W6,色黃W7,大便秘結或便溏不爽W8,舌紅W9,黃膩W10,脈弦滑W11按照上述方法邀請4 位從事中醫(yī)學科的專家填寫表4,得到以下4個評分矩陣:

表3 原發(fā)性肝癌證型的分類及證型相關因子統(tǒng)計表

圖1 原發(fā)性肝癌證型占比圖

表4 證型因子權重賦值評分表

再對所有專家評審的評分矩陣求和:

再求出加權平均評分矩陣:

算出的未歸一化的權值按照λ= 0.5為標準,區(qū)分主要證型因子和次要證型因子,由此可知濕熱蘊結證的主要證型因子:口苦W1,口干W2,小便少W6,大便秘結或便溏不爽W8,舌紅W9,黃膩W10,脈弦滑W11。次要證型因子為:惡心嘔吐W3,腹脹W4,胸悶W5,小便少W6,色黃W7。

然后對證型因子的權值進行歸一化處理:

按照上述方法對各證型的證型因子逐一歸一化處理,統(tǒng)計所得到的不同證型所對應的證型因子的權值。

每個證型因子的程度一般分為3 級分別是輕度(V1),中度(V2),重度(V3),本文將證型因子的量化級別命名為H(Wi),主要證型因子量化賦值為2 分、4 分、6分,次要證型因子的賦值為1分、2分、3分(式1):

若病歷中沒有描述程度,或者出現(xiàn)不屬于辨證主要因素的證型因子(式2):

最終通過上述模糊數(shù)學的方式處理,得到較為合理的中醫(yī)證型因子的量化數(shù)據(jù),再將這些量化后數(shù)據(jù)輸入至深度神經(jīng)網(wǎng)絡證型分類預測模型中,為下一步建立該模型奠定數(shù)據(jù)基礎。

2.3 深度神經(jīng)網(wǎng)絡證型分類預測模型構建

鑒于中醫(yī)藥數(shù)據(jù)大多為非線性的特點,而傳統(tǒng)的數(shù)據(jù)挖掘算法更適合處理線性的、有序的或者邏輯關系強的數(shù)據(jù)集。因此,急需一個合適的非線性的建模方法去處理這些中醫(yī)藥數(shù)據(jù)[22-24]。而人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)可以充分逼近任意復雜的非線性關系,具有很強的魯棒性和容錯性,對處理非線性的中醫(yī)藥領域數(shù)據(jù)有得天獨厚的優(yōu)勢[25-28](圖2)。針對中醫(yī)藥數(shù)據(jù)的非線性、多靶點、影響因素眾多等特點,所以本文擬采用深度神經(jīng)網(wǎng)絡構建原發(fā)性肝癌證型分類預測模型。因為每一例病歷內(nèi)均有中醫(yī)癥狀,舌質(zhì),舌苔和脈象等詳細信息,所以本文決定由這4種證型因子(中醫(yī)癥狀,舌質(zhì),舌苔和脈象)共同決定證型分類,其中輸入層為4種證型因子(即中醫(yī)癥狀體征、舌質(zhì)、舌苔和脈象),建立2 層隱藏層,兩層隱藏層的激活函數(shù)均為relu 函數(shù),輸出為8 種原發(fā)性肝癌證型(圖3)。

2.4 關聯(lián)規(guī)則驗證

在數(shù)據(jù)挖掘中2個或多個變量之間會存在一定的關聯(lián)性,而關聯(lián)規(guī)則挖掘就是用來挖掘出數(shù)據(jù)之間隱藏的關系。在關聯(lián)規(guī)則算法中,強關聯(lián)規(guī)則的產(chǎn)生一般由支持度(Support)、置信度(Confidence)、提升度(Lift)3 個指標決定。支持度表示項集在總項集中出現(xiàn)概率,用來剔除頻次較少的項集,而置信度則是在某事件發(fā)生前提下,該事件出現(xiàn)的概率的大小(即在含有X 的項集中,含有Y 的可能性),可以用來表示項集與項集之間的關系(式3、式4):

圖2 神經(jīng)網(wǎng)絡結構圖

圖3 深度神經(jīng)網(wǎng)絡結構圖

本文參照《中醫(yī)診斷學》和《中醫(yī)內(nèi)科學》對肝癌病中濕熱蘊結證、肝郁脾虛證、氣滯血瘀證、正虛瘀結證、肝氣郁結證、肝腎陰虛證、痰瘀互結證和脾虛濕困證的判斷標準進行模糊數(shù)學量化處理。再采用關聯(lián)規(guī)則的方法[29,30]對976 例病歷的量化數(shù)據(jù)進行挖掘分析,以此為據(jù)來判斷教材中的判定標準是否適用于本文數(shù)據(jù)集,從而對模型的準確性起到一定的驗證作用。

3 實驗結果與分析

3.1 模糊數(shù)學量化處理結果

仿照濕熱蘊結證證型因子的量化操作,依次對氣滯血瘀證等進行量化(表5)。

3.2 深度神經(jīng)網(wǎng)絡分類預測模型結果

常見的模型的評價指標一般有3 種準確率(Accuracy)、精確率(Precision)、召回率(Recall),在分類問題中,一般分為2 類正例和負例,令TP 表示實際為正例同時預測也為正例的樣本數(shù),TN表示實際是負例同時預測也是負例的樣本數(shù),F(xiàn)P表示實際為負例但預測卻是正例的樣本數(shù),F(xiàn)N表示實際為正例但預測卻是負例的樣本數(shù)。各個評價指標計算式(式5、式6、式7)如下所示:

表5 證型因子歸一化數(shù)值表

①準確率:被正確預測(正例和負例)的樣本數(shù)占總樣本數(shù)的比重:

表6 深度神經(jīng)網(wǎng)絡與其他分類算法準確率對比分析表

②精確率:預測正例且實際也為正例的樣本數(shù)占所有預測為正例的樣本數(shù)的比重:

③召回率:預測正例且實際也為正例的樣本數(shù)占所有實際為正例的樣本數(shù)的比重:

在保證模型的穩(wěn)定性和泛化性的前提下,通過對比分析不同的超參訓練下的預測模型的情況,最終確定迭代次數(shù)epoch = 30,minnibatch = 32,為防止過擬合這一現(xiàn)象的出現(xiàn),本模型參照文獻所提出了提前終止測試集、L1和L2正則化加權、soft weight sharing 以及dropout 等方法,經(jīng)過不斷地調(diào)參和嘗試,最終使用dropout=0.5,因為此時的dropout 的隨機生成的網(wǎng)絡結構最多,同時也能減少神經(jīng)元之間復雜的共適應關系來防止過擬合的出現(xiàn)。并采用Adam 優(yōu)化器替換傳統(tǒng)隨機梯度下降過程,提高模型的收斂速率,因其能基于訓練數(shù)據(jù)迭代地更新深度神經(jīng)網(wǎng)絡的權重,更有利于提高模型分類的準確率和運算速率。在上述這些參數(shù)的條件下所得到的深度神經(jīng)網(wǎng)絡預測模型,并根據(jù)上文評價指標中的準確率計算公式,計算出每個證型所預測出來準確率的測試結果并與其他分類算法進行對比分析(表6、圖4),觀察圖表不難發(fā)現(xiàn),從模型預測的準確率來看深度神經(jīng)網(wǎng)絡預測模型相較于支持向量機和貝葉斯網(wǎng)絡預測模型占據(jù)一定優(yōu)勢,尤其在濕熱內(nèi)蘊證、肝郁脾虛證、肝腎陰虛證和脾虛濕困證的模型預測的準確率均在90%以上,可以達到令人滿意的分類結果,同時隨著數(shù)據(jù)量的不斷增加,深度神經(jīng)網(wǎng)絡的在原發(fā)性肝癌證型分類預測模型中的優(yōu)勢就越來越明顯。

表7 頻繁集與教材判定標準對比分析表

圖4 深度神經(jīng)網(wǎng)絡與其他分類算法準確率比較

3.3 關聯(lián)規(guī)則驗證結果

在關聯(lián)規(guī)則分析中,我們設置支持度、置信度均為0.6,挖掘結果如下所示(表7),其中符合率即在頻繁集(即證型中頻繁出現(xiàn)的證型因子)中符合教材判定標準的證型相關因子個數(shù)與判定標準的總數(shù)之比。從符合率上看來,均超過75%,說明該數(shù)據(jù)集符合中醫(yī)教材中的證型判定標準,具有一定科學性和準確性,也從而驗證之前模糊數(shù)學量化數(shù)據(jù)的有效性,對進一步構建深度神經(jīng)網(wǎng)絡證型分類預測模型提供了有力的理論支撐。

4 討論

本文基于深度學習的理念,采用模糊數(shù)學和深度神經(jīng)網(wǎng)絡相結合的方法,建立了原發(fā)性肝癌病證型診斷分類的預測模型,預測準確率介于82.86%-92.76%,并用關聯(lián)規(guī)則方法驗證了預測結果,其符合率介于75%-100%,本研究成果為今后中醫(yī)證型分類的預測研究奠定了實驗與理論基礎。考慮到中醫(yī)證型診斷分類存在特征繁多的情況,通過深度神經(jīng)網(wǎng)絡預測模型恰當減少的參數(shù),用少量必要的參數(shù)模擬出復雜的非線性關系,從而達到了提高模型穩(wěn)定性的效果,并通過關聯(lián)規(guī)則的方法驗證了預測結果的準確程度,其結果表明收集的原發(fā)性肝癌數(shù)據(jù)符合衛(wèi)生部“十二五”規(guī)劃教材陳家旭、鄒小娟主編的的《中醫(yī)診斷學》和張伯禮、薛博瑜主編的《中醫(yī)內(nèi)科學》對中醫(yī)證型分類的判定標準,進一步保障了原始數(shù)據(jù)和模型的可信度。但由于深度神經(jīng)網(wǎng)絡模型容易出現(xiàn)過擬合現(xiàn)象,以及收斂速度緩慢等不足,所以其網(wǎng)絡結構仍有待優(yōu)化,這正是筆者進一步研究的內(nèi)容。

猜你喜歡
肝癌分類模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
LCMT1在肝癌中的表達和預后的意義
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
3D打印中的模型分割與打包
microRNA在肝癌發(fā)生發(fā)展及診治中的作用
主站蜘蛛池模板: 欧美精品在线免费| 欧美三級片黃色三級片黃色1| A级毛片无码久久精品免费| 久久黄色一级片| 亚洲av无码成人专区| 久久综合九色综合97网| 亚洲av色吊丝无码| 欧美日一级片| 国产不卡一级毛片视频| 免费无遮挡AV| 亚洲综合九九| 国产美女视频黄a视频全免费网站| 97视频免费看| 国产极品美女在线观看| 午夜福利在线观看成人| 99尹人香蕉国产免费天天拍| a色毛片免费视频| 麻豆国产精品一二三在线观看| 在线日本国产成人免费的| 国产av无码日韩av无码网站| 国产午夜无码片在线观看网站| 欧美高清视频一区二区三区| 伊在人亚洲香蕉精品播放| 人人澡人人爽欧美一区| 亚洲国产精品不卡在线| 亚洲国产看片基地久久1024| 久久窝窝国产精品午夜看片| 亚洲欧洲自拍拍偷午夜色无码| 中国国产A一级毛片| 91福利在线看| www.日韩三级| 欧美视频在线不卡| 国产又色又刺激高潮免费看| 亚洲成人高清在线观看| 国产精品香蕉在线| 欧美日本在线观看| 九色视频在线免费观看| 97视频免费看| 国产精品主播| 色婷婷久久| 91福利片| 九色在线视频导航91| 婷婷色狠狠干| 99国产在线视频| 日韩精品亚洲一区中文字幕| 91青草视频| 亚洲精品男人天堂| 日韩人妻精品一区| 久久伊伊香蕉综合精品| 激情爆乳一区二区| 色网站在线免费观看| 欧美区一区| 国产va在线观看| 看你懂的巨臀中文字幕一区二区| 无码日韩人妻精品久久蜜桃| 九九久久99精品| 青草视频在线观看国产| 久996视频精品免费观看| 国产视频久久久久| 88av在线看| 在线日韩日本国产亚洲| 手机在线免费毛片| 国产欧美日本在线观看| 亚洲系列中文字幕一区二区| 无码福利日韩神码福利片| 欧美va亚洲va香蕉在线| 久久不卡国产精品无码| 国产免费好大好硬视频| 久操中文在线| 国模私拍一区二区| 少妇高潮惨叫久久久久久| www.99在线观看| 露脸国产精品自产在线播| 精品人妻AV区| 国产精品丝袜在线| 亚洲国产中文精品va在线播放| 女高中生自慰污污网站| 国产91无毒不卡在线观看| 欧美日韩在线成人| 67194成是人免费无码| 国产黄色免费看| 免费AV在线播放观看18禁强制|