999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于模糊C均值聚類算法的蒙醫方劑類別劃分方法研究

2017-08-07 13:05:51張春生圖雅李艷
中國中醫藥信息雜志 2017年8期
關鍵詞:數據挖掘研究

張春生,包?圖雅,李艷

內蒙古民族大學計算機科學與技術學院,內蒙古 通遼 028043

基于模糊C均值聚類算法的蒙醫方劑類別劃分方法研究

張春生,包?圖雅,李艷

內蒙古民族大學計算機科學與技術學院,內蒙古 通遼 028043

目的 采用模糊 C 均值聚類(FCM)和硬 C 均值聚類(HCM)算法對蒙醫方劑進行類別劃分,探討 2 種聚類算法的合理性。方法 選取《傳統蒙藥與方劑》中治療赫依病的 27 首蒙醫方劑,進行數據預處理。采用 MS Visual Studio 2010 平臺,使用 C#語言進行開發,分別運用 Window From、WPF 技術實現漢、蒙文版本。采用 FCM 和 HCM 算法按 3、4、5、6 個類對數據進行聚類分析。結果 所有相異數不為零的分類都存在包含現象,2種聚類算法得到的分類結果中藥物不存在交叉。與HCM算法比較,FCM 算法的分類結果中各類樣本數量差較小,即分類較均勻。結論 2 種算法均正確合理,其中 FCM 算法具有更好的聚類效果,可廣泛應用于蒙醫方劑分析,為新藥研制提供數據支持。

模糊C均值聚類;硬C均值聚類;蒙醫;方劑;聚類;配伍

數據挖掘技術自產生以來,無論在算法理論還是應用研究方面均取得了豐富的研究成果,聚類分析作為數據挖掘的一種重要算法,在數據挖掘應用中起到了關鍵的作用。在中醫方劑理論研究方面,它可按各項指標要求對方劑信息進行聚類分析,從而揭示其配伍規律,為新藥研究提供數據支持。

目前,已有研究采用聚類分析方法分析中醫方劑配伍規律[1-4],但在蒙醫方劑聚類分析方面鮮有報道。目前該領域研究多采用一般的統計軟件作為分析工具,尚未建立專門的數據庫及開發通用程序,缺乏系統性、通用型、靈活性。

本研究在前期研究[5-6]基礎上開發了一套通用的蒙醫方劑數據挖掘系統。該系統集成了模糊C均值聚類(FCM)算法和硬 C 均值聚類(HCM)算法,可進行結果對比,同時HCM算法可為FCM算法提供初始中點服務。用戶可根據需要選擇合適的聚類算法,揭示蒙醫方劑配伍規律,為蒙藥新藥研制提供參考。

1 模糊 C 均值聚類算法

FCM 算法即眾所周知的 ISODATA 模糊聚類算法,是通過隸屬度即隸屬于某類程度實現聚類的一種算法,1973 年由 Bezdek 提出,是一種基于劃分的聚類算法。它的主旨是使被劃分到同一簇的對象間相似度最大,而不同簇間相似度最小。該算法是在 HCM算法硬性數據劃分的基礎上改進的一種柔性模糊劃分。核心思想為把 n 個一維向量 xi(i=1,2,…,n)分為C個模糊組,并求每組的聚類中心,使非相似性指標的價值函數達到最小。FCM 算法與 HCM 算法的主要區別在于其類的劃分原則是模糊的,每個數據點屬于哪一個類并不明確,而是用[0,1]區間的一個模糊值來確定屬于各個類的程度來表示。隸屬度是經過歸一化的,一個數據集的隸屬度總和等于1:

FCM 算法的價值函數/目標函數一般化形式為:

其中 uij屬[0,1];ci為模糊組 i 的聚類中心,為第 i個聚類中心與第 j個數據點間的歐幾里德距離;且是一個加權指數。

構造如下新目標函數,構建最小值的必要條件:

這里 λj(j=1,2,…,n)是公式①的 n 個約束式的拉格朗日乘子。對所有輸入參量求導,使公式②達到最小的必要條件為公式④和公式⑤:

FCM 算法分析步驟:步驟 1:構建滿足公式①的隨機隸屬度矩陣 U。步驟 2:計算每個類的中心點。步驟 3:計算價值函數。若價值函數小于給定閾值或與上次相比價值函數的變化量小于給定閾值則算法結束。步驟 4:重新生成隸屬度矩陣 U,回到步驟 2。

2 數據預處理

每首蒙醫方劑中包含的藥物數量和種類不同,而聚類分析要求所有方劑構成一個矩陣,因此模糊聚類分析第一步是對方劑數據進行預處理操作。

設原始方劑事務集為 T={t1,t2,…,tn},ti的屬性(藥物組成)集為 Ui={ri1,ri2,…,rik},對應的藥物重量集為 Wi={wi1,wi2,…,wik},預處理后事務的屬性集應包含所有的 Ui中的屬性,即預處理后的屬性集為 U={r1,r2,…,rm}為所有 Ui的并集。最終形成二維矩陣 D[n,m],n 為事務數,m 為 U 的屬性數。算法描述如下。

U=null

for i=1 to n //遍歷所有事務(方劑)

scan r Ui

//遍歷當前方劑中各個屬性(藥物)

if r not in U

//若當前方劑中屬性 r 不在 U 中

U=U ∪ r; //U 并入 r

endif

endscan

endfor

D[n,m]=0 //二維矩陣初始化為 0

for i=1 to n //遍歷所有事務(方劑)for j=1 to m //遍歷 U 中的每個屬性

if rjin Ui

//若 U 中的屬性 rj在當前方劑的屬性中

D[i,j]=wij;

//二維矩陣對應位置填對應的重量

endif

endscan

endfor

3 聚類分析程序設計

將 MS Visual Studio 2010 作為開發平臺,采用 C#語言進行開發,同時提供漢、蒙文2種版本,分別采用 Window From、WPF 技術實現。該系統可提供 FCM、HCM 2 種聚類算法,可進行聚類結果比較,同時 HCM算法可為 FCM 算法提供初始中心點服務。

FCM 算法設置了靈活的初始中心點和反模糊方法。初始中心點生成算法包括隨機中心點方法、隨機隸屬度矩陣算法,由HCM算法生成。反模糊方法包括最大隸屬度方法、中位數法、加權平均法。靈活多樣的生成算法為最終的聚類結果提供了保障。

4 案例實驗

本研究以《傳統蒙藥與方劑》[7]中治療“赫依病”的 27首蒙醫方劑為例,討論方劑的聚類分析方法,27 首方劑共涉及藥物 87 味。

對納入方劑進行數據預處理,得到一個 27×87的二維矩陣,可用于 FCM 算法聚類。由于各方劑間藥物組成相差較大,采用隨機中心點方法或隨機隸屬度矩陣算法產生的初始中心點,對應的聚類結果并不理想。因此,本研究的初始中心點采用HCM算法生成。應用程序界面見圖1。

同時采用 FCM 和 HCM 2 種算法對聚類數為 3、4、5、6 的方劑分布情況進行分析,聚類分析結果見表 1~表 4,2 種算法聚類結果的差異情況見表 5~表8。

圖 1 蒙醫方劑數據挖掘系統聚類算法應用程序界面

表 1 27 首治療赫依病蒙醫方劑聚類數為 3 時分布情況

表 2 27 首治療赫依病蒙醫方劑聚類數為 4 時分布情況

表 3 27 首治療赫依病蒙醫方劑聚類數為 5 時分布情況

表 4 27 首治療赫依病蒙醫方劑聚類數為 6 時分布情況

表 5 聚類數為 3 時不同算法聚類結果比較

表 6 聚類數為 4 時不同算法聚類結果比較

表 7 聚類數為 5 時不同算法聚類結果比較

表 8 聚類數為 6 時不同算法聚類結果比較

聚類結果表明,當分類數為3類和4類時效果較好,其中“蘇格木勒-3 音湯”和“烏莫黑.達布日海-5”為穩定的獨體類,說明這2種方劑嚴格不同于其他方劑;另外,所有相異數不為零的分類都存在包含現象,2種聚類算法得到的分類結果中藥物不存在交叉,即某一子集要么在A類,要么在B類,是聚類算法不同造成的,反映了2種聚類算法的合理性;從分4類的結果來看,除“蘇格木勒-3 音湯”和“烏莫黑.達布日海-5”2 個獨體類外,另 2 個類的相異藥物數均為 8,由于相互包含關系的存在,實際上就是這 8個相異藥物歸屬哪一類的問題。

與 HCM 算法比較,FCM 算法在類的劃分上引入隸屬度概念,從理論上 FCM 算法的分類結果更理想。本研究結果表明,與 HCM 算法比較,FCM 算法聚類結果中各類樣本數量差較小,即分類較均勻;本課題組蒙醫方劑學專家分析同樣認為 FCM 算法分類結果更合理。

6 小結

本研究在蒙醫方劑數據挖掘平臺上實現了對蒙醫方劑的 FCM 和 HCM 聚類分析算法,提供了 FCM算法較靈活的生成策略。結果表明,2種算法均正確合理,其中 FCM 算法具有更好的聚類效果,可廣泛應用于蒙醫方劑分析,為新藥研制提供數據支持。

傳統醫藥學具有突出的民族性、地域性和歷史傳承性。中醫藥學與蒙醫藥學在哲學思想、藥性理論及其在各自醫藥理論指導下的臨床用藥等方面,均有相通之處,但又各成體系、各具特色。目前,基于數據挖掘的中醫方劑研究已較成熟,但針對蒙醫方劑的研究卻鮮有報道。本研究對方劑進行了簡單分類以驗證算法合理性,在此基礎上可進一步對各類中的藥物頻次、功能、主治等進行分析。該方法可為保護蒙醫藥文化遺產、蒙醫藥研究提供新途徑,也可為蒙藥研發提供參考,具有一定的社會效益和經濟價值。

[1] 劉樹春,劉洋,張曉瑋,等.基于方劑數據的補腎常用中藥及其配伍規律的挖掘分析[J].中國實驗方劑學雜志,2015,21(20):208-212.

[2] 郭棟,童元元,黃生權,等.基于數據挖掘的枸杞研究熱點分析[J].中國中醫藥信息雜志,2016,23(9):48-51.

[3] 宋京美,吳嘉瑞,姜迪.基于數據挖掘的國家級名老中醫治療腫瘤用藥規律研究[J].中國中醫藥信息雜志,2015,22(6):50-53.

[4] 徐曉晶,徐麗敏,沈春鋒,等.孟河醫派徐迪華治療咳嗽經驗用藥分析研究[J].中國中藥雜志,2015,40(21):4301-4305.

[5] 張春生,圖雅,翁慧,等.基于關聯規則的條件函數依賴發現及數據修復[J].計算機應用研究,2016,33(2):384-387.

[6] ZHANG C S, TU Y. The design and real ization of mongolian medicine prescription data mining system[C]//2016 3rd International Conference on Information Science and Cont rol Engineering,2016.

[7] 奧?烏力吉,布和巴特爾.傳統蒙藥與方劑[M].赤峰:內蒙古科學技術出版社,2013:12.

Study on M ongolian M edicine Prescription Classification Method Based on Fuzzy C-means Algorithm

ZHANG Chun-sheng, BAO Tu-ya, LI Yan (College of Computer Science and Technology, Inner Mongolia University for Nationalities, Tongliao 028043, China)

Objective To classify Mongolian medicine prescription by using fuzzy c-means algorithm (FCM) and hard c-means algorithm (HCM); To explore the rationality of two kinds of clustering algorithm. Methods 27 Mongolian medicine prescriptions for treating Heiyi disease from Chuan Tong Meng Yao Yu Fang Ji were set as experimental data, and the data were preprocessed first. MS Visual Studio 2010 platform was used, and C# language was used for research and development. Chinese version and Mogolian version were implemented With Window From and WPF technology, respectively. The medicine prescriptions were classified into 3, 4, 5, and 6 types by using FCM and HCM. Results All categorization With zero classification showed the existence of inclusion phenomena. The medicine in the classification results obtained by the two kinds of clustering algorithm did not exist cross. FCM could produce clustering results With smaller quantity difference and the more uniform classification compared With HCM. Conclusion The two algorithms are correct and reasonable, in which FCM algorithm has better clustering effect, and can be w idely used in Mongolian prescription analysis, With a purpose to provide data supports for the research and development of new medicine.

fuzzy c-means algorithm; hard c-means algorithm; Mongolian medicine; prescription; clustering; compatibility

10.3969/j.issn.1005-5304.2017.08.022

R2-05;R291.2

A

1005-5304(2017)08-0099-05

2016-08-31)

2016-09-09;編輯:向宇雁)

國家自然科學基金(81460656)

包?圖雅,E-mai l:baotuya1978@163.com

猜你喜歡
數據挖掘研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
探討人工智能與數據挖掘發展趨勢
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 国产99在线| 亚洲人成影院午夜网站| 久久婷婷五月综合97色| 欧美精品一二三区| 亚洲男人的天堂在线| 91香蕉国产亚洲一二三区 | 五月天天天色| 国产91导航| 国产另类视频| 国产三级毛片| 在线观看91香蕉国产免费| 99久久精品国产综合婷婷| 丁香六月激情综合| 国产美女一级毛片| 婷婷在线网站| 69免费在线视频| 国产电话自拍伊人| 欧美性久久久久| 久久国语对白| 亚洲自拍另类| 久久人人妻人人爽人人卡片av| 亚洲va在线∨a天堂va欧美va| 99热国产这里只有精品9九 | 999精品免费视频| 国产精品综合久久久| 久久婷婷六月| 中国成人在线视频| 亚洲国产成熟视频在线多多| 国产系列在线| 亚洲国产精品一区二区第一页免| 亚洲人成在线精品| 欧美一级夜夜爽www| 中文字幕天无码久久精品视频免费| 久久a毛片| 国产精品9| 亚洲人成网18禁| 欧美日韩一区二区在线播放| 狼友视频国产精品首页| 国产精品自在线天天看片| 国产精品爆乳99久久| 国产a v无码专区亚洲av| 久无码久无码av无码| 久久久久免费精品国产| 伊在人亚洲香蕉精品播放| 欧美全免费aaaaaa特黄在线| 免费欧美一级| 久久无码高潮喷水| 亚洲欧美综合在线观看| 波多野结衣第一页| 五月天在线网站| 欧美成人午夜在线全部免费| 国产迷奸在线看| 久久天天躁狠狠躁夜夜躁| 国产91在线|日本| 国产人成网线在线播放va| 国产人成乱码视频免费观看| 亚洲愉拍一区二区精品| 97在线免费视频| 一级福利视频| 日韩精品少妇无码受不了| 国产91线观看| 欧美不卡视频在线| 在线精品自拍| 日韩在线中文| 日本免费高清一区| 亚洲色欲色欲www网| 国产成人久视频免费| 欧美日韩午夜| 久久国产精品麻豆系列| 亚洲手机在线| 2024av在线无码中文最新| 亚洲精品桃花岛av在线| 美女国内精品自产拍在线播放| 91麻豆精品国产高清在线| 一级黄色片网| 日韩精品无码一级毛片免费| 91青草视频| 国产欧美视频综合二区| 在线视频精品一区| 一级毛片在线播放免费观看| 欧洲一区二区三区无码| 色综合a怡红院怡红院首页|