999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中醫方藥云智數據挖掘平臺的設計與應用

2024-06-01 00:00:00張錦超黎晶石敏肖建成陳好鐵丁長松黃辛迪
現代信息科技 2024年3期
關鍵詞:數據挖掘

收稿日期:2023-07-17

基金項目:2022年度湖南省大學生創新創業訓練計劃項目(2906);湖南省教育廳普通高等學校教學改革研究項目(HNJG-2022-0726);湖南中醫藥大學校級教學改革研究項目(2020-JG029)

DOI:10.19850/j.cnki.2096-4706.2024.03.003

摘" 要:為整合和利用中醫藥大數據,基于多視角、相似性等方法融合多源數據,建立中醫方藥數據庫,串聯方藥-成分-靶點-疾病數據實體,利用圖數據庫建立可視化知識圖譜。平臺基于機器學習和深度學習構建方藥數據挖掘模塊,基于中藥藥性、方劑組成和深度學習技術實現藥方功效預測,提供方藥數據統計與關聯分析,構建數據挖掘平臺。采用阿里云服務架構,以B/S模式提供中醫藥數據展示、查詢、中藥關聯關系分析、知識圖譜、功效預測等應用服務,利用計算機技術輔助中醫藥信息研究與利用,推進中醫藥信息化發展。

關鍵詞:中醫藥數據;數據挖掘;功效預測;關聯分析;知識圖譜

中圖分類號:TP311.5" 文獻標識碼:A" " 文章編號:2096-4706(2024)03-0011-06

Design and Application of Traditional Chinese Medicine Prescription Yunzhi Data Mining Platform

ZHANG Jinchao1, LI Jing1, SHI Min1, XIAO Jiancheng1, CHEN Haotie1, DING Changsong2, HUANG Xindi1

(1.School of Information Science and Engineering, Hunan University of Chinese Medicine, Changsha" 410208, China;

2.Office of Science amp; Technology, Hunan University of Chinese Medicine, Changsha" 410208, China)

Abstract: In order to integrate and utilize Big Data of TCM, this paper integrates multi-source data based on multi-perspective, similarity and other methods, establishes a TCM prescription database, connects the data entity of prescription-composition-target-disease, and uses the graph database to establish a visual Knowledge Graph. The platform constructs prescription data mining modules based on machine learning and deep learning, achieves the efficacy prediction of prescription based on the medicinal property of TCM, prescriptions composition and deep learning technology, provides data statistics and association analysis of prescriptions, and the data mining platform is built. It adopts Alibaba cloud service architecture to provide application services such as TCM data display, query, association analysis of TCM, Knowledge Graph, and efficacy prediction in B/S mode, and uses computer technology to assist the research and utilization of TCM information to promote the informatization development of TCM.

Keywords: Traditional Chinese Medicine data; data mining; efficacy prediction; association analysis; Knowledge Graph

0" 引" 言

中醫藥學是中華文明的瑰寶,發展至今積累了大量數據資源。傳統醫藥凝聚著深邃的哲學智慧,是優秀傳統文化的重要載體,在促進文明互鑒、維護人民健康等方面發揮著重要作用。這些論述深刻闡述了中醫藥的歷史價值、文化價值、現實作用,是堅定民族自信、文化自信的重要支撐,增強了我們傳承創新發展中醫藥的底氣和信心[1]。

和現代醫學相比,中醫藥學突出一人一方的治療流程,旨在制定特定條件下的最優方案。在大多數診治過程中,中醫藥學療效評價和西醫通過大量的人體試驗獲取同一藥品效果的反饋方式不同。由于中藥數據千變萬化,且患者都采用個體辨證論治的治療方式,在小樣本集上很難獲得可重復的治療效果評價模板。因此,如何整合中醫學的臨床大數據和利用大數據的優勢來促進中醫藥的發展具有現實意義和挑戰性。

隨著大數據時代的到來,已出現了許多中醫藥數據信息平臺。例如中國中醫科學院開發的中醫百科全書(The Encyclopedia of Traditional Chinese Medicine, ETCM),該數據庫包含常用草藥和中藥配方及其成分的全面和標準化信息、中藥成分和預測靶基因信息,還開發了基本分析功能,使用戶可以探索中藥草藥、配方、成分、基因靶標以及相關途徑或疾病之間的關系或建立網絡[2]。由北京中醫藥大學、中國科學院計算技術研究所和四川大學華西醫院腎臟研究所組成研究團隊共同建立的本草組鑒(A High-Throughput Experiment and Reference-guided Database of Traditional Chinese Medicine, HERB),這一數據庫系統整理了高通量轉錄組篩選的數據和文獻數據,以了解中藥/成分的分子作用,確定對應的基因靶標,并與現代各種疾病關聯起來,供中醫藥研究使用[3]。

但當前人們對中醫藥數據信息的需求不再局限于簡單的查詢,尤其是對數據分析的需求尤為迫切。相較于現有數據庫只關注了一部分中醫藥數據的數據列表,我們設計了一款完整涵蓋多數據源、數據融合、挖掘分析、知識圖譜、可視化、多層次的系統,同時具有數據關聯分析、藥性分析功效預測功能,并且采用基于實現高效、安全、易管理的云基礎架構,實現操作簡便、運行穩定、靈活響應的系統,以助力中醫研究與決策。

本系統旨在構建中醫方藥云智數據挖掘平臺,收集整理并構建中醫藥方藥組成及藥性數據集、中醫藥化學、生物學數據集,融合疾病、靶點、成分、中藥、方劑及其關聯構建多層次數據庫,同時利用知識圖譜、關聯分析、機器學習等實現數據分析與展示,為中醫藥物質研究、臨床治療、科研教學提供有效數據支持。

1" 中醫方藥云智數據庫構建

1.1" 數據來源

中醫藥歷史悠久,源遠流長,數據量龐大而繁雜,傳統的查詢查閱方式過于煩瑣,需要大量的時間和精力。本系統數據來源于對現有的中醫文獻的收集整理,借鑒數據來自Pubmed、HERB、TCMSP(中藥系統藥理學數據庫與分析平臺)、ETCM、SYMMAP(中醫藥證候關聯數據庫)、YaTCM(傳統中藥數據庫)等現有中醫藥數據庫。基于不同數據源的數據特點,對各個字段及其內容進行數據融合。

1.2" 數據融合

由于多信息源的數據難以直接轉化,且化合物命名規則多樣,使得研究人員難以對不同數據庫間獲取的化合物信息進行歸納和去除冗余。數據融合旨在緩解數據庫更新不及時、數據冗余、單一數據庫信息廣度深度不足的局限。

1.2.1" 基于階段的數據融合

基于階段的融合方法常用于多模態智能系統,通過將不同階段產生的特征進行融合,以提取更豐富、更準確的信息。在特征提取階段,針對每個中醫藥模態的數據,我們提取方法將中醫藥數據轉化為特征向量進行特征表示。例如,在23維中藥藥性文本模態中,使用藥名詞向量、中藥屬性提取藥性特征基于余弦相似度進行融合。對于關系特征,采用多數據源、多階段互補融合轉化為標準的結構化數據。

1.2.2" 基于語義的數據融合

基于語義的融合方法是一種利用自然語言處理和知識圖譜等技術,將多個不同來源的語義信息進行整合和融合的方法。其中在知識表示階段,我們使用知識圖譜來表示實體、關系和屬性之間的關聯,知識圖譜可以通過結構化數據、標準本體和語義關聯等方式進行構建和擴充實現數據融合。

1.3" 數據庫的建立

基于融合后的數據庫建立中醫藥藥材、靶點、方劑、成分和疾病之間相互關聯,最終實現五層次“方劑-藥材-成分-靶點-疾病”的實體關聯,構建中醫藥與治療功效基礎物質研究的知識圖譜。例如,方劑數據庫包括方劑名、方劑類別、方劑劑量方式等屬性,其中類別劃分依據方劑學教材、方劑大辭典為主、中醫藥專業人士等作為補充[4,5]。中藥數據庫包括中藥名、四性、五味、歸經、有無毒等多個屬性,功效類別劃分基于中國藥典和中藥學教材[6,7]。所采用的數據庫各個實體的核心屬性如表1所示。

表1" 數據庫各實體的核心屬性

實體 核心屬性

方劑 方劑名、類別、計量方式等

藥材 中藥名、四性、五味、歸經、有無毒等

成分 成分名、分子公式、藥品分級等

靶點 靶點名、關聯方劑、關聯藥材等

疾病 疾病名、關聯藥材、關聯成分等

2" 中醫方藥云智數據挖掘云平臺系統設計

2.1" 系統的系統架構

系統實現的過程融入云平臺架構設計,以實現系統彈性、靈活性和可擴展性。系統采用Docker容器技術將應用程序和依賴項打包成簡單、可移植的容器鏡像,同時使用容器編排工具Kubernetes進行容器部署、編排和管理,實現跨云平臺的無縫遷移和管理。融入云平臺架構設計,系統可充分利用云平臺提供的資源和服務,實現彈性伸縮、自動化部署、高可用性和災備能力,以及實時監控和日志分析。總之,云平臺架構設計提高了系統的可靠性、可擴展性和效率,為應用的快速迭代和持續交付提供了基礎支撐。

系統具體實現采用Python中request、openyxl、BeautifulSoup等工具庫收集、清理和整理數據。前端使用Vue CLI搭建前端頁面,Apache ECharts繪制數據概況圖,Element Plus組件加速前端開發,應用D3.js繪制知識圖譜。后端使用SpringBoot框架搭建后臺接口和基本框架,通過TensorFlow 1.15.5構建藥物功效預測模型,基于Apriori算法實現數據關聯關系分析模型,基于Neo4J構建知識圖譜數據庫。

系統采用B/S架構,用戶能夠通過瀏覽器訪問本平臺,實現多平臺提供服務。同時本平臺頁面友好、操作簡便,后臺維護性好、拓展性強。本系統的系統架構圖如圖1所示。

圖1" 系統架構圖

2.2" 系統的主要功能

中醫方藥云智數據挖掘平臺包含四大功能模塊:數據管理模塊、關聯分析模塊、功效預測模塊、知識圖譜展示模塊。介紹如下:

1)數據管理模塊,包括五類實體“方劑-藥材-成分-靶點-疾病”的列表、查詢與管理功能。以列表的形式展示完整的疾病、靶點、成分、中藥、方劑的列表數據;可根據輸入的參數查詢展示對應的實體詳細信息,可根據需求對數據進行后臺內容維護。

2)關聯分析模塊,可根據用戶選擇的方劑類型、輸入的置信度及支持度,展示中藥數據集的關聯關系。

3)功效預測模塊,系統對用戶展示量化后的中藥藥性數據和提取特征的方劑數據,提供中藥功效預測。

4)知識圖譜展示模塊,根據輸入的指令繪制知識圖譜,展示疾病、靶點、成分、中藥、方劑實體之間的關系,助力醫療研究。

3" 中醫方藥云智數據挖掘平臺實現與應用

3.1" 實體展示和查詢

平臺可根據用戶選擇,展示疾病(Disease)及關聯藥材、關聯成分等實體屬性;靶點(Targets)及關聯方劑、關聯藥材等實體屬性;成分(Ingredient)及分子公式、藥品分級等實體屬性;中藥(Herbs)及四性、五味、歸經、有無毒等實體屬性;方劑(Formula)及來源、類別、計量方式等實體屬性。單擊具體實體名稱可查看實體屬性詳情信息。

以中藥數據為例,實體信息列表展示如圖2所示,點擊艾葉標簽后,進入該藥材的詳細信息頁面,如圖3所示。

3.2" 關聯關系分析

用戶可選定方劑類別并預置用戶參數,平臺提供頻次分析和關聯分析功能,以表格、知識圖譜等形式輸出結果。用戶還可以在輸入框采用特定格式手動輸入數據、或按照平臺規定上傳相應格式的Word或Excel文檔自定義數據,預置輸入支持度和置信度,展示自定義數據集的關聯關系分析結果。

以選擇口服藥和補益藥,支持度和置信度分別選擇0.04、0.5為例,點擊Search按鈕后,生成的一、二、三項集如圖4所示。

3.3" 知識圖譜構建

系統提供實體多節點關聯關系顯示,還可構建多類型節點之間的關聯圖譜。用戶自定義或選擇調整實體類別和每級擴展節點個數(默認10個),右側繪制對應數據的實體節點和關系圖,繪圖區支持鼠標位置放大縮小,便于用戶使用。

例如在左側菜單中,選擇Formula(方劑),在下拉菜單或者文本框中輸入AN GONG JIANG YA WAN(安宮降壓丸),知識圖譜中顯示如圖5所示。

點擊中心節點出現擴展環圖,供用戶選擇實體關聯類別,此例中選擇herbs(中藥)關聯后,顯示該方劑所含的所有中藥材節點。畫布中提供中藥材多選框,用戶可勾選需展示的節點,生成二級關聯圖譜,如圖6所示。本功能支持生成多級關聯圖譜,以輔助理解各個組成之間的關系。

3.4" 藥物功效預測

基于23維中藥藥性進行功效預測,其中藥性量化的依據是基于人民衛生出版社出版的《方劑學》教材收集到的中醫藥數據,將所收集中藥屬性數字化。其中23維藥性是寒、熱、溫、涼、平、酸、苦、甘、辛、咸、心、肺、膀胱、肝、膽、脾、腎、胃、大腸、小腸、三焦、心包、毒。其中將“寒、熱、溫、涼、平、酸、辛、甘、苦、咸、毒性”采用指數等級量化,若藥性為大寒,則為2,寒為1,小寒為0.5;苦為1,微苦為0.5,無此藥性為0。其余屬性采用二值量化,即有此屬性時記為1,無此屬性記為0[8]。以中藥功效術語詞組的主謂語順序和具體表達的意義為依據,規范后得到功效術語詞組[8]。

本系統使用BP神經網絡構建藥物屬性與藥材功效的深度學習模型[8,9],基于梯度下降法和小批量Adam算法迭代求解網絡各層之間的連接權重和中藥向量層的量化值,形成各屬性的計算量化取值。

在此功能頁面,平臺將收集處理之后的中藥屬性量化數據以分頁的形式展示,此外,用戶可在頁面內搜索關鍵字,定位并查看的中藥藥性量化值。以麻黃為例,按照藥材23維,原始量化值是溫、微苦、辛、肺、膀胱,計算量化值中溫的比重減小其余屬性比重增大,此時可以預測功效為:消腫,解表,宣肺,發汗,利水,平喘,除濕,散結,如圖7所示。

用戶還可以在頁面左側選擇相應藥性來直接預測其功效,例如選擇溫、微苦、辛、肺、膀胱,點擊“功效預測”,預測功效為:泄熱,消痔,峻下冷積,除煩,溫散止痛,溫補肝腎,開胃,化痰,如圖8所示。

3.5" 補益藥方劑功效預測

本系統利用HPE-GCN模型[10]將圖卷積網絡與中藥屬性相結合來預測方劑的功效,基于補益藥數據集、數據處理、特征學習,最終實現功效預測。HPE-GCN模型對中藥和方劑的低維特征表示較為完整,利用中藥藥性特征、藥性相似性計算、方藥依賴程度構建特征中藥關聯圖和方藥關聯圖,利用圖神經網絡進行補益方分類預測[9]。基于此方法對補氣、補血、補陰、補陽四小類功效預測精度較高,可以作為中醫藥研究的有效分析工具。

例如輸入方劑為四物湯,其藥材組成為:當歸、川芎、芍藥、熟地黃。其中當歸是一種常用的補血藥物,具有活血調經、補血養顏的功效;熟地黃是一種滋陰補腎的草藥,具有益氣補血、滋補肝腎的功效;白芍是一種血液活化藥物,具有舒緩經痛、抗炎鎮痛的功效;川芎是一種活血化瘀的草藥,具有消炎、止痛和舒經散瘀的功效。綜合來看,該方劑的組成與補血類方劑的特點相符,因此可以預測該方劑屬于補血類方劑。

4" 結" 論

現階段中藥資源數據庫以及中醫藥數據挖掘平臺的建設已有一定基礎,但都局限于對中醫藥文獻的保存和目錄數據庫形式等,沒有對方藥配方、病理、醫治方法之間的關系網絡進行層次劃分和總結,本項目對多源中藥資源數據進行整合歸納,完善對“方劑-中藥-成分-靶點-疾病”五個層次之間關系數據的知識網絡建設,并且進一步構建方藥數據挖掘平臺,使得對病癥藥方的檢索及推薦更加方便快捷,對中醫藥發展傳播具有重大意義。

參考文獻:

[1] 余艷紅,于文明.充分發揮中醫藥獨特優勢和作用 為人民群眾健康作出新貢獻 [J].中國中西醫結合雜志,2020,40(9):1029-1031.

[2] XU H,ZHANG Y,LIU Z,et al. ETCM:an encyclopaedia of traditional Chinese medicine [J].Nucleic Acids Research,2019,47(D1):D976-D982.

[3] FANG S,DONG L,LIU L,et al. HERB:a high-throughput experiment- and reference-guided database of traditional Chinese medicine [J].Nucleic Acids Research,2021,49(D1):D1197-D1206.

[4] 李冀,左錚云. 方劑學 [M].北京:中國中醫藥出版社,2021.

[5] 彭懷仁,王旭東,吳承艷. 中醫大辭典:第2版 [M].北京:人民衛生出版社,2017.

[6] 國家藥典委員會.中華人民共和國藥典 [M].北京:中國醫藥科技出版社,2020.

[7] 高學敏.中藥學 [M].北京:人民衛生出版社,2000.

[8] 鄧樂,丁長松,黃辛迪,等.基于多層前饋神經網絡的中藥藥性量化研究 [J].中草藥,2020,51(16):4277-4283.

[9] 匡文軒,周婉珠,晏峻峰.神經網絡在中醫領域應用的文獻計量與圖譜分析 [J].中醫藥導報,2021,27(4):168-173.

[10] LIU J,HUANG Q,YANG X,et al. HPE-GCN:Predicting efficacy of tonic formulae via graph convolutional networks integrating traditionally defined herbal properties [J].Methods,2022,204:101-109.

作者簡介:張錦超(2002—),男,漢族,湖南長沙人,本科在讀,研究方向:數據挖掘方向;通訊作者:黃辛迪(1987—),女,漢族,湖南長沙人,講師,研究方向:數據挖掘、中醫藥信息化。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 丰满人妻久久中文字幕| 一本久道久久综合多人| 亚洲男人的天堂久久香蕉| 国产麻豆精品手机在线观看| 国产精品女同一区三区五区| 亚洲一区波多野结衣二区三区| 欲色天天综合网| 日韩精品一区二区三区视频免费看| 茄子视频毛片免费观看| 国产精品久久久久久影院| 久久99精品国产麻豆宅宅| 狠狠色综合网| 国产肉感大码AV无码| 亚洲国产成人精品青青草原| 秋霞午夜国产精品成人片| 亚洲av无码成人专区| 国产成人久久777777| 久久黄色影院| 成人国产一区二区三区| 久久久久免费看成人影片| 一区二区三区四区日韩| 久热re国产手机在线观看| 5388国产亚洲欧美在线观看| 亚洲第一极品精品无码| 色AV色 综合网站| 亚洲色欲色欲www网| 激情影院内射美女| 国产激情影院| 国产理论一区| 亚洲 日韩 激情 无码 中出| 久久精品人人做人人综合试看| 久久公开视频| 欧美一区日韩一区中文字幕页| 综合人妻久久一区二区精品 | 久久综合九九亚洲一区| 精品国产成人a在线观看| 日韩麻豆小视频| 丰满少妇αⅴ无码区| 青青青伊人色综合久久| 国产在线观看成人91| 2021天堂在线亚洲精品专区| 国产va在线观看免费| 伊人婷婷色香五月综合缴缴情| 老汉色老汉首页a亚洲| 亚洲色图欧美| 国产成人久久777777| 欧美视频免费一区二区三区 | 久久综合国产乱子免费| 国产国产人成免费视频77777| 日韩午夜片| 男女精品视频| 中日无码在线观看| 久久久久国产精品嫩草影院| 国产亚洲男人的天堂在线观看| 97国产在线播放| 91小视频版在线观看www| 三级视频中文字幕| 亚洲精品制服丝袜二区| 国产乱子伦精品视频| 制服丝袜一区二区三区在线| 99久久国产综合精品2023| a亚洲视频| 中文字幕久久波多野结衣| a亚洲天堂| 91午夜福利在线观看| 亚洲美女一级毛片| 国产精品污视频| 色香蕉网站| 国产sm重味一区二区三区| 中文字幕2区| 女人爽到高潮免费视频大全| 色综合手机在线| 亚洲成人在线网| 成人韩免费网站| 日韩视频福利| 成人午夜视频免费看欧美| 国产不卡一级毛片视频| 欧美精品v| 无码精品一区二区久久久| 国产真实乱人视频| 精品国产一区二区三区在线观看 | 无码久看视频|