張勝男+車立娟+李明
摘要:大數據時代,數據挖掘作為有效地信息處理技術,可以在中醫(yī)文獻中提煉出潛在的、有用的信息。數據挖掘廣泛應用于特定疾病、方劑、醫(yī)案、名老專家臨床經驗與針灸的文獻研究中。本文簡要介紹了關聯(lián)規(guī)則分析、聚類分析、決策樹算法和神經網絡數據挖掘方法,以及在中醫(yī)文獻研究中的應用情況。
關鍵詞:中醫(yī);數據挖掘;文獻研究
中圖分類號:R2-03 文獻標識碼:A 文章編號:1006-1959(2017)13-0022-03
Abstract:The era of big data,data mining as an effective information processing technology,in the literature of traditional Chinese medicine extract potential and useful information.Data mining is widely applied to specific diseases,prescriptions,medical records,literature research and clinical experience of senior experts of acupuncture.This paper briefly introduces the association rules analysis,cluster analysis,decision making tree algorithm and neural network data mining method,and application in TCM literature research.
Key words:Traditional Chinese medicine;Data mining;Literature research
“大數據”已成為互聯(lián)網信息技術行業(yè)的流行詞匯。大數據時代,人們不再追求精準和因果關系,而是更為關注相關關系[1]。中醫(yī)學也迎來了大數據時代,從海量中醫(yī)數據中提取有用的信息也變得更加困難,數據挖掘作為有效地信息處理技術,可以幫助中醫(yī)研究者挖掘海量數據中有用的信息。數據挖掘(Data Mining,DM)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中、不為人知但又是潛在有用的信息和知識的過程[2],數據挖掘也被稱為數據庫中知識發(fā)現(xiàn),即從一個大的數據堆中找出有用的知識,從數據中挖掘知識[3]。這是一個從大量不完整的數據中發(fā)現(xiàn)、抽取有意義數據的過程。數據庫知識發(fā)現(xiàn)技術最早是在1989年的美國人工智能協(xié)會第11屆年會上提出的[4],而后漸漸成為人們在海量數據中尋找有效知識的一個必備方法。在中醫(yī)文獻研究中,常用的數據挖掘方法有關聯(lián)規(guī)則分析、聚類分析、決策樹算法和神經網絡,尤其是關聯(lián)規(guī)則分析和聚類分析最為常用。……