999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

針灸古籍經驗推薦平臺構建方法及功能展示

2017-08-10 01:32:50陳楚云李偉林洪佳明李麗霞張去飛謝麗琴
中國中醫藥信息雜志 2017年8期

陳楚云 李偉林 洪佳明 李麗霞 張去飛 謝麗琴

摘要:本文分析了針灸古籍數據的特點,提出根據針灸學診治疾病的模式,采用多種數據挖掘技術提取、整合、展示散布于古籍數據中的理、法、經、穴、術知識,構建一個通過B/S方式提供給用戶使用的針灸古籍數據庫平臺;闡述了針灸古籍經驗平臺的框架、模塊的功能、實現各功能的方法,對以“中風”為檢索詞的檢索結果作了演示,并總結歸納構建針灸古籍經驗推薦平臺的體會及該平臺在針灸古籍數據開發中的優勢。

關鍵詞:數據挖掘技術;針灸古籍;軟件開發

DOI:10.3969/j.issn.1005-5304.2017.08.002

中圖分類號:R2-05 文獻標識碼:A 文章編號:1005-5304(2017)08-0004-05

Construction Method and Function Display of Recommendation Platform for Acupuncture Ancient Books CHEN Chu-yun1, LI Wei-lin2, HONG Jia-ming3, LI Li-xia1, ZHANG Qu-fei1, XIE Li-qin1 (1. Department of Acupuncture, Guangzhou Hospital of Chinese Medicine, Guangzhou 510130, China; 2. Information and Network Center, Xinhua College, Zhongshan University, Guangzhou 510080, China; 3. College of Medical Information Engineering, Guangzhou University of Chinese Medicine, Guangzhou 510006, China)

Abstract: This article analyzed the characteristics of data of acupuncture and moxibustion in ancient books, and put forward to a mode of diagnosis and treatments according to acupuncture and moxibustion. A variety of data mining techniques were used to extract, integrate and display the theory, methods, meridians, acupoints and techniques in ancient books to establish a database platform of ancient books based on B/S architecture, which can be used by users. Also, this article described the framework, the function of the module, and the method of realizing each function of the experience platform of acupuncture ancient books, and demonstrated an interface of the results searched by key words “stroke”, and summarized the experience of building this platform and the advantages of the platform in the research and development of data of acupuncture ancient books.

Key words: data mining technology; acupuncture ancient books; software development

針灸療效取決于中醫獨特的理論體系,其診療過程離不開傳統的針灸經絡理論。文獻是記錄歷代針灸基礎理論和臨床經驗的主要載體,是總結和繼承前人學術思想的重要資料。針灸古籍是前人對針灸經絡、腧穴、刺灸法等理論和臨床經驗的總結,據不完全統計,現存針灸專著約180種[1]。但傳統的存在形式和使用方式已不能滿足現代社會對信息獲取的需求,且面對如此浩瀚的文獻信息,人工獲取非常有限。如何將針灸古籍蘊含的寶貴經驗開發成為可供現代人隨時獲取的方式,實現針灸古籍有效、

基金項目:廣東省科技計劃項目(2012B060500015);廣東省自然科學基金(2014A030309013);廣東省第二批名中醫師承項目(CS2015030)

通訊作者:李偉林,E-mail:lwl_tech@126.com

快捷地為臨床、科研、教學服務,擴大針灸的影響成為迫在眉睫的問題。

數據挖掘技術是從大量、不完全、有噪聲、模糊、隨機的數據中提取隱含、無先驗、對決策有用的知識,用專門算法從數據庫中抽取模式,然后通過系統解釋和評價模塊,將模式轉換成用戶可以理解的知識。由于古代針灸文獻數據量大,記錄方式簡單、術語不規范、標準不統一,造成文獻中知識、經驗具有明顯模糊性與不確定性。用普通的數據獲取方法,無法實現對復雜的模糊性與不確定性針灸古籍數據進行關聯分析。為此,筆者通過開發一個按照針灸學診治疾病的模式,以針灸古籍為分析對象,采用數據挖掘技術提取、整合、展示散布于古籍數據中的理、法、經、穴、術知識,連接現代針灸與古籍作用的平臺,以供用戶檢索使用。茲介紹如下。

1 平臺架構

該平臺基于SSH(Struts+Spring+Hibernate)架構,由Struts實現表示層、Spring實現業務邏輯層、Hibernate實現數據持久層,數據庫用Oracle10g,開發語言JAVA,運行環境為Windows2008 R2 Server+Tomcat6.0+JDK1.6,通過B/S(Browser/Server,瀏覽器/服務器模式)的方式提供給用戶和數據錄入核對人員使用。針灸古籍經驗推薦平臺功能模塊見圖1。

2 模塊功能實現

2.1 系統管理模塊

系統管理模塊包括操作員管理、角色管理、權限管理、設置個人信息、修改密碼、操作日志、訪問IP限定等子模塊,具體分述如下。

2.1.1 操作員管理 是系統管理員開通、設置錄入校對人員的操作員帳號、密碼、權限與真實姓名的操作模塊,只有在操作管理開通并授權的情況下方可進入系統進行相關的操作,每位參與古籍錄入校對人員均需有針灸專業知識基礎。

2.1.2 角色管理 因平臺先期的古籍收集整理,以及后期的古籍庫資料庫、資料核對、標準庫的建立工作均需大量人員參與,將參與這項工作的人員進行分工以方便管理是很有必要的,系統中將參與人員按角色區分為超級管理員、資料錄入校對員、標準庫錄入校對員,其中超級管理員擁有最高權限。

2.1.3 權限管理 是系統管理員限定操作員分工范圍的功能模塊,為超級管理員、資料錄入校對員、標準庫錄入校對員3種不同角色限定工作范圍,除超級管理員外,每個操作員登錄系統時只能操作本人錄入校對的古籍或標準庫內容,如資料錄入校對員可操作本人錄入校對古籍的查詢、查看、新增、修改、刪除、回收功能。

2.1.4 設置個人信息 所有操作人員于該功能模塊下完善個人信息,包括聯系方式、專業、單位、錄入或校對的古籍書目等。

2.1.5 修改密碼 系統管理員設置錄入校對人員權限時使用初始密碼,告知操作員后,操作員可于本功能模塊下修改自己的登錄密碼。

2.1.6 操作日志 所有操作人員每次登錄平臺,平臺自動記錄來訪操作員名稱、IP地址、操作時間,描述其操作內容等。

2.1.7 訪問IP限定 為提高系統安全性,除授權訪問外,還可通過IP地址限制哪些IP地址可以訪問,哪些IP地址不能訪問。

2.2 資料管理模塊

該功能模塊是操作員登錄系統后的操作界面,操作員于此錄入、修改、校對資料,包括標準庫、資料庫、簡繁體轉換、數據校對與規范、通假字處理、術語詞典等子模塊。

2.2.1 標準庫 在數據挖掘的多個環節需要使用標準庫,如分詞時將標準庫擴充為IKAnalyzer2012_u6(IK)分詞器的詞典,在詞性標注時將標準庫作為ICTCLAS2015的擴展字典,規則抽取是用標準庫的術語去標注分析資料庫,監督分類也需標準庫作為訓練語料,是進行數據挖掘的基礎。標準庫包括病證、癥狀、病癥、經絡、穴位、刺灸法6個子庫,操作員可于各個子庫下新增、查看、修改、刪除每個癥狀、病證、病癥、經絡、穴位、刺灸法的名稱、類別、代號、出處、別名、主癥、兼癥、描述等信息,并可上傳圖片。

2.2.2 古籍庫 針灸古籍是平臺進行數據挖掘的對象,包括古籍書名目錄、資料列表、回收站3個子庫,并有書籍管理、內容管理可供操作員按書名、作者、章、節、內容、錄入人員查詢。①古籍書名目錄:操作員可于本子庫下新增、查看、修改、刪除每本古籍的書名、版本、類別(綜合性、專書)、作者、朝代、備注等信息;②資料列表:操作員可于本子庫下新增、查看、修改、核對、刪除、回收古籍書名目錄下書籍的章、節、內容、備注等,并可插入書中圖片。

2.2.3 繁簡轉換 由于古籍存在版本年代的差異,可能存在繁體字,操作員可錄入繁體字與簡體字,系統采用開源包HanLP[2]中的簡轉繁詞典,實現繁體字與簡體字的互換。

2.2.4 同名穴處理 資料錄入后,由針灸專業人員用交叉校對法進行校對,糾正錯誤數據,刪除重復數據。

2.2.5 通假字處理 古籍存在大量的通假字,根據高啟沃《簡明通假字字典》[3]對古籍中的通假字進行識別替換,并基于二分Trie樹的前綴查詢算法實現快速的檢索匹配比較。

2.2.6 術語處理 除了標準庫中的病證、癥狀、病癥、經絡、穴位、刺灸法內容是IK分詞器的詞典、ICTCLAS2015的擴展字典,同時將搜狗輸入法的詞庫等進行整理,包括書名、人名、朝代名詞、古代區域名稱等,作為術語詞典之一。

2.3 數據挖掘模塊

數據挖掘是平臺核心部分,目的是實現對非結構化的古籍文本信息按照病癥、腧穴、經絡、刺灸法的關系進行抽取,并通過關聯挖掘分析腧穴的配伍關系及病癥、腧穴、經絡、刺灸法的對應關系,最終形成知識庫。

2.3.1 分詞 分詞是進行句子理解、語法分析及信息抽取的基礎,針灸古籍經驗推薦平臺采用IKAnalyzer2012_u6作為分詞器,將上述術語詞典作為擴展詞典,對資料庫進行切分并標注詞性。

2.3.2 詞性標注 為更好理解古籍中每個句子的含義,在分詞基礎上,對每個詞語進行標注,區分每一個詞的詞性,系統采用中國科學院計算技術研究所開發的漢語詞法分析系統ICTCLAS2015[4]作為詞性標注工具,將標準庫作其擴展字典,對資料庫進行切分并標注詞性。

2.3.3 依存分析 語法樹的依存關系分析有助于更好地進行人工智能的自然語言處理分析,平臺采用最大熵算法實現語法樹的依存關系分析。

2.3.4 規則抽取 通過詞性標注,得到每個詞語的詞性,通過擴展詞典,將病癥、腧穴、經絡、刺灸法標準庫的術語通過自定的詞性標注標簽來進行分區,存在關聯關系的句子用正則規則關系進行抽取。

2.3.5 監督分類 采用Adaboost算法[5],將規則抽取的結果根據標準庫的內容進行細分分類。該算法的優點是不需預先標注的手工訓練集,只需少量抽取目標的樣本信息及大量的未標注語料就可自動抽取目標信息。先將標準庫構建成訓練模板,通過Adaboost算法迭代進行分類。

2.3.6 相似度計算 為提高監督分類的準確率,在采用Adaboost算法基礎上,采用基于TF-IDF[6]和余弦[7]實現相似度分析。該算法通過詞頻和逆向文檔,將文本信息轉為多維的空間向量,通過余弦公式計算兩個空間向量的夾角大小進行評估文本的相似度。

2.3.7 歧義分析 對于同一病癥在不同書籍中存在不同名稱的歧義,采用基于隱含語義分析(latent semantic analysis,LSA)[8]和奇異值分解(singular value decomposition,SVD)[9]來解決。

2.3.8 關聯挖掘 通過以上的清理、去噪、整理,形成病癥-腧穴-經絡-刺灸法集,采用Apriori算法[10]實現多層的關聯分析,通過迭代和設置最小支持度和置信度,分析項集之間的潛在關系,建立腧穴配伍關系、病癥腧穴對應關系、腧穴刺灸法對應關系的知識庫。

2.3.9 決策分析 在關聯挖掘所建立知識庫的基礎上,采用決策樹C4.5算法[11]解決疾病不同癥狀所選用的腧穴、刺灸法可能不同的問題,以提高分類的準確度,實現更好的分類預測。

2.4 用戶檢索模塊

2.4.1 全文檢索 用戶可于該界面以檢索詞檢索古籍全文,檢索詞將以不同顏色顯示,用戶點擊任意一條記錄可以查看全文。

2.4.2 詞頻統計 用戶檢索全文時,系統自動統計檢索詞在古籍庫中每本書出現的頻率。檢索病癥時,還將出現治療該病癥的經絡、腧穴、刺灸法出現的頻率,以遞減的方式顯示;若檢索的是腧穴,還會出現該穴治療病癥、刺灸法的頻率,以遞減的方式顯示。

2.4.3 關聯挖掘結果 用戶檢索時,平臺將顯示關聯挖掘結果,病癥與腧穴(特定穴)、病癥處方中腧穴與腧穴、病癥與刺灸法及腧穴與刺灸法的支持度和置信度,且病癥與腧穴可以關系圖的方式表示。

3 平臺演示

通過上述的功能模塊設計和實現,完成平臺的構建,根據《新編針灸大辭典》[12]、《中國針灸穴位通鑒(上、下卷)》[13],將書中的經絡、穴位、刺灸法內容錄入系統,建立含有經絡、穴位、刺灸法信息的標準庫,具體包括名稱、別名、定義或描述、特性與出處等信息。根據《中國針灸薈萃·現存針灸醫籍之部》[14]、《新編針灸大辭典》[12]的針灸醫籍名稱,收集清代以前針灸古籍并錄入數據庫,建立古籍庫,具體包括書名、版本、作者、朝代、章、節、內容等。

3.1 全文檢索結果界面

用戶通過搜索界面,可對所錄入的150本針灸古籍進行全文檢索。平臺根據用戶的查詢條件在古籍中進行全文檢索,檢出包含檢索詞的文章,同時檢索檢索詞的別名、通假字等,且于界面以關聯詞語表示;全文檢索界面的主體部分是含有檢索詞的書籍名稱及部分章節,檢索詞于文中以紅色顯示,雙擊書目可連接書籍中所有含有該檢索詞的章節;界面同時以頻次遞減的形式列出所有含有該檢索詞的書目。

3.2 腧穴配伍關聯分析結果界面

平臺自動顯示關聯分析的結果,可選擇疾病相關的癥狀、所用腧穴、腧穴配伍關系、不同朝代腧穴配伍關系、刺灸法等。不同支持度與置信度的,分析結果記錄數不同,用戶可根據自身需求選擇支持度與置信度閾值。圖2顯示的是病癥處方中腧穴與腧穴的配伍關系。

3.3 病癥腧穴關聯關系圖界面

病癥與腧穴的關系以復雜關系圖顯示,圖3顯示的是中風病常見癥狀、常用腧穴及病癥與腧穴間的關系,使關聯分析結果更直觀。

4 小結

數據挖掘技術在海量、非線性針灸數據處理中具有明顯優勢,適于分析散在、龐雜的與針灸相關的經絡、腧穴、疾病、醫案等資料,以揭示針灸理論科學內涵。但由于在針灸古籍中,腧穴、病癥術語不統一,存在同名穴、一穴多名,以及同一癥狀有多種描述等現象,即針灸古籍數據具有模糊性與不確定性特點,限制了信息化研究的開展。目前,數據挖掘技術在針灸文獻研究中的應用大部分針對單個穴位的應用規律、某個病的選穴規律、某種刺灸法及單個名家病案的挖掘,且大多采用人工閱讀抽取目的相關的記錄,建立單病、單穴、單種刺灸法資料庫,而非真正意義上的大數據、智能化。針灸古籍經驗推薦平臺旨在突破以上限制,采用數據挖掘的分詞、詞性標注、依存分析、規則抽取、相似度計算、隱性語義分析、監督分類技術結合標準庫,實現自動古籍文本抽取,突破人工限制;建立含有經絡、穴位、病證、病癥對應、針灸相關術語等的標準庫,采用隱性語義分析用標準庫將病癥、經絡、腧穴庫標準化,解決古籍中腧穴、病癥術語不統一的問題。構建一個具有適合針灸診療模式及數據挖掘功能的平臺,綜合多種數據挖掘技術,通過“大數據”開發適合所有針灸文獻的智能系統,在反映古籍中病癥與腧穴、腧穴與腧穴、病癥與刺灸法、病癥與經絡關系特點的同時,實現針灸古籍有效、快捷地為針灸臨床、科研、教學服務,促進針灸的傳承與發展,并架起一座通往針灸古籍的橋梁。

參考文獻:

[1] 黃龍祥.針灸名著集成[M].北京:華夏出版社,1996:1.

[2] 上海林原信息科技有限公司.HanLP漢語處理包:HanLP v1.2.8[EB/OL]. [2017-03-23].http://hanlp.linrunsoft.com/.

[3] 高啟沃.簡明通假字字典[M].2版.合肥:安徽教育出版社,1999.

[4] 張華平.NLPIR漢語分詞系統:ICTCLAS2015[EB/OL].[2015-08-23]. http://ictclas.nlpir.org.

[5] 許劍,張洪偉.Adaboost算法分類器設計及其應用[J].四川理工學院學報:自然科學版,2014,27(1):28-31.

[6] 黃承慧,印鑒,侯昉.一種結合詞項語義信息和 TF-IDF 方法的文本相似度量方法[J].計算機學報,2011,34(5):856-864.

[7] 張振亞,王進,程紅梅,等.基于余弦相似度的文本空間索引方法研究[J].計算機科學,2005,32(9):160-163.

[8] 蓋杰,王怡,武港山.潛在語義分析理論及其應用[J].計算機應用研究,2004,21(3):9-12.

[9] 李金嶺.SVD算法簡介與模擬數據檢驗[J].中國科學院上海天文臺年刊,1998,19:16-21.

[10] HAN J W, KAMBER M.數據挖掘概念與技術[M].范明,孟小峰,譯.3版.北京:機械工業出版社,2012:148.

[11] 黃文.決策樹的經典算法:ID3與C4.5[J].四川文理學院學報,2007, 17(5):16-18.

[12] 程寶書.新編針灸大辭典[M].北京:華夏出版社,1995.

[13] 王德深.中國針灸穴位通鑒[M].青島:青島出版社,2004.

[14] 郭靄春.中國針灸薈萃:現存針灸醫籍之部[M].長沙:湖南科學技術出版社,1993.

(收稿日期:2016-12-16)

(修回日期:2017-01-26;編輯:梅智勝)

主站蜘蛛池模板: 日韩成人在线视频| 色哟哟国产精品| 在线网站18禁| 午夜啪啪网| 国产精品视频白浆免费视频| 毛片网站免费在线观看| 黄色成年视频| 欧美一级黄片一区2区| 国产成人综合亚洲网址| 久久毛片网| 欧美成人免费午夜全| 精品第一国产综合精品Aⅴ| 18黑白丝水手服自慰喷水网站| 97青草最新免费精品视频| 老司机午夜精品网站在线观看| 国产精品成人观看视频国产 | 国产福利微拍精品一区二区| 国产草草影院18成年视频| 日韩av无码精品专区| 美女高潮全身流白浆福利区| 亚洲精品无码av中文字幕| 91丨九色丨首页在线播放| 国产十八禁在线观看免费| 亚洲成a人片| 国产精品lululu在线观看| 久久女人网| 国内精品九九久久久精品| 狠狠躁天天躁夜夜躁婷婷| 欧美日韩国产成人在线观看| 亚洲va欧美va国产综合下载| 精品日韩亚洲欧美高清a| 午夜啪啪网| 亚洲日韩精品无码专区97| 亚洲无卡视频| 四虎永久在线精品影院| 日韩大乳视频中文字幕| 亚洲无码精品在线播放| 国产成人高清精品免费| 最新国产麻豆aⅴ精品无| 欧美日韩在线第一页| 国产精品久久自在自2021| 午夜日b视频| 色综合五月婷婷| 免费国产黄线在线观看| 日韩国产黄色网站| 97se综合| 亚洲AⅤ综合在线欧美一区| 在线中文字幕日韩| 茄子视频毛片免费观看| 亚洲浓毛av| 精品国产91爱| 色成人综合| 在线综合亚洲欧美网站| 亚洲欧美在线看片AI| 国产精品免费电影| 久久亚洲国产一区二区| 中文字幕在线永久在线视频2020| 大学生久久香蕉国产线观看| 又黄又湿又爽的视频| 国产波多野结衣中文在线播放| 青青草91视频| 欧美午夜在线视频| 日韩av无码精品专区| 亚洲国产成人综合精品2020 | 婷婷色狠狠干| 国产成人精品第一区二区| 亚洲中文字幕无码爆乳| 国产区人妖精品人妖精品视频| 亚洲国产天堂在线观看| 91色在线观看| 99re热精品视频中文字幕不卡| 日韩欧美国产区| 国产精品女人呻吟在线观看| 国产午夜福利片在线观看| 欧美日韩一区二区在线播放| 亚洲国产精品一区二区高清无码久久| 婷婷五月在线| 亚洲人成网站18禁动漫无码| 福利小视频在线播放| 国产成人精品一区二区| 区国产精品搜索视频| 色综合中文字幕|