楊 靜,譚 勇,郭洪濤,蔡 峰,鄭 光,姜 淼,呂愛平
隨著生物醫學的迅猛發展,大量的醫學信息與數據不斷積累,應用數據挖掘技術從中提取潛在有用的信息和知識進行分析研究,已逐漸成為醫學研究的一個重要方向。文本挖掘是利用數據挖掘技術從文本集中發現隱含知識、尋找潛在規律的過程,它能對海量數據進行整合、分析,獲得的結果更具有代表性[1]。
冠心病(CHD)多屬中醫學“胸痹”“心痛”“心悸”范疇。治療多以西藥、中藥、中西醫結合治療、介入治療、外科手術等方法為主,其中中西藥合用治療冠心病使用普遍,且取得良好療效。本文利用文本挖掘技術探索中西藥治療冠心病的用藥規律,為臨床用藥和藥物研究提供相關依據。
1.1 文本數據采集 登錄中國生物醫學文獻數據庫(Chinese Biomedical Literature Database,CBM)在主題檢索下檢索關鍵詞“冠心病”,共得到文獻64 039篇(檢索日期:2011年3月6日)。
1.2 文本數據處理 將采集的數據按照先后順序整合到一個平面文件中,以ANSI編碼格式保存。然后,利用專有的文本提取工具(軟件著作權,登字第0261882號,登記號2010SR073409)對下載的非結構化文本數據進行信息提取,保存成格式化的、便于數據庫(Access和Microsoft SQL Server)處理的格式。
1.3 文本挖掘以及分析 在同一篇文章中出現的關鍵詞,部分反映整篇文章的信息,相關的關鍵詞之間存在著“共同出現”的特點。這種“共同出現”不是隨機的,而是蘊含有一定的意義,尤其對于高頻共同出現的關鍵詞對,在一定程度上反映了科研工作者的重視程度。這些關鍵詞對可作為文本挖掘的主要素材。
在本研究中,首先采用構建關鍵詞對程序算法針對每一篇文獻共同出現的關鍵詞對,得到DN_pairs數據表。然后采用合并篩檢關鍵詞對程序算法,將上述數據表中相同的關鍵詞對進行合并處理,僅保留它們出現的頻數,得到DN_pairs_frqcy數據表。
使用人工方法對計算出的藥物進行原文獻回溯,初步建立逆向規則庫,改進詞表及算法,對數據反復降噪,最終得到文本挖掘的結果。
1.4 數據的可視化 從DN_pairs_frqcy數據表中抽出不同頻數的關鍵詞對,根據藥物間相關頻次手工分類,用Cytoscape 2.7進行可視化處理,分別得到治療冠心病的中藥、中成藥、西藥以及西藥與中成藥聯合用藥的文獻頻數圖。
2.1 治療冠心病的常用中藥和中成藥使用情況 丹參和丹參注射液分別是治療冠心病時最常用的中藥和中成藥。詳見圖1、圖2。

2.2 治療冠心病的常用西藥使用情況(見圖3)

圖3 冠心病常用西藥使用文獻頻數圖(頻數≥249)
2.3 治療冠心病常用中成藥和西藥聯合使用情況 硝酸甘油是中西藥聯用時最常用的西藥,其與丹參注射液是最常聯用的中西藥組合,也常與麝香保心丸、復方丹參片、葛根素注射液、速效救心丸、冠心寧注射液、黃芪注射液、參麥注射液、生脈注射液分別聯合使用。丹參注射液是中西藥聯用時最常用的中成藥,除了常與硝酸甘油聯合使用外,也常與阿魏酸鈉、阿司匹林、硝酸異山梨酯、低分子肝素分別聯合使用。詳見圖4。

圖4 冠心病常用中成藥及西藥聯用文獻頻數圖
文本挖掘具有探索治療疾病用藥規律的技術特征和條件,可操作性強,其結果具有較好的可信度[2]。
從文本挖掘的結果分析發現,丹參是治療冠心病最常使用的中藥,其屬于活血祛瘀類藥物,有活血化瘀止痛、養血安神的功效。丹參及其有效成分可改善心肌的缺血再灌注損傷,有降低血黏度、抑制血小板聚集、促進血栓溶解等作用[3]。而其他較為常用的中藥黃芪、人參、葛根、紅花、麥冬、川芎、生地、細辛、麝香等也大都屬于活血化瘀類、補氣類、滋陰類、溫里升陽類、開竅類藥物。冠心病屬于中醫的“胸痹”“心痛”“心悸”范疇,臨床上辨證以心血瘀阻、陰寒凝滯、痰濁壅塞、心腎陰虛、氣陰兩虛、陽氣虛衰證型多見,治療的中藥多以活血化瘀、通絡止痛、溫陽散寒、益氣養陰、養心安神類藥物為主[4]。本次挖掘得到的常用中藥大都屬于以上幾類藥物,這提示挖掘得到的中藥使用規律符合臨床的使用情況。
丹參注射液是治療冠心病最常使用的中成藥,有活血化瘀,通脈養心的作用,其主要成分是丹參;復方丹參片也是使用較多的中成藥,由丹參、三七、冰片組成,三者合用達到活血化瘀、理氣止痛的作用;冠心寧注射液由丹參、川芎組成,也是治療冠心病的常用中成藥。由此可見,丹參以及丹參為主要配伍的中成藥制劑在治療冠心病時較常用。葛根素注射液是由中藥葛根中提取的葛根素制成,有擴張冠狀動脈,改善微循環和抗血小板聚集等作用;麝香保心丸有芳香溫通、益氣強心的作用;其他使用較多的中成藥黃芪注射液、生脈注射液、參麥注射液偏重益氣養陰、養心通脈的作用;速效救心丸的功效以行氣活血止痛為主。從文本挖掘分析可見,治療冠心病時使用頻率較高的中成藥多以活血化瘀、益氣滋陰、養心通脈、行氣止痛的功效為主,符合中醫臨床上冠心病治療的主要辨證原則,與中醫治療的臨床實際較為符合,文本挖掘的結果能較好地反映臨床使用情況。
阿司匹林可抑制血小板的黏附與聚集,是治療與預防冠心病的常規用藥,為文本挖掘結果中最為常用的西藥。硝酸甘油可松弛血管平滑肌,從而擴冠、增加冠脈血流[5],是冠心病發作時的常用藥,結果顯示其在使用頻率中居第二位。其他使用頻率較高的藥物如辛伐他汀、氯吡格雷、多巴酚丁胺、低分子肝素、美托洛爾、硝酸異山梨酯、美托洛爾、尿激酶等也都是治療冠心病時溶栓、降脂、抗心絞痛、抑制血小板聚集、升壓等的一線用藥。從以上分析可見,使用頻率較高的藥物大都屬于冠心病治療時臨床主要治療原則下的一線用藥,與臨床實際應用相符。
中西藥聯合應用是目前臨床上治療冠心病的重要與常用方法,合理的聯用中西藥能起到增強治療效果、減少不良反應的作用[6]。本研究結果顯示,硝酸甘油是西藥與中成藥合用治療冠心病時最常合用的西藥,其中硝酸甘油與丹參注射液分別是中西藥聯用時最常用的西藥和中成藥。硝酸甘油通過松弛血管平滑肌,達到擴冠、增加冠脈血流的作用[7];丹參注射液有抗心肌缺血和抗心肌梗死,改善血液流變性及微循環,抗凝血和抗血栓形成,抗氧化等作用[3],兩者合用可提高治療冠心病的總有效率,改善血液流變學的指標[8]。硝酸甘油與麝香保心丸聯用可提高治療冠心病的療效[9]。阿司匹林是另一個中西藥聯用時較為常用的西藥,其與葛根素注射液、丹參注射液聯用都是較常用的中西藥組合。中西藥聯用在冠心病的臨床治療中發揮著重要作用,西藥的作用靶點、治療途徑明確,而中成藥多數為多成分、多靶點的作用途徑,且很多治療途徑、作用機制尚不明確,這對于優化中西藥聯用的配伍劑量、找準中西藥聯用適應證帶來了難度;且冠心病治療時大多為多種西藥與一種或幾種中成藥合用,很少有一種西藥與一種中成藥聯用的情況,也為探討兩者聯用的作用機制帶來了困難,因此有關中西藥聯用的研究還待進一步探索。
使用文本挖掘技術探索中西藥治療冠心病的用藥規律,獲得的數據能較真實地反映冠心病臨床用藥實際,總結出的新規律,拓展臨床用藥思路,為臨床用藥提供了一定參考,也為進一步開展中西藥合用的作用機制研究奠定了基礎。研究冠心病用藥規律的文本挖掘方法為臨床其他疾病的用藥規律研究提供了方法學上的參考。
[1] Rodriguez-Esteban R.Biomedical text mining and its applications[J].Plos Comput Biol,2009,5(12):e1000597.
[2] 譚勇,郭洪濤,鄭光,等.利用文本挖掘技術探索中醫藥治療疾病的用藥規律[J].世界科學技術中醫藥現代化,2010,12(5):823-827.
[3] Cheng TO.A cardiovascular effects of Danshen[J].Int J Cardiol,2007,121(1):9-22.
[4] 張伯臾,董建華,周仲瑛.中醫內科學[M].第5版.上海:上海科學技術出版社,1985:108-112.
[5] 趙玉梅.葛根素注射液臨床應用進展[J].現代中西醫結合雜志,2009,18(1):106-108.
[6] Nossaman VE,Nossaman BD,Kadowitz PJ.Nitrates and nitrites in the treatment of ischemic cardiac disease[J].Cardiol Rev,2010,8(4):190-197.
[7] 張殿勤,丁泓.中西藥的合理聯用與禁忌[J].淮海醫藥,2010,28(3):262-263.
[8] 李旭.丹參注射液聯合西藥治療不穩定型臨床研究[J].湖南中醫學院學報,2006,26(2):28-29.
[9] 陳志軍,劉界軍.中西醫結合治療不穩定型心絞痛60例總結[J].湖南中醫雜志,2011,27(2):16.