孫海舒,李宗友,王映輝,李鴻濤,李敬華,于 彤,李 兵,王 蕊,邱潤苓,張一鳴(中國中醫科學院中醫藥信息研究所,北京 100700)
【方藥研究】
方劑數據庫頂層設計原則初探?
孫海舒,李宗友△,王映輝,李鴻濤,李敬華,于 彤,李 兵,王 蕊,邱潤苓,張一鳴
(中國中醫科學院中醫藥信息研究所,北京 100700)
方劑是中醫治病與養生的主要形式與手段,是中醫理論與臨床聯系的重要途徑之一。方劑數據庫利用電子手段組織、存儲和檢索的作品或資料集合。在中醫理論指導下,利用電子手段組織方劑內容,有利于中醫方劑的傳播與利用,有利于提升中醫藥健康服務能力。通過分析現有方劑數據庫的特點,試總結方劑數據庫整體設計的三個關鍵因素,即方劑源流的納入、方劑的分類、方劑原生信息的處理,對方劑數據庫的文獻納入、檢索與利用功能的合理布局以及知識產權保護作有益的探索。
方劑;方劑數據庫;設計原則
“中醫藥兼具人文與醫學科學的多重屬性,是我國獨具特色的衛生資源、經濟資源、科技資源、文化資源和生態資源,是中華文明與‘一帶一路’沿線國家交流合作的最佳載體”[1]。時至今日,作為我國獨具特色的醫藥衛生資源、擁有自主創新優勢的科技研發資源、具有發展潛力的民族產業資源和服務貿易資源,以及其他領域難以替代、別國難以復制的文化傳播載體,在保障人民健康、推動醫學科學進步、促進經濟社會發展、提升國家軟實力中發揮著重要的作用。基于背景因素的考量,在中醫理論指導下的方劑,是我國擁有自主知識產權優勢的領域之一,從古籍中獲取的方劑信息是建立方劑數據庫的關鍵來源。如何安全有效地利用好方劑數據庫這個載體,是設計方劑數據庫要解決的基本問題之一。基于中國中醫科學院自主課題,對方劑數據庫的頂層設計做了有益的探索。
通過文獻考察與市場調研,依據運作模式,目前使用的方劑庫大致可以分為三類,一是商業運作模式的數據庫,如中國方劑數據庫;二是公益性網絡數據庫,如“生物谷數據中心”的方劑數據庫;三是由各級各類課題資助的專題數據庫,如南京中醫藥大學研制的《中醫方劑文獻數據庫》《湖湘中醫單驗方數據庫》《古代肝病方劑數據庫》等[2-4]。從內容角度來看,有以現代期刊中應用的方劑為主的“中醫藥數據庫檢索系統”[5];還有一部分則基于古籍原文建立的方劑數據庫[6-7];以二次文獻建立的數據庫,如《中醫大辭典·方劑分冊》[8]等,是方劑數據庫常見的類型。如果單純考慮方劑納入的數量,《太平圣惠方》收方16834首,《圣濟總錄》載方20000多首,《普濟方》載方60000余首,一個數據庫的方劑總量越大,值得研究、利用的空間也越大。處理重復出現的方劑,也須謹慎。
2.1 數據庫基本內容比較
表1顯示,雖然資助來源不同,但是基于用戶角度考慮使得不同的數據庫在內容上有可比性。
表2顯示,由課題資助的方劑數據庫,相比方劑數量來看,主題比較重要。這一類數據庫相對定位準確,描述詳細,界面友好。以《湖湘中醫單驗方數據庫》《古代肝病方劑數據庫》比較為例。
2.2 數據庫基本功能及使用狀況
中國中醫科學院方劑數據庫,即中國方劑數據庫,由中藥方劑查詢系統和子集方劑查詢系統組成,2個查詢系統可以滿足不同的限定查詢需求[9]。中醫方劑文獻數據庫由南京中醫大學方劑文獻研究室主任孫世發研究員主持,依據其內容的基本數據,實現檢索和歸納任一同類方劑,并可以通過索引進行方名、書名、藥名、藥味、功效等內容的快速英文單詞檢索,進行多項目綜合檢索和模糊檢索,并具有動態管理功能。生物谷方劑數據庫由生物谷數據中心開發,實現了在線自由獲取功能。
但是方劑數據庫也面臨一些問題,如商業化數據庫沒有可持續的后續數據注入,距離臨床有差距。網絡可以自由獲取的數據庫,非醫背景的讀者獲取之后不能正確使用;因為沒有清晰的源流或校讎,醫務人員無法采信。課題資助的專項數據庫,利用度往往限制在小范圍之內。如何規避上述問題,是建立數據庫頂層設計需要注意的問題。
3.1 方劑源流納入的規則
中醫方劑是在辨證論治之后,選擇合適的中藥酌定用量,按照組成原則妥善配伍而成。中醫方劑包含在中醫藥古籍中。依據《中國中醫古籍總目》的分類,方劑即集中于方書之中,又散見于經典、養生、醫案、臨證各科,還有少量存在于針灸醫籍之中。據文獻記載,截止晚清歷代古方近10萬首,該數據尚未納入民間的抄本、稿本等。根據上述方劑數據庫的對比結果,方劑有效信息之一是方劑的來源,即方源信息。方源信息是數據庫的源頭,方書的來源、版本、館藏地以及相關文獻信息、方劑來源的簡化,模糊了方劑的朝代個性,不同時期的癥狀、藥名,代表的內涵并不完全相同,方劑納入的源頭清晰與否,直接影響數據庫的準確性。所以,納入古籍中的方劑必須清晰地錄入古籍的版本信息,保留并體現朝代對方劑的影響;在方劑達到一定數量后,便于整理方劑的源流與衍變。

表1 數據庫基礎內容比較

表2 《古代肝病方劑數據庫》
3.2 頂層設計關鍵因素之一——方劑的分類
方劑分類的完善與否,決定了方劑數據向知識庫的轉化。方劑分類一直是學界研究的重點之一,分類原則有病證、病因、功效、治法、組成等不同模式。各種分類標準均由其目的所決定,因而不同的目的就產生了各異的分類。《內經》的“七方”分類方法;唐·孫思邀的《千金要方》,先按人體臟腑列出大類,然后各臟腑類之下又按病證分為若干類;《千金翼方》則按照類方分類;徐之才《藥對》的“十劑”;汪昂《醫方集解》采用綜合分類法,以類方形式為例分析其分類特點。但是類方的分類方式,也不能完全表達方劑的核心概念。
設計方劑數據庫,分類是頂層設計中重要的一個環節。如果依據國際社會較易接受的以臨床各科分類的思維方法進行編排,那么如何處理在中醫理論指導下異病同治或者同病異治的方劑?如果依據教材現行的分類方式單獨分類,如“治燥劑”不免有重復之嫌,功能分類只能滿足主治“純粹”的方劑,那些可以“多科治療”的方劑如何處理?如果根據辭書的編排方式,以方名首字的筆劃或者拼音排列,確實便于查找,對于沒有方名的方劑如何處理?
簡而言之,方劑分類的根據應該是方劑的本質屬性,但方劑的屬性往往有多個表現層面,這就需要一個相對統一、業內能夠達成共識的提取原則。如果不能把握提取特性的原則,勢必導致方劑分類的混亂,從而影響數據庫的利用。能否探索一種有效的層級分類方式,既能考慮檢索的便利,又能盡量保留方劑的特點,中國中醫科學院中醫藥信息所在方劑數據庫的設計中進行了有益的探索。在框架方面采用《古今圖書集成醫部全錄》中的層級結構,適當引入“五運六氣”,根據錄入方劑的具體情況適當調整;對于沒有方名的方劑組成,也引入“五運六氣”,以功效或主治查詢,并為方劑注明來源或版本,提供圖片鏈接。
3.3 頂層設計關鍵因素之二——方劑原生信息的處理規則
方劑本身的信息又稱為原生信息,諸如藥物組成、配伍特點、主治病癥、方名、藥名、劑量、治法、功效等。原生信息需要有目的排列、細化、清除冗余數據,利于數據庫的運行。但是考慮到朝代、地域、作者、經濟政治等背景因素的影響,合并同類項式的數據整理,可能在某種程度上變成了“去中醫化”;方劑的使用,一定是在中醫理論指導下的化裁,擯棄了中醫理論,只是簡單的藥味堆積;從數據庫的角度而言,引入“方論”或者是基礎理論的內容,不是技術的問題,而是頂層設計必須考慮的關鍵因素之一。
3.4 頂層設計關鍵因素之三——方劑數據庫與知識產權
中醫方劑或中醫復方,是我國傳統中醫藥知識產權保護的內容之一[10]。另一方面,中醫藥具有明顯的特色優勢,在中醫理論指導下的方劑即是這種優勢的體現。在提升中醫藥國際服務能力的趨勢下,如何在繼承中醫、保護知識產權的基礎上發揮方劑的優勢?作為方劑數據庫的頂層設計,知識產權保護是關鍵因素之一。
從知識產權的角度來看,歐共體法律將數據庫定義為“由論文、數值、圖形或其他情報的集合體并能利用計算機檢索上述情報的系統構成的作品”。目前在國內,有文獻資料支撐的方劑數據庫,其研究重點在于方劑內容的本身和應用技術的層面,如納入的數量、內容的覆蓋范圍、清晰或挖掘技術等。而在方劑的知識產權保護方面幾乎是研究的盲點,探索知識產權保護視角下的數據庫構建模式可以成為方劑數據庫研究的重點。
雖然方劑的載體,中醫古籍存在署名權,但是閱讀古籍并不受限制,一些實用價值高的方劑遭遇了“資源掠奪”“名牌流失”及一些重要創新成果不能及時申請專利保護等性質的事件。如何既保證古代醫籍中的方劑得以利用,又保護其不被惡意掠奪。基于中國中醫科學院的自主課題,研究人員做了積極的探索。將古籍中的方劑以文本化形式抽取,按照一定的分類原則將古籍內容“碎片化”,并依據一定的排列、組合方式,形成符合某項功能的方劑數據庫或者知識庫。換言之,按照某種組合方式,將一系列自身擁有獨立著作權的古籍作品重新組合,形成古籍著作的機讀版本。
關于排列組合方式,以中國中醫科學院信息所《古籍方劑知識庫》為例,簡要介紹如下。
用戶需求決定數據庫(知識庫)的使用周期。首先保證文獻來源的忠實性。在納入古籍文本化數據之前,要對這部分數據進行校對,務必保證納入的數據忠實原文,如果因為影響理解而修改,必須有合理的解釋以及出處。如針對不同時代方劑的劑量,仍依原文錄入,對于有據可循的換算,通過技術手段加以鏈接而不是修改原文。其次要根據臨床需求,做好方劑數據的分類。根據“病機十九條”并結合五運六氣進行一級類目的劃分,保證“方對法立”的原則,每條病機之下再列第二級類目,“門”下依次為內、外、婦、兒科門。再通過技術手段預留分類空間,滿足不斷納入數據的進一步分類。對于標準術語庫與文獻術語索引等關鍵技術,目前仍在研究當中。
方劑的應用是中醫治療疾病的基本手段之一,是在中醫理論指導下的治療方法。據《全國中醫圖書館聯合目錄》記載,僅清代以前的“方書類”醫籍高達1216種。古代醫籍中記載的方劑,記錄了歷代各位醫家臨證經驗體會,是后人總結中醫臨證規律、借鑒利用前人臨床審證、用藥、處方經驗的寶貴資料。如果能夠將古籍中的方劑信息抽取出來,根據需求重新進行排列組合,并使用一定的技術手段,那么方劑數據庫將是突破古籍保護與利用瓶頸的有效手段之一,既挖掘了前人的經驗,又通過知識產權的形式對寶貴資源加以必要的保護;既能發揮中醫藥優勢特色的傳承,也是實現中醫知識產權保護的主要措施之一。
[1] 向佳.全國政協委員、國家中醫藥管理局副局長于文明:“一帶一路”合作中醫藥是最佳載體[N].人民政協報,2015-05-13(5).
[2] 張新玲.《中國中醫藥數據庫檢索系統》Windows版的檢索策略探討[J].陜西中醫學院學報,2001,24(5):65-66.
[3] 譚玉美.湖湘中醫單驗方數據庫的建構[D].長沙:湖南中醫藥大學,2013: 5-10.
[4] 張林.計算機輔助古代肝病方劑組方規律的研究及古代肝病方劑數據庫初探[D]北京:北京中醫藥大學,2004: 10-38.
[5] 中國中醫藥數據庫檢索系統.[Online]Available:http://cowork.cintcm.com/engine/windex.jsp.
[6] 劉陽.數據倉庫技術在《金匱》文獻整理和研究中的應用初探[D].北京:北京中醫藥大學,2003.
[7] 陳波,蔣永光,胡波,等.東垣脾胃方配伍規律之關聯分析評述[J].中醫藥學刊, 2004,22(4):611-612.
[8] 蔣永光,李力,李認書,等.中醫脾胃方配伍規律的數據挖掘試驗[J].世界科學技術,2003,5(3):33-37.
[9] 周志煥,年莉.方劑數據庫及數據挖掘應用研究述要[J].山東中醫雜志,2013,32(10):768-770.
[10] 李宗友,雷燕.中醫知識產權保護的戰略研究[J].中國中醫藥信息雜志,2005,12(11):1-3.
中國中醫科學院基本科研業務費自主選題(ZZ080314);中國中醫科學院基本科研業務費自主選題(ZZ090303)
孫海舒(1976-),女,山東青島人,副研究員,主治醫師,醫學博士,從事中醫古籍暨名老中醫經驗整理與利用研究。
△通訊作者:李宗友,男,研究員,碩士研究生導師,從事中醫藥信息與軟科學研究,Tel:010-640895990,E-mail:lizongyou@sina.com。
R289.1
A
1006-3250(2017)04-0546-03
2016-10-17