鄧浩軒 周一奇 甄雨穎 張江華 楊祖曉
河北醫科大學中西醫結合學院,河北石家莊 050017
隨著電子閱讀的普及,中醫藥知識已不再局 限于紙質閱讀,因此把中醫藥文化與現代信息技術相結合是助力其發展的必經之路[1]。當前中國中醫藥數據庫有48個子數據庫,數據總量約120G,但只在中醫藥信息需求及研究方面起積極作用,在“互聯網+”時代尤其顯示出諸多問題[2]。以中藥數據庫TCMD為例,其在新冠疫情期間輔助篩選出Mpro蛋白酶抑制作用的先導化合物Talampicillin,為Mpro蛋白酶抑制劑的開發提供指導方向[3-4]。然而TCMD也存在相應的局限性,與其比較結果如下:(1)從構建思路看,前者微觀到宏觀,后者宏觀到微觀;(2)從各自優勢看,前者:①將中藥通過相似化合物結構單元進行分類;②藥物靶點的篩檢;后者:①宏觀角度歸納中藥信息更符合中醫學整體觀的特點;②通過對臨床應用的反向檢索得到治療某種疾病的共性藥物,如搜索肺炎可得到穿心蓮、大青葉、魚腥草、金蕎麥等中藥信息,便于后續藥物開發;(3)其功能是開展藥物實驗室研究的第一步。(4)雙語化建設;(5)從局限性看,前者:①對藥理模型過于深度的歸納導致操作方法過于繁瑣;②僅用中文限制其傳播范圍;后者:尋找藥物靶點較困難。在此背景下,標準化中藥分析及統合數據庫(Standardized Traditional Chinese Medicine Analysis and Integration Database,STRAIT, http://zy.hbup.top/dist/index.html#/)應運而生。
以《中華本草》《中華人民共和國藥典》《中藥藥理與臨床應用》等為依托,按類別歸納整理常用中藥及復方。
STRAIT的建立順應當今文化發展趨向,雙語結合擴大受眾范圍,推動中醫藥文化走向世界。通過查閱文獻,力求對中醫藥術語精準化翻譯。當前部分中醫術語譯文不僅不能準確傳達中醫概念,還陷入被人誤解的境地[5-6]。如某些書籍中把“虛”“實”分別譯為deficient activity、excessive activity,僅在病癥層面翻譯,沒有考慮不同語境下其內涵的不同。
“健康中國”戰略不斷推進,“大健康”意識深入人心[7]。STRAIT的建立使民眾便捷地獲取健康知識,推動全民健康事業的發展。
STRAIT目前有6張庫表:名稱、類別、功效、主治、藥理作用、臨床應用,分別設有:457、36、525、225、170、810共2223個詞條。以“名稱”為主表,類別、功效、主治、藥理作用、臨床應用為二級表。“名稱”庫表涵蓋了類別、藥用部位等16個字段。通過將主庫表與二級表相同字段建立超鏈接,實現各庫表數據的交互檢索。藥物具體圖表以“紫蘇子”為例見2.4“歸納統計”條目內容。
STRAIT對大多中藥涉及的經典名方和醫案設計小窗口打開方式,便于快速借鑒古籍,對藥物靈活應用。STRAIT結構示意圖見圖1。

圖1 數據庫結構示意圖
以《中華本草》《中華人民共和國藥典》《中藥藥理與臨床運用》等權威書籍以及全國高等中醫藥院校規劃教材為數據依據。見表1。

表1 參考書籍詳細信息
鑒于中藥典籍龐雜,不同典籍對藥效名詞的使用存在差異,藥效名詞帶有部分自然語言的色彩,變動性較大[8]。數據庫建設應該求“精”、求“特”,避免數據資源重復、標準不一[9]。STRAIT在建設過程中嚴格遵循標準化這一原則。
中藥信息分兩類,一是性味歸經之類的短小數據;二是藥理、臨床之類的大文本數據。為使數據適宜計算機處理,STRAIT設計引入中藥信息“量子化”概念[10]。對庫表中的數據進行量子化操作,使原來內涵龐雜的中藥信息被解析成數個具有獨立概念的“量子”信息。該設計可在后期通過頻數統計、關聯規則分析等方法對藥物使用頻次、性味歸經等進行分析為創新臨床治療方案提供便利[11]。實現了數據庫內雙向檢索,既能通過對名稱正向檢索得到化學成分、藥性、藥味等相關信息,又能反向檢索得到該藥物功效、主治、藥理作用等方面相關信息。
現有數據庫大多是對中藥大全的摘錄,且對經典名方收集不具體,與現代臨床處方差異較大。而該庫將多部權威書籍中性味、歸經等多個單位信息量子化處理,便于多庫之間信息融合。以“紫蘇子”為例,見表2(僅顯示兩庫對比較鮮明的條目)。
STRAIT以獨有的統計圖和環形圖突出顯示中藥的功效、主治、藥理作用、臨床應用、類別、藥用部位、藥性、藥味、歸經等信息,見圖2~3。

圖2 紫蘇子的STRAIT數據庫搜索結果柱形圖

圖3 紫蘇子的STRAIT數據庫搜索結果環形圖
使用統一標準術語譯詞在中醫術語英譯實踐中特別重要[12]。當前中醫文化傳播存在晦澀難懂、中醫藥翻譯缺乏系統標準的問題[13]。STRAIT利用《中國中醫藥學主題詞表》權威書籍進行標準化翻譯,該書具有科學性、適用性及與《醫學主題詞表》(medical subject headings,簡稱MeSH)的兼容性特點[14]。實際翻譯中,仍存在一些詞匯該詞表未收錄,借助Pubmed平臺進行檢索[15],尋求認可度最高的翻譯結果,如在Pubmed中按title/abstract搜索中藥五味,見表3。

表3 Pubmed按title/abstract搜索中藥五味結果
中醫藥數據庫建設源于20世紀,至今已有近百個。包括現代文獻型及事實型數據庫、結構型數據庫、數據倉型數據等。這些數據庫存在以下問題(圖4)[16]。相當一批數據庫沒能保持維護是最突出的問題[17]。

圖4 以往數據庫建設五點問題
STRAIT避免以上數據庫缺點的同時又綜合市面數據庫優點,實現一個庫就可完成中藥及復方相關內容的搜尋。為保證準確性,該庫從標準制定、資料搜集、數據填寫到最后初步試運行,經歷了小組互查、團隊互糾、導師審核等步驟,初步建成了精而全的標準化數據庫。
檢索多樣化為STRAIT突出優勢。市面上數據庫檢索模式單一,而該庫通過量子化操作實現雙向檢索,既可直接檢索熟知的應對戾氣藥物,查閱其功效主治,又間接檢索臨床應用,通過其主要化學成分展開研究。此外數據庫采用雙語建設,擴大數據庫的使用范圍,推動中醫藥文化的傳承與弘揚。
目前,國家大力倡導弘揚中醫藥文化,國內外各界人士也對中國傳統醫療技術的發展抱有很大期望,這更要求我們積極借鑒國內外數據庫發展經驗,讓中藥順應時代發展,增強中國文化影響力[18]。STRAIT的易用性,便于使用者實際掌握中藥及復方遣方用藥和相關藥理知識,避免片面化[19-20]。