董燕 劉靜 朱玲 劉麗紅 李海燕
摘要:目的 為新版《中國中醫藥學主題詞表》(以下簡稱《詞表》)的修訂工作提供中醫藥學及其相關學科類(TG類)擬新增、刪除、修改的主題詞。方法 基于詞表編制原則,根據詞頻統計和數據庫檢索結果,參考《醫學主題詞表》(MeSH)等相關資料,完成TG類主題詞的修訂。結果 新版《詞表》TG類主題詞擬新增“醫學,韓國傳統”“中醫體質類型”等35個主題詞,擬刪除“醫學,東方傳統”“經絡帶”等35個主題詞,擬修改“四象醫學”“民族醫藥學”等19個主題詞。并統一“民族醫藥學”行文格式,協調“中醫藥學”與其他類主題詞交叉的問題。結論 TG類主題詞選詞應基于詞頻統計,主題詞的詞形應規范描述,符合教材與文件,并注意與其他類主題詞的協調統一。
關鍵詞:中醫藥學主題詞表;主題詞;詞頻;選詞
DOI:10.3969/j.issn.1005-5304.2015.07.012
中圖分類號:R2;N7 文獻標識碼:A 文章編號基金項目:中國中醫科學院科技創新團隊項目(PY1306);中國中醫科學院基本科研業務費自主選題項目(ZZ070301)
通訊作者:劉靜,E-mail:liujbeijing@163.com
醫科學院中醫藥信息研究所從20世紀70年代開始研制《中醫藥學主題詞表》,1987年第1版問世,1996年更名為《中國中醫藥學主題詞表》(以下簡稱《詞表》),2008年修訂第3版。該《詞表》與美國國立醫學圖書館編制的《醫學主題詞表》(MeSH)兼容。2013年開始進行新版《詞表》的研制與修訂工作。修訂選詞的重要參考依據是中醫藥學期刊文獻主題詞和關鍵詞的詞頻統計[1]。本文介紹新版《詞表》中醫藥學及其相關學科類(TG類)主題詞修訂選詞的原則、方法及結果。
1 資料與方法
1.1 數據來源
主題詞、關鍵詞詞頻數據采用溫氏等[2]對2008-2012年中醫藥學期刊文獻主題詞和關鍵詞的詞頻統計結果;計算機檢索《中國中醫藥期刊文獻數據庫》(TCMLARS)和中國知識資源總庫(CNKI),檢索時間范圍2008-2013年,對要考察的主題詞以關鍵詞進行檢索,以確定是否有相關文獻。選詞過程中參考了中華中醫藥學會發布的ZYYXH/T157-2009《中醫體質分類與判定》和“十二五”全國高等中醫藥院校規劃教材等資料。
1.2 選詞原則與方法
選詞的總原則包括3個方面:①以詞頻作為主題詞刪除、增加的依據,選定的主題詞應有中醫藥學文獻標引與檢索的依據。②保持與MeSH的兼容。③將中國中醫科學院中醫藥信息研究所在《詞表》編制過程中制定的《中醫藥學主題詞表編制原則(草案)》用于指導本次選詞工作。
保留詞:正式主題詞(或入口詞),如果TCMLARS中有標引,可保留;如果TCMLARS沒有標引,但CNKI近5年有相關文獻的則保留;若為類目詞及刪除后影響詞表結構完整性的詞則予以保留。
新增詞:在TCMLARS或CNKI中,5年內標引次數≥5次的詞;2012版中文醫學主題詞表(CMeSH)中新增的中醫藥相關詞。
刪除詞:正式主題詞,如果TCMLARS中標引為0次、CNKI中查詢也無該主題詞的相關文獻,可考慮刪除;2008年版《詞表》中的非中醫相關的主題詞,原則上MeSH已收錄而在《詞表》中無必要重復收錄的,可考慮刪除;若2008年版《詞表》和MeSH中都有的中醫類詞,與我國現行觀點不一致(或國家利益不一致)也可考慮刪除,如“醫學,東方傳統”。
修改詞:同一類詞在不影響含義的情況下格式盡量統一,如“醫學,傳統”下的亞類格式統一為“醫學,XX傳統”來表示;簡稱容易導致歧義的,改用全稱,如民族醫藥類均修改為“民族名稱+醫藥學”。
2 結果
2.1 數據檢索結果
根據溫氏等[2]的詞頻統計結果,TG類相關、詞頻>5次的有35個。2008年版《詞表》TG類的3個子類“醫學,傳統”“中醫基礎理論”“中藥藥理學現象”,共有主題詞337個,其中20個主題詞在TCMLARS中標引為0次、在CNKI中查詢也無相關文獻支持(2008-2013年)。
2.2 擬新增主題詞
按照以上規則調整后,擬新增主題詞35個,見表1。
表1 擬新增主題詞的詞頻統計
主題詞 詞頻統計
(2008-2012年) TCMLARS檢索結果(2008-2013年) CNKI檢索結果(2008-2013年)
醫學,韓國傳統 0 22 >150
回族醫藥學 5 13 >20
布依族醫藥學 0 1 >20
滿族醫藥學 0 7 >20
哈尼族醫藥學 0 12 >20
哈薩克族醫藥學 5 34 >8
黎族醫藥學 0 13 >20
傈僳族醫藥學 0 5 >20
畬族醫藥學 13 38 >20
水族醫藥學 0 11 >10
羌族醫藥學 0 6 >10
布朗族醫藥學 0 3 >10
毛南族醫藥學 0 0 >20
鄂溫克族醫藥學 0 9 >10
中西醫結合基礎 0 5 >20
中醫藥語言系統 0 8 6
中醫臨床術語 0 5 5
中醫電子病歷 0 6 >20
實驗針灸學 0 23 >20
中醫體質類型 13 62 >60
平和質 0 8 >10
氣虛質 0 8 >10
陽虛質 5 4 >10
陰虛質 0 1 >5
痰濕質 10 4 >10
濕熱質 0 4 >5
血瘀質 0 77 >50
氣郁質 5 9 >10
特稟質 0 3 >5
中藥制藥工程 0 5 >30
臨床中藥學 13 23 >60
中藥藥效學 0 3 >100
中藥藥動學 0 9 >60
中藥毒理學 0 0 >20
中醫藥標準化 7 22 >60
2.3 擬刪除和修改主題詞
擬刪除主題詞35個,擬修改主題詞19個。擬刪除的35個主題詞有3種情況:①2008年版《詞表》中主題詞“醫學,東方傳統”在MeSH中也列于“醫學,傳統”的下一級,但該說法與我國現行觀點不一致,為避免未來國際學術討論的糾紛而將其刪除。②有20個主題詞在TCMLARS和CNKI中檢索為0,沒有相關的文獻支持,考慮刪除,包括:一貫堂醫學、經絡帶、經絡顯示、可見經絡現象、體耳反射、循經感傳,隱性、循經感傳顯著者、穴位被動相、穴位活動相、穴位隱性相、膽汁貯存、腐熟水谷、受盛化物、分清泌濁、母氣、子氣、降沉、升浮、淡(中藥)、酸澀(中藥)。③有14個主題詞與“中醫形態”(TA類)中的主題詞有交叉,考慮刪除,包括:營衛、營、衛、膽(中醫)、骨、脈、腦、髓、子宮(中醫)、神、魂、魄、意、志。擬修改的19個主題詞均有詞頻支持,修改原因主要3種:①在樹形結構中位置調整的主題詞,如中醫文獻學、脈象圖和四象醫學;②改變詞形的主題詞,主要是民族醫藥學,為了統一格式都改用全稱來描述,如藏族醫藥學、蒙古族醫藥學等15個主題詞;③與其他類交叉的主題詞,如五體、五神。
3 討論
3.1 詞形應規范描述
同類主題詞,在不影響含義的情況下格式盡量統一,并且主題詞應用全稱。以民族醫藥為例,具體民族醫藥統一用民族全稱,格式為:“民族全稱+醫藥學”,這樣可避免因采用民族簡稱導致的歧義,影響檢索的準確性。如用2008年版的主題詞“水醫藥學”檢索會有很多不相關的信息,而用全稱“水族醫藥學”則準確性提高;用主題詞“黎族醫藥”檢索CNKI,結果顯示,近5年相關文章大于60篇,但如果用2008年版主題詞“黎醫藥”檢索則只有6篇。
3.2 學科名稱符合教材與文件
新增的學科類主題詞既要有文獻標引與檢索數據支持,還應盡量與教材一致。新增的主題詞中藥制藥工程、臨床中藥學、中藥藥效學、中藥藥動學、中藥毒理學、實驗針灸學等與“十二五”全國高等中醫藥院校規劃教材一致。學科類主題詞還應符合我國學位教育和學科規劃文件。如用“民族醫藥學”檢索出700多篇文獻,遠遠多于用2008年版主題詞“少數民族醫藥”檢索出的231篇;而且《研究生專業目錄》和《重點學科目錄》都使用“民族醫學”,因此考慮改用“民族醫藥學”作為主題詞更合適。許多民族醫藥學的研究文獻呈現大量增長的趨勢,民族醫藥學日益受到研究者的重視,《詞表》也要隨著研究熱點領域的變化而增刪。涉及民族名稱的主題詞,以中華人民共和國國家民族事務委員會網站公布的民族名稱為準。
中醫藥信息學作為一個發展中的學科,相關研究文獻近幾年增多,應該及時關注。中醫藥信息學2012年成為中醫藥學科中的二級培育學科,屬于國家中醫藥管理局重點建設學科。其相關主題詞參考MeSH中“醫學信息學”及其下位主題詞的分類,將主題詞“中醫藥學語言系統”“中醫臨床術語”“中醫電子病歷”歸類于其下。
3.3 協調與其他類交叉的主題詞
TG類中有些主題詞與其他類主題詞詞形一致,要考慮這些主題詞的協調,并盡量減少不必要的交叉。TG類與“中醫形態”(TA類)有交叉的主題詞主要是機體形態和功能類的詞,分2種情況處理:①屬于機體形態類的主題詞,轉移到TA類下,同時為了保持TG類的完整性,僅在TG類保留其上級類。如2008年版中主題詞“奇恒之腑”及其下位詞同屬于TG類和TA類,在新版修訂中考慮TG類只保留“奇恒之腑”,其下位主題詞“膽(中醫)”“骨”“髓”“脈”“腦(中醫)”“子宮(中醫)”等刪除。同樣處理的還有“五臟”“六腑”“營衛”,這樣可減少《詞表》冗余。②屬于描述機體功能的主題詞,其上位詞是具體“形態”,則該“形態”類主題詞保留。例如:“胃主受納”的上位主題詞“胃(中醫)”,這里的“胃(中醫)”要保留。這樣既可減少不必要的交叉主題詞,又能維持TG類的完整性。
4 小結
新版《詞表》修訂的選詞是在遵守編制原則的基礎上,以詞頻統計為依據,保持與MeSH兼容。TG類的主題詞類目較多,既包括學科分類,又有與其他類有交叉的情況。學科分類除參考教材、MeSH,還考慮我國學位教育和學科規劃的實際情況。在處理與其他類重復主題詞時,從詞表整體性考慮,在保障詞表結構完整的情況下盡量減少不必要的交叉,以減少詞表加工維護人員的工作量。在對主題詞進行增、刪、改的同時保證詞表的完整性、可用性、實用性,為下一步詞條注釋等編寫做準備,為實現新版《詞表》在中醫藥文獻數據標引、檢索中的更好應用奠定基礎。
參考文獻:
[1] 蘇大明,吳蘭成,朱東升,等.基于編程技術的中醫藥學主題詞表修訂[J].國際中醫中藥雜志,2007,29(4):209-212.
[2] 溫先榮,張晶,劉靜,等.基于文獻標引詞頻統計的《中國中醫藥學主題詞表》選詞研究[J].中國中醫藥信息雜志,2013,20(10):16-18.
(收稿日期:2014-06-10;編輯:華強)
:1005-5304(2015)07-0040-03