郭力銘

摘要:中醫漢語屬于留學生專門用途漢語,教學研究具有重要意義。徹底厘清中醫漢語教學特點及學生習得模式,并進行深入研究建設,是當務之急。其中中醫漢語語料庫建設可以對中醫漢語研究起基礎性作用,應從建庫標準、標注規范、具體建設等方面做出細致研討。
關鍵詞:中醫漢語 中醫術語 中醫漢語語料庫
一、引言
什么是中醫漢語?首先要引入“專門用途漢語”的概念。專門用途漢語(CSP)不同于“一般用途漢語”,指為了滿足不同學習者的特定需求,以某種專門用途為目的而進行的對外漢語教學,中醫漢語、商務漢語、科技漢語、法律漢語正是專門用途漢語教學的下位分支學科,其中經貿漢語的發展最充分。隨著中醫藥事業的繁榮發展,中醫越來越廣泛地為世界各國人民所接受,“中醫熱”在全球范圍內盛行。然而對比全球范圍的需求,中醫漢語卻呈現出零散發展、分散研究、缺乏統一體系的特點,充分顯示學科的發展需求與發展實際不對應的情況。
中醫藥院校留學生漢語教學作為漢語國際教育的一個具體方向,長期以來并未得到學界的重視。隨著中醫院校外國留學生招生規模進一步擴大,如何提高留學生中醫學習水平已經成為首先需要解決的問題。鑒于專門用途漢語尤其是中醫漢語的特殊性,囿于普通漢語研究似乎不能滿足要求。面對中醫院校留學生日常學習中遇到的障礙,需要找到適合中醫漢語教學和研究的模式。
二、研究現狀概述
隨著大數據時代的來臨,中醫術語研究朝著新的方向發展,目標為建立的術語體系既適用于機器語言理解,又具有廣泛代表性和自我完善性。
在中醫術語研究方面,李德新提出中醫基礎理論術語標準,曹興魯提出建立真實世界中醫術語標準,倪菲等提出研究中醫治未病術語標準化,朱建平提出研制《中醫藥術語標準編制通則》,等等。然而,與術語研究密切相關的語料庫建設方面,中醫領域專用語料庫呈現出零星發展的態勢,目前比較成熟的有“中醫藥文獻語料庫系統”。除了中醫藥古文獻語料庫已經開始討論詞語標注的細則外,其他語料庫建設均停留在建庫設想、建庫原則討論、詞語分類規范確立的階段,如:中醫英語語料庫、中醫語料檢索庫、《黃帝內經》語料庫建設等,因此并不能直接指向實踐。專用語料庫的建設目標是什么?價值何在?如何更好地利用語料庫解決實際問題?都將是學界亟待處理的問題。
目前學界對中醫院校漢語教學及研究進行了一些有益的嘗試和探討,對諸如詞匯、寫作等具體領域的研究進行了一些有益的探討。但是中醫漢語教學作為一門獨立學科的系統性和規范性尚未得到梳理,課程設置尚無一定的標準,教材資源并未得到合理的配置。值得一提的是,對外漢語學界發展比較迅速的習得研究,在中醫漢語研究中尚無跡可尋。然而在教學反饋即留學生中醫漢語的習得情況方面,如何找到癥結,徹底厘清中醫漢語教學的特點及學生習得模式,并進行深入研究建設,是亟待解決的問題。
三、指向中醫漢語研究的中醫術語與漢語語料庫建設
中醫術語研究中中醫漢語語料極富重要性。因此,我們擬在中醫術語研究的背景下,立足于針對留學生的中介語專用語料庫的建設,以中醫漢語為考察點進行研究。研究成果將為我們提供中醫漢語中介語語料,填補本領域的空白,在留學生教育和中醫海外推廣方面有著極大的首創價值。
中醫術語建設的重要性不容小覷,本文將中醫漢語語料庫建設的思維納入中醫術語建設大框架中,以學界目前的中醫術語建設研究成果指導中醫漢語語料庫建設。在大數據時代,語料庫的建設前提之一即建立標準的詞表和標注標準。之所以選擇本研究角度,因為通過語料的整理、分析和語料庫的建設,可以把問題落在實處,從實然——實際的語料中對比分析,指向應然——實際問題的解決,將為漢語二語習得者對中醫漢語的研究提供更大的幫助。
中醫漢語中介與語料庫的建立和完善,能為我們進行中醫術語標準建設提供真實的語料及反饋,進一步指導中醫術語標準建設。
中醫術語建設與中醫漢語研究實際上是相輔相成、互相呼應的,中醫漢語語料庫的具體建設被提上研究日程。
四、中醫漢語相關語料庫體系構建
外國留學生在進入中醫學本科專業學習之前,需要掌握中醫學的基礎詞匯、構詞法、表達句式和基本中醫學常識;掌握中醫漢語聽說讀寫技能,能夠在既定的醫療相關情景中進行成功交際、開處方,引用中醫經典、撰寫實習報告等。
我們提出建立中醫漢語語語料庫的構想,旨在通過實際語料的梳理、對比和分析,得出具體的統計數據,直接指向實際問題的解決,從中歸結中醫漢語特定的語言規律,構建留學生學習模型,指導中醫漢語教學。諸如中醫漢語專業詞表的建設、中醫漢語習得順序的確定、中醫漢語立體化教材建設等問題都可以借助中醫漢語語料庫的研究得到切實解決。擬達到的研究目的具體如下:
第一,確定中醫專用漢語詞表。
第二,確定中醫漢語習得順序。
第三,構建中醫漢語教學大綱,如《中醫漢語教學詞匯大綱》《中醫漢語教學語法大綱》《中醫漢語教學功能大綱》《中醫漢語教學文化大綱》等。
第四,通過語料庫的建設指向教學資源的建設,指導教師用書、配套用書、工具書、詞典的編寫;為教學資源庫的構建提供第一手材料、基礎和支撐。
(一)建設構想及語料來源
語料庫的建設和語料的檢索、結果的分析,從“應然”指向“實然”,在實際語料中對比分析,所得統計數據直接指向實際問題的解決,將為漢語二語習得者對中醫漢語的實踐和研究提供更大的幫助。
1.中醫漢語語料庫
鑒于專門用途漢語的特殊性,目前的普通漢語研究似乎不能滿足要求。然而面對中醫院校留學生在日常學習中遇到的障礙,需要找到適合中醫漢語教學的模式。我們提出建立中醫漢語語語料庫的構想,旨在通過實際語料的梳理、對比和分析,得出具體的統計數據,直接指向實際問題的解決。中醫漢語語料庫的構建可以為詞表的建設提供最基礎的材料支撐。在學術英語詞表建設領域,不少學者(Coxhead,A.2000;Davies,M. 2008:Gardner,D.,&Davies,M. 2014;Hsu,W.2014;Lei&Liu 2016)做出過相關研究。無論結論和目標有何差異,無一不建立在龐大的專用語料庫基礎之上。
第一步,以語料庫為基礎的詞表建設。
我們擬建設中醫漢語語料庫,語料來源由具有代表性的中醫學教材和中醫學術期刊兩部分組成。擬與中醫學專家研討,確定教材和期刊的選擇范圍,并進行分詞、計算和統計。
首先,我們借鑒醫學專業英語詞表的建構體系(Lei&Liu2016),確定醫學漢語的架構步驟。我們將中醫漢語詞表建設的核心集中在四個層次:
標準一:頻次比率(frequency ratio)。該指標用于剔除通用漢語的詞匯。我們將頻次比率設定為1.5,意即在專用漢語語料庫中頻次需要高于普通漢語語料庫的頻次的50%。
標準二:廣泛分布(range ratio)。根據前賢的技術路線,并結合語料規模和下位學科分布(中醫基礎理論、中藥學、診斷學、針灸學、中醫綜合理論、中醫養生),選擇50%為頻次比率標準。即收錄在詞表中的詞語需要保證至少出現在3個下位學科(共6個下位學科),且每個學科領域的頻次至少為20%的期望頻次。
標準三:均勻分布(dispersion)。收錄在詞表中詞語的均勻分布指數(Juilland's D value)需要在0.5及以上。
標準四:學科指數(discipline measure)。為了排除在某個下位學科領域中尤為高頻的詞語,該標準對收錄在其中的詞語在某個下位學科領域的頻次做出規定,一般來說,不能超過該詞語在該學科的期望頻次的3倍及以上。
標準一排除的是通用漢語高頻詞,標準二、三、四排除的是某個下位學科的專業詞。以上是指導外向型中醫漢語詞表建設的一個基礎性指引方針。
第二步,我們自建外向型的中醫漢語語料庫。所謂外向型,即面向中醫專業的留學生。
語料的來源決定語料庫建設的現實可操作性,指向本研究在既定期間的可完成性。
第三步,分詞和詞頻統計(Python語言編寫代碼,進行處理)。
第四步,根據國際前沿關于專用英語詞表建設的要求(Coxhead 2000,Wang et al 2008),篩選去除不能達到最小頻次28.57PMWs(每百萬詞出現28.57次)要求的詞語。
第五步,初審詞表,基于中醫漢語的專業性和特殊性(例如根據“氣”這個詞,在中醫專用漢語領域的義項與普通漢語的義項的區別,將其進行義項的分離),將初步得出的詞表進行人工校對和義項分離。
最后,得出中醫漢語專用詞表,該成果作為基礎詞表,可以作為中醫漢語教材詞表的來源,并根據教材的規模,按照詞頻高低進行取舍。該詞表還將為中醫專用漢語的教學和研究,進一步為中醫漢語測試提供詞匯標準。
2.中醫漢語中介語語料庫
中醫漢語的中介語語料庫擬通過采集中醫學專業各個層級的留學生在學習中醫課程時的書面文本(考試題中的問答題題型的作答文本),并進行規范的標注。在語料收集過程中,需要甄選出真正適合本語料庫的語料,需要解決語料的平衡性和代表性的問題。我們在中介語語料庫建設時,可供選擇的語料主要就是二語習得者在習得目的語過程中記錄下來的文本(如平時作業、考試答卷、課程小論文等)。“從理論上說,每個文本都有語料的價值,都值得錄入語料庫中,很難說哪一種語料更有代表性,最需要做的工作就是根據合適的參數將它歸人相應的類型和層次中”。由此可見,平衡性顯得尤為重要。
(二)標注規范及偏誤類型分類標記
中醫漢語語料庫作為一個專用漢語語料庫,應該首先關注中醫術語的標注問題。鑒于此特殊性,我們根據《中華人民共和國國家標準——中醫基礎理論術語》,為標注框架和規范的建立提供支撐和參考。按照“有限的一錯多標”的原則,按中醫漢語的特殊性和本階段的研究目標,先標注主要中醫術語、詞性、固定結構、句式和文化詞語。我們并不進行普通漢語的分詞及詞性標注,只是提取出中醫類詞匯,進行詞性、結構、句式和文化的標注。
標注單位:中醫專業詞匯、中醫文化類詞語、詞性、短語結構、句式。
標注方式:以“上位類(大類)一個代碼,下位類(小類)兩個代碼的原則”進行標注。從詞語、短語和句子三個層面分別標注。
首先詞語層面。詞語層面用“C”表示屬于詞這個大類,然后區分出詞性和特殊的詞語。
如:名詞[MC] 形容詞[XR] 動詞[DC] 文言詞[GC] 特殊詞(屬、兼等)[SD]、[JD]]
因為中醫詞匯“和普通詞匯的界限并不分明,很多詞語兼有兩者的屬性”(周延松,2017),所以我們在名詞的下位詞語標注中,有必要對食物和藥物進行區分標注,比如用[SW]表示食物,[YW]表示藥物。
(1)艾葉/CMC/CYW/
(2)山藥/CMC//CSW/CYW/
其次,短語層面。短語層面我們用“Z”表示屬于短語這個大類,然后具體標注短語結構。如:聯合[ZLH]主謂[ZZW]
(3)干澀不榮/ZLH/
最后,句子層面。句子層面我們用“S”表示屬于短語這個大類,然后,具體標注句式。如:動詞謂語句[SDW]主謂謂語句[SZW]]
(4)皮膚潤燥/CXR/:皮膚潤澤/CXR/。為津液未傷/CGC//CWT//CMC//CGCJ/CWF/。營血充足/CMC//SZW/;皮膚干澀不榮/CXR//ZLH/,多為津液已傷/CGC//CWT//CMC//SZW/,或營血虧虛/CMC//CDC//SZW/。皮膚干枯粗糙,狀若魚鱗,稱為肌膚甲錯/CDCI/SDW/,若兼見面色黧黑/CJD//SDW/,屬淤血久停/CSD//SDW//CMC//ZZW/。
關于中介語語料庫的語料標注規范,學界多有論述,且有不同的意見。然而,根據中醫漢語的特點,根據肖奚強的詞匯標注,我們將標注的偏誤類型分為五類,分別用以下字母標注:
錯序[O] 冗余[R] 替代[T] 遺漏[W] 其他類偏誤[Q]
偏誤信息可以在中醫漢語語料庫的基礎上進行偏誤的標記,比如一個主謂謂語句的遺漏可以標注為[OSZW]。
(三)工作進展
目前我們已經完成了中醫漢語語料庫的生語料的錄入,完成了20萬字學生作業語料的錄入的中醫漢語中介語語料庫建設,并研制了標注規范。
在語料標注規范研制過程中,我們對已錄入語料進行了試標,經過討論,確定了中醫漢語語料庫和中醫中介語語料庫的標注規范。
五、結語
我們對中醫漢語研究做了深入的探討,歸結出現階段中醫漢語研究的不足和存在的問題,對中醫漢語語料庫建設的構建提出要求。我們期待通過中醫漢語語料庫的建設,指向中醫漢語研究中uR待解決的問題,促進教材及配套資源建設的縱深發展。
然而,在強調中醫漢語語料庫建設的重要性之余,還有兩點問題需要引起我們的重視,即:如何將中醫文化融人中醫漢語教材,可以通過哪些可行的途徑?另外,除了面向“準中級”水平的中醫漢語學生的中醫漢語教材以外,是否有必要在中醫學本科(五年)的其他階段也進行漢語教學,以及相對應層級的漢語教材建設問題,需要后續研究進一步探討。
參考文獻:
[1]李泉.論專門用途漢語教學[J].語言文字應用,2011(3):110-117.
[2]李德新.加強中醫術語研究,促進中醫學術發展[J].遼寧中醫雜志,2011(5):810-812.
[3]曹馨宇,等.中醫臨床術語編碼方式研究[J].中國數字醫學,2016(6):30-32.
[4]倪菲,等.中醫治未病術語標準化研究(1)[J].遼寧中醫雜志,2016(7):1389-1391.
[5]倪菲,等.中醫治未病術語標準化研究(2)[J].遼寧中醫雜志,2016(7):1877-1879.
[6]朱建平.中醫藥名詞術語規范化現狀問題與對策[J].中華中醫藥雜志,2017(4):1633-1637.
[7]周延松.專門用途漢語教學中的專業詞匯問題——基于中醫漢語的視角[J].現代語文(語言研究版),2014(10):81-84.
[8]周延松,姚力峰,金瑛.中醫院校對外漢語教學課程結構芻議[J].醫學教育探索,2009(11):1439-1441.
[9]施春宏,張瑞朋.論中介語語料庫的平衡性問題[J].語言文字應用,2013(2):117-126.
[10]李德新,等.中華人民共和國國家標準:中醫基礎理論術語(GB\T20348-2006)[S].北京:中國標準出版社,2006.
[11]張寶林.漢語中介語語料庫建設的現狀與對策[J].語言文字應用,2010(8):129-138.
[12]肖奚強,周文華.漢語中介語語料庫標注的全面性及類別問題[J].世界漢語教學,2014(3):368-377.
[13]Coxhead,A. A New Academic Word List[J].TESOLQuarterly,2000(34):213-238.
[14]Davies,M. The Corpus of Contemporary AmericanEnglish[EB/OL].http://corpus.byu.edu/coca/,2008.
[15]Gardner,D&Davies,M.A New Academic Vocab-ulary List[J].Applied Linguistics,2014(35):305-327.
[16]Hsu,W.Measuring the Vocabulary Load of Engi-neering Textbooks for EFL Undergraduates[J].English forSpecific Purposes,2014(33):53-64.
[17]Wang,J,Liang,S,&Ge,G. Establishment of aMedical Word List[J].English for Specific Purposes,2008(27):442-458.
[18]Lei Lei,Dilin Liu. A New Medical Academic WordList:A Corpus-Based Study with Enhanced Methodology[J].Journal of English for Academic Purposes 2016,22:42-53.
課題項目:遼寧中醫藥大學2020年度校級教學改革研究項目“基于慕特MOOT的外國學生《中醫漢語》在線課程教材的開發和使用研究”(LNZYJG2020155);2020年沈陽市社會科學課題名稱:基于“迎進來”和“走出去”相結合的沈陽中醫文化中東歐合作交流體系研究——以“一帶一路”中東歐國家和地區為對象(SYSK2020-10-08)。