車宇玲
語料庫(Corpus)是是選擇能代表一種語言特點的自然發生的語言文本的集合實證主義和經驗主義為基礎的語料庫語言學,起源于20世紀60年代的英美國家(Sinclair,1991)。護理英語所涉及的內容非常廣泛,包含有放射、助產、口腔、公共衛生等不同學科,要把中國傳統醫學推向世界,但是護理英語目前為止沒有一個完整齊全的語料庫,教師無法找到相應學科的語料庫,其應用于教學也即無從談起。
1 護理英語的特點
護理英語人才培養新模式首要解決的問題是人才培養目標的準確定位。樹立科學的教育質量觀,把臨床技能、實踐能力、職業素養、創新精神培養協同發展作為衡量教育質量的根本目標。護理英語詞匯量大、結構復雜術語過長,是當前護理英語教學重、難點。護理英語具備以下特點:
1.1 護理醫學詞匯豐富有趣
醫學英語專業詞匯和術語大部分來源于拉丁語和希臘語。拉丁語詞匯豐富有規律,比如,拉丁 sub-(在…下面)于是就有了 suf- suffocation(窒息)和sup- suppository(栓劑),一個詞根的學習可以舉一反三,帶動一組相同詞根的學習,但是護理英語術語偏長 ,過于復雜,這與中醫的四字語有沖突,護理英語語料庫勢在必行。
1.2 護理英語與中醫英語的結合
護理英語覆蓋面非常廣,單詞也較為復雜,學生很難從把握學習進度。護理學習要求加強學生查閱外文文獻的能力。護理英語語料庫的范圍很小,在資料庫中能搜索到的也是中醫的語料庫,對于護理英語學科涉及的很少,中醫英語和護理英語雖然是同意學科,卻很難融合在一起。
2 護理語料庫的建立初探
2.1 語料庫的規模
語料庫起源于20世紀60年代的英美國家(Sinclair,1991)。關于語料庫的三點基本認識:語料庫中存放的是在語言的實際使用中真實出現過的語言材料;語料庫是以電子計算機為載體承載語言知識的基礎資源;真實語料需要經過加工(分析和處理),才能成為有用的資源。筆者調查早期文獻發現,大多數研究者認為語料庫規模越大越好。隨著社會的發展,語料庫的不斷增大,大量的信息使得檢索越來越困難。所以,能夠根據自身實際建設語料庫建立固定規模的語料庫才是最適合自己的語料庫。大多數人認為構建語料庫是一件非常費心費力的事情,而且很多人不知道從何處著手。所以,結合實際情況,按需求構建一個小型中醫英語和護理英語語料庫以方便自己的教學和科學研究工作。
2.2 語料庫的來源和選擇
要收集符合條件的文本,要建立的學習型語料庫,保證語料的真實性就要分析的學生的真實語言能力。護理語料可以從大量的在線語料資源、光盤資料和實際操作中收集,這些使語料庫的建設和擴充變得非常快捷。網上語料豐富,可以運用各種引擎手段如Google,百度等去收集,也可以運用一些數字和電子圖書館來收集你需要的資料。筆者收集語料庫是護理英語專業學生的教材、翻譯、口語和實踐課。語料來自教材內容中的各種疾病以及外科、婦科、兒科和基礎醫學等方面,當然這些都不是書本上的知識,書本上的知識不算是語料庫的。筆者通過記錄,錄音等方式記錄學生的原始語料,再把這些原始材料轉化為文本,以確保文字詞匯的準確性,真實性和完整性。
2.3 語料的標識
標識分為兩類:一類是對文本的性質和特征進行標識,另一類是對文本中的標點符號進行標識。大多數的語料庫研究者都認為,任何語料庫都需要標識。把收集到的語料整理好,如口語,筆錄,期刊等。把標記信息通過語言編碼用多媒體數據庫標記,統一命名以方便日后搜索查詢。
護理英語語料庫(Nursing English Corpus,以下簡稱NEC)分為純文本和標記模塊。標記模塊主要包含來源,檢索日期,類型等。經過標識的語料庫可以廣泛應用于護理英語教學甚至是中醫英語教學,經過標識的語料庫變得井然有序,隨時可以查詢。接著是借用詞性標注軟件來搜索,筆者使用的是geniatagger,這個軟件可以進行詞性標注和進行命名實體識別,使用方法:
在geniatagger所在的文件夾下,直接命令行執行: .\geniatagger.exe <輸入文件路徑> 輸出文件路徑。
語料庫經過標識后儲存起來,簡單小型的語料庫算是完成了。語料庫以真實的面目為護理英語教學提供了一個平臺。語料庫的建立看起來很復雜,實際上它可以用于護理英語的教學,為老師和學生提供相應的查詢資源。其次,護理英語語言語料的研究以及大量語料收集,能夠幫助護理學習者和研究者進行全面的提高和掌握。
總之,迎合新時代的需求,護理英語語料庫的建立就顯得非常重要。作為語料庫的建立者和使用者,我們應該認識到,護理英語語料庫的建立和完善,為我們學習護理英語帶來了意想不到的效果,但是我們也不能完全依賴語料庫而忽略了護理英語的真實性,只有更好的利用語料庫,結合實際情況,按需所求,我們才能更好地建立和使用語料庫。
(作者單位:廣西中醫藥大學賽恩斯新醫藥學院)