[關鍵詞]商務漢語;詞語表;分級
[摘 要]基于大規模商務漢語語料庫,分析了商務漢語教材生詞的編排情況;結合《商務漢語交際功能項目》,重新構建了一個商務漢語交際功能項目庫,并將功能項目分為三級;在分析了新商務漢語常用詞語表(新BCT詞表)建設的理論基礎、需求和原理后,利用語料庫語言學中的聚類方法和專家檢驗,構建了新BCT詞表,并分為四級;將新BCT詞表與《商務漢語常用詞語表》《漢語國際教育用音節漢字詞匯等級劃分》中的“詞匯等級劃分”進行對比,并分析了其在等級分布上的特點。
[中圖分類號]H195;H195.2 [文獻標識碼]A [文章編號]1674-8174(2018)01-0035-14
1. 引言
現有《商務漢語考試大綱》中的《商務漢語常用詞語表》(下稱為“BCT詞表”)共收錄2500個①常用詞語。按照詞語的使用范圍,“表一”收入與商務有關的生活、社交、工作類詞語1035個(下稱為“BCT生活詞表”),“表二”收入商務活動的常用業務類詞語1422個(下稱為“BCT業務詞表”)。
該BCT詞表基于國內財經門戶網站的經貿類新聞來提取候選詞語②,人工干預,按照生活和業務將詞語分為表一和表二。該方法最大的缺陷在于其詞語主要來源于中國母語者閱讀的書面語語料,沒有考慮二語習得者商務交際的實際需求,也缺乏口語語料的支持;同時,詞表收詞主要基于統計方法,缺乏可解釋的理據,也難以保證科學性;并且,詞表沒有進行分級,大大降低了BCT詞表的使用價值。
國內外很多學者圍繞BCT詞表、商務漢語教材詞語進行了相關研究,主要集中在基于商務漢語教材生詞或課文用詞的統計,分析現有BCT詞表的局限,進而提出BCT詞表建設和分級的建議,例如,辛平(2007)、周小兵等(2008)、黃潔云(2008)、胡梓華(2011)、張吉紅(2012)、吳丹(2012)、安娜等(2012)、喻雪玲(2013)等。但是,目前尚無權威性高的BCT分級詞表。
針對原有“BCT詞表”建設的局限,本文基于商務漢語交際功能項目庫,利用語料庫語言學方法,重新構建了一個新的《商務漢語常用詞語表》(下稱為“新BCT詞表”),并進行了詞語分級。
2. 整體研究思路與流程
全文分為六個步驟:
(1)建立商務漢語語料庫,將商務漢語教材生詞表與BCT詞表、《漢語國際教育用音節漢字詞匯等級劃分》中的“詞匯等級劃分”(下稱為“詞匯等級”)進行對比分析。
(2)基于語料庫中商務漢語教材的交際功能項目編排,結合《商務漢語交際功能項目》(下稱為“《項目》”),重新構建商務漢語交際功能項目庫;結合功能項目的頻率和常用度,將功能項目分為三級。
(3)圍繞“交際圖式、心理詞典、話題詞表”,闡述新BCT詞表建設的理論基礎;探討了商務漢語詞表建設的需求和構建原理。
(4)將語料庫按功能項目分類,聚類出各功能項目的領域詞語,從教材生詞表、BCT詞表補充詞語,專家控制詞表,最終構建出新BCT詞表。
(5)討論了新BCT詞表分級的原理,結合功能項目常用度、生詞表頻率、詞語常用度,將詞語分為四級。
(6)將新BCT詞表與“詞匯等級”、BCT詞表進行對比分析。
3. 商務漢語語料庫及教材生詞表分析
3.1商務漢語語料庫
商務漢語教材大多數是按照商務場合中的交際功能來編排的。我們選取了常用的商務漢語教材共22套、44冊,涉及到初、中、高三個等級,同時兼顧了商務漢語聽說讀寫、案例、常用句等各方面的內容。
選取了恒星英語學習網站(duihua.hxen.com)部分商務類英漢情景會話,公文范文網(www.50yl.com)中簡短易懂的商貿類公文內容,以及財經類新聞網語料。
另外,選取了商業題材影視中相關的商務會話材料,如《杜拉拉升職記》片段。
3.2商務漢語教材生詞表基本情況
商務漢語教材生詞表指的是將44冊教材所有課文的生詞匯總后形成的詞語表(下稱為“生詞表”),共12872個詞條。如:
優惠(22)、咨詢(21)①、開發、成本(20)、承諾、意識、業務(19)、投資、條款、優勢(18)、利潤、風險、促銷、開拓、信息(17)、合同、調整、品牌、設計、洽談(16)
總體上看,生詞表詞條總量很大,但最高頻次詞條的頻次才22,為44本教材的一半;平均頻次為2.16,重復率不高;3次及3次以上的詞條共2985個(下稱為“核心生詞表”),3次以下的占到總詞條數的76.81%,其中頻次為1的占到60.15%。這些說明了各教材之間生詞重合度很低,各教材的生詞并未按照統一的詞匯大綱來編排,隨意性很大;從另一個角度也說明現有BCT詞表對于商務教材編寫缺乏指導意義。
3.3 核心生詞表與BCT詞表對比情況
核心生詞表共2985個,和BCT詞表2500相差不大。二者對比數據如表1:
BCT詞表和核心生詞表的共用比例為40.40%,其中,BCT詞表獨用詞語多為專業性強、不太常用的詞語,例如(按音序排列,部分):
澳元、罷工、罷市、版稅、半成品、包工包料、包工頭、包退包換、包銷、包租、保額、保險額、保價、保稅區、保險箱、保有量、保證金、保證人、保值、報酬、報復關稅、報失、報稅、報賬、暴跌、暴利
核心生詞表獨用詞則主要是日常生活用詞,例如(按頻次降序排列,部分):
開發(21)、承諾(20)、意識、開拓(18)、調整(17)、時尚(16)、關鍵、符合、潛力、享受、傳統、領域、順利(14)、實施、知名度、理念、關注、參與、核心、實力、涉及、標志、控制、發揮(13)
BCT生活詞表和核心生詞表的共用比例為52.77%,BCT業務詞表和核心生詞表的共用比例為31.47%,前者共用比例高于后者21.30個百分點。這說明來自教材的核心生詞表更趨向于生活用詞,BCT詞表則趨向于業務用詞,這可能和教材編寫者對于商務漢語及其生詞的理解有關系,編寫者多傾向于商務漢語學習者低起點、更偏重日常生活,教材生詞主要以日常生活用詞為主。
3.4 核心生詞表與詞匯等級劃分對比
二者共用2410詞條,詞匯等級獨用8546詞條,獨用比例為78.00%,核心生詞表獨用575詞條,獨用比例為19.26%。數據如表2:
核心生詞表中,大多數詞語屬于詞匯等級中的甲、乙、丙級詞,丁級詞很少,綱外詞占約五分之一。這和上文的觀點相印證:來自教材的核心生詞表更趨向于生活用詞。生詞表中,綱外詞占比超過了一半,這和教材生詞低頻詞很多,偶發性強有關。
4. 商務漢語交際功能項目庫構建及分級
基于場景交際功能設計的商務漢語的功能項目教學已經成為主流,商務漢語教材大多數都是按照商務場合中的交際功能項目來編排的。
4.1 商務漢語交際功能項目庫構建
商務漢語交際功能項目庫(下稱為“功能庫”)重構的基礎是《商務漢語考試大綱》中的《項目》。該大綱將商務交際功能項目①(下稱為“功能項目”)分為生活和業務兩大類,每個功能項目下又包含若干個子交際功能項目。
本文結合商務漢語教材中語料的具體情況對《項目》作了一些歸納和修改。
4.1.1 子功能項目添加
這類情況一共有12處。例如:教材中有很多酒店的簡介,但《項目》中并無此子功能項目,我們添加了“酒店簡介”子功能項目于“住宿”功能項目之下。
4.1.2 子功能項目刪除
這類情況只有2處。例如:業務類“談判”含子功能項目“付款”,與另一個子功能項目“支付方式”內容重疊,因此將其刪除。
4.1.3 子功能項目合并
這類情況共有3處。例如:業務類“談判”有三個獨立的子功能項目“品種;數量;包裝”,這三個子功能項目在語料中通常都是同時出現在一篇課文中,難以分開,因此將其合并為一個子功能項目“品種、數量、包裝”。
4.1.4 子功能項目修改
此類修改只有1處。生活類“購物”有子功能項目“商品的保修及售后服務”,售后服務已經包括保修,而商務漢語教材中更多的是關于商品質量問題的篇章,而在“購物”這個功能項目之下并沒有可以包含商品質量問題的子功能項目,因此將其與售后服務放置一起,修改為“商品的質量及售后服務”。
4.2 功能庫的排序與分級
4.2.1 功能庫分級實現
考慮到功能項目的難易和常用程度不一,應該對功能庫的功能項目進行排序分級。方法如下:
按照文章內容確定語料歸屬于哪一個子功能項目,將商務漢語教材語料庫中的每一篇文章標注上功能項目名稱;統計每個子功能項目的總頻次,功能項目的頻次即為諸子功能項目頻次之和;按照頻次高低排序;基于頻次,結合功能項目的常用程度和難易度,人工分級。
同時,通過對教材的統計,按照教材中功能項目出現的頻次以及與商務漢語的密切度,又增添了三個子功能項目,分別是“出行”中的“天氣”(出現3次);“銀行”中的“理財”(出現3次)和“其他”下的“環境”(出現3次)。
經過多次對比與專家分析,最終構建了一個含24個功能項目,120個子功能項目的分級的商務漢語功能庫。其中,生活類功能項目7個,業務類功能項目17個;生活類子功能項目31個,業務類子功能項目89個;一級子功能項目共23個,二級子功能項目共46個,三級子功能項目共51個,見表3(第39頁)。
4.2.2 分級后的功能庫分析
從4.2.1中一、二、三級的數量來看,“23、46、51”體現了商務漢語初、中、高三級從少到多、循序漸進的規律。
從一、二、三級的具體功能項目內容來看,一級子功能項目主要是解決最基本、最常用的日常生活交際任務,是最基礎、最必須的功能項目;二級子功能項目兼顧了解決更廣泛、更復雜的日常生活交際任務和培養比較常用的商務活動能力,這些商務能力是商務活動中偏日常、職場的常用能力;三級子功能項目則是為了解決復雜、專業商務任務的功能項目,都是非常專業領域的商務功能項目。總體上,一、二、三級子功能項目的分級,體現了“基本日常生活→廣泛日常生活 + 日常商務活動 → 專業商務活動”這種由易到難、由通用到專業的規律。
需要注意的是,功能庫雖然分列了生活和業務兩大類,以及各自的子功能項目,但是在實際教學和教材編寫中,并不能依此將功能項目完全獨立開來,實際上很多功能項目是交叉在一起的。例如,一篇招聘應聘類課文中,很可能同時包含“生活-社交-約見拜訪、業務-招聘-面試、業務-應聘-自我介紹、業務-待遇-工資獎金”等子功能項目。
同時,分列兩大類,在一定程度上體現了商務漢語教學的等級性,即生活類功能項目相對簡單易學,可以在較低階段先學,業務類則反之。但是,要注意的是,這種等級遞進關系并不嚴格。原因有三,其一如上所述,功能項目交叉;其二是功能項目劃分不嚴格,分到其他類中也可,比如“聯系”“銀行”中的很多子功能項目,更適宜放到生活類中;其三是子功能項目自身還可以分等級。比如“訂票”,簡單的一句話即可,復雜點的可以問及價格、數量,再復雜一點,可以詳及顧客信息、航班信息、路線選擇等等。
5. 新BCT詞表建設的理論基礎、需求分析和構建原理
5.1 理論基礎
5.1.1 交際圖式
交際圖式在話語中作用在于:“即使沒有提到所有的細節,聽話者只要具備這種交際圖式或認知腳本,就能根據聽到的人和事物及其對認知圖式或認知腳本的知識來重構事件”(羅納德等,2001)。交際圖式包括情景圖式、程序圖式和策略圖式三類。
情景圖式是對社會交際場景以及相應適當行為的認識。比如,一看到“醫院”,我們馬上會聯想到“白大褂、病房、醫生、病人、護士”等。
程序圖式和情景圖式相連,是對經常發生事件的有序組織的認識,包括恰當步驟和行為規則。比如有上醫院就診經驗的人,對如何掛號、診治、檢查、打針、繳費的過程比較熟悉。
策略圖式是對解決問題的策略辦法的認識,往往和專業相聯系。比如,商務類功能項目“海關、商務談判”等,專業性較強,多屬于策略圖式。
落實到詞語,各種交際圖式實際上都是以對應詞語群為基礎的。
5.1.2 心理詞庫
語言理解分為兩步,其第二步是詞匯理解:從長時記憶中提取詞匯的相關信息,并將之與上下文結合,這一過程中,從長時記憶中提取速度最快的是心理詞庫。心理詞庫是根據個人知識涵養、生活經驗等形成的大腦內部的詞匯,會不斷更新也不斷遺忘。當我們在談及一個功能項目時,這個功能項目就會觸發已有的心理詞庫,結合上下文提取與之相關的詞語進行交際,這在很大程度上提高了語言交際的效率。
商務漢語的交際功能項目實際上就是商務活動中的一個個情景模型。學習者在大腦中都會有與之對應的一個模擬場景,即使是陌生領域,通過對情景模型的學習,也可以很快地在記憶庫中建立一個新的情景模型。由于情景模型的記憶強度最高而且記憶時間最長,所以情景模型涉及到的詞匯也會相對其他詞語記得更牢更穩固。同時,學習完該情景模型涉及到的詞語后,將之保存至心理詞庫中,使用時提取即可。例如,當談及“旅客登記入住”這個功能項目時,我們就會在大腦中構建一個旅客在酒店前臺與服務員對話的情景模型,并觸及心理詞庫中的詞語:前臺、登記、預訂、房型、房價、房卡等,有助于學習者更好地進行交際。
5.1.3 話題詞表
研究表明:“詞表是第二語言教學的基礎,科學的詞表可以更好地指導對外漢語教學點的總體設計、教材編寫、課堂教學和成績測試,使教材更實用,教學更有效。”“學習者在討論同一話題時所使用的主題詞能夠緊密圍繞話題,按照語義聯系結成詞語網絡,構成本話題的心理詞庫和圖式。學習者口語交際成功與否,很大程度上取決于他們能否通過圖式迅速有效地觸發心理詞庫,并準確運用詞語。”所以,建構一個以功能項目(話題)為導向的“商務漢語功能項目詞表庫”,有利于在學習者心中建立起詞語網絡,方便詞匯調度,使其表達更加流暢,提高其交際能力。
5.2 需求分析
從性質上來說,商務漢語是以漢語言知識為基礎,以傳授商務知識為目的的漢語教學,其重點在于培養學生用漢語進行商務交際的能力,這是商務漢語最主要的特點。
因此,從初級水平學習者到熟練商務漢語人才的需求出發,商務漢語交際需要又可以劃分為兩方面:日常生活的口語交際需要;專業領域的商貿實務需要。相應地,新的BCT詞表也包括兩個方面:
5.2.1 生活詞表——日常交際需求
這部分詞語應該從初級學習者需求出發,滿足初中級學生的日常生活交際需要。因此,生活詞表以日常口語交際中的情景圖式、程序圖式類詞語為主。構建時主要基于口語會話語料,例如教材會話、網站情景會話、影視字幕。
5.2.2 業務詞表——商貿實務需求
這部分的詞語是在解決日常交際需要之后,滿足中高級學習者的商貿實務的功能需要。因此,在掌握上述生活詞表的基礎上,業務詞表應該以策略圖式類的詞語為主。構建時主要基于書面語語料,例如教材文本、公文范文、財經新聞等。
5.3 構建原理
基于上述商務漢語需求,利用計算語言學的聚類方法,從按功能項目分類的商務漢語語料庫中,找出每個子功能項目對應的詞語群,一級一級往上匯總詞語群;同時,參考原BCT詞表和教材生詞表中的詞語。這是一個基于需求、數據驅動、從下到上的詞表構建方法:
構建按功能項目分類的語料庫;聚類出各功能項目的領域詞語;匯總各功能項目的詞表;從教材生詞表、原BCT詞表補充詞語;專家人工控制詞表;詞語按常用度分級。
6. 新BCT詞表構建方法與流程
6.1語料庫按功能項目分類
將上文收集到的商務漢語語料按照120個功能項目分類編排。在分類時,有些文本可以同時存在于幾個子功能項目中,例如,《為了大家的健康干杯》這篇文章可歸入以下子功能項目中:“干杯、祝酒辭”“點菜、介紹”“接風”和“邀請及致謝”。
6.2 分功能項目的詞語聚類
詞語聚類的核心原理是利用詞語在不同類別語料中分布的差異性來計算詞語對于該類別的貢獻度。(劉華,2010)比如,虛詞(如“的、在”)在不同類別語料中的頻率幾乎一樣,散布均勻;而某些詞語(如“銀行、市場、優惠”)在“經濟”類的語料中出現的頻率會遠高于它們在其它類別(如體育、政治等)語料的頻率,它們是經濟類別中的領域詞語。
其中,[w(wi,cj)]表示詞語[wi]在類[cj]([cj]表示某類功能項目語料,如“生活-出行-訂票”功能項目的語料)的權重,[N(wi)]表示訓練語料中出現詞[wi]的次數,N是所有詞在所有類的頻次之和;[pij=TijLj],[Lj]是類[cj]含有的所有詞的次數之和,[Tij]是詞[wi]在類[cj]出現的次數;[pi=jpijm],m為類別數; n=1.5。
在120個功能項目中,利用該聚類原理分別聚類出120個功能項目的詞語,得到120個詞語表。例如,“業務-簽證-辦手續”功能項目的詞語聚類結果如下(按貢獻度降序排列):
申請、證件、具體、辦理、原件、申請表、領取、簽證、費用、單位、要求、填寫、出國、資料、遞交、本人、護照、表格、出入境管理、辦證、回執、復印件、照片、申請人、攜帶、接待、通行證、身份證復印件、受理、證明、提交、大廳、往來港澳、所在地、戶口簿、照片、時限、交費、購買、網上申請、居民身份證、查看、選擇、提供、工作單位、姓名、復印、戶口、郵政速遞、快遞、公安局、審核、有效期、大使館、個人資料、面談、打印、確認、公章、負責人、申請費、審查、登記表、往返機票、取證、臨時、戶籍、核對、流程、出示、邀請信、通知、預約、訂單、收據、境外、程序、旅游簽證、繳費、發票、代領
6.3 詞表專家控制和詞語補充
6.3.1 詞表專家控制
對于每一個詞語聚類后得到的詞表,以其子功能項目的領域特征為依據,人工刪除一些不符合構詞規范、日常常用、不屬于功能項目或功能項目代表性不強的詞語。例如,“業務-簽證-辦手續”的功能項目詞語表中,“出入境管理、身份證復印件、個人資料、往來港澳、郵政速遞”,可拆分為其他詞語,并且詞表中已經包含這些詞語,刪除;“具體、要求、臨時、選擇”是常用詞語,刪除;“單位、提供、接待、購買、負責人、流程、程序、領取、大廳、查看、打印、復印、出示”等詞語,在其他功能項目詞表中也會出現,經過和其他功能項目詞表多次比較后,發現這些詞語在其他功能項目中更具代表性,因此,將其保留在其他功能項目詞表中,本表中刪除。
同時,將詞表發給漢語國際教育的研究生和多年從事商務漢語教學的老師,讓他們對詞表進行考察。綜合各種建議,再刪除了“發票、訂單、取證”,增加了“出入境、工作簽證、簽、郵遞”等詞語。
6.3.2 詞語補充
利用“詞語聚類在線檢索”檢索相關詞語,對詞表進行補充。“詞語聚類在線檢索”是在超大規模層級分類語料庫(2002—2013,20億字)的基礎上建立起來的詞語聚類(擴展)的在線檢索軟件。(劉華,2010)
在“詞語聚類在線檢索”中輸入“辦手續”或“簽證”進行檢索,其擴展詞語經篩選后可采用的有“免簽、拒簽、SEVIS、存款證明、入境、駐華使館”。
最終得到“簽證-辦手續”的詞表為:
申請、證件、辦理、原件、申請表、簽證、費用、填寫、出國、資料、遞交、本人、護照、表格、辦證、回執、復印件、照片、申請人、攜帶、通行證、受理、證明、提交、所在地、戶口簿、照片、交費、網上申請、居民身份證、戶口、快遞、公安局、審核、有效期、大使館、確認、公章、申請費、審查、登記表、往返機票、戶籍、核對、邀請信、通知、預約、收據、境外、旅游簽證、繳費、代領、出入境、工作簽證、簽、郵遞、免簽、拒簽、SEVIS、存款證明、入境、駐華使館
6.4 各子功能項目詞表合成
將“生活類”各子功能項目的31個詞表合在一起,去重后共得到1132個詞條(下稱為“新BCT生活詞表”)。按照出現在各功能項目中的次數降序排列,3次及3次以上的詞語共50個:
顧客(6)①、辦理(5)、提供、便宜(4)、護照、服務員、填寫、合作、安排、檢查、請客、發票、簽證(3)、照片、商場、收據、員工、各位、取消、免費、現金、查詢、設施、滿意、方便、禮品、敬酒、特色、申請、要求、證件、邀請、出境、感謝、消費、預約、做東、正式、索要、酒店、訪問、幫助、協議、干杯、出示、前臺、本人、結賬、公里、環境
將“業務類”各子功能項目的89個詞表合在一起,去重后共得到2177個詞條,這2177個詞條減去“生活類”詞表已有的詞條后,共1878個詞條(下稱為“新BCT業務詞表”)。按照出現在各功能項目中的次數降序排列,4次及以上的詞語共73個:
項目(10)、市場(9)、風險(8)、資金、調查、制度(7)、檢驗、權利、談判、交易、委托、結算、制定、報告、賬戶(6)、爭議、行業、貨物、簽署、目標、資產、策略(5)、創新、關稅、仲裁、執行、當事人、利率、成交(4)、趨勢、授權、利潤、裁決、評估、盈利、公告、資格、索賠、解除、貸款、交易所、利息、戰略、樣品、比例、證據、實施、介紹、規劃、法定、人力資源部、擔保、融資、行情、貨幣、簽訂、產品、協商、權益、加盟、指定、納稅、商檢、儲蓄、按照、履行、國際、完善、指數、提升、監管、政策、發行
“生活類”和“業務類”各功能項目詞表合計為3010個詞條,是初始的新BCT詞表。按照出現在各功能項目中的次數降序排列,4次及4次以上的詞語共103個:
投資(16)、辦理(15)、協議(14)、提供(13)、規定、申請(12)、合作(10)、項目、經營、價格、企業(9)、合同、審核、發展、批準、市場、風險(8)、顧客、調查、資金、條款、登記(7)、商品、提交、委托、報價、受理、費用、證明、制度、檢驗、權利、談判、交易、責任、安排、業務、銷售、結算、咨詢、填寫、品牌、制定、報告、行業(6)、貨物、要求、賠償、目標、證件、資產、簽字、發票、購買、滿意、賬戶、消費、簽署、現金、管理、材料、爭議、預約、查詢、損失(5)、宣傳、感謝、歡迎、出口、護照、邀請、策略、聯系、生產、員工、訂單、金額、承擔、銀行、約定、注冊、關稅、設計、環境、訂購、客戶、便宜、創新、價值、通知、憑證、參觀、優惠、仲裁、公司、執行、檢查、順利、成功、當事人、核對、利率
6.5 詞表對比及詞語添加
6.5.1 新BCT詞表和BCT詞表對比,添加詞語
將原BCT生活詞表和新BCT生活詞表進行對比,二者共用詞語185個,共用率為16.34%(新BCT生活詞表),新BCT生活詞表獨用詞語共947個,BCT生活詞表的獨用詞語共850個。
參考上文的分類分級的功能項目庫,專家人工對BCT生活詞表的獨用詞語進行篩選。例如,“公務艙、柜臺、服務臺、高檔、貴”等詞語,憑語感應多出現在生活類功能項目中,因此歸到新BCT生活詞表中;“港口、海運、庫房、免除”等詞語,多出現在業務類功能項目中,因此歸到新BCT業務詞表中。最終,共選出299個詞語加入到新BCT生活詞表,選出393個詞語加入新BCT業務詞表類。這時的新BCT生活詞表共1431個詞條,新BCT業務詞表共2202個詞條,合計為3633個詞條。
將BCT業務詞表和新BCT業務詞表進行對比,二者共用詞語570個,共用率為30.35%(新BCT業務詞表),新BCT業務詞表獨用詞語共1308個,BCT業務詞表的獨用詞語共852個。利用上面的方法,選出11個詞語加入新BCT生活詞表,例如“大路貨、共計、冒牌、優惠價”等;選出817個詞語加入新BCT業務詞表類,例如“總裁、份額、投放、壁壘”等。這時的新BCT生活詞表共1442個詞條,新BCT業務詞表共3019個詞條,合計4461個詞條。
6.5.2 新BCT詞表和核心生詞表對比,添加詞語
將更新后的新BCT詞表和教材核心生詞表進行對比,二者共用詞語共1517個,共用率為35.44%(新BCT詞表),新BCT詞表獨用詞語共2764個,核心生詞表獨用詞語共1468個。
利用上面的方法,專家人工對核心生詞表獨用詞語進行篩選,將核心生詞表中19個頻次大于9的詞語加入到新BCT生活詞表;同時在頻次小于10的生詞中,選出56個詞語加入新BCT生活詞表,例如“節省、特價、租、物美價廉”等,選出101個詞語加入新BCT業務詞表類,例如“裝箱單、大宗、資質、承兌”等。這時的新BCT生活詞表共1517個詞條,新BCT業務詞表共3120個詞條,合計為4637個詞條。
6.5.3 對新BCT詞表進行最后一輪人工過濾
最后,專家對詞表再次進行人工過濾,刪掉了105個詞條。主要包括如下一些情況:過時的或者政治色彩比較強的詞語(例如“政治體制改革、社會主義市場經濟、人民法院”,詞表中已有“體制改革、市場經濟、法院”);組合后望文知意的短語(短語意義是各詞義的簡單相加,例如“禁止吸煙、租船、圓滿成功、擴大生產”,不包括詞語縮略后的組合或是組合后不容易望文知意的短語,如“退市、網購、險別”);不常用的、已有更常用替換詞的(例如“雞蛋湯、紐約證交所”,詞表中已有“蛋湯、紐交所/紐約證券交易所”);地名等專名(例如“廈門、深圳、珠海”)。這時的新BCT生活詞表共1489個詞條,新BCT業務詞表共3043個詞條,合計為4532個詞條。
7. 新BCT詞表分級與分類
7.1 新BCT詞表分級原理
7.1.1 商務漢語和通用漢語的相似、重疊規律
商務漢語和通用漢語存在等級層次上的相似和重疊,商務漢語詞表中通用漢語的生活詞語也應占一定比例,等級越高,生活詞語越少,商務詞語越多。通用漢語的詞匯等級劃分標準也可以作為商務漢語詞匯等級劃分的一個反照參考標準。
孫靜(2010)采用需求分析模型對被調查者進行“目標情景需求分析”和“學習者需求分析”,發現商務人員在跨語言交際情景中使用的日常生活語言也被看作是商務漢語教學的內容,而且這部分內容在教學需求中所占比重較大。
李柏令(2008)指出:商務漢語內部包含高級、中級與初級之間的層次,同時,商務漢語與通用漢語在所有層次水平上都有不同程度的相似和重疊,中級商務漢語與通用漢語的重疊程度處于中間地位,比初級重疊的少但比高級重疊得多,而就各個級別的專業性而言,初級階段專業性最弱,隨著層次向高級發展,專業性逐步增強。
因此,依據此重疊規律,通用漢語的詞匯等級劃分標準可以作為商務漢語詞匯等級劃分的一個參考,或者說是一個反照。
7.1.2 新BCT詞表等級與《商務漢語考試等級標準》、功能庫、“詞匯等級”的對應關系
上文提到,結合功能項目的頻次及其在日常生活、商務活動中的常用程度,商務漢語功能庫依據“基本日常生活 → 廣泛日常生活 +日常商務活動 → 專業商務活動”這一規律劃分為一、二、三級。這與上節中商務漢語和通用漢語的初中高三級重疊規律,存在對應性。相應地,依據功能項目的分級來輔助商務漢語詞匯分級,也是合理可行的。
《商務漢語考試等級標準》是商務漢語教學和考試的指導性標準,是商務漢語教材編寫的重要依據,顯然,其中關于商務漢語考試的各項等級標準也可以作為商務漢語詞匯等級劃分的參考。
我們認為,參照《商務漢語考試等級標準》,商務漢語詞表可以分為初、中、高三個等級,其中,中級是商務漢語教學的主體部分,又可以依據其“廣泛日常生活 +日常商務活動”兩類功能細分為兩級:
a. 商務漢語詞表初級
商務漢語初級階段主要解決基本的日常生活的交際任務,這些交際任務體現在商務漢語功能庫的一級子功能項目中,其語言能力則對應《商務漢語考試等級標準》的一級和二級;“詞匯等級”中的一級詞匯也是解決日常生活交際任務的,二者存在一定的對應關系,考慮到商務漢語初級階段解決的是最基本的日常生活交際任務,其詞匯和“詞匯等級”中的一級詞匯相比,應該更加基礎實用,更少一些,是通用漢語中的最常用的生活詞語。
b. 商務漢語詞表高級
商務漢語高級階段是針對專業經貿領域來培養商務漢語能力的,對應《商務漢語考試等級標準》的五級,這些語言能力體現在商務漢語功能庫的三級子功能項目中。依據重疊規律,商務漢語高級階段的詞匯幾乎排除了通用漢語的生活詞語,以商貿領域的專有詞匯為主。因此,對應到“詞匯等級”,商務漢語高級詞匯應該以“詞匯等級”之外的詞語(我們稱之為“綱外詞語”)為主①。
c. 商務漢語詞表中級
商務漢語中級階段主要培養在更廣泛的日常生活交際中的語言能力,以及在日常商務活動中的語言能力,大體對應《商務漢語考試等級標準》的三級和四級,這些語言能力主要體現在商務漢語功能庫的二級子功能項目②中。相對于初級和高級,中級階段應該是商務漢語中更主體的部分,因為初級階段只是鋪墊,高級階段則又太難太專,學習者較少。“詞匯等級”因為其覆蓋面的通用性、全面性,既包括通用漢語的生活用詞,當然也包括一些比較常用的職場、日常商務領域中的詞語。因此,商務漢語中級詞匯分為兩個級別,中級一大致對應“詞匯等級”的二、三級中的生活用詞,偏重于更廣泛的日常生活交際中的詞匯;中級二大致對應“詞匯等級”的三、三級附錄中的商務用詞,偏重于日常商務活動中的詞匯。
7.1.3 新BCT詞表分級框架
新BCT詞表等級與《商務漢語考試等級標準》(BCT標準)、商務漢語交際功能項目庫、“詞匯等級”之間的對應關系和分級框架如表4。
7.2 新BCT詞表分級實現
7.2.1 各子功能項目詞表初分級
利用“詞匯等級”對“生活類”和“業務類”各子功能項目詞表進行初分級。
例如,子功能項目“生活_出行_問路、指路、看地圖、理解公共場所的標志”中,原詞表中的詞語為(按貢獻度降序排列):
場所、標志、樓梯、問路、方向、直走、公共場所、自動扶梯、迷路、路人、左轉、車站、通道、天橋、大廈、商場、附近、路口、走路、出口、電梯、拐角、入口、衛生間、紅綠燈、地圖、汽車站、右轉、換乘、轉彎處、提醒、遇到
利用“詞匯等級”分級后:
一級詞①:場所、問路、方向、車站、商場、路口、走路、出口、入口、地圖
二級詞:標志、樓梯、通道、附近、電梯、衛生間、提醒、遇到
三級詞:公共場所、迷路、路人、天橋、大廈
附錄詞:無
綱外詞語:直走、自動扶梯、左轉、拐角、紅綠燈、汽車站、右轉、換乘、轉彎處
7.2.2 對初分級的子功能項目詞表進行人工校驗,重新分級
依據詞語對于其子功能項目的類別歸屬性(貢獻度)和常用度,以及子功能項目本身的級別,對子功能項目中的各級詞語,進行人工校驗。例如,“生活_出行_問路、指路、看地圖、理解公共場所的標志”是一級子功能項目,在生活中很常用,其功能項目詞語理應多數為新BCT詞表的一級詞語(也可能部分為二級詞語)。
依據7.1.2節中新BCT詞表與“詞匯等級”、功能庫的等級對應關系,校驗重分后為:
一級詞②:場所、問路、方向、車站、商場、路口、走路、出口、入口、地圖、天橋、大廈、附近、直走、左轉、右轉、紅綠燈、汽車站
二級詞:標志、通道、提醒、遇到、公共場所、迷路、路人、自動扶梯、拐角、換乘、轉彎處
人工校驗后,“詞匯等級”的綱外詞語(劉華,2010)和二、三級詞語都提升到新BCT詞表的一級或二級中。例如,“電梯、衛生間、樓梯、天橋、大廈、紅綠燈、附件、直走、左轉、汽車站”是“生活_出行_問路、指路、看地圖、理解公共場所的標志”常用詞語,在日常生活中也是經常用到,升為新BCT詞表的一級詞語。也會有一些詞語會進行降級處理,例如,“場所”不是最基礎的日常用詞,意義又比較虛,降為新BCT詞表的二級詞語。
7.2.3 子功能項目詞表之外的詞語分級
新BCT詞表共4532個詞條,減去各子功能項目詞表的詞語后剩下1522個詞條,對這1522個詞條我們采取如下方法來進行細分:
利用“詞匯等級”將1522個詞條分為五級,利用上文6.1.2節中“詞匯等級”與新BCT詞表等級對應關系,將其部分詞條初步分到新BCT詞表的四級中。
再結合商務漢語教材生詞表的生詞頻率、“詞語常用度”③輔助專家檢驗詞語分級。商務漢語教材生詞表集中了各個教材編寫者的集體智慧,又經過了實際教學的檢驗,很有價值,其生詞頻率高的詞語,應該比較常用,屬于新BCT詞表的低等級詞語;“詞語常用度”綜合考慮了詞語在時間和空間上均勻分布的程度,以及詞語的生成能力,是詞語是否常用的可計算數據資源,常用度高的詞語越常用,在新BCT詞表中等級越低。
7.3 新BCT詞表分級后的內部再排序
最終的新BCT詞表包括四級,共4532個詞條,一級(初級)共491個詞條,二級(中級一)共1129個詞條,三級(中級二)共1235個詞條,四級(高級)共1677個詞條。
分為四級后,每一級別內部的詞語實際上還是存在常用程度的差異,更常用的應該先教先學。可以再根據詞語的常用程度再排序,這也方便在編寫教材時安排生詞出現的先后順序。
我們利用“詞語常用度”來為每一級內部的詞語重新排序。例如,新BCT高級(四級)詞語按照“詞語常用度”重排序后,示例如下(括號中為常用度):
……營銷(218.69)、 旗下(221.36)、 先期(221.63)……競標(312.09)、 大戶(313.49)、 減緩(314.45)……免檢(666.01)、 消費稅(666.8)、酬勞(667.11)……儲備金(870.72)、承兌(871.28)、關稅壁壘(875.44)……報稅(1016.82)、水單(1017.68)、浮動匯率(1018.26)……補償貿易(1634.94)、兌取(1687.46)、契據(2253.59)……
8. 新BCT詞表分析
8.1新BCT詞表與“詞匯等級”對比及等級分布
新BCT詞表與“詞匯等級”對比及等級分布如表5。
從表5可以看到,新BCT詞表各級的詞匯量,比較合理,體現了由少到多的特點。新BCT詞表超出“詞匯等級”的詞語共2281個,占到一半,“詞匯等級”內的詞語也占一半,這體現了商務漢語和通用漢語的重疊規律。綱外詞語占到一半的量體現了新BCT詞表的商務領域特色。
同時,新BCT詞表的一、二、三、四級詞語數量分別占到對應“詞匯等級”中一、二、三級及三級附錄、綱外詞語的59.88%、52.61%、47.04%、98.33%,體現了由易到難的特點。這也證明了我們當初參照“詞匯等級”來分級是合理的;同時,也證明了商務漢語“等級越低,生活詞語越多,等級越高,生活詞語越少,商務詞語越多”的觀點。
值得注意的是,“詞匯等級”的綱外詞語中有632個詞條分到了新BCT詞表的一、二、三級中了。例如:
一級:點菜、收銀臺、買單、服務員、零、包間、房卡、上菜、勞駕、房號。
二級:班機、半價、包退包換、保險箱、保修期、報失、報團、賓客、冰鎮、病假。
三級:工會、平行、銳減、創始、縮寫、休會、遺漏、折中、按揭、盎司。
8.2 新BCT詞表與BCT詞表對比
二者對比結果如下:
新BCT詞表基本涵蓋了BCT詞表的詞語,充分吸收了BCT詞語的成果,同時,更多得是擴充了詞語,新增詞語量的比例達到了45.65%。
BCT詞表的獨用詞語中,主要是一些罕用詞語、過時的詞語、不常用或望文知意的詞語組合,例如:罷市、舶來品、撤股、登帳、房地產市場、股票市場、上海證券市場、基本建設、技術含量、擴大生產、零買。這些詞語并未收錄進新BCT詞表中。
我們再對比一下BCT詞表和新BCT詞表中詞語在“詞匯等級”中的分布差異,見表7。
從比例上來看,二者在“詞匯等級”中的分布,在每一級別上,具有較高的一致性,都是以綱外詞語為主。
9. 結語
本文研制的新BCT詞表,希望能為商務漢語教材編寫、商務漢語詞典編撰提供有價值的語言資源,為從事商務漢語教學的教師們提供實質性的幫助。更希望在實際的商務漢語教學中,新BCT詞表能得到進一步的檢驗,獲得修改或重構的直接建議。
[參考文獻]
安 娜,史中琦 2012 商務漢語教材選詞率及核心詞表研究[J]. 語言文字應用(2). //An Na Shi Zhongqi 2012 Word selection ratio and core wordlist for business Chinese textbooks[J]. Applied Linguistics (2).
董燕萍 2005 心理語言學與外語教學[M]. 北京:外語教學與研究出版社. //Dong Yanping 2005 Psycholinguistics and Foreign Language Teaching[M]. Beijing: Foreign Language Teaching and Research Press.
胡梓華 2011 中級商務漢語教材詞匯分析研究[D]. 暨南大學碩士學位論文. //Hu Zihua 2011 A Study on the Vocabulary of Intermediate Business Chinese Textbooks[D]. M.A. Thesis of Jinan University.
黃潔云 2009 初級商務漢語教材詞匯分析研究[D]. 暨南大學碩士學位論文. //Huang Jieyun 2009 The Research on the Vocabulary of Primary Business Chinese Textbooks[D]. M.A. Thesis of Jinan University.
季 瑾 2007 基于語料庫的商務漢語學習詞典的編寫設想[J]. 語言教學與研究(5). //Ji Jin 2007 Some thoughts on the compilation of corpus-based learners dictionaries of business Chinese[J]. Language Teaching and Linguistic Studies (5).
李柏令 2008 從商務漢語的本質看零起點商務漢語教學[J]. 商場現代化. //Li Bailing 2008 See business Chinese teaching from the essence of business Chinese[J]. Market Moderniaztion (549).
劉 華 2010 詞語計算與應用[M]. 廣州:暨南大學出版社. //Liu Hua 2010 Calculation and Application of Words[M]. Guangzhou: Jinan University Press.
劉 華,方 沁 2014 漢語教學用話題庫及話題分類影視資源庫構建[J]. 世界漢語教學(3). //Liu Hua Fang Qin 2014 On constructing a topic bank and a topic-oriented video resource library for Chinese teaching[J]. Chinese Teaching in the World (3).
蘆 薇 2009 商務漢語教材內容評估及編排探討[D]. 華東師范大學碩士學位論文. //Lu Wei 2009 Research on the Texts of the Business Chinese Teaching Materials[D]. M.A. Thesis of East China Normal University.
羅納德·斯考倫,蘇珊·王·斯考倫 2001 跨文化交際:話語分析法[M]. 施家煒(譯),北京:社會科學文獻出版社//Scollon, R. S. W. Scollon 2001 Intercultural Communication[M]. Shi Jiawei(tran.), Beijing: Social Sciences Academic Press.
孫 靜 2010 以需求分析為導向的商務漢語教材主題研究[D]. 大連理工大學碩士學位論文. //Sun Jing 2008 Business Chinese Teaching Material Study Leading by the Needs Analysis[D]. M.A. Thesis of Dalian University of Technology.
吳 丹 2012 商務漢語口語教材詞匯分析[D]. 四川外語學院碩士學位論文. //Wu Dan 2012 The Vocabulary Analysis of the Oral Business Chinese Textbook[D]. M. A. Thesis of Sichuan International Studies University.
辛 平 2007 面向商務漢語教材的商務領域詞語等級參數研究[J]. 語言文字應用(3). //Xin Ping 2007 Scalar parameters of domain: Specific vocabulary in Chinese textbooks for business purposes[J]. Applied Linguistics (3).
喻雪玲 2013 基于語料庫的商務漢語話題及話題詞表構建[D]. 暨南大學碩士學位論文. //Yu Xueling 2013 Constructing of Topics bank and Topic-specific Word List for Business Chinese on Corpus[D]. M.A. Thesis of Jinan University.
張吉紅 2012 中、高級商務漢語教材中的生詞層級探究[D]. 暨南大學碩士學位論文. //Zhang Jihong 2012 A Study on the Vocabulary in Intermediate and Advanced Business Chinese Textbooks[D]. M.A. Thesis of Jinan University.
張 黎 2006 商務漢語教學需求分析[J]. 語言教學與研究(3). //Zhang Li 2006 A need analysis in teaching business Chinese [J]. Language Teaching and Linguistic Studies (3).
中國國家漢語國際推廣領導小組辦公室 2006 商務漢語考試大綱[S]. 北京:北京大學出版社. //Office of Chinese Language Council International 2006 Business Chinese Test Syllabus[S]. Beijing: Beijing University Press.
中國國家語言文字工作委員會 2010 漢語國際教育用音節漢字詞匯等級劃分[S]. 北京:北京語言大學出版社. //State Language Work Committee 2010 The Graded Chinese Syllables, Characters and Words for the Application of Teaching Chinese to the Speakers of Other Languages[S]. Beijing: Beijing Language and Culture University Press.
周小兵,干紅梅 2008 商務漢語教材選詞考察與商務詞匯大綱編寫[J]. 世界漢語教學(1). //Zhou Xiaobing Gan Hongmei 2008 An investigation of word choice for business Chinese textbooks and the compilation of business vocabulary outlines[J]. Chinese Teaching in the World (1).
Key words:business Chinese;wordlist;grade classification
Abstract:Based on a large-scale business Chinese corpus,this article deals with the arrangement of new words in business Chinese Textbooks. In light of The List of Communicative Functions of Business Chinese,a database of the communicative functions of business Chinese is recreated,which was classified into three grades. After addressing the theoretical basis,the demand and the principle for rebuilding a new BCT wordlist,this article utilizes one which classifies the new words into four grades by using the clustering method of corpus linguistics and experts testing. A comparison is made between the new BCT wordlist,the old BCT Wordlist and The Outline of the Grade Vocabulary for HSK,focusing on their distributional features.
【責任編輯 張耀文】