潘 泰 曲抒浩
(武漢大學國際教育學院,中國 武漢 430070;華中師范大學國際文化交流學院,中國 武漢 430079)
在對外漢語教學中的“字本位”教學法理論[1]的代表性人物,是法國的漢學家白樂桑(Joёl Bellassen)先生。“字本位”教學法在法國經歷了實踐的考驗,取得了顯著的成績,在法國乃至歐洲的影響甚大,也得到了我們國內一些專家學者的支持,比如張朋朋(1992)、王若江(2000)等。陸儉明先生(2011)說:“白樂桑先生提出的‘字本位’漢語教學模式,是一項成功的創舉。”
漢語教學中的“字本位”,白樂桑先生(2018)稱之為“相對字本位”,將“字”作為漢語教學的出發點,包括以下要點:
第一,“字”向下關聯筆畫、偏旁,符合認知規律,更有助于了解漢字文化;
第二,“字”向上關聯詞、句,應該先選字,由字而詞,由詞而句、篇;
第三,有必要在漢語學習當中設置學習和評估的漢字“門檻”,區分主動漢字和被動漢字。
本文主要針對前面兩個問題,談一談“字本位”教學法在理論和實踐中可能面臨的困難和突破的方法。
眾所周知,漢字可以向下拆分為偏旁和筆畫,有一種直觀的看法是偏旁部首的分析能夠加速漢字的學習,讓漢字學習更具經濟性:《說文解字》(以下簡稱《說文》)有部首540多個,收字過萬;《現代漢語詞典》(第7版)(以下簡稱《現漢》)共有部首201個,收字13000多個。漢字和部首的比率如此之大,答案看似非常明顯。
可能正是基于這樣的考慮,法國基礎教育階段(小學至高中)的漢語教學大綱在制定了“漢字門檻”(共805個漢字,其中初中300個)的同時,也設置了一個“偏旁門檻”,一共列舉了105個偏旁(實際上是104個,其中初中95個)作為漢字以下組成部分的學習目標。然而漢字向下部分的利用卻并非如詞典的部首一般,還有諸多問題值得討論。
首先,我們檢查了“法綱”漢字的科學性。我們將“法綱”中這805個漢字與《漢語國際教育用音節漢字詞匯等級劃分》中一級的900個漢字進行了對照,結果發現二者重合率高達93.5%,僅有52字在前者當中而不在后者當中。說明這兩種字表都是有效的,能夠代表漢語二語學習的最初要求。
接著,我們試圖對這805個漢字逐個進行傳統的字源分析,參考的標準是《說文》系統(包括段注),因為根據“法綱”偏旁表列出來的偏旁意義,可以知道它采用的絕大部分是《說文》系統的釋義。
漢字的分析異常復雜,的確不敢保證每個漢字的拆分都是確切無疑的,但應該能夠得出一些傾向性的結論。如果只做一次切分,這805個漢字共能分解成1470個一級偏旁,其中不同的偏旁共564個,漢字與偏旁的比值為1.43。為了將這種優勢“最大化”,我們決心繼續再來一次徹底的切分,一直分到不能分的象形字(和指事字)為止。因為只經過一次切分,比如“水”作為一級偏旁一共出現了30次,它們是“法、海、漢、河、湖、活、濟、江、酒、渴、浪、滿、沒、漂、汽、清、深、水、溫、洗、消、演、油、治、洲、注”等26個沒有問題的,以及“決、況、涼、準”這4個有問題的,其中被切分出來的“去、每、可、胡、曷、青、昷、臺、兄”等偏旁當中,顯然還包含更小的、可重復利用的漢字組成部分。

然而,在做了上述的艱苦嘗試之后,我們最終還是不得不得出一個非常悲觀的結論:僅以字源作為標準,對現行漢字進行傳統意義上的偏旁部首分析,在對外漢語教學的應用環境下顯得并無太大必要,而且還是一個基本上不可能完成的任務。
1.傳統的偏旁分析難度大
表1是我們統計出的在經過了徹底的切分之后,“法綱”805個漢字中最常用的50個偏旁:

表1 傳統字源標準切分出的最常用偏旁
還是以“水”為例,它從一級偏旁30次擴展到了上表中的42次,新增加的漢字及其傳統偏旁分析如下:

表2 新增的12例偏旁“水”

看來,字源方面的探討并不一定能很好地起到辨認(recognize)和復寫(reform)現行漢字的作用,有時甚至還會產生反作用。不僅如此,字源的探索事實上是無止境的,對研究者的要求非常高,幾乎不可能全部完成。比如:
部分漢字需要掌握其傳統字形。根據我們的觀察,這805個漢字中至少有217個需要掌握其傳統字形,才能將字源的分析進行下去,比如“辦、層、導、婦、顧、環、樂、鬧、時、雖”等,必須回到簡化字之前才可能找到它們所包含的傳統形旁或聲旁。


2.尊重漢字的符號性特征
其實,最大的麻煩還不在于漢字字形分析難度這一“技術”問題,更大的問題來自于對文字這種“符號的符號”的本質特征的認識這一理論問題。

再比如“這”是怎么來的,段玉裁也老老實實地說:“凡俗語云‘者個、者般、者回’皆取別事之意,不知何時以‘迎這’之‘這’代之。”意思是告訴我們“這”本是“迎迓”中“迓”的古字,毛晃、段玉裁等人都無法說清它是何時和“者”產生了語音上的偶然聯系,進而記錄了“者個、者般、者回”等口語詞匯,最終定格為“這個、這般、這回”。
說到底,關于漢字問題的核心關鍵就是,到底書寫符號是約定俗成的,還是有語言世界和客觀世界支持的,到底承認還是不承認語言符號的任意性這個結構主義的第一原則。大量的常用漢字根本無法從字形分析中得出其音、義(語素),比如“盡、的、亞、頭、舊、買、農、義、呆、關、以、由、于、總”等,例子不少。這是個不得不承認的現實問題。文字符號能指和語言世界、客觀世界所指之間的差距在漢語中,和在其他語言中一樣,早就已經大到了無法承受的程度了。
不僅我們現代人應該有這樣的認識,從中國傳統小學的發展歷程來看,許慎之后專注于音、義的學者也遠遠要多于關注字形的。比如“體例精密,考證賅洽,誠字學之源藪,藝苑之津梁”(王引之語)的《康熙字典》對字形的分析就比較少,引用的范圍也多是音義分析。退一步說,就算是在許慎的那個時代,甚至比他還早一些,事實上也存在著另外一種專注音義的傳統。比如張滌華先生(1962)就認為在《說文》之外,還有以義為核心(以《爾雅》為代表)和以音為核心(從《倉頡篇》到《切韻》等),只求音義,不求字形的字書傳統。再退一步說,起碼我們現在出版的通用字詞典已經絕少分析字形的了,這總是可以肯定的。
總而言之,漢字與漢語之間關系的疏離是一種趨勢,這種趨勢使得通過漢字字形直接推求最小的語言單位——作為音義結合體的語素——這種嘗試面臨著來自理論和實際操作的雙重困境,尤其是在漢語教學的環境當中。
那么,在我們的漢語學習當中,是否就可以不考慮漢字的下級單位,放棄部件對漢字學習的益處呢?答案當然也是否定的。一個直觀的理由就是上面的統計數據告訴我們,漢字以下的確包含可重復利用的更小部件;現在的問題關鍵是這些部件到底有哪些,到底該如何加以利用。
1.以簡化字為對象,加強對漢字及其部件的研究
到目前為止,關于現行漢字部件拆分的最重要的文獻應該是1997年頒布的《信息處理用GB13000.1字符集漢字部件規范》和2009年頒布的《現代常用字部件及部件名稱規范》。我們用這兩個規范對“法綱”805個漢字再次進行了部件切分,結果是用前者的標準可以切分出381個不同的部件,用后者的標準可以切分出324個不同部件,和上文用傳統字源方法切分出335個不同偏旁在數量上差別不大,但是在具體內容上差別明顯:

表3 “信息處理用規范”切分出的最常用部件

表4 “常用字規范”切分出的最常用部件


還有更多的問題,我們這里也無法展開討論。只能先說明以簡化字為對象,深入開展漢字及其構成部件研究的重要性。
2.以普通話為范圍,重新探索漢字的音義規律


我們不必拘泥于傳統說法,而應該以漢語教學為直接目的,重新分析漢字的部件及其與整字的互動關系,這樣做不僅沒問題,而且很有必要,甚至是非此不可。在“算、好、章”等傳統字形和現行字形較為一致的漢字之外,還有一些現在通行的漢字很難找到或者根本就找不到歷史根源,不重新分析還能怎么辦?比如把“咱”分析成會意兼形聲字,意思就是“口語中的自己”,其中“自”還能提示整字的讀音;“雜”原來是形聲字(雜),現在我們就說這個字表示“九種木頭混合在一起,這就是雜亂”;“窮”由“穴”和“力”組成,在洞穴里努力工作,自然就是貧窮、不順利的意思,不必一定要分析成“穴”和“躬”;“獲”本來是以“犭”為義符,“蒦”為聲符,“蒦”又和用手(又)抓住鳥(萑huán,鴟屬,據《說文》)有關,到了如今,我們就不妨說“獲”由“艸、犭、犬”這三個義符組成,意思是帶著狗(犬)在草里(艸)抓住了動物(犭)。
對于包含語音信息的漢字,同樣應該不計古音韻,只以普通話為標準分析字音。比如“且”這個部件,在現行漢字中大致可以分為四種情況(這里沒有辦法,對805門檻有點兒突破),分別是“且、姐、疊、趄”這一組,“組、租、阻、祖、粗、助、詛、俎”這一組,“蛆、咀(jǔ)、狙、疽”這一組和“縣、懸”這一組(未考慮不太常用的字)。前三組中“且”都是音符,沒有做義符的;在第四組中“縣”的本字是“首”倒過來,是義符。那么從教學的角度出發,我們可以得到如下提示:
第一,“且”的本義(“薦席”)可以不予介紹,不如說“且”主要表音,比如第一至第三組的漢字。
第二,“且”在表音時有ie、u、ü這三種可能,至于這三組之間的讀音音轉關系,在以漢語為二語的教學環境下完全可以不予考慮。
第三,“且”表義時和“首”(這個字會用在“首都”這個常用詞里)有關,是倒過來的腦袋,所以第四組和前三組讀音不同。“縣”和“懸”本是一個字,“懸”是會意兼形聲的。
最后,再舉一個例子來說明我們的困窘和做出改變的緊迫性:試想如果一個漢語教師在面對英語學生時說不清“英”是怎么回事,在面對法國學生時說不清“法”是怎樣的構成,我們到底該怎么辦?
上面我們討論的是漢字及其下級單位,現在讓我們換個方向,看看漢字作為語素(音義結合體)向上聯系詞的情況。
同樣,先觀察數量的問題。
首先,我們將“法綱”的805個漢字和新HSK六級考試的詞匯表進行了碰撞,看看這805個漢字能構成多少個詞,“詞字比”有多高。
利用計算機,我們拿這805個漢字和新HSK六級考試5000詞匯中的單音節詞進行匹配,共得到了334個單音節詞;然后再讓這805個漢字任意互相搭配組成“雙音節詞”,共得到805×805= 648025個可能存在的詞(包括AA式的詞),接著再把這些可能存在的詞和5000個真實的詞進行匹配,總共得到了1708個合法的、實際存在的詞;最后,我們人工比對了三音節和四音節的詞語,總共找到111個三音節或四音節的詞語是完全由這805個漢字組成的。這樣,我們就說這805個漢字的“詞字比”是(334+1708+111)∶805=2.67,這意味著“法綱”的805個漢字中每一個平均都能組成2.67個新HSK六級詞。我們的統計方法和王若江(2000)有所不同,我們得到“法綱”基礎漢字的“詞字比”并沒有那么“嚴峻”地高(3.97)。
與此同時,我們很容易得到HSK詞匯的詞字比,情況如表5、表6所示:

表5 新HSK的詞字比

表6 老HSK的詞字比
觀察上面的兩個表格,我們可以發現,在新HSK中,當詞匯量低于1000時,詞字比甚至都達不到1,也就是1個漢字還不能組成1個詞,這說明新HSK中有很多漢字暫時只用在少量詞語里面,成為詞語的一部分。
當詞匯量擴大到5000左右時,不論是老HSK還是新HSK,詞字比大約都在2左右;而且從趨勢看,詞量越大,詞字比就越大。當老HSK的詞匯量達到8000左右時,詞字比會達到或超過“法綱”的2.67。
這種現象可以從兩個方面來看,其一可以說,詞匯量和詞字比是正相關關系,也就是你學習的詞匯越多,你認識的漢字也就越多,這叫先詞后字的“詞本位”;第二,也可以說漢字的選擇的確會影響詞的學習,起碼在碰到新詞的時候能夠認出其中的漢字,這是先字后詞的“字本位”。
那么,問題就來了。
第一,先詞后字和先字后詞兩種思路究竟孰優孰劣?僅從簡單直觀的角度來看,前者在學習書面語的起始時期可能要困難一些,要同時面對大量無法和音、義直接建立起聯系的漢字;后者可能開始時容易一些,核心的漢字不斷重復出現,能加強書面漢字的視覺記憶效果。我們認為,這兩種方案可以根據教學對象的不同來進行選擇。HSK,特別是老HSK主要是針對來華留學生的,他們學習期限比較長,學習動機更為強烈,口語環境更好,優先發展口語既是可能的,也是在華學習生活必需的,也許更適合采取“詞本位”的方案;“法綱”針對的是在法國的漢語學習者,他們學習時間有限,口語練習機會少,漢語和其他外語語種存在競爭關系,迫切需要入手快的教學方式,也許就更需要采取第二種方法。這也許是“字本位”的思路在法國能夠成功的原因之一。
其次,統計數據還迫使我們必須追問:構詞能力強是不是就一定有助于漢字的記憶?詞字比高的漢字是不是一定就更常用?“詞字比”到底意味著什么?
構詞能力和漢字記憶的問題,有人(江新,2006)用心理學實驗的方法做過研究,結果發現構詞能力的強弱和該漢字的記憶效果之間沒有明顯關聯。第二個問題同樣也并非不證自明,舉個例子:“媽”和“奶”分別有3個和5個義項,用“媽”構詞很有限,以其開頭和結尾的只有2+5個詞(據《現漢》和李菁民,2011。下同),“媽”的構詞力是7∶3=2.3;而“奶”的構詞能力顯著強大,以其開頭和結尾的詞有24+11個,“奶”的構詞力是35∶5=7。這是不是就能說明“奶”比“媽”更常用?那以后我們的漢語教材一開始就不應該設計孩子和媽媽的對話,而是應該設計孫子、孫女和奶奶的對話了,這有道理嗎?
再比如“快”和“慢”,它們都在“法綱”805漢字的范圍內,在老HSK里都是甲級詞匯用字,在新HSK里都是2級詞匯用字。“快”有9個義項,能組44+21個詞;“慢”只有5個義項(包括同音詞),能組25+10個詞。從義項和詞匯的比率來看,我們可以說有9個“快”,總共能組65個詞;有5個“慢”,總共能組35個詞,二者的構詞能力不相上下。但是,語感強烈地提示我們“快”比“慢”更常用,這是為什么?我們也找到了白樂桑先生(2018)引用的笪駿《現代漢語單字頻率列表》,用以驗證我們的語言感覺,結果和我們的想法一樣,它們的頻率排位差距明顯:“媽”在750位,“奶”在1278位;“快”在366位,“慢”在822位。這說明漢字的構詞能力強弱,和其常用度不一定是有正相關的關系的。構詞能力反映的是漢字的語言或語法能力,而不一定是使用頻率。
最后,“詞字比”究竟意味著什么?先學常用漢字就一定有助于漢語能力的提高嗎?這看起來是個愚蠢的問題,但我們卻同樣有話要說。還是以“快”和“慢”為例,它們倆在現代漢語中的基本義是相對的,都是關于運動速度的,學習起來難度相當;當本義學完了,字形與基礎音義之間的聯系建立起來了,漢字的學習就結束了。但是,對這兩個詞的學習就結束了嗎?學生的語言能力就得到提高了嗎?答案顯然都是否定的。除了基礎義之外,“快”這個漢字還是“愉悅”“敏捷”“鋒利”等語素或詞的書面符號形式,而對這些語素或詞進行學習的復雜程度遠遠超過了“慢”;“快”還有“快看”“快送醫院”“快放假了”“快四十年了”這些用法,都不能換成“慢”,和“快”有關的語言能力的提高和言語技能的發展都還有很長的路要走。
所以,詞字比高,充其量只是意味著某個漢字所記錄的語素更多,這個漢字的語言學知識更為豐富。更進一步說就是,必須認識到,漢字能力當然與漢語能力有聯系,但漢字和漢語本就不應該劃等號,二者有顯著不同的側重點。沒有必要將“字本位”和“詞本位”對立起來:“字本位”教學法著重先解決的應該是在漢字與其基礎音義之間建立起聯系,這種基礎性的關系一旦得以建立,如何提高漢字與其音義聯系的質量,就必須交給“詞本位”的漢語教學來推進。這是我們設想的漢語學習的兩個步驟,其中的后者,即提高漢字與其音義聯系質量的任務,則可能是伴隨漢語習得全時段的艱辛過程,不僅對二語學習者,對母語學習者而言也是如此。
事實上,我們不僅不能反對“字本位”,還應該大力倡導“字本位”,深入研究“字本位”,努力發展“字本位”的理論和方法。這樣選擇的原因是漢語教學的實踐告訴我們,對于來華留學生而言,最大的困難就是漢字,不會讀、不會寫常常比不會聽、不會說要嚴重得多;對于海外漢語學習者、特別是孔子學院的學習者而言,受語言環境和學習要素的限制,聽說應該、也不得不和讀寫分開,“語”“文”分步走。這就是我們認識到的最大的現實。所以,不管怎樣強調漢字的重要性都是必要的,漢字的確應該成為初中級階段漢語學習的核心,要突出漢字學習的極端重要性。只不過同時我們也認為,現行慣常的漢字學習方法還有很多的具體的做法需要改進,關于字詞關系的語言理論問題需要重新認識,部分地方要推陳出新,直至完全革新。
和印歐語的書面字符相比,漢字最大的難點在于字形與語素(音、義)之間的聯系是不直接的,無法做到聽音寫字、見字讀音;但是,漢字也有自己的優勢,我們應該在教學當中揚長避短,把漢字的優勢充分發揮出來,實現“漢字利益”的最大化。
白樂桑先生(2018)曾用198個“最高頻字”(根據筆者的統計,事實上只用了189個不同的漢字)編寫了一篇共652字的“滾雪球”短文,我們以此為例,從漢語教學的角度,簡要分析一下漢語中字與詞的關系。
從字來看詞,字無詞不成語素,字需要詞。不結合詞、句,漢字就無法與語素建立聯系,更無法提升這種聯系的質量,不能形成實際的語言能力。
第一,一字多義需要詞來進行明確。有很多漢字都是一字多義、一字多用、一字多音的,學完了漢字的基礎形、音、義,并不意味著就掌握了語言點,提高了語言能力。比如“好”在這篇短文里一共出現了6次,分別是“你好”“好久”“身體好嗎”“不好意思”“好聽”和“不知怎么好”,結合《現漢》,我們知道這6個“好”都是不同的義項,學會了“好”這個漢字,并不足以把這6個“好”都弄清楚。類似的例子還有很多,比如“講課……講得很有水平”和“講成語”“講知心話”“講信用”等中的“講”,“天天在想你”和“一……就想起你”“想跟你在一起”等中的“想”,“講得很有水平”和“高興得不知怎么好”“我得了學位”等中的“得”。
第二,字詞界限不清的語言片段(這是漢語書面語理解的一個難點)需要詞、句予以確認。在這篇短文里至少有3例這種情況,“有點兒心疼你”和“有點兒黑龍江口音”中的“有點兒”不同,前者是一個副詞,后者是“動+數+量”;“最近”用在“你最近怎么樣”和“在大城市中,天津離北京最近”(這一句不是白文中的)不同;“以前”用在“三年以前”和“18歲以前不準喝酒”(這一句不是白文中的)也略有不同。
第三,成語、習語、隱喻距離較大等“1+1≠2”(整體不等于部分的簡單相加)的情況,都不能只學習漢字,不考慮詞、句。比如“不好意思”“三心二意”“(不知)怎的”“動人”“心疼”“意中人”等,都是這種情況,每個漢字都認識也不一定能夠準確地知道這些詞語的意思。
從詞來看字,沒有字就沒有豐富多彩的詞,詞需要字。比如和印歐語相比,漢語有一個重大的特點就是“未登錄詞”特別多,漢字形成或組成詞語的能力比印歐語顯著強很多;所以對于新生事物,我們常常不需要創造新字,而是利用已有的字形成新的組合,這也是漢字效率高超、永葆生命力的核心秘密之一。
比如在白文中有“門口、民歌、難忘、問題、唱片、錢包、藥房、機場”等詞,如果僅將這些詞翻譯成“doorway、ballad、unforgettable、question、record、wallet、pharmacy、airport”等外語單詞,而不向下學習漢字,不弄清楚“口、歌、難、題、片、包、房、場”等漢字的意思,我們馬上就會在教學中面對“街口、村口、名歌、爛歌、難辦、難做、真題、坑題、港片、淚片、菜包、卡包、水房、馬場、谷場”這些在《現漢》里都查不到的詞語,它們給漢語學習者們造成的障礙非常明顯,解決之途當然在于漢字及其基礎語義。
當然,我們在這里所說的都只是問題的“冰山一角”,還需要對字與詞的互動關系進行更為深入的研究。事實上,不論是漢語母語者還是非母語者,只有充分認識到字與詞互相促進、互相影響,平衡好二者之間的關系,才有可能成為水平高超的語言使用者。
綜上,我們認為,“字本位”教學法的出發點是好的,是很值得尊重和提倡的,但是正如每種理論都必須不斷發展,才會擁有生命力一樣,我們需要在“字本位”的旗幟下再多做一些切實的工作,提升相關理論水平,完善教學操作模式,為切實提高漢語教學效果而不斷努力。
注釋:
[1] 關于“字本位”這一術語,我們采用了陸儉明先生(2011)的觀點,“學術界目前實際存在著兩種不同性質的‘字本位’之說:一是指徐通鏘先生1991年起所提出的‘字本位’之說(徐通鏘,1991,1994,1997,2004,2008),一是指白樂桑先生1989年在他與張朋朋合寫的法文本漢語教材里所提出的‘字本位’之說(Bellassen & Zhang,1989)。二者其實只是術語相同,實質有別。”本文主要的討論對象是后者。
[2] 《說文解字注》第198頁:“算,數也,從竹具。”第104頁:“具,共置也,從廾貝省。古以貝為貨。”審稿專家指出“具”當從“鼎”,并非從“貝”,在金文才發生訛變。此亦可見字源分析之難。