

摘 要:本文從分析影響留學生漢字習得的因素入手,通過對92份有效問卷的分析,按照數學期望值大小來劃分各因素的影響力等級。在分析過程中區分了漢字文化圈與非漢字文化圈學生的不同情況,得出了不同漢字背景下,筆畫數、部件數、理據性、義項數、字頻漢字結構、構詞能力這七個因素對漢字習得影響力大小的順序。
關鍵詞:漢字因素 "留學生 "習得 "調查分析
一、影響留學生漢字習得的因素
(一)影響漢字認知的字形因素
現代漢字的字形可以分成“筆畫”“部件”和“整字”三個層次。筆畫是構成漢字字形的最小單位,是研究漢字的基礎,也是對外漢字教學的基礎。筆畫數量影響學習者對漢字的辨識,雖然有個別研究結果反映筆畫數多少不影響漢字認知,但大多數學者采用認知心理學研究方法得出量化數據驗證了少筆畫字的認知易于多筆畫字。
第二層次部件是由漢字組成的具有組配漢字功能的構字單位,它大于或等于筆畫,小于或等于整字。它對漢字學習產生的影響表現在部件頻率、部件位置和部件數三方面。韓布新(1998)發現部件頻率有易化作用,即部件頻率高的漢字識別要優于部件頻率低的漢字。而針對留學生漢字加工的實驗發現部件的位置信息影響漢字識別,左右結構字的右下角筆畫易抽取,包圍結構字的左上角筆畫易抽取;右部件比左部件作用大,下部件比上部件作用大。至于部件數量,大量實驗表明在控制筆畫數干擾的情況下,少部件字的識別加工快于多部件字。
第三層次是整字,漢字的結構模式①體現了漢字中各個部件的組合規律,而對比漢字和拼音文字的形體特征差異時發現“在漢字字形屬性筆畫、部件和結構方式三者當中,最能體現這種差異的是結構方式”(肖少北、許曉藝,1996)。大量研究表明,母語者在學習和使用漢語過程中受到“結構方式效應”的影響,即左右結構的漢字識別加工優于上下結構。對于非漢字文化圈學習者的實驗出現了不同于母語者實驗的結論,漢字的結構類型影響漢字的學習,獨體字識別優于合體字,但在合體字中,上下結構字的識別優于左右結構字。
(二)影響漢字認知的音義因素
文字是記錄語言的一套符號系統,而“文字的理據就是字理,真正實用的文字都是有理據的?!逼匆粑淖钟米帜副硎疽羲鼗蛞艄?,這些字母按照一定的規則拼合能表示所構詞的讀音,而作為表意文字代表的漢字,它的理據性就表現在漢字字形直接與語言中的音或者義發生聯系?!耙话愕卣f,理據性高的文字,學習和使用比較方便;理據性低的文字,學習和使用比較困難”(蘇培成,2001:102)。外國人感覺漢字難學的主要原因在于“把漢字當成沒有聯系、毫無意義的符號,一個一個地死記硬背”(趙妍,2006),他們不能很好地將漢字字形與字音、字義聯系起來,即見字知音或見字知義。因為現代漢字中形聲字的比例仍然很高,所以從形旁或者聲旁入手去記憶漢字,仍然是擴大字量、記憶音義的重要手段。絕大部分現代漢字是有理據的,在對外漢語漢字教學中,仍可從現代漢字的理據性入手,通過現代漢字的音、形、義之間的聯系幫助留學生發現漢字規律,提高學習效率。
(三)字頻及復現率
對于影響母語者學習漢字效果的因素,除了字形復雜性(筆畫數、部件數)和結構類型等,漢字的頻率也對漢字學習成績起一些作用。“字頻,即漢字在漢語書面材料中出現的次數,是一種客觀的統計指標,它常常被研究者用來代表漢語讀者對漢字的實際接觸頻率和熟悉程度。”(江新,2007:109)英國學者埃利斯在《語言加工中的頻率效應》中指出,語言加工的所有方面都受到語言輸入頻率的影響,即漢字認知過程中存在字頻效應——人們對高頻字的認知要比低頻字快。很多研究證明,母語者漢字學習效果受到字頻效應的影響,而針對外國人學習漢字的一些研究也發現存在字頻效應。劉麗萍(2002)認為作為衡量字形熟悉度的指標,字頻是影響漢字識別的重要因素。其通過計算非漢字背景留學生的漢字識別正確率與漢字頻率間的相關系數,發現兩者關系密切,字頻高則識別易。
另外一些研究則表明,漢字復現率②在某種程度上同樣影響著留學生的漢字學習?!皾h字在教材中出現的次數會影響留學生學習漢字的效果。因為同一個漢字接觸次數越多,學習者對該漢字的熟悉性就會提高,在心理詞典中的表征就更精確,識別記憶所需的時間就越短”(郝美玲、劉友誼,2007)。江新(2004)通過對拼音文字背景漢語初學者的拼音組詞紙筆實驗,得出最佳復現率至少為7次,且若漢字在課文及生詞表中出現的次數為24次,被試正確率高達70%??梢?,在教材中控制好漢字的重現次數有助于漢字學習。
(四)構詞能力
張凱(1997)利用計算機統計分析了《現代漢語常用字表》的3500字的構詞率(構詞個數)③,總結出“現代漢語中的大部分詞匯是由這3500字構成的。對我們能用于是漢語的人來說,掌握了這3500字,就具備了理解70000個詞的基本條件”(張凱,1997)。這說明漢語中數量有限的漢字構成了數十倍于己的詞匯,以構詞數多的字帶動詞的學習方式能減輕記憶負擔。另一方面,某字的構詞數越多,出現在印刷品及口語中的頻率就越高,那么學生對它們的學習效果就更好,所以不少學者認為初級漢語階段應該教授留學生構詞能力強的漢字。而大量針對漢字學習的實驗確實發現構詞數效應的存在。趙果(2003)采取注音組詞實驗發現字在教材中的構詞數的確影響初級歐美學生的識字量,發現構詞數多的漢字的學習效果優于構詞數少的漢字。且相比較頻率、筆畫數、部件數,“從偏相關看,漢字構詞數與漢字學習效果的關系最為密切?!保ń?、趙果,2006)
二、關于影響漢字學習因素的問卷調查
對于前人實驗或經驗總結出的影響因素,我們存在兩個疑問:第一,雖然大部分實驗結果證明這些因素對外國漢字學習者發生作用,然而,也存在一些不一致甚至相反的實驗結果。如“構詞能力”一項,馮麗萍、宋志明(2004),郝美玲、劉友誼(2007)發現構詞數效應受到詞素類別④、學習者母語背景和字頻的制約,而江新(2006)采用紙筆實驗⑤檢測不到明顯的構詞數效應。
第二,得到廣泛認可的漢字學習影響因素對學習者施予的影響力大小如何?這方面的探討較少且結論不一。楊成思認為與語言應用相關的“字頻級”“構詞頻率”“理據性”比與漢字符號本身相關的“筆畫”“部件數”“結構類型”“義項數”等影響程度大,而施莎在設計字序表時認為理據性對漢字編排最重要,其次是構詞能力,最后才是與漢字自身的筆畫、部件因素。
為了避免主觀因素干擾,本文將結合外國漢字學習者的問卷分析確定初級漢字教材漢字選取依據及權重賦分等級。本次問卷發放99份,剔除7份無效問卷,共收集92份。
(一)調查對象
目前區分國別及文化圈的漢字教材較少,所以本文中討論的影響因素的作用對象包括把漢語作為第二語言學習的所有外國人,對他們漢字水平的劃分主要依據其掌握漢字的數量?!稘h字等級大綱》規定初級階段漢字包括甲、乙級共1604個,但其對字量的確定與分級取決于相應等級的詞匯量,沒有很好體現漢字的自身規律,所以“按照漢字自身出現頻率而統計出來的漢字覆蓋率,將是確定漢字輸入量的一個重要依據”(李炎、孟繁杰,2006)。參照《中國語言生活綠皮書》《現代漢語頻率詞典》《漢字頻率統計表》《漢字等級大綱》《社會科學、自然科學綜合字頻統計表》及《漢字流通頻率表》對常用字覆蓋率的統計,本文對初級漢字水平的劃分以1000為界:掌握字量小于等于1000是初級水平,1000以上識字量不再細分中、高級,一律記作非初級水平。本次問卷調查對象橫向涉及漢字圈、非漢字圈學習者,縱向包括初、中高級漢字學習者。一方面,在廣范圍內獲取作用于初級階段外國漢字學習者的普遍影響因素,另一方面,可以從不同水平階段漢字學習者的信息反饋中總結出一些影響因素的動態變化規律。
參與此次問卷調查的有韓國延世大學30名對外經濟貿易專業留學生,除4名歸為初級水平外,其余26人皆為中高級水平;中國人民大學初級漢字書寫班的9名留學生,其中除一名來自韓國,其余都是歐美籍(將該韓國學生問卷并入延世大學問卷集),他們的識字量在50~500間,屬于初級水平⑥;愛爾蘭孔子學院的46名漢語學習者,一人識字量不確定,一人識字量3000屬于高級水平,2人識字量1500屬于中級水平,其余42人識字量在20~1000之間,屬于初級水平;意大利博洛尼亞孔子學院的15名漢語學習者,15人識字量在30~200之間,都屬于初級水平。
(二)調查內容
問卷內容大體包含三部分:第一部分為開放題,詢問學習漢字的時長與掌握字量以及對于“漢字難學”的看法,這么設計方便后續漢字水平分類工作,可以根據對方掌握字量情況將問卷分為初級、中、高級兩檔;第二部分是選擇題,對前人總結出的影響漢字學習因素的作用效果進行“是、不確定、否”的三選一判斷,每道題附有例子幫助答卷者理解題意;最后一部分是排序題,要求結合答卷者本人漢字學習經歷,從上述七個因素中選取影響因素并對它們的影響程度從高到低進行排序。
具體來說,第二部分的七個因素來源有三:一是學界普遍承認的選字依據,如“理據性”“構詞能力”“字頻”;二是研究者們通過實驗證明過的“筆畫數效應”“部件數效應”“結構效應”,雖然實驗結論尚不一致,我們先將其“筆畫數”“部件數”“漢字結構”納入了設題范圍,留待答卷人的選擇。對于“漢字結構”一項又附有追問,即對“上下”“左右”“包圍”“框架”四種結構的學習難易進行排序,這樣做一方面防止此項出現隨意作答的情況,另一方面可以探尋被調查者對四種漢字結構的難易認識是否同于實驗結果;來源三是前人研究論文中曾涉及而未得到理論和實驗證明的因素,即“義項數”。
(三)調查結果
1.漢字文化圈
從韓國漢字學習者處收集的31份問卷,統計第二部分答案發現有兩處“極值”。一處是“筆畫數”“部件數”“字頻”三項,不論處于初級還是中高級水平,學習者全都選擇“同意影響漢字學習”;另一處是“義項數”欄,除一人選擇“不確定”,其余皆選“不同意影響漢字學習”。而剩下三項的答案“不確定”遠多于“否定”。“漢字結構”項:初級水平5人,只有一人選“同意”項,3人不確定,一人選“不同意”。中高級水平學習者11.5%的人認為其不影響自己學習漢字,剩下的88.5%選擇“不確定”;“構詞能力”項:初級水平無一人選“同意”,中高級水平學習者一人贊成其影響自己漢字學習,7.7%的人選擇否定答案,88.5%選擇“不確定”;“理據性”項:初、中高級者無人同意其影響漢字學習,中高級者有38.5%的人選擇“不確定”,而61.5%否認其對自己產生影響。
針對第三部分問題,剔除4份初級水平者的答卷與1份無效問卷⑦,剩下26份中高級水平問卷。為了科學合理地得出各因素影響力大小的排序,我們在本文中引用“數學期望值”對問卷數據進行分析。離散型隨機變量的數學期望指離散型隨機變量的一切可能的取值xi與對應的概率Pi(=xi)之積的和。根據調查結果計算某個因素的真實排名,這一過程可以看成是求該因素排名的數學期望。某一個因素X(七個當中的一個)的絕對排名應該是確定的,但是不同被調查個體的直觀選擇卻是隨機的,第一到第七的七個排名都有可能被選到,我們把該因素的排名看作一個隨機變量,當樣本(參加調查的人數)足夠大時,這個排名的期望應該趨近于真實的排名。該因素的真實排名越靠前,那么它的數學期望就應該越低。作為隨機變量,一個因素的排名在調查的時候有第一到第七七種可能的取值,每種取值乘以它在樣本中出現的概率,求和后得到的就是該隨機變量的期望值。
該方法從統計的角度上講是正確的,可以用極端情況來檢驗。不妨做個假設,所有參與調查的樣本在排序的時候所做的決定都是絕對正確的,與真實排名吻合,假設因素“X”的真實排名是“x”,那么所有人在選擇時給因素“X”的排名都將是“x”,其數學期望EX=1*A%+2*B%+…+7*G%=x,即數學期望和真實排名吻合。即使實際情況沒有這么絕對,當樣本足夠大的時候,排名的期望和排名的真實值也應該是趨近和吻合的。統計計算數據如表1,表中數據Px⑧是X因素排名第N位的概率,即“排第N位時X因素的被選次數A2”與“選X的總次數B2”之比,P1是X因素排第一時的概率,P2、P3、P4、P5、P6、P7依次類推,EX指因素X的排名期望值x⑨。
根據表1,我們可以對各因素影響力進行排序:第一,字頻(1.58);第二,筆畫數(1.96);第三,部件數(2.50);第四,構詞能力(4.31);第五,漢字結構和義項數(5.46);第六,理據性(6.73)。
表1:漢字圈各因素影響力排序期望值表
因素
概率 筆畫數A 部件數B 字頻C 漢字結構D 義項數E 構詞能力F 理據性G
P1 "7/26 "3/26 16/26 " 0 " " " "0 " "0 " " " " 0
P 2 13/26 "8/26 5/26 " 0 " " " "0 " " " " "0 " " " " 0
P3 "6/26 14/26 5/26 " 0 " " " "0 " " " " 1/26 " 0
P4 " 0 " " " "1/26 "0 " " " "3/26 "4/26 "18/26 " 0
P5 " 0 " " " " 0 " " " "0 " " " "12/26 "9/26 " 5/26 " 0
P6 " 0 " " " " 0 " " " "0 " " " "7/26 10/26 " 2/26 7/26
P7 " 0 " " " " 0 " " " "0 " " " "4/26 "3/26 " "0 " " " 19/26
x(EX) 1.96 2.50 1.58 "5.46 "5.46 " 4.31 6.73
對比分析二、三部分題目的結果可以發現96.7%的人不同意“義項數”影響漢字學習,在排序題中“義項數”數學期望列第六位,兩者表現一致。但結合其在問卷上的批注發現韓國學生并不否認“義項數”影響自己認知漢字,而是認為漢字義項越多越容易導致混淆,進而造成識記負擔。而楊成思認為“如果在教授漢字的過程中,能將漢字承載的多個義項有機結合串聯起來,就可以達到學習有限的漢字而擴展多個詞的效果,對學習者有效利用所學漢字表達語言是大有幫助的”(楊成思,2009)。這與我們的問卷結果有矛盾,說明“義項數”的確對漢字學習起一定作用,但是起負作用還是正作用還有待進一步研究。
至于大多數人不確定對漢字結構類型是否影響漢字學習,原因在于“韓文字母文字也是方塊形,而且其結構也是以左右結構和上下結構為主……這些字母經過排列組合,形成方塊型拼音文字”(郭圣林,2010),這種與漢字字形相似的特點對習得漢字產生正遷移,他們不大受漢字結構類型的影響。參與問卷調查的韓國學生大多處于漢字中、高級水平,且一部分人學習了相當數量的繁體字,所以對漢字理據性有較多認識,馮麗萍針對漢字圈與非漢字圈學生的漢字語音加工的實驗結果也證明了此點,漢字圈學生能利用形、音之間的聯系,采取聲旁推理、形似推理策略,“形與音之間的聯系較固定”,而非漢字圈學生“對于字形和字音的聯系不太固定”(馮麗萍,2002),常常利用語義和語境來記憶語音。從第三部分結果可以發現影響韓國學生學習漢字的首要因素是字頻、筆畫數、部件數,理據性影響力最弱,這與前人對理據性的影響力評估也有一定偏差。
2.非漢字文化圈
本次針對非漢字文化圈的歐美籍學生的問卷調查一共61份,剔除其中三份非初級水平問卷(識字量在1000~3000),剩余58份作為統計分析對象。我們發現第二部分答卷情況與韓國的共性之處多于異性。相同點在于兩者對筆畫數、部件數、字頻歸入影響因素的肯定和對義項數的否定。超過70%的人認為筆畫數、部件數和字頻影響自己的漢字學習(筆畫74.1%; 部件82.8%;字頻79.3%),只有15.5%的人同意義項數的多寡影響漢字識記,通過訪談了解到他們所謂的影響和韓國學生的一樣,都認為漢字的義項數越多越容易引起混淆從而抑制漢字識記。不同之處則表現在對“構詞能力”和“理據性”的認可度上升,63.8%的學習者認為漢字構詞數越多越有利于自己的漢字學習,而同意將理據性納入影響因素的人數近58.6%。另外,我們發現,隨著識字量的增加,同意理據性影響漢字學習的人數越多。將漢字初級水平歐美籍學生的識字量分為4級,一級掌握字量100及其以下者,同意度⑩僅為39.4%(13/33);二級掌握字量100~200(含200)者,同意度上升到88.9%(8/9);三級掌握字量200~500(含500)者,同意度為75%(9/12);四級掌握字量500~1000(含1000)(4/4)者,同意度高達100%??傮w來看,識字量越多,越認同理據性的影響力,說明理據性的作用要在一定的識字量基礎上才會顯現。
崔永華和陳小荷(2000)曾借助漢語中介語料庫,通過統計對比非漢字圈學習者使用漢字的情況,發現“非漢字圈學習者漢字使用錯誤率,與構成漢字的部件數、筆畫數和大綱等級呈正相關11,與漢字的使用頻率12和構詞等級呈負相關13,且以上因素跟錯誤率都顯著相關?!蔽覀兊膯柧斫Y果也明顯反映出筆畫數、部件數、字頻級、構詞能力影響非漢字圈學習者學習漢字。
至于“漢字結構”,9.7%的人選擇否定選項,而近45%的人認為其影響自己學習漢字,但只有29%的人對四種漢字結構難易程度進行排序。關于“左右結構”“上下結構”“包圍結構”和“框架結構”孰難孰易,共有8種排序方式,統計發現,超過80%的人認為左右型漢字最易、框架結構最難,77.8%的人把包圍型列于第三位,55.5%的人將上下型漢字排在第二位。這能在一定程度上反映“結構方式效應”,但由于完成排序的人數基數較少(18人),且還存在例外情況,我們認為這部分的統計數據不一定具有代表性。
第三部分對于各個因素影響力大小排序,我們依舊按照數學期望值大小來劃分各因素的影響力等級。由于部分填卷者只選出影響自己學習的因素而未進行排序,所以本部分的有效問卷14共23份。
表2:非漢字圈各因素影響力排序期望值表
因素
概率 筆畫數A 部件數B 字頻C 漢字結構D 義項數E 構詞能力F 理據性G
P1 "5/21 "5/21 2/21 "1/21 "3/21 " 0 " " " "5/21
P 2 "5/21 "3/21 5/21 "3/21 "1/21 "4/21 " 0
P3 "2/21 "5/21 3/21 "1/21 "5/21 "1/21 "4/21
P4 "4/21 " 0 " " " 4/21 "3/21 "3/21 "4/21 "3/21
P5 "1/21 "2/21 1/21 "6/21 "3/21 "4/21 "4/21
P6 " 0 " " " "5/21 4/21 "5/21 "3/21 " "4/21 " 0
P7 "4/21 "1/21 3/21 "2/21 "3/21 "4/21 "5/21
x(EX) "3.33 "3.48 4.14 "4.57 "4.10 "4.71 "4.00
根據上表的統計數據,我們得到各因素影響力進行排序:第一,筆畫數(3.33);第二部件數(3.48);第三,理據性(4.00);第四,義項數(4.10);第五,字頻(4.14);第六,漢字結構(4.57);第七,構詞能力(4.71)。
注釋:
①蘇培成根據第一級部件的組合模式將合體字分為“左右結構”“上下結構”“包圍結構”和“框架結構”。
②所謂復現率,是指字或詞在教材中重復出現的次數。
③構詞率=單音+雙音/2+三音/3+四音/4+五音/5+六音/6
④構詞數影響粘著詞素的識別,對自由詞素沒有明顯作用。
⑤該實驗采用的漢字頻率表和構詞數主要以漢語學習者在學校課堂學習中使用的統一課本為基礎統計得到。
⑥參照引言中引述的“初級輸入字量”,此處“初級水平”為1000及其以內。
⑦問卷第三部分問題未作答。
⑧Px=A2/B2
⑨x=1*P1+2*P2+3*P3+4*P4+5*P5+6*P6+7*P7(保留兩位小數)。
⑩同意度=同意理據性影響漢字學習的人數/總人數。
k部件越多、筆畫越多、大綱等級越高,錯誤率越高。
l語料庫中的使用頻率和公共使用頻率。
m使用頻率越高、構詞等級越高,錯誤率越低。
n對7個因素的影響力大小進行排序的問卷。
參考文獻:
[1]韓布新.漢字識別中部件的頻率效應[J].心理科學,1998,(3).
[2]肖少北,許曉藝.結構方式在漢字識別中的作用[J].應用心理學,1996,(1).
[3]蘇培成.現代漢字學綱要[M].北京:北京大學出版社,2001.
[4]趙妍.現代漢字的理據性與對外漢字教學[J].語言文字應用,2006,(2).
[5]劉麗萍.非漢字背景留學生漢字形音識別的影響因素[J].漢字文化,2002,(3).
[6]江新.“認寫分流、多認少寫”漢字教學方法的實驗研究[J].世界漢語教學,2007,(2).
[7]郝美玲,劉友誼.留學生教材漢字復現率的實驗研究[J].語言文字應用,2007,(2).
[8]江新.漢字復現率對拼音文字背景的外國學生漢字學習的影響[A].北京地區第三屆對外漢語教學學術研討會論文選[C].北京:北京大學出版社,2004:437~445.
[9]崔永華.漢字部件和對外漢字教學[J].語言文字應用,1997,(3).
[10]張凱.漢語構詞基本字的統計分析[J].語言教學與研究,1997,(1).
[11]江新,趙果,黃慧英,柳燕梅,王又民.外國學生漢語字詞學習的影響因素——兼論《大綱》字詞的選擇與分級[J].語言教學與研究,2006,(2).
[12]馮麗萍,宋志明.詞素性質與構詞能力對留學生中文詞素識別的影響[J].云南師范大學學報(對外漢語教學與研究版),2004,(6).
[13]崔永華,陳小荷.影響非漢字圈漢語學習者漢字學習因素的分析[J].海外華文教育,2000,(1).
[14]馮麗萍.漢字認知規律研究綜述[J].世界漢語教學,1998,(3).
[15]張旺熹.從漢字部件到漢字結構——談對外漢字教學[J].世界漢語教學,1990,(2).
[16]柳燕梅.從識記因素談漢字教材的編寫原則[J].漢語學習,2002,(5).
[17]李焱,孟繁杰.初級階段對外漢語教材漢字輸入量及字目選擇[A].首屆全國教育教材語言專題學術研討會[C].廈門:廈門大學出版社,2006:113~116.
(李祿興 "北京 中國人民大學文學院 "100872)