蔡淑華
在對外漢語教學中,漢語寫作課是一門重要的語言技能訓練課,教材在這門活動課中有著教學憑借的作用。《發展漢語》作為對外漢語教材中最具代表性的教學憑借之一,其難易度在一定的程度上影響著漢語作為第二語言習得者的學習效果,其中的范文只有難易適當、長短適中,才能真正發揮它的示范和可模仿性作用。中級寫作是初高級過渡的橋梁,中級寫作教材中范文選編的恰當與否直接影響到初級水平的學習者能否成功地實現向高級水平學習的過渡。可見,對《發展漢語·中級寫作》范文難易度進行分析至關重要。
易讀性是指書面材料易于閱讀和理解的程度。文本易讀性的研究成果主要體現在易讀性公式上,大多數學者采用Fry的“閱讀難度評估指示圖”,眾多公式中,多數把詞匯難度和句法難度兩方面作為公式的重點。盧偉提出漢字、詞匯、語法結構、語篇等幾個語言變量是影響對外漢語教材語料的難易程度的主要因素。張寧志參照Fry公式的研究方法,將對外漢語的句長、非常用詞進行量化,指出每百字句子數是區分中高級教材的重要標準。
本文采用Fry公式的研究方法,從字頻統計分析,生詞量、詞頻統計分析,平均句長統計分析,篇長統計分析這五個方面對《發展漢語·中級寫作》中范文的難易度進行定量分析,以明確范文在漢字層面、詞匯層面、句子和語法層面、語篇層面所體現的易讀性問題。
字頻統計分析
字頻指一個字的常用度,是測量漢字難度的一個重要指標。字頻能反映漢字的難度,進而間接反映出文本的難度。《國際漢語教學通用課程大綱》是編寫教材、進行教學工作的主要依據,它將常用的漢字分為六個級別,統計文本中六個級別的字頻是反映文本漢字層面難度的方法之一。漢字字頻與教材難度的關系是:高字頻的漢字越多,教材難度越小;反之,教材難度越大。
字頻統計采用傳統的全文統計法,以《國際漢語教學通用課程大綱》為依據,統計每篇范文中所含漢字的等級,平均每百字三級、四級、五級、六級、超綱字數即范文中各級字數除以篇長乘以100所得。表1是對《發展漢語·中級寫作》上下冊各15課語料包含字頻的具體統計結果。
從統計結果來看,上下兩冊范文難字編排上有共同之處。橫向上都以三級字的數量為主,四級字數量為輔,其他次之,具體的難字數量差距為:三級>四級>五級>六級>超綱。縱向上,下冊比上冊在難字數量上有所提高。以1000字的范文為例,下冊的三級、四級、五級、六級、超綱字分別比上冊多約18.7個、36個、10.8個、2.4個和0.4個,明顯提高的是三級和四級難字的數量。
對比各冊內部每篇范文的漢字難度差異和增減趨勢,可以看出兩冊前后范文平均每百字三到六級,超綱字合計值的差距波動都很大。上冊中合計值呈現為兩個“W”相連接的走向,出現了3個波峰和3個波谷,波動頻率高,難易相間的編排交替次數多,波動的差距很大為23.1個漢字,第6課的漢字難度是最簡單的只有15.93個,最難的是第12課有39.03個。下冊中合計值是一個狀似“M”的趨勢,出現了1個波谷和2個波峰,也是難易相間的編排,波動的差距也很大,有20.99個漢字,但相對于上冊要穩定,波動的頻率較低次數也較少,漢字難度最簡單的是第16課,最難的是第18課。
生詞量、詞頻統計分析
范文在詞匯層面的易讀性問題,主要是通過對生詞量、詞頻的統計分析而體現出來的,下面將從這兩個方面進行分析。
生詞量統計分析
生詞量是確定語料難度的一個重要指標。教材中的生詞量越多,教材難度越大;反之,教材難度越小。生詞量指范文后標注的生詞,對其進行手工統計,包括各課的生詞量、每冊的總生詞量和均值,具體統計數據如下(表2)。
表2中的數據橫向來說上冊課文間生詞量相對穩定,但變動較大,第2課最簡單只有4個生詞,第13課最難有10個生詞;下冊課文間生詞量的浮動較上冊相對平穩在6~9個詞之間,生詞數量基本都維持在生詞量均值附近,第24課最簡單只有6個生詞。縱向對比,下冊的總生詞量和生詞量均值較上冊都有所增長,下冊的總生詞量比上冊多14個,相當于增加了近兩課的生詞量均值,在生詞量均值上,下冊比上冊多出近一個生詞。這表明,下冊生詞量的選編較上冊更加成熟,上下兩冊生詞總量的安排是合理的,符合學習者由簡到難、循序漸進的習得規律。
詞頻統計分析
在一定數量的真實語料中詞匯重復的次數叫作詞頻。詞頻不同,學習者對詞匯的熟悉程度也不同。詞頻是評價詞匯客觀難度的一個重要指標。《漢語水平詞匯與漢字等級大綱》是對教材和漢語測試的重要依據,將詞匯分為四個等級,統計文本中四個級別詞匯的出現頻率,可以間接地反映文本詞匯方面的難度。詞語的詞頻越高,范文的難度越小,反之亦然。
詞頻統計采用傳統的全文統計方法,以《漢語水平詞匯與漢字等級大綱》為依據,結合語料庫在線對范文進行分詞,并手動調整分詞誤差,然后將分好的詞語放入自制程序,統計出所有詞匯對應的等級,平均每百字丙級、丁級、超綱詞數即范文中各級詞數除以篇長乘以100所得。表3是對《發展漢語·中級寫作》上下冊各15課語料包含的詞頻的統計,具體統計結果如下:
從平均每百字丙級、丁級、超綱詞和均值來看,上下冊詞匯難度的差異很小,丙級和丁級詞都有所增加,超綱詞相對減少,詞匯難度控制上具有很大的一致性。在篇長為1000字的文本中,下冊比上冊僅多出0.9個丙級詞,6.8個丁級詞,少4.2個超綱詞。丁級詞、超綱詞所占比例是衡量中級漢語教材詞匯難度層面的重要變量。在平均每百字丙級、丁級、超綱詞中,上下冊所占的比例均值分別為10.55和10.82。從這點看,上下冊差距不明顯,難度相當。從每冊教材內部各主課文間詞匯難度差異和增減趨勢來看,上下冊丁級詞、超綱詞都呈現波浪式難易相間的編排特點,從整體來看都是先難后易漸漸趨于平穩。上冊中最難的是第3課,丁級超綱詞高達15.37個,最簡單的是第8課只有7個;下冊中第17課最難,第28課最簡單。
統計的結果表明:教材中丙級詞匯明顯不足,超綱詞匯過多。上下兩冊各課中平均每百字丙級詞匯平均所占都不足2個,而超綱詞匯卻都高達9個。丙級詞是中級階段教學的重點,在教材的安排中顯然比重不足,而超綱詞的比重卻很大,這對于具備初級漢語水平的學習者來說,不利于其學習水平及能力的提升,且可能會起到相反的厭倦逃避作用。
平均句長統計分析
句子長度是決定課文難度的重要因素。張寧志認為,通過測量平均句長可以有效地將對外漢語教材進行入門、初級和中高級三級的區分。平均句長統計以“。”“?”“!”“;”“……”符號切分出句子,手動統計出句子數,平均句長等于篇長除以句子數,包括每課的平均句長和上下各冊的平均句長,具體統計如下(表4)。
通過考察表中的數據我們發現,上冊中各課的平均句長浮動范圍在19.52~36.15之間,總范文的均值為27.43;下冊中各課的平均句長浮動范圍在22.59~50.92之間,總范文的均值為33.18,兩冊中各課的平均句長超過總范文均值的課數均為8課。張寧志認為通過測量平均句長可以有效地將教材分為初、中、高三個等級。《發展漢語·中級寫作》上下冊每百字平均句數都不到6句,屬于中高級教材。在各課的平均句長和總范文均值兩項統計中,下冊都高出上冊,這說明范文的難度在有階段、有計劃地循循上升。但平均句長差距過大,上冊的平均句長差距為16個漢字,下冊平均句長差距為28個漢字;兩冊之間平均句長的差距高達12個漢字之多。
篇長統計分析
Stern、盧偉和郭望皓都認為篇長是控制教材難度語篇層面的一個變量。篇長是測定教材語料難度的重要變量之一,二者的關系是:篇長和教材難度成正相關關系。通過把范文導入教學軟件進行篇長字數統計,包括各范文的篇長和每冊的平均篇長,輔以手工糾正其失誤處,具體統計數據如下(表5)。
篇長統計數據顯示,上下冊的范文都屬于中長語料,上冊中范文的中長語料占比為2∶3,篇長在327~620之間,范文的均值為486.13;下冊中范文都是長語料,篇長在525~750之間,范文的均值為638.8。各冊范文間篇長的整體趨勢都是穩步增長的,超過范文均值的數目也比較接近,下冊只比上冊多一課。對比各課的篇長、總范文的均值和超過均值科目數,下冊都高于上冊,表明范文篇長的編排合乎教學難度有階段、有計劃循循上升的原則。但各冊課文之間的篇長差距較大,上冊差距高達293個漢字,下冊有所減緩,相差225個漢字。適當的篇長利于學生的習得和記憶,過猶則不及。
根據《發展漢語·中級寫作》范文難易度影響因素各方面統計分析所發現的問題,在此我們提出以下三個建議,以供對外漢語寫作教材范文選編的編寫者參考。
從詞句跨度的角度,我們認為應該縮小差距,適當平衡范文間各級漢字、丙級詞、超綱詞、平均句長和篇長。從二語習得的規律來說,同一水平的范文之間,各級漢字、丙級詞、超綱詞、平均句長和篇長的差距過大,會讓學習者感覺突兀,增加認知和習得的難度,嚴重者會產生厭煩和逃避心理,這些都不符合教材編寫的由簡到難、循序漸進的原則,不利于學習者寫作能力的提升。
從重點詞語教學的角度來看,應該有階段有步驟地增加丙級詞的習得。丙級詞是中級漢語詞匯教學活動的中心,趙新曾談到中級教材(中級精讀教材)中丙級詞至少應占 70%~80%,高級詞(丁級詞和超綱詞)應該維持在 20%~30%。這一數據具有一定的借鑒作用,按照這個標準,教材中丙級詞的數量是遠遠不夠的,這對于具備初級水平的學習者來說,很難起到中級漢語水平的提升作用,更難以實現中級作為初高級跨越之間橋梁的目標。
從超綱詞處理的角度來說,需要加強對超綱詞的控制和處理。范文的超綱詞主要有三個來源:專有名詞中人名、地名、物名;成語和俗語;語素加上詞構成的超綱詞。對于專有名詞中人名、地名、物名,普遍的方法是在選編時,為了降低學生的理解難度,對其進行提示標注;另一種方法是根據其常用程度,加強關注,也可以考慮是否應該選編入教學大綱。成語和俗語是中華民族文化凝聚的精華,都有其獨特的內涵,應該結合語境進行恰當處理。語素加上詞構成的超綱詞,提示學生對詞進行標注識別,并隨著詞匯量的擴展逐漸形成辨識推測能力,幫助其進行語料的理解。