○ 趙鳳嬌
(北京語言大學 漢語國際教育研究院,北京 100083)
分級閱讀指根據不同年齡層的生理、心理和認知能力的發展情況,對閱讀材料進行分級,為不同年齡段的閱讀主體提供適合的閱讀材料。美國分級閱讀研究最早,也相當成熟,應用范圍較廣的閱讀分級方法有藍思分級法、A-Z分級法等。藍思分級法是針對兒童語言能力發展設計的。較之其他分級方法,該方法更注重對文本中的語言要素的測量,操作步驟為首先對文本中的詞頻、詞長以及句長等要素進行量化統計,然后將量化數值帶入公式計算出藍思值,再與難度等級對應,就能得知讀物的藍思等級。漢語與英語不同,張博教授在“面向可讀性測評的漢語文本語言特征分析”項目論證中指出:“英語的詞長富有彈性,詞長類型多樣,短則一兩個音節,長則近二十個音節,而漢語的詞長較短且類型有限,單音節詞和雙音節詞占絕對優勢,詞長對詞義的可理解性及文本可讀性的影響不可能像英語那樣明顯。”因此, 漢語分級閱讀研究不可照搬國外分級閱讀的評測因素。
目前,漢語分級閱讀研究集中在南方分級閱讀中心以及接力兒童分級閱讀研究中心,它們分別提出分級閱讀的標準以及參考書目[1]。就目前研究而言,分級標準并未形成完整的科學的體系,沒有國家統一的標準,現有的閱讀分級標準側重于經驗,從兒童個體出發,把兒童讀者的年齡、學習階段和身心發展作為分級的標準[2],而語言要素作為影響文本理解的重要因素,在分級讀物研究中很少提及。文本在語言要素上所呈現出來的復雜程度一般被稱為可讀性(Readability)。
以往漢語可讀性的研究集中在漢語二語分級閱讀研究中,影響因素可以歸納為漢字、詞匯和句法三大語言要素。與拼音文字相比,漢字是表意文字,具有鮮明的特點;句法層面的結論也比較單一,句長對可讀性具有顯著的預測作用。相較于漢字和句法,詞匯層面因素較為復雜,考察維度不盡相同,結論也不一致。如有的研究著重于詞匯多樣和詞頻維度[3],有的研究僅關注詞頻維度[4]等;在結論上,有的學者認為虛詞數、虛實比是重要的詞匯影響因素[5],有的則指出詞次比在詞匯層面起決定性作用[3]。臺灣學者曾對臺灣中小學語文教材中的文本難度進行分析,發現難詞數、實詞頻率對數的平均值、人稱代名詞數等因素影響文本可讀性。[6][7][8]那么影響漢語文本可讀性的詞匯因素有哪些?哪些因素起主要作用?還需要進一步深入研究。鑒于此,本文從詞匯多樣性、詞頻、詞匯密度和詞長等四個維度考察可能影響文本難度分級的主要詞匯因素,以及這些因素的有效性。
張博教授在項目論證中提出:“由于要在比較不同難度漢語文本語言特征的基礎上分析提煉影響可讀性的主要參數及其權重,因此,選取難度梯級分明的系列漢語文本至關重要。”溫儒敏指出“部編本”語文教材是由教育部出面聘請主編和編寫專家,調集了全國最強的編寫隊伍,有條件在總體質量和水平上超越現有各種版本的教材。[9]因此,我們選取部編版二年級、七年級和十二年級①《語文》中的課文②建立了低難度、中難度和高難度三個難度等級的文本庫,如表1所示。

表1 部編人教版不同難度等級課文數量、總字數、平均課文長度分布
本文使用NLPIR-ICTCLAS漢語分詞系統對文本進行詞語切分。之后對切詞結果進行逐一校對和處理。校對工作以《現代漢語詞典》(第7版)為主,以百度百科搜索引擎(https://baike.baidu.com/)為輔。
與漢語不同,英文文本是由一個個單詞“word”所構成的,而漢語中的字和詞是不同的概念,二者并不等同。漢語文本長度多采用字來統計,因此本文按照字數來劃分文本長度,每個劃分的文本稱作一個文本塊。為了避免文本大小對統計結果的影響,我們分別以500字和1000字的長度來劃分③。
詞匯多樣性由樣本中的不同詞的數量來表示,在英語中一般通過比較不同單詞的數量與總單詞數來衡量,即類符-形符比(Type-Token Ratio,簡稱TTR)。[10]8TTR是樣本大小的函數,受文本長度的影響,如較大樣本的TTR值比較低,較小樣本的TTR值比較高,因此TTR公式的信度飽受質疑。Johnson提出了改善TTR的方法,即平均節段類符-形符比(Mean Segmental TTR,簡稱MSTTR)。[11]該方法通過將樣本分成給定長度的連續段來控制文本長度,然后計算所有段的平均節段類符-形符比來得到TTR。Torruella & Capsada基于不同類型的文本考察了七種測量詞匯多樣性的公式對文本長度的依賴性,研究發現MSTTR對文本長度的依賴不顯著。[12]故本文選用MSTTR的測量方法,將文本先按500字數分成大致相等的文本塊,根據每個文本塊計算TTR,最后統計TTR的平均值獲得MSTTR。本文擬采用詞數、詞種數和MSTTR值來衡量詞匯的多樣性。如表2所示。

表2 不同難度等級文本的詞匯多樣性的統計結果
由表2可以看出,詞數隨難度等級的升高而減少;詞種數也基本隨難度等級的升高而增加,不過高難度文本的詞種數略微下降。MSTTR隨文本難度等級的升高而增加。
通過使用SPSS21.0計算詞數、詞種數以及MSTTR與文本難度等級的Spearman相關系數,結果如表3所示。

表3 不同難度等級文本的詞匯多樣性與文本難度等級的Spearman相關系數
注:*代表Spearman相關系數的顯著程度,*越多,相關性越顯著,下文同。
統計結果表明,詞數、詞種數和MSTTR與文本難度均呈顯著相關,詞數與文本難度等級呈顯著負相關,詞種數呈顯著正相關,MSTTR呈顯著正相關,相關性由高到低為:MSTTR(0.487)>詞種數(0.376)>詞數(|-0.351|)。
通過獨立樣本T檢驗來驗證這三個因素對不同難度文本的預測效用,我們發現,在詞數、詞種數和MSTTR因素上,低難度與中難度、高難度文本均存在顯著差異(p<
0.05);而中難度和高難度文本均不存在顯著差異(p>0.05)。也就是說,詞數、詞種數和MSTTR能顯著區分低難度與中、高難度文本,但并不能顯著區分中難度和高難度文本。
綜上,通過Spearman相關系數和獨立樣本T檢驗我們發現,詞數、詞種數、MSTTR與文本難度等級呈顯著相關,詞數隨文本難度等級的升高而減少,詞種數和MSTTR隨文本難度等級的升高而升高,三個因素均能顯著區分低難度與中、高難度等級文本。但是中難度與高難度文本在三個因素上并不存在顯著差異,即詞數、詞種數、MSTTR不能區分中難度和高難度文本。
詞頻(Lexical Frequency)具有兩種含義,一是指在特定文本或語料庫中詞語重復的頻率,也就是通常所說的詞次數或頻數;二是指詞頻概貌(Lexical Frequency Profile),指詞語在詞表的不同詞匯頻率等級上的分布情況。蘇新春和顧江萍全面考察了四套語文教材中的詞語分布情況,對比了頻率法(詞次數)與分布法(詞頻概貌),發現分布法更容易體現出語文詞語的穩定性與通用性。[13]比如對于科技文等特定文本,雖然某些詞語在文本中出現次數較高,但對于非專業人士來說卻較難理解,這樣通過詞次數來描述就不準確。相反,這類詞在詞表中可能屬于低分布詞,從而通過詞表可以較好地反映詞的屬性。因此,我們采用詞頻概貌來進行研究。
《現代漢語常用詞表》(草案)是基于2.5億字大規模語料,對現當代社會生活中使用頻率較高的56008個漢語普通話詞語做出詞頻排序,并給出了每個詞語的詞性,是目前最具權威性的詞頻統計數據。因此,本文將該詞表作為詞頻概貌的劃分依據。將該詞表按照使用頻率由高到低的順序劃分為六個區間,每個區間范圍包含10000個詞,分別為最常用詞([1,10000])、常用詞([10001,20000])、次常用詞([20001,30000])、較不常用詞([30001,40000])、不常用詞([40001,50000])、罕用詞④([50001,+∞))。詞頻分布如表4所示。

表4 不同難度等級文本的詞頻分布情況
由表4可以看出,不同難度等級文本的詞數在最常用詞區間數量最多,占比均高于80%;罕用詞區間占比次高,基本上隨文本難度等級的升高而升高,這說明《語文》教材文本均以前10000常用詞為主,同時會設置一些生詞,這在一定程度上關照了學生的認知規律,即既要保障學生理解文義,也要增加學生的詞匯量。

表5 詞頻與不同難度等級文本之間的Spearman相關系數
由表5可以看出,最常用詞和常用詞區間與文本難度顯著相關(p<0.05),其他區間的相關性均不顯著(p>0.05)。
通過獨立樣本T檢驗我們發現,低難度文本和中難度文本在常用詞區間、次常用詞區間上存在顯著差異(p<0.05),低難度文本和高難度文本在最常用詞區間、常用詞區間上存在顯著差異(p<0.05)。中難度和高難度文本在各區間上都不存在顯著差異(p>0.05)。
綜上所知,常用詞區間能顯著區分低難度與中、高難度文本,而中難度和高難度文本在各區間并無顯著差異。
詞匯密度指具有詞匯屬性的詞(即具有實際意義的詞,包括名詞、動詞、形容詞等)的數量與總詞數的比率,即實詞在總詞數中所占的比重。Vajjala & Meurers認為實詞比是測量英語文本難度的有效因素。[14]本文借鑒朱德熙的詞語分類標準,將名詞(包括時間詞和方位詞、處所詞)、動詞(包括助動詞和趨向動詞)、形容詞(包括屬性詞和狀態詞、區別詞)、數詞、量詞、代詞(包括人稱代詞、指示代詞和疑問代詞)歸為實詞,將副詞、介詞、連詞、助詞(包括語氣詞)、嘆詞、擬聲詞等歸為虛詞。[15]46-50本文擬采用實詞數、實詞比來衡量詞匯密度。實詞數、實詞比在不同難度文本中的分布如表6所示。

表6 實詞數、實詞比在不同難度文本中的分布
從表6可以看出,實詞數隨文本難度等級的升高而下降,在詞匯密度中,低難度比重最高,高難度文本次之,中難度文本比重最低。

表7 實詞數、實詞比與文本難度等級的Spearman相關系數
由表7可知,實詞數和實詞比均與文本難度等級呈顯著負相關(p<0.05),其中實詞數的相關性最顯著。通過獨立樣本T檢驗發現,低難度與中、高難度文本在實詞數、實詞數比上存在顯著差異(p<0.05),而中難度與高難度文本均不存在顯著差異(p>0.05)。
總之,在詞匯密度中,實詞數與實詞數比顯著影響低難度與中、高難度文本等級,而中難度與高難度等級文本之間并無顯著差異。
詞匯長度(word length)一般用于英語文本的測量,指一個詞語所包含的音節或字母數。在英語可讀性公式中,詞長作為文本可讀性測量的主要因素,漢語與英語不同,漢語的詞長較短且類型有限,單音節詞和雙音節詞占絕對優勢。漢語詞長對文本可讀性的影響是否像英語那樣明顯還需進一步研究和驗證。不同難度等級的文本的詞長分布如表8所示。

表8 不同難度等級的文本的詞長統計
由表8可以看出,單音節詞的詞長及其比重隨文本難度等級的升高而下降,雙音節詞長及其比重隨文本難度等級的升高而升高,而其他音節的詞長并無明顯規律。

表9 詞長與不同難度等級文本的Spearman相關系數
通過表9可知,單音節詞長與文本難度均呈顯著負相關(p<0.05),雙音節詞與文本難度均呈顯著正相關(p<0.05),其他音節的詞長與文本難度的相關性均不顯著(p>0.05)。
通過獨立樣本T檢驗我們進一步發現,在單音節詞、雙音節詞長上,低難度與中、高難度文本存在顯著差異(p<0.05)。中難度與高難度文本僅在雙音節詞上存在顯著差異(p<0.05)。
總之,單音節和雙音節詞能顯著區分低難度與中、高難度文本,中難度與高難度僅在雙音節詞上存在顯著差異。
本文從詞匯多樣性、詞頻概貌、詞匯密度和詞匯長度等四個維度考察影響文本可讀性的詞匯因素,發現在500字文本塊中,詞數、詞種數、MSTTR、常用詞區間詞頻、實詞數、實詞比以及單音節和雙音節詞長能夠顯著區分低難度與中、高難度文本,影響力由高到低均為:MSTTR>常用詞區間詞頻>實詞數>詞種數>單音節詞長>詞數>雙音節詞長>實詞比,但對中、高難度文本的區分并不明顯。本文還按照1000字對文本長度進行劃分,發現結果與500字文本塊劃分中對文本難度等級的影響基本一致。
本文的研究結果契合了目前我國義務教育《語文》課程的總教學目標,也遵循了兒童的認知發展規律。義務教育階段總教學目標規定初中階段的任務是全面普及九年義務教育,語文課程側重要求學生識字與寫字、閱讀、寫作、口語交際、綜合性學習;而高中階段的任務是面向高等教育,為社會培養及輸送合格人才,語文課程標準的要求是積累·整合、感受·鑒賞、思考·領悟、應用·拓展、發現·創造。因此從這個意義上來說,義務教育階段的語文學習更加重視學生語言知識的階段性的掌握與積累,而高中階段的語文學習則是重視學生如何正確地將學習到的語文知識運用到具體的實踐中。根據皮亞杰的認知發展理論的四個階段可知,小學階段為第三階段,即具體運算階段(7~11歲),該階段兒童只能利用具體的事物、物體或過程來進行思維或運算,不能利用語言、文字陳述的事物和過程為基礎來運算,也就是說該階段學生的語言知識還比較低,處于學習階段;初中階段為第四階段,即形式運算階段(11~15歲),該階段兒童的思維不必從具體事物和過程開始,可以利用語言文字,在頭腦中想象和思維,重建事物和過程來解決問題,也就是說學生在該階段的語言知識水平已經初步形成。皮亞杰認為15歲之后的人的認知水平在形式運算階段基礎上更加成熟。所以從語言方面來看,低難度文本與中、高難度文本等級區分比較明顯,而中、高難度文本等級不太明顯。本研究從詞匯多樣性、詞頻、詞匯密度和詞長等四個維度全面考察了影響文本難度分級的主要詞匯因素及其在文本難度分級中的有效性,在一定程度上為分級閱讀文本的選材和編寫提供些許參考。
【 注 釋 】
①由于目前“部編本”未涉及高中教材的編寫,故十二年級《語文》教材選用正在使用的經全國中小學教材審定委員會2004年初審通過的普通高中課程標準實驗教科書《語文》(必修)5。
②課文中排除文言文、詩歌(古代和現代)、戲劇等,主要選取記敘文、議論文、應用文和說明文。
③通過SPSS21.0的配對樣本T檢驗,檢驗同一難度等級文本的順序和亂序劃分是否存在差異。結果表明,兩種長度劃分方式中,三種難度等級的順序劃分與亂序劃分在詞數和詞種數上均不存在顯著差異(p>0.05)。因此,我們選取順序劃分作為文本的分塊方式。
④罕用詞不僅包含《現代漢語常用詞表(草案)》中的50000以上的詞語,還包括詞表中未收錄的詞語,我們將罕用詞視為更為低頻的詞。