邵克金



摘? 要:通過對百余年以來語文(國語、國文)教科書中詞匯量的考察,可以發現,教科書所呈現的詞匯量在不斷增長。值得注意的是,同一時期,面向同一階段師生,不同版本教科書中的現代漢語詞匯量,存在著較大的差異。這在一定程度上說明,有些教科書在詞匯編排上仍缺乏科學意識,這跟語文教育界長期缺乏教學指導量表有關。當前,《義務教育常用詞表(草案)》已經頒布,今后義務教育語文教科書的修訂或新編,應注意考慮與該詞表的兼容。
關鍵詞:語文教科書;現代漢語;詞匯量
古代漢語詞匯以單音節為主,字和詞相對統一,因此,古代語文教育中詞匯教學的數量問題,也就大致相當于古代常用字的教學問題,一般認為在2000個左右。從古代漢語發展到現代漢語之后,由于詞匯的多音節化,單音節詞不再占主體地位,字、詞、短語之間的邊界變得更加模糊,詞語的認定至今未能得到很好解決,這使得詞匯的量化統計成了一個棘手問題。與此同時,常用漢字的統計對于詞匯教學的意義也大大削弱。如黎錦熙曾以葉圣陶的小說《低能兒》之一節為例,對字數和詞數進行了統計研究,他在結論中指出:“那么,‘這篇800個字的文章中,有327個生字,是根本的錯誤;應該說‘這篇470個詞的文章中,有302個生詞。”[1](P48)黎錦熙之所以這樣說,意在告訴大家,如果只關注字,那么這里的字種數除以字總數的結果為40.87%,而詞種數除以詞總數的結果則高達64.25%。也就是說,如果把生字和生詞都看作新信息,那么生詞的新信息量要遠大于生字的新信息量。這一結論從理論上也能加以解釋:詞與人類的知識觀念系統發生直接聯系,是言語交際中最小的獨立運用單位,而字與人類的知識觀念系統是間接聯系。當漢語詞匯多音節化后,詞的數量要遠遠大于字的數量。因此,新文化運動之后,語文教育的詞匯量問題相比古代也就變得更為突出,不過,相關的量化研究卻遠不如漢字教學的量化研究成熟。盡管如此,一些學者仍在教科書詞匯統計方面作出了很大努力。
一、國語教科書中的白話文詞匯量
新文化運動時期,一批先進知識分子倡導使用白話文,使語言和文字更緊密地統一起來,白話文逐漸進入書面語系統;與此同時,文言文也并未退出歷史舞臺。這時的社會語言使用呈現出文言文與白話文并存的狀態,如當時的國文教科書實行語體文、文言文混編;白話文期刊、書籍等不斷增多;在很長一段時間內,政府的公文、法令、條約乃至民間的賬簿、書信等,仍以文言文為主。
就目前所見,最早提出要對白話文基本詞匯進行統計的當屬黎錦熙。1922年,他在《國語基本語詞的統計研究》一文中,介紹了西方基本語詞的統計研究成果,并對“識字”教育在量、序及相關標準等方面提出了疑問,這實際上就指出了當時詞匯教學中存在著同樣的問題。作者認為,如果要做漢語基本語詞的統計研究,“必須先從國語的本質上找出我們語言中表示整個觀念的真正單位出來”。這里的“表示整個觀念的真正單位”,相當于今天嚴格定義的詞,即音義結合的、能夠獨立運用的語言單位。黎氏最后指出,如果不做這樣的統計而只統計字,“結果將與漢語中運用詞類的實際也不相符”[2]。同年,邰爽秋在《科學化的國文教授法》一文中,也呼吁對教科書的字詞選用進行調查統計,作者指出:“將來調查成功之后,就可依發現次數的多寡,編為語匯。小學國文教材,即可拿這種語匯來做根據,依年級的高低,定教授的先后。這樣選字,方可以沒有遺漏。”[3](P246)
最早對白話文基本詞匯進行統計的學者似乎是陳鶴琴。1928年,陳鶴琴分析了554478個字的語體文材料,從中得到4261個常用字,編成《語體文應用字匯》一書。作者指出:“本字匯研究方法有兩種:第一,專研究個別的單字;第二,研究連詞……第一種研究效用小,不過借此可以知道中國語體文通用單字共有多少,通用單字應用次數之多寡與其價值之輕重。第二種研究效用浩大,所得之結果,容后另行發表。”[4](P59)
這里的“連詞”相當于今天所說的“詞語”。從中可以推測,陳氏當時應該是進行過第二種統計的,遺憾的是,我們并未見到相關的統計報告。
1931年,王文新發表了《小學分級詞匯研究》一文,該文中的統計包含了三套小學國語教本:《新中華國語教科書》,中華書局,1929—1930年出版;《新時代國語教科書》,商務印書館,1927—1930年出版;《新主義國語教科書》,世界書局,1928—1930年出版,共計36冊[5],但作者并沒有對這些教科書中的詞匯給出獨立統計結果。
1935年前后,艾偉開始著力詞匯統計研究。1949年,在《閱讀心理·漢字問題》一書的第四章,他詳細報告了自己的詞匯統計研究成果[6](P227)。他對三套初等小學國語教科書的詞匯情況進行了統計,這三套教科書分別是:《復興國語教科書》,編著者沈百英、沈秉廉,校訂者王云五、何炳松,商務印書館,1933—1934年出版;《基本教科書國語》,編纂者沈百英,校訂者蔡元培、吳研因,商務印書館,1931—1932年出版;《新編初小國語讀本》,編者呂伯攸,校者朱文叔,中華書局1938—1939年出版。每套教科書各八冊,合計24冊。三套教科書收詞情況,具體如表1所示[6](P236):
不僅如此,艾偉還對三套教科書的共有詞和特有詞情況進行了統計,具體如表2所示[6](P236):
表格說明:“一部”代表“商務復興本”,“二部”代表“商務基本本”,“三部”代表“中華新編本”。
從艾偉的統計研究中,可以獲得這一時期語文教科書詞匯量的一些基本信息:第一,當時小學國語教科書白話文詞匯種量的統計結果在5784~7715個之間,中值約為6749個。第二,在初等小學國語教科書中,單音詞的詞種數差異較小,復音詞的詞種數差異較大。第三,因為復音詞的詞種數差異較大,所以詞種量的差異也比較大。第四,在共有詞詞種數量方面,無論是單音詞還是復音詞,共有量都很小。
總的來看,三套教科書在詞匯種量上相差近千,同時,共有詞匯量很少,特有詞匯量較大。這說明在文白交替時期,沒有比較科學的上位數據(即白話文基本詞匯表)來指導語文教學及教科書編寫。教科書編寫主要是基于編者經驗,而缺乏詞匯教學量及構成上的考慮。此外,王文新、王顯恩和周其辰等學者,均對小學或普通民眾應學詞匯量進行了研究,并給出了詳細的詞匯表。如果能將同一時期的教科書詞匯情況與這些學者所做的研究進行比較,考察它們之間的共性與差異,對探索基礎教育的詞匯教學是很有意義的。令人遺憾的是,至今尚未見到類似的研究報告。
二、當代語文教科書中的現代漢語詞匯量
中華人民共和國成立之后,對于民族共同語的進一步規范化提出了更高的要求。1955年,中國社會科學院主持召開了“現代漢語規范問題學術會議”,會上確定把漢民族共同語稱為普通話,主張向全國大力推廣。會后經各方研究,正式確定了現代漢民族共同語的標準內涵:“以北京語音為標準音,以北方話為基礎方言,以典范的現代白話文著作為語法規范。”[7](P3)需要指出的是,這一時期,尤其是改革開放以后,漢語詞匯統計取得了很大進步,在語文教科書詞匯統計研究上也涌現出很多成果。
(一)婁警予、馬世一的研究
1980年,婁警予、馬世一等教師,對當時試行的十冊統編語文教科書中的常用詞,作了比較詳盡的調查和統計,該教科書由人民教育出版社于1978—1980年出版。經過篩選后,整理出中學生應該理解掌握的常用詞共6494個[8](P184)。他們的研究目的主要是為了解決中學生應掌握多少詞匯量這一問題,并根據他們對中學生應學詞匯量的理解而篩選、整理出應學詞表。因此,并沒有統計十冊語文教科書的詞種量和詞總量。值得注意的是,他們所提出的中學語文課詞匯教學總量的算法:漢語常用詞匯量-中學生在學齡前期、小學時期已經學會的詞匯-自然科學、社會科學中常用的術語=中學語文課詞匯教學的總量。該算法中蘊含著“常用詞不等于語文課程的教學詞匯”“應先搞清楚兒童學齡前已掌握的詞匯情況”等命題,對今天的詞匯教學仍然有啟示意義。
(二)北京語言學院的研究
1979至1986年,北京語言學院在實施“現代漢語詞匯的統計與分析”專題研究時,對人民教育出版社于1978—1980年出版的全國通用的中小學語文課本的詞匯作了統計與分析。統計之前,剔除了詩歌韻文、古代漢語、外國作品的翻譯文章;統計結果出來之后,又剔除了地名、人名等專有名詞,阿拉伯數碼、外文字母、專用符號等,共得到18177個詞語單位,并編著了《漢語詞匯的統計與分析》一書[9]。該書收錄了2個正表5個附表,其中,表I為“按音序排列并注明年級分布的頻率詞表”,在該表中,可以按音序查看詞的詞次、頻率、年級分布情況及相應的頻數等信息。表II為“按頻率排列的詞表(一)、(二)”,在該表中,可以按頻次高低查看詞的詞級、詞次、累積詞次、頻率、累積頻率、年級分布、使用度等信息。表III為“前1000個高頻詞的漢字組詞能力分析”,該表可以查看前1000個漢字的構詞情況。表IV為“詞的年級分布和音節構成統計”,該表可以查看不同年級的不同音節數的詞條數量情況。表V為“各詞次級別和同級單位的數量統計”,該表可以查看不同詞級的詞在數量及音節等方面的構成情況。表VI為“不同音節詞的數量及覆蓋率對比”,該表可以查看不同音節數目的詞的數量及占比等信息。表VII為“前若干詞在語料中的覆蓋率”,在該表中,抽樣展示了不同數量的高頻詞的累計詞次在語料中的覆蓋率。為了滿足廣大中小學教師、學生等的迫切需要,研制者還從《漢語詞匯的統計與分析》中選取了出現次數最多的漢字和詞語,出版了《常用字和常用詞》[10],該書共收入常用字1000個,常用詞3817個。
《漢語詞匯的統計與分析》是1949年以來首次采用詞匯計量學的科學方法,對一整套通用語文教科書中現代漢語詞匯進行的統計研究,包括詞級、詞次、累積詞次、頻率、累積頻率、年級分布、使用度等信息,使得該研究具有了統計學意義上的可信度,標志著詞匯統計研究已經從經驗式的方法轉向實證式的方法,對后來的詞匯統計影響深遠。
(三)北京師范大學的研究
1983至1985年,北京師范大學現代教育技術研究所部分研究人員與中文系部分漢語教師通力合作,對全國統一使用的1983~1984年度的中小學語文教科書作了大規模的詞頻統計與分析,該教科書由人民教育出版社出版,共24冊。該研究共輸入104萬字,約生成4萬個詞條。然后再利用計算機,把詞頻值和方差值(即詞在各種文體中的覆蓋率)都達到某一界限的詞語全部提取出來,確定為常用詞。這項成果于1985年7月通過國家鑒定,并撰寫了《現代漢語詞表》[11]、《現代漢語三千常用詞表》[12]等專著。這項研究得出的詞表,包含詞長、頻數、頻率、方差等信息。
需要指出的是,《現代漢語詞表》《現代漢語三千常用詞表》的反響并不大,其原因主要在于兩個方面。一是從現代漢語常用詞視角來看,24冊語文教材的詞匯量不足,文本的多樣性也不突出,從中提取出的現代漢語常用詞有失偏頗。二是從語文教學視角來看,這些常用詞很多都是學生已經掌握的詞,并不是語文課程詞匯學習的重點,3000個常用詞對語文教學的指導價值不大。
(四)李焱、孟繁杰的研究
2016年,李焱、孟繁杰對20世紀80—90年代基礎教育語文教科書中的詞匯情況進行了統計[13](P151),這些教科書包括:《六年制小學課本(試用本)(第一版)》,1983年11月—1985年1月,共12冊,《初級中學課本(第一版)》,1981年11月—1983年4月,共6冊,二者合之,簡稱“80語文”;《九年義務教育六年制小學教科書(第一版)》,1992年10月—1998年4月,共12冊,《九年義務教育三年制初級中學教科書(第一版)》,1992年10月—1995年4月,共6冊,二者合之,簡稱“90語文”。統計結果表明,“80語文”的詞種數為19383個,“90語文”的詞種數為19031個。需要說明的是,作者并未直接給出上述數字,這里的數據是根據作者所統計的“各年級新增詞種數”而得出的。
(五)羅樹林的研究
2017年,羅樹林對北京1972年的小學與初中語文教科書課文正文中所使用的詞語進行了統計,該教科書由北京人民出版社出版,共16冊。其中,小學語文教科書共有9832個詞種,初中語文教科書共有13693個詞種[14](P96)。
(六)蘇新春等人的研究
2017年,蘇新春、楊書松、孫園園對人教版、蘇教版、北師大版、語文版等四套義務教育階段新課標教材的用詞情況進行了統計,統計結果如表3所示:
需要指出的是,李焱與孟繁杰、羅樹林、蘇新春等的研究,均是基于蘇新春所提出的語文教材語言研究理論,他們都對各自研究的教材詞匯情況進行了描述性分析,其中,蘇新春等學者對同一時期四套教材的詞匯情況進行了比較研究,更值得關注。我們可以從表3獲取以下信息:第一,教材之間的詞種數差異較大,其中,北師大版和語文版差異最小,有1505個;蘇教版和語文版差異最大,有5220個。第二,四套教材的詞總數差異更大,其中,最大差異值為87542個,最小差異值為19783個。第三,四套教材合計詞種數50670個,但只有20.64%的詞為四套教材的共用詞,比例很低。第四,四套教材的共有詞在各自詞種數中的占比偏低,但相差不大。其中,人教版和蘇教版趨同,占比都在40%以上;北師大版和語文版趨同,占比都在40%以下。第五,四套教材的部分共用詞在各自詞種數中的占比相對均勻,比值在35%左右。第六,四套教材的獨用詞占比較小。其中,人教版和蘇教版趨同,占比都在20%左右;北師大版和語文版趨同,占比都在27%左右。
第一至第三點說明,僅就詞種量來看,教材編寫者的主觀隨意性較強,并沒有采取統一、規范的詞匯參照視角,這和上世紀艾偉的教科書統計反映出相同的問題,說明我國百余年來的語文教材編寫,一直缺乏相對統一的詞匯參照系統。也就是說,從詞種量這一視角來講,教材編寫的規律性較弱。同時,第四至第六點又分明呈現出一定的規律性,因為主要數據是相對穩定的。筆者認為,這種規律性并不是因為教材編寫者有意識地主動求同,而是主要來自語文教材編寫經驗的傳承,以及漢語本身的規律制約,后者應該是更為重要的原因。即漢語中常用詞的數量是相對穩定的,這使得不同教材編寫者盡管對詞匯量的選擇是隨意的,但又必然會呈現出一定的共性。
與文白交替時期相比,中華人民共和國建立之后,語文教科書的詞種數量不斷擴大。這主要是由兩個方面的原因造成的。一方面,在文白交替時期,語文教科書中的文言文占比較高。1920年,北洋政府教育部通令全國,從小學一、二年級國文課開始,教材改用語體文[16](P95)。不過,語體文教學的推行并不一帆風順,它遭到了保守勢力和封建復古主義者的激烈反對。1923年新學制頒布不久,軍閥混戰開始,一些軍閥控制區嚴禁教學白話文,嚴令中小學讀經和教學國文。即使到了1929年,中學階段的國文教科書在選文編排上也是遵循著“語體文漸減,文言文漸增”的原則[16](P191)。另一方面,基礎教育階段的詞匯教學主要是常用詞,兩個階段的數量差異如此之大,說明現代漢語的詞匯系統的發展速度是很快的,反映了我國經濟社會持續高速發展背景下新概念、新技術、新事物層出不窮的現狀。
與文白交替時期國語教科書中的白話文詞匯量相比,當代語文教科書中的現代漢語詞匯量也存在相似的問題。1949年之后,同一時期不同版本的語文教材之間,詞匯數量的差異也是很大。究其原因,除了各統計研究的分詞標準不統一外,更重要的仍是因為語文教學長期以來缺乏權威的具有指導性的詞匯量表,在教材編寫時相對忽視了詞匯視角,詞匯量的控制主要受教材的編撰理念和選文標準的影響。
三、百余年來語文教科書詞匯量的變化特點及原因
通過上文的梳理,我們發現,一百余年來,語文教科書在詞匯量方面具有兩個鮮明特點。
第一,語文教科書的詞種量一直在擴大。其根本原因在于:語言中的詞匯系統對社會的發展變化十分敏感,每當社會出現新生事物、新的思維成果時,就要用詞語加以記載,這些新事物、新概念最初是以新詞新語的方式出現在語言系統中,有些詞語還會沉淀成語言中的基本詞。這樣日積月累,語言中的詞匯系統也就會越來越大。
第二,同一時期不同版本語文教科書的詞種量差異較大。如前所述,無論是艾偉等現代學者的教科書詞匯統計,還是最近幾年的教科書詞匯統計,均顯示出不同版本教科書之間的詞匯種量存在一定區別。這種現象說明語文教科書的編撰理念仍需完善,現代語文教科書實際用詞應為多少,要以怎樣的文本厚度來呈現,是今后需要認真考慮的問題。
之所以會出現上述現象,究其原因,我們認為主要有三點:
一是因為各位學者所統計的詞語范疇及取詞標準不統一。同樣是對語文教科書中的現代漢語文本進行統計,有的學者只統計課文中的詞語,有的學者則連導讀及練習中的詞語也計算在內。在最終建立詞表時,有些學者凡是統計到的都一概收入,有些學者只收入典型詞語,人名、地名等專有名詞或者臨時組合詞均排除在外。
二是因為語文教育自身的發展、語文教材的編寫理念并不穩定。在這一百余年間,語文教育經歷了多次變化、多輪改革,每一輪改革都會對前一輪形成沖擊,這使得教科書的編寫經驗很難得以積累、總結與揚棄。魏本亞指出,百年來語文教材結構形態發生了許多變化,主要體現在:由“經本”到“文本”;由“文言一統課本”到“文白合一課本”;由“文選型教材”到“單元型教材”;由“混編型教材”到“分編型教材”;由“單元型教材”到“模塊·專題型教材”。結構形態變化的背后隱含著教材編寫理念的搖擺不定[17]。
三是因為近現代語文教科書缺乏科學的詞匯量表作依據。以往教科書的編撰主要依靠編者的主觀經驗或認知,而實證研究相對較少。1949年之后,語文課程標準(教學大綱)是指導語文教科書編寫的最主要依據,不過,語文課程標準中并沒有像外語/二語教學大綱那樣制定了明確的指導詞表。這或許是導致近代以來語文教科書中的詞匯量不夠穩定的最重要原因。
總之,語文教科書詞匯量會對學生的詞語學習產生重要影響,百余年來,由于缺乏相關的權威指導量表,導致人們在編寫教科書時對詞匯的編排缺少科學的參考依據,對教科書詞匯的統計結果,也難以進行科學的評價。2019年,《義務教育常用詞表(草案)》以語言生活皮書的形式出版發行,從某種意義上說,這對義務教育階段的語文詞匯教學具有官方指導意義,填補了百年來的空白。那么,今后的義務教育語文教科書在修訂或新編時,就應當充分考慮詞匯量對《義務教育常用詞表(草案)》的兼容性。當然,《義務教育常用詞表(草案)》也需要根據實施情況與時代發展進行修訂和完善。
參考文獻:
[1]黎錦熙.字數和詞數的一個統計研究[A].前國語研究會編.國語月刊·漢字改革號[C].北京:文字改革出版社,1957.
[2]黎錦熙.國語中基本語詞的統計研究[J].國文學會叢刊,1922,第一卷第一號.
[3]邰爽秋.科學化的國文教授法[A].李杏保,方有林,徐林祥.國文國語教育論典[C].北京:語文出版社,2014.
[4]陳鶴琴.語體文應用字匯[A].陳秀云,陳一飛.陳鶴琴全集(第六卷)[M].南京:江蘇教育出版社,2008.
[5]王文新.小學分級詞匯研究[J].教育研究,1931,(29), (30),(31).
[6]艾偉.閱讀心理·漢字問題[A].徐林祥主編.百年語文教育經典名著(第十卷)[C].上海:上海教育出版社,2017.
[7]黃伯榮,廖序東主編.現代漢語(增訂六版)[M].北京:高等教育出版社,2017.
[8]婁警予,馬世一.對詞匯教學科學化的建議[A].中學語文教學研究會會刊編委會.語文教學研究——中學語文教學研究會會刊(第一輯)[C].北京:教育科學出版社,1980.
[9]北京語言學院語言教學研究所.漢語詞匯的統計與分析[M].北京:外語教學與研究出版社,1985.
[10]北京語言學院語言教學研究所.常用字和常用詞[M].北京:北京語言學院出版社,1985.
[11]劉源主編.現代漢語詞表[M].北京:中國標準出版社,1984.
[12]何克抗,李大魁主編.現代漢語三千常用詞表[M].北京:北京師范大學出版社,1987.
[13]李焱,孟繁杰.20世紀80—90年代基礎教育語文教材語言研究[M].廣州:廣東教育出版社,2016.
[14]羅樹林.20世紀60—70年代基礎教育語文教材語言研究[M].廣州:廣東教育出版社,2017.
[15]蘇新春,楊書松,孫園園.21世紀新課標基礎教育語文教材語言研究[M].廣州:廣東教育出版社,2017.
[16]顧黃初.中國現代語文教育百年事典[Z].上海:上海教育出版社,2001.
[17]魏本亞.百年中國語文教材變革與困惑[J].徐州師范大學學報(哲學社會科學版),2008,(3).
Vocabulary Teaching Volume in Modern Chinese Language Education
——Statistical Analysis of Modern Chinese Vocabulary Based on Chinese Textbooks over 100 Years
Shao Kejin
(School of Humanities, Gannan Normal University, Ganzhou 341000, China)
Abstract:Investigating the vocabulary of modern Chinese in Chinese textbooks for more than a hundred years, it is found that the vocabulary presented in textbooks is growing. At the same time, for teachers and students at the same stage, There are great differences in the vocabulary of modern Chinese in different versions of textbooks. This shows that the textbook compilation lacks the awareness of scientific vocabulary arrangement, which is related to the long-term lack of Teaching Guidance Scale in the field of Chinese education. At present, Yiwu Jiaoyu Changyong Cibiao(Caoan)(《義務教育常用詞表(草案)》) has been promulgated. The revision or new edition of compulsory education Chinese textbooks should pay attention to the compatibility with this vocabulary.
Key words:Chinese textbook;modern Chinese;vocabulary