袁嫩嫩 王佶旻
語言能力標準是根據(jù)語言使用者的行為表現(xiàn)來定義其語言水平的能力量表,包含“量表”和“描述語”兩個關(guān)鍵因素。語言能力標準本身就是量表,具備測度(語言能力)、全距(語言能力范圍)、單位(相鄰兩個語言能力等級之間的級差)三種特性。描述語則是對每個單位上語言使用者能夠完成的語言任務(wù)、語言技能和語言特征的陳述。語言能力標準是一個能夠客觀地測量、評價、描寫和解釋語言使用者語言水平的能力量表。
語言能力標準的制定,可以為語言教學、學習、測試與評估提供統(tǒng)一的標準參照體系,同時為各類學校、機構(gòu)和企事業(yè)單位的使用者提供規(guī)范性參考。隨著社會需求和語言理論研究的發(fā)展,語言能力標準也是動態(tài)變化的[1]。科技和移動互聯(lián)網(wǎng)的發(fā)展不僅影響著對語言能力的認識和需求,也改變著語言教學和測試,對語言能力標準的未來發(fā)展具有重大意義。
國外的語言能力標準起源于1955 年美國外交學院(Foreign Service Institute,F(xiàn)SI)制定的FSI 量表。在FSI 量表的基礎(chǔ)之上,1968 年,國防語言學院、中央情報局等部門聯(lián)合制定了聯(lián)邦政府語言協(xié)調(diào)會(Interagency Language Roundtable,ILR)能力量表。1982 年,美國教育測驗服務(wù)中心和美國外語教學委員會推出ACTFL(American Council on the Teaching of Foreign Language)大綱試行版,1986年發(fā)布ACTFL 正式版。1996 年,第一套加拿大語言測試標準(Canadian Language Benchmarks,CLB)面世。2001 年11 月,歐洲議會通過了《歐洲語言共同參考框架》(A Common European Framework of Reference for Languages,CEFR)。CEFR 對全球的語言教育產(chǎn)生了革命性的影響。至此,英語語言能力標準經(jīng)歷了從雛形到發(fā)展再到成熟的過程。
《中國英語能力等級量表》(China Standards of English,CSE,2018)的發(fā)布,進一步推動了英語教育的本土化進程,進入與國際量表對接合作的新階段。而在國際中文教育領(lǐng)域內(nèi),教育部、國家語言文字工作委員會于2021 年發(fā)布《國際中文教育中文水平等級標準》,標志著國際中文教育進入了一個全新的發(fā)展時代。基于此,本研究嘗試通過梳理國際中文能力標準的歷史發(fā)展以及學界對語言能力標準的研究,詳細對比各版本中文能力標準,探討其對國際中文能力標準和國際中文教育事業(yè)的啟示。
新中國漢語作為第二語言的教學,從1950 年清華大學成立“東歐交換生中國語文專修班”算起,至今已有70 多年的歷史,但其學科和規(guī)模的大力發(fā)展都始于改革開放后的20世紀80年代。
中文能力標準雛形起源于等級大綱的規(guī)范性文件。1987 年,對外漢語教學學會成立了7 個人的漢語水平等級標準研究小組。1988年,該小組推出《漢語水平等級標準和等級大綱(試行)》(以下簡稱《標準與大綱》)[2]。此標準以“結(jié)構(gòu)—功能—文化”相結(jié)合為主要原則,按規(guī)劃應(yīng)分為五部分:《漢語水平等級標準》《詞匯等級大綱》《語法等級大綱》《功能、意念等級大綱》(暫缺)和《文化等級大綱》(暫缺)。在這個大綱的框架下,1992年出版《漢語水平詞匯與漢字等級大綱》[3],1996年出版《漢語水平等級標準與語法等級大綱》[4],分別補齊了詞匯(包括漢字)和語法兩個大綱,而功能和文化這兩個大綱一直未推出。至此,一個由等級標準和詞匯、漢字、語法等級大綱構(gòu)成的系統(tǒng)基本建成,即“中文能力標準1.0版”。
與此同時,漢語水平考試(HSK)由北京語言大學漢語水平考試中心(以下簡稱“北語漢考中心”)從1984 年開始研制,1988 年在北京首次開考,1990 年在國內(nèi)正式組織實施,1991 年推向海外,1992 年正式被定為國家級考試,并先后發(fā)布了三個考試大綱:《中國漢語水平考試大綱(初、中等)》(1989)、《中國漢語水平考試大綱(高等)》(1995)、《中國漢語水平考試大綱(基礎(chǔ))》(1998)。至此,HSK 構(gòu)成了一個水平由低到高的較為完整的系統(tǒng),即“漢語水平考試1.0版”。
“中文能力標準1.0 版”將漢語水平分為三個級別(初等、中等、高等),等級標準分為五級(一級、二級、三級、四級、五級),每一級標準均由“話題內(nèi)容、語言范圍、言語能力”三個要素構(gòu)成,并規(guī)定了“聽、說、讀、寫、譯”五種語言技能應(yīng)達到的水平(“譯”只有三、四、五級才有)。而詞匯、漢字、語法大綱均分為四個等級(甲、乙、丙、丁)。“漢語水平考試1.0 版”包括HSK【基礎(chǔ)】、HSK【初、中等】和HSK【高等】,分為3等11級(如表1)。這一系列的標準、大綱與考試之間有著大致明確的對應(yīng)關(guān)系(如表2),實踐中經(jīng)常配合使用。

表1 漢語水平考試1.0版的等級結(jié)構(gòu)

表2 標準、大綱與考試(1.0版)之間的關(guān)系
《標準與大綱》開創(chuàng)了漢語能力標準的先河,對教材編寫、課程設(shè)置和水平測試均有很高的參考價值。HSK 的研發(fā)以及面向國際開考,對于漢語言文化向世界傳播和國與國之間文化的交流,具有重要的現(xiàn)實意義和歷史意義。雖然“中文能力標準1.0版”和“漢語水平考試1.0 版”存在一些不足之處,如過度強調(diào)語言要素和語言技能而非語言交際能力且試卷難度較大等,但是它們的推出,標志著我國對外漢語教學界的工作邁出了實質(zhì)性的一步,使對外漢語教學從僅僅憑借教師主觀經(jīng)驗指導(dǎo)的時代,跨入了依靠統(tǒng)一的綱領(lǐng)性指導(dǎo)文件和科學的衡量指標的新時代。至今,仍有許多教材、大綱、考試以這些標準為依據(jù)。
2004 年,隨著孔子學院的建立,全球掀起了“漢語熱”,中國的“對外漢語教學”開始走向世界,進入了“國際漢語教育”時期。為了應(yīng)對新時期的需求,順應(yīng)世界各地漢語教學迅速發(fā)展的趨勢,國家漢辦集中出版了6 個標準和大綱,包括《國際漢語能力標準》(即中文能力標準2.0版,2007)[5]、《國際漢語教師標準》(2007)、《國際漢語教學通用課程大綱》(2008)、《新漢語水平考試大綱》(即漢語水平考試2.0 版,2009)、《漢語口語水平等級標準及測試大綱》(2010)、《漢語國際教育用音節(jié)漢字詞匯等級劃分》(2010)[6]。
《國際漢語能力標準》(2007)借鑒了CEFR、CLB等國際語言能力標準的研制成果,以交際語言能力理論為指導(dǎo),注重語言的實際運用。該標準分為五個水平等級,每個水平等級都有三個層面(如圖1),第一個層面是漢語能力總體描述,第二個層面是漢語口頭和書面交際能力描述,第三個層面是漢語口頭和書面理解與表達能力描述,包括“語言能力描述”和“任務(wù)舉例”兩部分。

圖1 中文能力標準2.0版框架圖
在這一階段,出現(xiàn)過兩個HSK并存的現(xiàn)象,分別是北語漢考中心研發(fā)的HSK 改進版(漢語水平考試1.0 改進版)和國家漢辦研發(fā)的新HSK(漢語水平考試2.0 版)。“漢語水平考試1.0 改進版”是對“漢語水平考試1.0 版”的繼承和發(fā)展,是北語漢考中心從2000年開始,對其等級劃分、試卷題型、主觀測驗、分數(shù)體系和解釋等方面做的新嘗試;2007 年正式調(diào)整為初級、中級和高級三個等級考試,每個級別均包括客觀卷(聽力理解、綜合閱讀)和主觀卷(口試、寫作),實現(xiàn)了對聽、說、讀、寫的全面測評,其科學化得到了廣泛的認可。而“漢語水平考試2.0 版”則由國家漢辦2009 年開始逐步推出,包括筆試和口試獨立的兩部分,筆試分為6 級,口試分為3 等9 級(初、中、高三等,每等分3 級),采用錄音的形式(如表3)。2010 年底,“漢語水平考試2.0 版”全面推廣,結(jié)束了兩個HSK并存的局面,一直延續(xù)至今。

表3 標準與考試(2.0版)的關(guān)系
“中文能力標準2.0 版”沒有對語言能力進行量化的描述,只在考試大綱中提供了詞匯量的要求。直到《漢語國際教育用音節(jié)漢字詞匯等級劃分》(2010),創(chuàng)立了音節(jié)、漢字、詞匯的三維基準體系,將音節(jié)、漢字、詞匯均分為三個等級,規(guī)定了每一級的具體數(shù)量,并提供三級附錄供漢語水平較高的學習者進一步使用。具體指標為:音節(jié)(一級608,二級301,三級163,附錄38,共1110);漢字(一級900,二級900,三級900,附錄300,共3000);詞匯(一級2245,二級3211,三級4175,附錄1461,共11092)。
“中文能力標準2.0版”和“漢語水平考試2.0版”降低了初學者的門檻,調(diào)整了難度跨度,重視語言的交際能力,使?jié)h語作為第二語言的教學向普及化的方向發(fā)展,這無疑有助于漢語教學走向全世界,符合國際漢語教育時期的需求。但是,“中文能力標準2.0 版”并未解決1.0 版存在的不足,對語言能力的界定和描述不夠全面細致,只注重中低水平的漢語能力分級[7],與真正意義上的語言能力標準有一定的差距。“漢語水平考試2.0 版”各級別的學習時間和詞匯量要求大大低于1.0 版考試,與CEFR 直接掛鉤的合理性受到質(zhì)疑,一定程度上缺乏科學性和專業(yè)性。
2018年,教育部統(tǒng)計數(shù)據(jù)顯示,學歷生占來華留學生總數(shù)的52.44%,成為國際漢語教育的主體,實現(xiàn)了第一次翻轉(zhuǎn)。盡管新冠肺炎疫情影響了來華留學生的數(shù)量和教育生態(tài)質(zhì)量,但隨著我國綜合實力的發(fā)展,學歷生越來越多的總趨勢是不會改變的[8]。
普及化的能力標準與水平考試(2.0 版)顯然不能滿足專業(yè)型的學歷教育,即使達到“漢語水平考試2.0 版”的最高級(HSK6 級),學生依然不能很好地完成專業(yè)學習。在此背景下,從2017 年起,教育部中外語言合作交流中心(原孔子學院總部/國家漢辦)組織研制新的等級標準,并于2021 年發(fā)布《國際中文教育中文水平等級標準》[9](以下簡稱《標準》,即“中文能力標準3.0 版”),開啟了“國際中文教育”的新時代。
《標準》將學習者的中文水平由2.0 版的六級增加至“三等九級”,對各等級采用“3+5”的新路徑進行全方位、立體系統(tǒng)的描述(如圖2),包括言語交際能力、話題任務(wù)內(nèi)容、語言量化指標3 個評價維度和聽、說、讀、寫、譯5 項語言技能,并確定了音節(jié)、漢字、詞匯、語法的四維語言量化指標體系(如表4)。其中,音節(jié)、漢字和詞匯是在《漢語國際教育用音節(jié)漢字詞匯等級劃分》基礎(chǔ)之上進行的細分。

圖2 《標準》“3+5”新路徑

表4 《標準》語言量化指標總表
“中文能力標準3.0版”基本沿用了“can do”描述語的方法,依然重視語言交際能力,但是以轉(zhuǎn)型升級和提高質(zhì)量為中心,立足漢語特點,更加強調(diào)包容性、可持續(xù)性和國際合作性。在《標準》的引領(lǐng)下,國家將重點研發(fā)相配套的“漢語水平考試3.0版”,以滿足高質(zhì)量、多元化的需求[10]。《標準》也將為國際中文教育的教材編寫、課程大綱以及“互聯(lián)網(wǎng)+”時代各種新模式、新平臺的構(gòu)建提供重要的依據(jù)。
除了國家發(fā)布的不同版本中文能力標準之外,學界對漢語作為第二語言能力標準的研究從2004年開始也獲得了長足的發(fā)展。
研究者提出,漢語之所以與CEFR 不完全兼容,是因為單個漢字內(nèi)部所包含的部首、偏旁、筆畫、筆順等知識信息,與交際性質(zhì)及功能關(guān)系不大,應(yīng)當制定具有中文特色的能力標準[11]。鹿士義和王二平(2010)通過分析1135 名國際中文學習者對64 項任務(wù)的評價,列出了交際任務(wù)的重要性、使用頻次和難度[12]。但交際能力并不完全等同于語言能力,二者之間很難建立起一一對應(yīng)的關(guān)系,因此描述交際語言能力時一般結(jié)合語言任務(wù)、語言知識與技能進行綜合陳述。方緒軍等(2011)指出應(yīng)建立大量的具有區(qū)別性特征的描述語數(shù)據(jù)庫,并對其進行量表化,以提高實用性和科學性[13]。還有研究者認為,漢語語言能力教育目標應(yīng)當是語言知識素質(zhì)、語言能力素質(zhì)和語言文化素質(zhì)的“三級遞進”的動態(tài)目標,漢語能力標準的制定可以在標準語言能力、社會語言能力、職業(yè)語言能力和藝術(shù)語言能力四個層面展開[14]。這些研究為中文能力標準的制定提供了重要參考。此外,在中文能力標準的應(yīng)用方面,研究者們將重點轉(zhuǎn)移到來華留學預(yù)科教育和本科入學中文水平等領(lǐng)域,如張潔(2021)提出以《標準》的高等七級作為來華留學生本科入學中文水平標準是比較合適的[15]。
到目前為止,《漢語作為第二語言能力標準》的制定采用項目反應(yīng)理論(IRT)中的多級計分模型(Polytomous Rasch Model,簡稱RSM 模型)來估算描述語的任務(wù)難度進行等級劃分,才真正突破了只定性不定量的模式,本研究稱之為“中文能力標準學術(shù)版”。
該標準由北語國際學生教育政策與評價研究院(原北語漢考中心)王佶旻牽頭研發(fā),從2006 年作為教育部人文社科重點研究基地重大項目開始,到成為2015 年國家社科基金重大項目“漢語交際能力標準與測評研究”的重要成果,遵循科學、全面、實用和兼容的原則,構(gòu)建了漢語作為第二語言的能力標準基本框架(如表5),包括三個方面:語言水平等級描述、水平測驗和大綱。語言水平等級描述(即描述語指標庫)是標準的主體部分;水平測驗是配套的測量工具,是對“漢語水平考試1.0 改進版”的繼承和修訂,有大規(guī)模的題庫提供保障;語法、字詞大綱是量化參考體系。

表5 中文能力標準學術(shù)版框架
“中文能力標準學術(shù)版”將漢語水平分為三等六級(初級低、初級高、中級低、中級高、高級低、高級高),對聽、說、讀、寫四項技能分別做等級描述,搭建起具有橫向的能力維度和縱向的等級難度的雙維度描述語指標庫,并從能力概說、能做描述和量化指標三個層面進行詳細陳述。該版本最大的創(chuàng)新性在于對每條描述語提供能力維度、難度值和水平等級的參數(shù)體系,這不僅實現(xiàn)了真正意義上的定量研究,也有利于與國內(nèi)外的語言能力標準和考試進行科學的對接,為國家標準提供學術(shù)補充,從而推動國際中文教育的規(guī)范化、科學化和國際化。
語言能力標準的制定和實施是實現(xiàn)國家語言戰(zhàn)略的重要手段,也是國家軟實力的體現(xiàn),其核心競爭力在于學術(shù)權(quán)威性[16]。本研究從量表的性質(zhì)、描述語特征、對接關(guān)系三方面對比不同版本的中文能力標準。
語言能力標準也是語言能力量表,科學的量表應(yīng)該明確三要素:測度、全距和單位。
1.測度
測度指測量的對象或?qū)傩浴UZ言能力標準的測量對象是語言能力,因此語言能力理論的演變直接影響著能力標準的制定。學界對“語言能力”的研究經(jīng)歷了從Chomsky“能否造出合乎語法的語句”的語言能力[17],到Hymes“能否合適恰當?shù)厥褂谜Z言”的交際能力[18],再到Bachman“能否在不同的語境中得體地運用語言”的綜合語言交際能力的演化過程[19]。“語言能力”從只關(guān)注語言知識本身到同時強調(diào)運用語言進行交際的能力,這樣的理論變化也為中文能力標準的制定提供了重要的借鑒和參考價值。
“中文能力標準1.0 版”受結(jié)構(gòu)主義語言學的影響,力求將結(jié)構(gòu)同功能結(jié)合起來,對不同階段的詞匯(包括漢字)和語法都提出了定量要求,構(gòu)建了“漢字跟著詞匯走”的“二維基準”等級標準[20]。“中文能力標準2.0 版”以交際語言能力理論為指導(dǎo),從不同的交際方式和交際過程入手,聚焦“能做某事”的語言能力描述,體現(xiàn)漢語口語和書面語存在較大區(qū)別的特點,但對漢語語言要素缺乏關(guān)注。直到2010 年的《等級劃分》引入音節(jié),以漢字為核心,開創(chuàng)了音節(jié)漢字詞匯的“三維基準”國家標準,但未得到充分的重視和應(yīng)用。“中文能力標準3.0版”重視綜合語言交際能力,強調(diào)包容性、混合型、全方位的三等九級新范式和“3+5”新路徑,突出了中文“音隨字走”的特點,確立了音節(jié)、漢字、詞匯、語法的“四維基準”新規(guī)則。三個版本的中文能力標準的變化基本上與語言能力理論的變化保持一致。
但是,從技術(shù)層面來講,任何一種語言能力標準的建立,都需要對其構(gòu)想效度做出詳細的理論闡述,如果缺少堅實的理論基礎(chǔ),就難以保證語言能力標準的有效性和可靠性[16]。與國外的語言能力標準研制的過程相比,三個版本的中文能力標準對其理論依據(jù)的闡釋均尚顯薄弱。“中文能力標準學術(shù)版”的突破在于使用定量的方法,但其背后的課題理論依據(jù)是基于大漢語和全球化的研究視角,將不同群體漢語使用者的能力標準統(tǒng)一起來,構(gòu)建漢語交際能力標準體系[21],這樣的理論指導(dǎo)無疑推動了整個中文能力標準學科建設(shè)的新發(fā)展。
2.全距
全距指量表的起點與終點之間的距離。語言能力標準的全距代表著所能描述和解釋的語言能力范圍。
針對不同的群體和目的,量表選取的全距范圍各有不同。如來華留學預(yù)科教育的漢語能力標準,該量表的起點為基礎(chǔ)漢語大于零點,學術(shù)漢語接近零點,終點是達到本科入系學習的基本漢語水平[22]。很顯然,這樣的全距并不適用于面向中文作為第二語言的所有學習者的能力范圍。作為國家級別的語言能力標準,可以借鑒CEFR 的定位。CEFR 的起點(A1)描述是“能了解并使用熟悉的日常用語和詞匯,滿足具體的需求;能介紹自己及他人,并針對細節(jié)(如住在哪里、認識何人等)進行問答;能在對方說話緩慢且清晰時,做簡單的互動”。CEFR 的最高等級(C2)描述是“能輕松了解幾乎所有聽到或讀到的信息;能連貫地概述各類口、筆語信息,不漏內(nèi)容及其論據(jù);能表達自如、精確、流暢并能把握復(fù)雜主題中細微的含義差別”。由此可知,起點以能夠使用語言滿足最基本的交際需求為基準,終點在近似母語者的水平上,這樣的全距是比較合適和可行的。“中文能力標準學術(shù)版”的聽、說、讀、寫四個描述語子庫的全距基本符合這樣的范圍。
“中文能力標準1.0 版”的起點(一級)規(guī)定的話題內(nèi)容為“最基本的日常生活、有限的學習活動和簡單的社會交際”,具有“初步的讀聽說寫能力”。終點(五級)規(guī)定的話題內(nèi)容為“中國報刊、電臺和電視臺的各類新聞,較高層次的學習和社會交際活動,帶有一定專業(yè)性的實際工作”,具有“從事較高層次的學習、社交活動和帶有一定專業(yè)性工作的能力;言語活動符合漢語的規(guī)范性,體現(xiàn)漢語的多樣性,顯示漢語運用的得體性,適應(yīng)不同語體的不同需要;對所學漢語的文化背景和語義內(nèi)涵應(yīng)有較深的了解和活用的能力,并初步具備運用漢語進行思維的能力”。1.0版本的全距覆蓋范圍不夠大,基本建立在“我國四年制對外漢語專業(yè)”水平之上,未考慮在中國以外的國家和地區(qū)學習漢語人群的水平,且詞匯和語法的最高級丁級水平,僅相當于CEFR的B級。
“中文能力標準2.0 版”的起點(一級)描述為:“能大體理解與個人或日常生活密切相關(guān)的簡單、基礎(chǔ)而又十分有限的語言材料。借助肢體語言或其他手段的幫助,能用非常有限的簡單語匯介紹自己或與他人溝通。”終點(五級)的描述是:“能理解多種場合、多個領(lǐng)域的普通語言材料,能夠把握重點,進行概括和分析。能使用多種交際策略較自如地參與多種話題,包括專業(yè)領(lǐng)域內(nèi)一般性話題的交流和討論,表明自己的觀點和態(tài)度,并能對各種意見進行闡釋,表達連貫,基本得體。”2.0 版本的全距與CEFR 基本吻合,并直接與CEFR 掛鉤(如表4),但實際操作和僅有的詞匯量化指標上與CEFR大相徑庭。可見,僅僅在描述語上進行參考和借鑒,顯然有悖科學性。
“中文能力標準3.0 版”的起點(初等)描述是:“能夠基本理解簡單的語言材料,進行有效的社會交際。能夠完成日常生活、學習、工作、社會交往等有限的話題表達,用常用句型組織簡短的語段,完成簡單的交際任務(wù)。能夠運用簡單的交際策略輔助日常表達。初步了解中國文化知識,具備初步的跨文化交際能力。”終點(高等)描述是:“能夠理解多種主題和體裁的復(fù)雜語言材料,進行深入的交流和討論。能夠就社會生活、學術(shù)研究等領(lǐng)域的復(fù)雜話題進行規(guī)范得體的社會交際,邏輯清晰,結(jié)構(gòu)嚴謹,篇章組織連貫合理。能夠靈活運用各種交際策略。深入了解中國文化知識,具備國際視野和跨文化交際能力。”3.0版的標準從語言材料、話題表達、交際策略、跨文化知識四方面進行描述和界定量表的全距,除一般語言能力描述之外,充分體現(xiàn)了漢語教學特點和中國文化特色,基本涵蓋了所有中文作為第二語言的學習者語言能力水平。
3.單位
單位指量表中相鄰兩個刻度之間的距離。在全距一定的情況下,單位越大,量表的等級數(shù)目越少,測量的精度越低。單位變小,測量的精度提高,但等級劃分時決策錯誤的概率也會增加。前兩個版本的中文能力標準均劃分為五個等級,“中文能力標準3.0 版”則增加到九級,一到六級的每一級都是獨立完整的,七到九級的量化指標不再細分。“中文能力標準學術(shù)版”為實現(xiàn)與CEFR 兼容,分為三等六級。等級數(shù)量的增加,意味著中文能力標準這把尺子的刻度變得更加精確。
國外語言能力量表的精度也存在顯著差異。CLB 劃分的等級數(shù)量最多,分12 級。CEFR(2001版)劃分為六級(A1-C2),2018 年在A1 級之前增加Pre-A1級,因此可歸為7級。ILR 雖然分為6級,但0級-4 級均含有附加級(即0+、1+、2+、3+、4+)。ACTFL分為5級,前3級又細分出低、中、高級。但語言能力量表并非精度越高,信效度越好。精度越高,說明等級劃分越多,這就增加了區(qū)分各等級典型語言行為描述語的難度。精度過低,會造成同一級別內(nèi)語言使用者的能力水平差距懸殊。語言能力量表是根據(jù)語言能力進行的等級劃分,而語言能力是一種抽象的心理屬性,單位宜粗不宜過細。
描述語是對各等級上的語言能力各維度要達到的水平進行描述的語句。描述語的質(zhì)量直接影響著語言能力量表的信、效度。從結(jié)構(gòu)主義語言學的角度來看,對語言能力的描述就是人們對語音、詞匯、語法等要素的掌握以及在聽說讀寫等活動中表現(xiàn)出來的技能水平,如“中文能力標準1.0版”。但在交際語言能力理論下,受Halliday 提出的“Can do”即“能做某事”的理念影響[23],一般采用Can do 描述語的陳述方式,對交際語言能力進行分層次、分技能、分等級的多方面描述,如CEFR、2.0 版、3.0 版和學術(shù)版的中文能力標準。
1.描述語細度
描述語細度包括總數(shù)、各等級的平均細度、各等級的細度差。如表6 所示,從描述語的總數(shù)來看,“中文能力標準2.0 版”(118 條)<“中文能力標準1.0 版”(136 條)<“中文能力標準3.0 版”(198 條)<“中文能力標準學術(shù)版”(500 條)。無論哪個版本的中文能力標準,其總量與CEFR(1507 條)相比,均遠遠不夠。

表6 語言能力量表描述語數(shù)量統(tǒng)計表
從平均細度來看,中文能力標準3.0 版本共9級,平均每級22 條描述語,2.0 版本共5 級,平均每級24條,1.0版本共5級,平均每級27條,三個版本的中文能力標準均屬于低細度型語言能力量表;“中文能力標準學術(shù)版”共6 級,平均每級83 條,屬于中細度型語言能力量表;而CEFR 共7 級,平均每級215 條,屬于高細度型語言能力量表。
從細度差來看,CEFR 具有最大的標準差128.12,說明描述語離散程度大,分布范圍廣。“中文能力標準學術(shù)版”的標準差大于其他三個版本,說明該版本的描述語難度分布較廣,描述語之間的區(qū)分度很好。進一步分析發(fā)現(xiàn),CEFR 是非常典型的“中間多,兩端少”的語言能力量表,這與語言能力水平高低的實際情況和社會需求程度緊密相關(guān),在日常生活、工作和學習中,中間等級的描述語涉及的場景和任務(wù)最多,掌握該等級語言能力的人數(shù)也最多[24]。因此,提高中文能力標準的精細度,不僅要擴充描述語的總量,也要對中間等級進行更為詳細的描述。
2.描述語參數(shù)
描述語參數(shù)指的是描述語所描述的能力類別,直接反映著量表所依據(jù)的語言能力模型。“中文能力標準1.0 版”的基本參數(shù)是話題內(nèi)容、語言范圍和言語能力,言語能力的次級參數(shù)包括聽說讀寫譯,但基本沒有描述學習者在實際語言交際中能夠做什么的內(nèi)容。“中文能力標準2.0版”的基本參數(shù)是口頭理解能力、口頭表達能力、書面理解能力和書面表達能力,沒有次級參數(shù)。“中文能力標準3.0 版”的基本參數(shù)是言語交際能力、話題任務(wù)內(nèi)容、語言量化指標,言語交際能力的次級參數(shù)包括聽說讀寫譯,話題任務(wù)內(nèi)容的次級參數(shù)包括話題和任務(wù),語言量化指標的次級參數(shù)包括音節(jié)、漢字、詞匯和語法。“中文能力標準學術(shù)版”的基本參數(shù)只有聽說讀寫,但次級參數(shù)詳細描述了四項技能所涉及的子能力,如閱讀技能中,描述的維度包括總說、文本說明、閱讀過程和量化指標四個方面。
3.0版本的描述語參數(shù)最豐富,且突出了中文的特色。但與CEFR 相比,略顯單薄。CEFR 的基本參數(shù)包括普通能力、交際語言能力、語言活動、語言活動領(lǐng)域、策略、任務(wù)、語篇,各基本參數(shù)下還包括更為具體的次級參數(shù),構(gòu)成了語言能力描述的參數(shù)網(wǎng)絡(luò)。
由于各個版本的能力標準均有聽說讀寫的語言技能描述參數(shù),因此可統(tǒng)計對比各標準在語言技能方面的描述語數(shù)量。關(guān)于“譯”的描述語,1.0 版標準的三、四、五級各含6 條,共18 條;3.0 版標準的四到九級各含3條,共18條;另外兩個版本不包含。由表7 可知,第一,中文能力標準學術(shù)版在聽說讀寫四項技能方面的描述語數(shù)量最多,共447 條,說明該標準對四項語言技能描述得最為詳細;第二,1.0 版、學術(shù)版和CEFR均在“說”的方面具有最多的描述語,相比于聽讀寫技能,學界在口語能力描述語方面的研究最為豐富(王佶旻,2013);第三,從標準差來看,這5個量表在四項語言技能的描述上差不多均衡施力。

表7 各版本語言能力標準聽、說、讀、寫四項語言技能描述語數(shù)量統(tǒng)計
3.描述語的等級劃分
描述語參數(shù)的設(shè)置解決的是橫向的能力維度問題,而將描述語定位在量表上的合適位置,就是對描述語進行縱向的等級劃分過程。
Council of Europe 概括了三種描述語等級劃分的方法:直覺法、定性法和定量法[25]。直覺法主要是參考現(xiàn)有的大綱和標準,根據(jù)專家的經(jīng)驗來劃分描述語的難度等級;定性法通過對語言教師進行調(diào)查研究,請他們對描述語進行評價、取舍和排序;定量法包含科學的研究設(shè)計、大量數(shù)據(jù)的采集和統(tǒng)計分析工作,例如采用Rasch 模型,計算每條描述語的相對難度進行定位[26]。1.0、2.0 和3.0 三個版本中文能力標準對描述語的等級劃分均采用的是直覺法和定性法,并未使用定量法。能力標準中對音節(jié)、漢字、詞匯和語法的量化指標,實質(zhì)只是定量描述。
“中文能力標準學術(shù)版”采用RSM模型估計每條描述語的難度值,并進行等級劃分,才真正突破了只定性不定量的模式。該方法可以使難度值量表具有等距性,從而使依據(jù)難度值所做的能力等級劃分具有更高的科學性。中文能力標準未來改進和完善的方向之一便是采用定量法對描述語進行難度等級的劃分。
對接指的是將兩個獨立的測量工具連接起來,包括量表與量表的對接、量表與考試的對接、考試與考試的對接[27]。語言能力量表之間之所以可以進行對接,一是量表作為標度本身具有可比性,二是“人的語言能力水平是可比的”[28]。語言能力是人類普遍具有的能力,跨語言的語言能力量表之間具有高度的相關(guān)性和顯著的穩(wěn)定性[29]。相同的語言任務(wù)在不同的語言中,其難度排序是大致相似的。因此,語言能力標準的描述語重點應(yīng)描述的是完成語言任務(wù)的能力,而不應(yīng)只是描述語言知識和語言技能。
“中文能力標準1.0 版”幾乎沒有描述“能做某事”的語言任務(wù),僅僅用掌握的字、詞、語法結(jié)構(gòu)的數(shù)量來定義能力水平,因此無法與國際接軌。“中文能力標準2.0 版”沒有科學定量的語言知識和技能描述,僅通過簡單的語言任務(wù)描述與CEFR 直接對接,學術(shù)性和科學性大打折扣。“中文能力標準3.0版”既沿襲了“can do”的語言任務(wù)描述方式,又調(diào)整了語言知識和語言技能的量化指標,體現(xiàn)了漢語的特性,提高了其學術(shù)權(quán)威性;未來應(yīng)與國際語言能力標準進行對接,以提高國際權(quán)威性。“中文能力標準學術(shù)版”的制定非常注重與CEFR 的掛鉤,不僅等級數(shù)目與CEFR 保持一致,還提供了詳細的描述語參數(shù)體系,尤其是描述語的難度值,這為兩個量表之間的換算關(guān)系提供了科學的統(tǒng)計基礎(chǔ)。
由于前三個版本的中文能力標準沒有描述語任務(wù)難度的數(shù)值估算數(shù)據(jù),因此本研究先通過對比語言知識的量化指標來分析不同版本能力標準的對接兼容關(guān)系。如表8 所示,從詞匯量來看,“中文能力標準學術(shù)版”各等級的詞匯量要求均是最高的;1.0版和3.0 版的詞匯量要求接近;2.0 版的詞匯量大大低于其他版本。雖然3.0版能力標準還沒有與CEFR進行對接,但從詞匯量化指標來看,CEFR 的A1 和A2級別要求589詞和1245詞,3.0版的一級和二級要求500詞和1272詞(參考表3),二者已十分相近。

表8 語言知識量化指標對比
從漢字量來看,3.0 版能力標準要求的漢字量在初等水平低于1.0版,高等水平高于1.0版,中等水平與1.0 版接近,說明3.0 版能力標準的漢字量化指標與1.0版接近,但覆蓋范圍更大。從語法掌握程度來看,3.0 版能力標準的要求遠低于1.0 版,尤其在中高等水平上。
國際中文能力標準的歷史發(fā)展分為三個階段:開創(chuàng)階段(1984 年-2008 年)、過渡階段(2009 年-2020 年)、系統(tǒng)化開始階段(2021 年開始)。這三個階段也見證了立足國內(nèi)的“對外漢語教學”轉(zhuǎn)變?yōu)樽呦蚴澜绲摹皣H漢語教育”,再由強調(diào)發(fā)展廣度的“國際漢語教育”進入重視深度的“國際中文教育”。學界對國際中文能力標準的研究也轉(zhuǎn)移到以來華留學學歷生的需求為主的層面,開始重視預(yù)科教育和本科入學的能力標準,強調(diào)學術(shù)漢語能力的重要性;并考慮制定國別化的中文能力標準,以適應(yīng)本土化的中文教學需求。
無論哪類中文能力標準的制定,都需要考慮以下三方面的問題:
第一,構(gòu)建中文能力標準的理論體系。語言能力問題是能力標準需要解決的首要問題,對語言能力結(jié)構(gòu)描寫的準確性,直接影響著語言能力量表的科學性和實用性。中文能力標準3.0 版在語言交際能力的框架下,融入了中文教學特點和中國文化特色,推進了國際中文能力標準理論特色化的進程。國家社科基金重大項目“漢語交際能力標準與測評研究”基于大漢語的視角,搭建適合于漢語作為母語的普通公民、少數(shù)民族、華人華僑和外國人的漢語交際能力標準,推進了中文能力標準的系統(tǒng)化進程。但目前各類能力標準對所依據(jù)的理論結(jié)構(gòu)均缺乏詳細的闡釋,未來應(yīng)綜合各學科的成果,豐富中文特色的語言能力結(jié)構(gòu)理論研究。
第二,建立描述語數(shù)據(jù)庫。描述語的功能一是橫向地評價語言使用者應(yīng)具備的能力類別和維度,二是縱向地定位語言使用者所處的語言能力水平。在挑選和修訂描述語時,應(yīng)遵循單維性、排他性、正向性的原則,在保證描述語表達準確和簡潔的前提下,建立足夠數(shù)量的具有區(qū)別性特征的描述語庫,并使用定性和定量相結(jié)合的方法,對描述語進行參數(shù)估計和等級劃分。未來希望能從方法和技術(shù)層面拓寬中文能力標準研究的途徑。
第三,展開對接機制研究。語言能力標準是總的綱領(lǐng),是語言教學、學習和測試研究的基礎(chǔ)。在統(tǒng)一標準的指導(dǎo)下,開發(fā)配套的測試工具和教學大綱,就需要使用測量統(tǒng)計技術(shù)來解決這些工具之間的連接問題。目前已存在許多中文能力測驗,這些根據(jù)不同需求開發(fā)的測驗,如何與標準進行對接使之具有可比性,如何與國際上的語言能力標準進行對接以提高國際權(quán)威性,均有待進一步研究。