王漢衛,黃海峰,楊萬兵
(1.2.3.暨南大學華文學院/暨南大學華文教育研究院)
隨著漢語作為第二語言教學的升溫,漢語水平考試種類增多是必然的。上世紀80年代以來,國內外推出了一系列漢語 (中文、華語文、中國語)作為第二語言的大型標準化水平考試。從日本舉辦的 “中國語檢定”,北京語言大學舉辦的漢語水平考試 (HSK)、教育部舉辦的中國少數民族漢語水平等級考試(MHK)、美國舉辦的AP中文考試、臺灣地區舉辦的華語文能力測驗 (CPT),一直到中國國家漢辦推出的新HSK系列,北京語言大學的HSK改進版系列和實用漢語水平認定考試(C.TEST),以及最近教育部和國家語委聯合推出的漢語口語水平測試 (HKC)等。
既然已經有這么多 “測試”,為什么還要推出 “華文水平測試” (以下簡稱 “華測”,字母縮寫HSC)?在進入本文的主體部分之前,這是我們必須回答的問題。
縱觀漢語水平考試的發展和類型,迄今為止,無論國內外,除了中國少數民族漢語水平等級考試 (MHK),幾乎所有考試都只以 “漢語作為第二語言”為考生的語言身份限制,理論上這會帶來一些問題,事實上也的確如此(陳宏,1995;任杰等,2002)。正如中國國內的少數民族跟一般意義上的漢語二語者有著巨大的差異一樣,因為歷史和現實的原因,大量的華人和海外華人社區也給 “外國人”這個概念在語言上的同質性帶來巨大的挑戰。上世紀90年代以前,東南亞的華文教育尚未復蘇,西方發達國家的新華人移民圈也尚未成熟,然而近年來這兩方面的情況都發生了巨大的變化,華測正是適應這個變化而做出的積極舉措。
語言,不僅是交際的工具,更是文化認同、民族認同、身份認同的工具。一般外國人學習漢語,通常僅僅是把漢語作為交際工具來學習使用的。相應的, “對外漢語教學”的主要屬性也是交際工具的教學。而 “華文”之于海外華裔,則不僅是交際工具,更是文化認同和民族認同的工具,這正是華文教育的初衷(郭熙,2012:233)。簡言之, “對外漢語教學”跟 “華文教育”是性質不同的兩種教學,理所當然,應該有專屬于自己的考試,否則,就不能形成完整的 “華文教育”體系。
測試具有強烈的后效作用,也是實踐上的教學指揮棒。華測的推出,從測試理論上是對同質性問題的關注,從測試實踐上是對海外華裔這個巨大的語言文化群體的關注,是對考教關系的關注。華測并不僅僅是一個考試,同時也關乎漢語/華文教學和漢語/華文測試的全局性。研發針對海外華裔的 “華測”,將會成為“漢考”史上繼中國少數民族漢語水平等級考試 (MHK)之后的一個里程碑式的發展,對“漢考”的理論和種類,對 “漢教”的理論和模式,都將起到重要的推進作用 (王漢衛,2009)。
陳宏 (1996)談到過這樣一個問題: “北京語言學院漢語水平考試中心在向海外推行漢語水平考試 (以下簡稱HSK)時,經常會遇到一些漢語教師問到這樣的問題:獲取HSK各級證書的考生,其漢語能力分別相當于哪一水平的以漢語為母語者?”并且認為這是HSK所不能回答的問題。
HSK不能回答這個問題,這是由它的性質決定的。HSK有常模參照的成分——它的常模是由典型的來華留學生構成的;HSK又以目標參照為基礎——它有基于和面向留學生的 《漢語水平等級標準》等明確的大綱 (劉英林等,1988;劉英林,1994;張凱,1995;謝小慶,1995;劉鐮力,1999)。這樣,HSK的外部效度就當然 “不可能伸張得那么大”了 (陳宏,1996)。
我們同意這樣的觀點, “目標參照本身就隱含著常模,常模參照也能折射出目標參照的影子” (劉英林,1994)。標準參照離不開常模,問題的關鍵是常模的性質——是零起點來華留學生的常模,還是母語者的、千百年累積下來的常模。以后者為常模得出的常用字、常用詞、基本語法點、基本文化點等等就是漢語的標準,而且這是早已確立的標準。比如我們說某某 “小學文化”,就語文能力來說,即意指某某具有一般小學生的讀寫能力,而 “一般小學生”就是母語者的常模, “一般小學生的讀寫能力”就是母語者的讀寫標準。這個標準量化為數字就是:識字量、寫字量、讀懂詞匯、使用詞匯、閱讀速度、寫字速度、寫作速度……
語言能力的終極標準只能從母語者那里去尋找,而一旦找到了這個標準,譬如一把尺子,不分高個兒、矮個兒,不管對誰都是適用的。也就是說,以母語者常模為標準,即可回答二語者和母語者語言水平的關系。
仍然以尺子為例,拿一把以 “米”為最小單位的尺子顯然不適合測量人的身高,而拿一把直尺去測 “三圍”也勉為其難。回到語言測試上來,一方面堅持參考母語者標準 (尺子),一方面根據被試的特點開發出相應精度、風格、用途的測試 (直尺、角尺、皮尺等),我們就能衡量任何二語者,回答其漢語水平相當于什么程度的母語者。
華測需要的是結合海外華語的實踐,參考、研究、調整漢語母語標準,最終確立華測的標準,這個標準是跟 “母語者水平”掛鉤的,在此基礎上,基于華測的成績就可以回答跟漢語母語者的關系這個問題了。
“獲取HSK各級證書的考生,其漢語能力分別相當于哪一水平的以漢語為母語者?”這也許不是一般外國人關心的問題,但卻必然是海外華人社會關心的問題。
從歷史以及現實來看,海外華裔,成年移民者自然擁有母語者的水平,海外出生的第一代移民后裔,通常也保持了較好的漢語 (華文)水平,一般來說,移民的時間越久,后裔的華文水平就越差,最終失去了跟中國的聯系,嚴重的甚至丟失了自己的華人身份。
顯然,華文是海外華裔跟祖籍國相互認同的重要憑證,想知道自己的漢語水平相當于什么程度的漢語母語者,這既是情感的需要,也是理智的需要。對華測來說,滿足這個需要,這幾乎是最本質的學術追求。
經過上文的討論,華測的參照性質可以表述如下:以漢語母語者標準為基礎,以典型華裔為常模對母語者標準進行調校,最終得到“華語標準”。這個標準就是華測的參照目標,典型華裔就是華測的參照常模。下文我們對這個參照做一點具體的解釋。
首先,因為海外華人社會久遠的歷史 (以東南亞華人社會為主體),某種程度上, “華語”已經成為海外華人社會的 “標準語言”。另外,過去幾十年間華語文教學在東南亞曾有過斷層,以及第一語言和第二語言的掌握要求本來就存在差異等因素的綜合影響,堅持完全意義上的漢語母語者標準是行不通,也是沒有必要的。然而,母語者標準的存在又是非常必要的,沒有這個標準, “華語文”的標準將不知所云,華測也將在很大程度上喪失它應有的意義和功能。所以,我們必須制定和執行一個低于漢語母語者而高于一般二語者的參照標準,即華語標準。
獲取華語標準不是一件容易的事。海外華人社會語言狀況復雜,如何求取一個能夠基本代表海外華人社會現有最大語言共核的常模水平,這是非常棘手的問題。穩健的解決方案是盡可能多地選取一些代表性的 “點”,描寫其語言變異和語言能力變異的基本情況,對照標準漢語,找到變異程度上的平衡點。另一種較為積極同時也可能更可行的方案是走大膽假設,小心求證,以測校測,逐漸完善的開發路線 (謝小慶,2010)。
總之,只有將 “華測”建設成母語標準參照性質 (或者說更多地具有該性質),才能使自己的 “解釋”具有理論效度。
從英語以及漢語的測試實踐上看,把聽力和閱讀捆綁測試,是習慣的做法。所謂 “捆綁測試”有兩方面的實際表現:一是聽力和閱讀作為一張試卷、一次考試;二是聽力考試中含有閱讀的成分 (閱讀選擇項)。
“捆綁測試”的理由有兩個:一是聽力和閱讀都是輸入性的能力;二是聽力和閱讀考試采用的都是客觀性試題,便于評分和試題分析。
我們認為華測應該在這個問題上做出新的探索。首先,從語言習得上看,聽和說是更接近自然習得的能力,而讀和寫無論對母語者還是二語者來說,都是專門學習的結果。其次,華裔的特點是盡管有全日制、半日制華校的存在,但習得方式的差異、聽說讀寫能力的失衡是一種普遍的客觀情況。有鑒于此,我們不主張聽力和閱讀的 “捆綁測試”,而要為其徹底“松綁”。
徹底 “松綁”并不意味著同一個級別的考試要參加聽、說、讀、寫四次考試,考試有極強的實踐性,這就決定了考試必須顧及它的可操作性,盡可能為用戶提供方便。聽和說屬于一個類型——自然習得類,讀和寫屬于一個類型——專門學得類,前者總體屬于口語能力,后者總體屬于書面能力。可以把聽、說合并為一個考試,讀、寫合并為一個考試。
這樣的測試設計能體現語言的認知過程和特點,也滿足交際性語言測試的需要。從語言測試理論的發展來看,交際性語言測試是未來的發展趨勢。聽說、讀寫的測試設計體現了語言的習得屬性、功能屬性,也符合交際性語言測試的發展方向。
就母語的發展來說,一般情況下,學齡前是聽說能力的迅速發展期,學齡后到小學畢業,是讀寫能力的迅速發展期,當然,這一階段的聽說能力、特別是說話的能力也隨著認知能力的提高和知識面的拓寬而提高。進入初中以后,母語能力的發展就更主要的表現為隨著知識面的拓寬而帶來的詞匯量的增加、讀寫能力的增強,以及跟專業知識關聯的聽說能力的提高。
從出生到小學畢業是一段較長的時期,也是基本的母語言能力逐漸成型的時期。因此,如果華測的分級體系和分數試圖跟母語者關聯,就必須重視這一階段的分級。更明確地說,華測的整個分級體系應該主要表現為跟這一階段的對應,而初中以后則宜大而化之。
華測的縱向結構和分級體系初步描寫如下:
1級 (入門級)——入讀小學的華語文能力。
2級 (基礎級)——小學2年級的華語文能力。
3級 (提高級)——小學4年級的華語文能力。
4級 (初通級)——小學畢業的華語文能力。
5級 (熟練級)——初中畢業的華語文能力。
6級 (母語級)——高中畢業的華語文能力。
這里需要解決三個問題:
問題1:如何從不同層級的母語者那里抽取較為純粹的漢語能力。
問題2:如何從不同層級的母語者那里抽取較為核心的漢語能力。
問題3:如何建立適應于自然語言發展(即隨著認知能力的發展而發展)的測試內容。
這是三個相互關聯的問題。所謂 “較為純粹的漢語能力”是指使用漢語的能力,而非關于漢語的能力。所謂 “較為核心的漢語能力”是指能夠滿足 “使用”,而非滿足“規范”的漢語能力。如果強調 “普通話”的規范,帶濃厚方言味道的 “母語者”的能力等級就很難樂觀了,我們必須找到理論和方法,使測試結果可接受、有意義、合情合理,這就必然涉及到 “標準”的再討論、再認定——即華語化 (詳見下文)。至于問題3,這是一個嚴峻的問題,HSK的測試實踐還沒有在同一個系列的考試上明確體現協調認知能力的發展跟語言能力的發展,這方面還有很多問題需要解決。
在語言測試領域, “標準”至少有兩方面的含義:第一,正誤判斷的依據,即 “規范”;第二,等級評價的依據,即能力表現的描寫。
對于一般漢語作為第二語言的考試來說,規范意義上的標準,即什么是對,什么是錯,依據的是國家的語言文字規范,這不是考試設計者有資質表述的問題,考試設計者需要做的是在 “規范”的框架下進一步制定考試 “大綱”而已。
華測則不同。關于 “華語”、 “華文”,學術界對于這兩個概念的內涵和外延還缺乏充分的描寫。以 《現代漢語詞典》為例,1965年的試用本未收入 “華語”、 “華文”,第1版收錄“華語”,而 “華文”則直到1996的修訂本才登錄 (郭熙,2007)。至于這兩個詞條的解釋,從最早出現直到今天都仍然是 “華文:指中文”; “華語:指漢語” (《現代漢語詞典》第6版第557頁)。顯然,學術界對華語文的認識還不深入。
華測對華語文基本面貌的描寫和基于描寫的規范性工作既責無旁貸,也無可回避,這將涉及到語音、詞匯、語法、語用等諸多方面。只有經過這樣的工作,海外華裔的 “華語文”能力才能得到符合其身份的鑒定,這也是華測“標準”建設的重中之重。
“規范”直接關聯到評價,但主觀題的評價還涉及到 “標準”的第二層含義,即 “能力表現的描寫”,以前的漢語水平考試對能力等級標準的描寫有失籠統。例如HSK高等口試的標準:
“5級:內容充實,能用語音語調較純正的普通話得體流利地表達思想。詞匯豐富,使用恰當。能比較形象、生動地描寫事物,語氣自然。語法結構清楚,能較熟練地使用漢語中常用的口語句式,并能根據交際需要變換句式和說法。有極個別語音語法錯誤,但不影響交際。口語表達接近以漢語為母語者。” (劉鐮力等,1994:30)
華測不能滿足于這樣的等級標準。事實上,即便是主觀性試題,只要我們的基礎研究足夠到位,也仍然可以提出一系列量化的評價標準。例如針對口語可以數字化的標準至少有語速、句長、用詞量、用詞等級、重復次數、中斷次數、中斷時長……量化標準即意味著有效降低評價的主觀性,從而使評分者信度得以增強。
如何構擬漢語作為第二語言能力的標準,既有專文探討 (王佶旻,2012),更有HSK二十幾年的摸索,至于華語文能力的標準問題,一切尚待開始。結合上文的討論,華測至少需要以下的基礎性工作來構建它的 “標準”系統,來支撐其最基本的運作。
· 華語語音標準及語音大綱
· 華語詞匯標準及詞匯大綱
· 華語漢字標準及漢字大綱
· 華語語法標準及語法大綱
· 華測功能、話題大綱
· 中華傳統文化大綱
· 華語聽力能力等級標準
· 華語口語能力等級標準
· 華語閱讀能力等級標準
· 華語寫作能力等級標準
這樣,至少有10個屬于華測自己的標準性基礎文件需要建設,它們是華測構建的核心要素,是華測主體面貌之由來。
相較于一般作為第二語言的漢語測試,華測內容上必須更多地融入文化因素,當然也必須是適當地,不能喧文化這個 “賓”而奪語言這個 “主”。至于如何 “融入”,這是進一步的問題,尚待研究解決。除了文化問題,漢字也是華測必須突出的一個內容。
幾十年來,對外漢語教學一直重聽說,漢語水平測試自然與漢語教學相輔相成。相比較而言,重聽說的教學和測試模式更適合非華裔,而對于華裔,讀寫 (特別是寫)則無論對個人還是對整個華人社會都有著至關重要的意義。
“寫”的重要、 “文”的意義,有社會語言學者早已經注意到這一點,面對新加坡的“講華語運動”,陳松岑等 (1999)有過這樣的論述: “如果只推廣華語而不提倡華文,不但用華語來繼承傳統文化的愿望會落空,華語的使用價值將進一步下降而逐漸被英語所取代,新加坡將變成完全西化的社會,新加坡的華族事實上也將不再是真正的 ‘華族’了。” 王漢衛 (2012:18)也認為: “民俗文化可算是相對最持久的祖籍國特征,比文化難于保持的是語言,比語言更難于保持的是文字。反過來,華人身份的流失,首先是從漢字開始的。”
所以,華測一方面要照顧現實,徹底把聽說跟讀寫分開,另一方面更要引領未來,在讀寫測試中強化漢字的價值。總之,開發對促進漢字讀寫有強力反撥作用的測試,是華文測試的特征和使命。
為此,必須開發出一些新題型和新的測試方式,這方面我們已經有了初步的嘗試 (王漢衛,2012;楊萬兵等,2012),但還遠遠不夠,更多能夠突出華測特點的相關題型尚待開發。
測量總是首先基于理論的,理論效度是測量的基礎,華測就是建立在華裔不同于一般意義上的外國人 (指語言狀況)這一基本理論上的。早在十幾年前,陳宏 (1995)從測試實踐中發現了HSK跟 “中國背景”的不適應,發出了事實上的華測第一聲。
總結上文,華測的總體特點和性質可以歸結為以下幾點:
第一,它是標準參照加常模參照 (這一點跟HSK沒有不同,不同之處在于以下幾點)。
第二,它參照的語言標準是基于母語標準的華語標準。
第三,它參照的語言能力標準是基于母語標準的華語能力。
第四,它的常模是以漢語為準第一語言的海外華裔,是具有典型性的華裔群體。
第五,它有不同于以往的橫向和縱向的宏觀結構,該結構既有針對性也有導向性。
第六,它有突出文化和漢字的微觀特征。
上面6點即為華測的基本面貌,然而世界上不存在為測量的測量,華測應不應舉辦、該不該推出,除了取決于華測的面貌,更跟基于華測能做出什么決策密切相關。
測量總是跟決策相關、決策總是跟后效相關 (張凱,2002:159)。評價一個測量好不好,信、效度等指標固然重要,這是它的科學本質,但更重要的是看它能引起 (引起了)什么樣的決策和后效。華測,因為它的性質,也因為它的測試對象的不同,基于它的決策至少有以下幾點,它跟HSK系列的考試有所不同,可以形成互補:
(1)監測海外華人社會華語文現狀、變遷的依據;
(2)海外通用華文教材的編寫依據;
(3)海外華裔中小學生華文學習的階段性檢驗標準;
(4)海外華裔入讀當地各級華校的華語文標準;
(5)海外華裔入讀中國各級學校的華語文標準;
(6)海外成年華裔華語文水平的檢驗標準;
(7)中國國家各直屬、隸屬機關、企事業單位選拔、錄取、錄用、獎勵海外華裔的語言依據;
(8)海外高校中文系的入學檢驗標準;
(9)華人所在國政府選拔、錄取、錄用、獎勵華裔的華語文依據。
至于因決策而帶來的后效,以及基于華測的內容、標準等不同于以往而帶來的后效,不再贅言,但可以預期的是,基于華測的反撥作用,將會出現更加多樣、也更加積極的教學模式和效果,海外華人更多的華語文學習熱情和行動也有理由值得期待。
陳 宏 1995 關于考生團體異質程度對HSK(初中等)信度的影響[A].漢語水平考試研究論文集[C].北京:現代出版社.
———1996第二語言能力結構研究回顧[J].世界漢語教學(2).
陳松岑,徐大明,譚慧敏 1999 新加坡華人的語言態度和語言使用情況的研究報告[A].李如龍(主編),東南亞華人語言研究[C].北京:北京語言文化大學出版社.
郭 熙 2007 以“國、中、漢、華、唐”為上字的詞與社會認同建構[J].語言教學與研究(4).
———2012華語研究錄[M].北京:商務印書館.
劉鐮力 1999 中國漢語水平考試(HSK)的等級體制[J].世界漢語教學(3).
劉鐮力,李 明,宋紹周 1994 高等漢語水平考試的設計原則和試卷構成[J].語言教學與研究(1).
劉英林 1994 高等漢語水平考試的總體設計與理論思考[J].語言文字應用(1).
劉英林,郭樹軍,王志芳 1988 漢語水平考試(HSK)的性質和特點[J].世界漢語教學(2).
任 杰,謝小慶 2002 中國少數民族考生與外國考生HSK成績的公平性分析[J].心理學報(2).
王漢衛 2009 論華語測試的三個基石[J].暨南大學華文學院學報(1).
———2012華語測試中的閱讀研究[M].北京:北京大學出版社.
王佶旻 2012 制定漢語作為第二語言的能力標準的初步構想[J].語言文字應用(1).
謝小慶 1995 漢語水平考試的分數體系[A].北京語言學院漢語水平考試中心(編),首屆漢語考試國際學術討論會論文選[C].北京:北京語言學院出版社.
———2010談語言能力測驗開發的路線圖[J].考試研究(1).
楊萬兵,文 雁 2012 初級漢語半聽力與全聽力測試對比實驗研究[J].語言文字應用(3).
張 凱1995標準參照性的語言能力測驗——兼論HSK的參照性質[A].北京語言學院漢語水平考試中心(編)漢語水平考試研究論文選[C].北京:現代出版社.
———2002語言測驗理論與實踐[M].北京:北京語言文化大學出版社.