楊惠中
《中國語言能力等級共同量表研究——理論、方法與實驗研究》終于在上個月由上海外語教育出版社出版,感謝外教社的支持和責編楊帆的辛苦工作。這是一本只有165頁的書,但是題目很大。是不是故意戴上去的大帽子呢?倒不是,因為里面說的都是實事,另外,我們對于這項研究態度是認真的。
建立我國語言能力等級共同量表在我國有著十分迫切而重要的現實意義。我國是語言教學大國,只說英語教學,全國每年學英語的人數以億萬計,各種類型的英語課程不計其數。有教學就有測試,于是也就有了各種外語測試項目,紛繁復雜,林林總總,不一而足。這種局面還有愈演愈烈之勢。由于我國一千三百年科舉考試的傳統,考試(包括教育考試)往往被看作是一種行政行為,而不是心理測量學范疇的獨立的學術行為。凡行政主管部門,只要一紙紅頭文件就可以啟動一項大規模考試,關起門來命題,試題未經預測就直接用于實際考試。在一般人的觀念中,凡教師都能命題,打個分數就是考試,只要采用多項選擇題,就是標準化考試。這樣做,如果考試的結果決定學生一生命運的話,后果可能是很嚴重的。
我國的考試,考生人數往往達到每年數十萬、數百萬、甚至上千萬,成為真正意義上的大規模考試。但是迄今為止,我國尚沒有統一的語言能力等級共同量表,語言教學和語言測試沒有共同的參照標準,甚至連等級的劃分也相當混亂,有的語言測試項目分為2個等級,有的分為5個等級,有的9個等級,有的則只分初、中、高3個等級。不同測試的等級劃分五花八門,不同測試報告的考生成績根本缺乏可比性,完全不便于用戶使用。這種缺乏統一尺度的做法,好比做買賣的都各自制作自己的磅秤,焉能不亂?對教學來說,沒有統一的參照標準也不便于課程的組織和銜接,很容易造成課程的重復設置,根本談不上外語教學實現“一條龍”。而且考試成績互不承認,學生只好一次次參加考試,徒增學生學業和考試負擔。語言測試領域亂象叢生,解決之道在哪里呢?我們認為,必須制定全國統一的語言能力等級量表,這是相當于“車同軌、量同衡”的大事。
國際上在這方面已有成熟的經驗,其中最具影響力的當是歐洲語言能力等級共同量表(CEFR)。歐盟目前有27個國家,使用20多種不同的語言,怎樣解決語言交際問題,在歐共體成立之初,成了促進一體化的重要課題。為此,歐洲委員會的語言政策部門(The Language Policy Division)提出了語言教學應當實現分級的要求,把漫長的語言教學過程劃分成若干個較小的、能獨立授予學分的單元,建立一個能得到歐洲各國相互承認和采用的共同的參照標準。自上世紀70年代以來就展開了歐洲語言能力共同量表的研究。經過二十多年的努力,最后形成了“歐洲語言能力等級共同量表”(CEFR)。歐洲語言能力等級共同量表共分六個等級(A1、A2、B1、B2、C1、C2),每個等級都有明白、準確的語言能力描述,不論何種語言,不論是英語、法語、還是德語,學生只要達到某個等級,例如B2級,所反映的是相同的語言能力水平,也就是說語言能力的解釋是統一的。這對于人員之間相互理解與溝通將會多么方便!CEFR自2001年11月發布以后,歐洲各國的語言教學和語言測試項目都實現了與CEFR的關聯,使考試的分數獲得統一的可解釋性,大大提高了語言教學和語言測試過程的透明度,對促進人員往來與交流起到了很好的作用。
看來,制定統一的語言能力等級量表是一項重要的基礎研究項目,涉及語言測試和語言教學的一切方面,與大綱設計、教學組織、教材開發、能力鑒定、甚至人才的合理使用無不密切相關。我們為此寫過文章,呼吁有關方面組織人力物力開展相關研究。大概因為這樣的研究未必能迅速帶來看得見的“價值”,故遲遲未見動靜。我們幾位從事語言測試研究的普通工作者不免內心焦急,打算自己啟動前期研究,正在這時候上海師范大學的方緒軍老師來上海交通大學應用語言學博士后流動站進行博士后研究,他的加入加強了我們開展這項重要研究的決心和力量。方緒軍博士長期從事對外漢語教學,在漢語水平考試方面也有豐富的實踐經驗,于是決定以語言能力等級量表作為研究方向,申請國家社科基金項目資助。幸運的是,申請很快得到了批準并立項。在整個研究過程中朱正才負責實驗設計與數據分析,方緒軍則在資料整理、文獻分析、數據整理、報告起草等方面做了大量扎實的研究工作。現在,方緒軍的博士后研究早已以優異成績順利完成,社科基金項目也早已經過鑒定結項,作為項目成果的《中國語言能力等級共同量表研究——理論、方法與實驗研究》一書終于出版,這些都是值得高興的。
考慮到研究經費一共只有區區幾萬元,只好集中力量,著眼在最重要的方面。于是課題組決定把研究重點放在制定我國統一的語言能力等級共同量表的理論、原則和方法上。我國現行的許多考試,對于語言能力的描述往往缺乏語言學的理論框架,對于等級的劃分也缺乏心理測量學的支持,現有的一些量表或大綱在描述語言能力或設計考試分數體系方面存在經驗性、相對性和任意性的問題。制定語言能力等級量表,必須立足于一定的理論基礎和科學依據之上。課題組在全面分析文獻的基礎上,決定采用交際語言能力的理論模型作為制定我國統一的語言能力等級量表的語言學理論框架,采用定性和定量相結合的方法,對語言能力進行描述,整理和設計了一套“能做”描述語,對語言能力的各方面進行了分層次、分等級的描述。我們認為一套完善的語言能力描述語是語言測試和語言教學的基本操作工具,是語言能力理論的具體體現,將為語言測試和語言教學提供基本框架。
制定我國語言能力等級量表的工作不是紙上談兵,所提出的理論、原則和方法以及具體的描述語是否具有可操作性,需要進行大規模調查實驗來證明,這樣的研究就是效度研究。由于條件限制,課題組決定采用上述原則和方法,對英語口語能力的描述和分級進行一次大規模實驗研究,以驗證其科學性和可行性,作為建立我國語言能力等級共同量表的一種先行性嘗試。
課題組根據口語交際活動的特征,分不同的參數層級建立了一個包括65條描述語的中國學生英語口語能力描述語庫。實證研究的操作是組織相當數量的有經驗的教師,提供10位學生口語考試的實際視頻樣本,這些考生的能力必須覆蓋設計中的能力量表的口語能力全距,請有經驗的教師根據所提供的描述語對考生的口語能力水平逐條進行評價或描述。研究工作量很大。
本次調查研究得到了全國15所大學的大力支持,共有183位有豐富教學經驗的教師參加了調查,一共生成了1830組數據,為本項研究的數據分析提供了堅實基礎。通過對數據進行因子分析得到三個顯著性突出的公因子,考察各因子所概括的具體描述語,發現這些描述語大體是從“語言使用的準確性和豐富性”和“口語交際的有效性”這兩個側面來描述和評價口語能力水平的,這些描述語都涉及使用話語參與或完成交際任務的有效程度,證明這些描述語能夠充分準確地反映學生的英語口語能力。另外,聚類分析證實:65條描述語所描述的全部被試的口語能力水平,就本項研究所涉及的考生能力范圍而言,可以劃分為4個等距的能力等級。調查分析的數據為語言能力的等級劃分提供了依據。
語言測試研究中最困難的部分是實證研究,研究結果是否有效,完全取決于參加者是否認真,規模越大越難保證研究的質量。這次研究規模比較大,但是數據檢驗證明參加實驗研究的老師都非常認真。實驗結果證明,本項研究所提出的理論和原則是有效的,方法是可行的,可以在將來開展大規模研究時采用。我們對于參加研究的學校和老師由衷地表示感謝,由于經費拮據,課題組無法為參加實驗工作的老師提供分文報酬,連勞務費也沒法支付。這些學校和老師在了解本項研究的重要性后,完全是出于對教育事業的奉獻精神,認真地完成了工作。現在書出版了,我們將向每位參加實證研究的老師贈送一本,謹以此略表謝意。
這里想到一個問題:在當前商業大潮沖擊下,語言測試被炒作為一個火紅的“產業”,一個牽動人心的社會鏈接。它們既有許多利益相關者,還有更多的對英語賦予了許多附加值的社會關心者。
有人說,搞語言測試是利益驅動。這樣說不對。搞語言測試只有風險,因為語言測試工作者處在矛盾沖突的交匯點上,他們的職業道德要求他們兢兢業業、恪盡職守,“精心設計、精心組織、精心施考”,但是他們的權益卻很難得到保障。一方面,考試的專業質量越高,越可能被社會廣泛使用而被賦于極大的社會權重,并由此產生巨大的他們無法控制的商業利益,這一切都對語言測試工作者造成壓力,甚至使他們處于危險境地;另一方面,也是因為普通公眾并不了解語言測試是一項高度專業性的工作。要說利益,恐怕只有編寫出版模擬試題集可以迅速牟利,但是這種東西只是樣子像多項選擇題,跟標準化考試風馬牛不相及,拿來考試毫無用處,拿來教學完全無助于提高學生語言能力,相反只會坑害學生,完全是教育領域中的偽劣商品。嚴肅的語言測試工作者都有道德規范進行自律,從來不去編寫出版模擬試題集之類的東西去輕松牟利。因此可以說,在我國目前的實際情況下,語言測試是一項專業要求高、風險大、零“回報”的工作,沒有這個思想準備的人,并不適合從事專門的語言測試工作。
制定我國語言能力等級共同量表是一項浩大的工程,不是幾個人的綿薄之力就能完成的,必須從實際出發,考慮我國目前語言教學和測試實際需求的迫切性和可行性,協調各不同語種、不同規模、不同層次的教學和測試機構,組織全國有關力量,才能實現制定全國語言能力等級共同量表這一總目標。我們所做的只是前期的先行性研究。
把考試看作一種行政行為而不是學術行為的后果是政學不分(也是一種政企不分的表現),考試的用戶和考試的組織者合而為一,缺乏社會監督。其實考試僅僅是一種測量工具,是一種專業性服務。教育考試是實現教育公平公正的社會道德底線,為此必須保證教育考試的專業質量。把大規模考試的實踐從行政行為轉變為學術行為,最好的辦法是承認考試的心理測量學與教育測量學的專業性質,成立非盈利的專業機構,聚集專業人才,潛心進行研究,來從事各種考試項目的設計、開發與實施,保證考試的專業質量,供社會使用。政府部門則起監管作用,政府的行政力量應用來制定并頒布“教育測量與心理測量國家標準”,制定并頒布“中國語言能力等級共同量表”,制定并頒布教育考試法以保護語言測試工作者的權益和考試知識產權、對考試結果的正確使用進行監管等等。這些重要措施都將有利于教育考試事業的健康發展,最終造福千百萬莘莘學子。
這是我們的愿望和期盼。