【摘 要】影響語言測試的發展是多方面的,諸如語言學、心理學及測量技術的發展等,都以不同的程度影響語言測試的發展。但隨著對語言測試的深入研究發現:在影響語言測試的諸多方面中,往往是經濟和政治等社會因素而非測量理論和技術推動語言測試的革新。語言測試具有社會性,對它的研究不能脫離具體的社會環境。本文將以T0EFL考試為例,探析語言測試的社會性。
【關鍵詞】語言測試 社會因素 T0EFL考試
一、引言
現代語言測試發展至今已有幾十年歷史,在其發展過程中,它從語言學、語言教學法和學習理論取得科學內容,從心理測量學獲得手段,逐漸發展成為一門跨學科的綜合性科學。語言測試與語言學理論息息相關,人們的語言觀不同語言測試的方法也不盡相同。語言測試大致歷經三個變化時期:(1)前科學時期(1960年以前),主要采用短文寫作—翻譯法;(2)心理測量—結構主義時期(以1961年Robert Lado發表“語言測試”一文為轉折點);(3)心理語言學和社會學時期(上世紀七十年代中期開始)。語言測試與教學關系緊密,語言教學是第一性的,語言測試是第二性的(楊惠中,1999)。我國對于語言測試的研究進十年來主要集中在6個主要方面——測試信度、效度、測試類型、題型、測試的反撥作用、測試問題與改革等;研究方法以非材料性研究為主實證性研究為輔,研究內容層面存在不足,對學習主體——受試者的研究不夠(蔣顯菊,2007)。除此之外,我們不能忽視這樣一個問題:任何語言測試的研發、實施都在一定的社會背景下進行并受到來自該社會的經濟和文化的影響。探尋語言測試起源不難看出,從語言測試誕生開始就沒有脫離社會因素的影響。隨著對語言測試的深入研究發現,在影響語言測試發展的方方面面中,往往是經濟和政治等社會因素而非測量理論和技術推動語言測試的革新。語言測試具有社會性,對它的研究不能脫離具體的社會環境。當前,國際語言測試的重點也轉向語言測試的社會運用。在國內也有一些學者如張寶昆(1999)、吳宗潔(2004)、楊惠中、桂詩春(2007)張榮建,曾文武(2007)等都從不同層面關注語言測試的社會問題。本文擬從分析語言測試的社會性入手,探析TOEFL考試全貌,闡釋社會因素如何制約語言測試。
二、語言測試的社會性
1.測試、語言測試
測量(measurement)、測試(test)、評估(evaluation)、常常被看作是同一概念,事實上,他們之間是有區別的。Bachman(1999:18-23)對此作出解釋:“測量是根據明確的程序和規則量化研究對象特征的過程”;“測試是一種測量手段,用以獲取某些行為的方法,其目的是從這些行為中推斷出個人具有的某些特征(Carroll 1968:46)”。與測量不同的是,考試是一種具體的、為獲取某一行為樣本而量身定做的定性分析方法。評估則為“為決策而系統地收集信息的過程(Weiss, 1972)”。所以測試被包括在測量的范圍并為評估服務。語言測試的目的是:(1)為教育過程中的重要決策提供信息服務;(2)作為評價語言能力、二語習得能力及語言教學的重要指針(Bachman(1999:54))。以上是關于測試及語言測試的概念分析。
2.測試的歷史
語言測試與語言教學的關系毋須贅述,語言教學是第一性的,語言測試為語言教學服務。除此之外,我們應該看到:教學本身是一種社會活動,服務于它的測試行為就不可能脫離社會因素的制約。考試是在特定的社會環境中發生的,語言測試從誕生起就烙上社會的痕跡。語言測試的歷史淵源似乎可以追溯到《圣經·舊約全書》之《士師記》第l2章的一個故事:兩個閃族部落——以法蓮人(Ephraimites)和基列人(Gileadites)之間發生大戰,基列人打敗了以法蓮人,基列人隨后把守約旦河的渡口以抓獲潰逃的以法蓮人。崗哨命令欲過河的每個人說shibboleth這個字,此字在希伯來方言中的意思是“谷穗”(也有學者認為是“河流”之意)。以法蓮人的語音系統中沒有sh/∫/這個音素,而會把sh發成/s/,于是,發錯了這個音的人就被基列人崗哨識別為敵人而被殺掉,一共有42,000人被殺(Judges 12:4-6)。從這一記載中我們看到:語言測試起初與教學似乎并無任何聯系而是服務于一種政治目的。現代客觀語言測試出現在這樣的背景:考試分數的威力與效益。智力測試可以用來測試特殊的認知能力和普遍智力。它首先出現在 1920年代的美國,從20世紀20年代到 30年代,心理測量方法鼓勵并大量使用客觀測試技巧,表現在語言測試上主要是書面語測試。20世紀50年代起,客觀測試風靡全球。心理測試在一戰期間成為客觀測試的主要驅動力。最早開始客觀標準測試研究的是Thomdike,他于1904出版了一本關于社會科學和教育中測量問題,主要研究了測試中的衡量單位(unit of measurement)。1912年,他的學生開發了寫作測試的標準,提供了比較判斷的范例,這標志著客觀語言能力測試邁出重要的第一步。1913年,研究語言測試的委員會的成立,由 the Association of Modem Language Teachers of the Middle States of Maryland指定,開發了法語、德語和西班牙語的聽說測試,其目標之一就是找到測量中的統一模式(uniformity)。隨后,1920年,大多數州立大學開教育測試課程。1925年,美國大學入學考試委員會 (The College Entrance Examination Board)希望普林斯頓的 Brigham設計學業能力測試(SAT,Scholastic Aptitude Test )。現代語言測試從此開始它的歷程并在美國流行開來。
3.語言測試的社會特征
語言測試的兩個功能:一是教學測試,它為教學服務;二是資格測試,主要用于選拔等為社會服務。語言測試的社會、政治目的使我們帶著批評的眼光看待語言測試。Michel Foucault在他的著作——《監視與懲治:罪惡的開始》中的第三部分論述到:“考試提供一種范式、一種監控,使選拔、分類及懲治成為可能(1975:186-187)”,考試事實上是權力與學術的有機統一。所以,語言測試的目的本是提供一種科學的測試工具,對學生語言能力進行客觀、準確、公正的評價,反映教學并為教學服務,而事實上,作為一種社會活動,語言測試有其深刻社會目的。自中世紀以來,語言的教學測試和選拔測試就一直交融在一起。在法國,正規考試常被用于選拔人才及對教育過程中的監控,當然,這些思想都源于中國悠久的考試歷史。中國是考試的故鄉,一千三百多年前的科舉考試杜絕了腐敗的發生,又使國人享有平等為官的權利,考試的社會作用不言而喻。
語言測試性具有社會性,對于大規模的語言測試社會性就越高。一項好的測試不僅涉及考試的研發,而且要考慮其社會的影響力。大規模考試的社會性必然帶來如何對待考試的問題,也就是考試的正確使用和誤用。在我國主要的、大規模的語言考試有:公共英語等級考試體系(Public English Test System, PETS),大學英語四、六級考試(College English Test ,CET)和英語專業四、八級考試(Test for English Major, TEM)。PETS的目標和宗旨是:(1)建立一個覆蓋不同層次需要的,擁有無個級別的目標參照性英語考試體系;(2)完善各種考查手段,確保個級別都能考查考生的聽說讀寫能力;(3)根據我國英語教學及社會發展的需要,設置各級評價標準等。CET和TEM分別由全國大學英語四、六級考試委員會和全國高等院校專業委員會主持開發、設計和實施的全國性考試。考試的目的在于檢查已修完所規定課程是否達到相應的教學大綱所規定的各項目標,考試的任務是對考生語言能力進行科學、客觀的、公正的鑒定并為教學的改革服務。然而在現實中,上述考試已經成為各級人事部門錄用大學畢業生的標準之一,這就使其帶有一定的功利性,這就是其社會性的表現。
關注語言測試的社會性還可以從另一方面得以論證。綜觀測試的改革與變化,人們幾乎可以總結出這樣一條規律:“改革為先,研究于后”,測試的改革往往是政治因素促成的而非測試的理論和技術。從英國的普通教育證書、托福考試、多項選擇題的采用及基于學校日常教學的評估到等級評分,都可以證明不是研究引起改革,而是先有改革才有相應的測試研究。
三、T0EFL考試
1.基本情況
TOEFL(Test of English as a Foreign Language,作為外語的英語考試)是由美國教育考試服務處(Educational Testing Service)舉辦的為申請去美國或加拿大等國家上大學或入研究生院學習的非英語國家學生提供的一種英語水平考試。美國教育考試服務處從1965年開始承辦此項考試的管理工作。全球170多個國家和地區共設立了1700多個T0FFL考試中心。至今為止,美國和加拿大共有2300多所院校規定,凡是外國學生申請到該校入學學習的,必須提供T0FFL,GRE,GMAT或TSE的某一項或兩項標準化考試證明,只有達到學校所要求成績的報考者,才能取得入學和申請獎學金的資格。除了美國、加拿大等大部分國家的高等院校外,歐洲(如英國)、大洋洲(如澳大利亞、新西蘭)以及東南亞一些國家和地區也都已承認T0EFL考試成績。近幾年來,國內的聯合國駐華機構和外企及合資企業在望聘錄用職員時,或國際基金組織在測試職員的英語水平時,也都采用T0FFL考試成績。1981年,托福考試進入中國,每年成千上萬人參考。T0FFL考試已真正成為一項規模浩大的國際性考試。
2.T0EFL考試的形成與發展
至1960年開始,現代語言測試在美國已經發展至成熟階段,同時它也開始從一貫強調語言測試的客觀性和追求測量技術的可靠性轉向以一種較為平衡的方法測量外國人的英語水平。二戰以后,密執安大學的Ann Arbor聯手華盛頓、劍橋、英格蘭、愛丁博格大學組建針對外國人英語測試中心。Robert Lado, David Harris, John Upshur和 Leslie Palmer見證中心成立的全過程并作出他們的貢獻。1959年,密執安大學第一次測試的對象是國立衛生學校的十名外國人,所有費用全部有世界衛生組織承擔。此后,此類的測試在世界其它國家得到不斷的發展。1961年,在美國的學術界及政府認為現有的語言測試存在諸多不足,這是推動針對外國人英語考試發展的原因。當然,從根本上講,當時所存的語言考試受到政府的監控是微弱的,這需要加強。在他們看來,一項考試不僅是考試本身而且還有在它之外的東西需要考慮。1961年5月11日~12日,由應用語言學中心發起華盛頓會議,提出他們的目標是建立一整套英語水平體系,滿足欲進入美國大學學習的外國學生的需要。此次會議的主要觀點源于John Carrol所提交的論文。John Carrol指出,大規模的語言測試勢在必行,它不是為教育服務的測試而是專門針對外國人的測試。Sako總結會議的主要議題是兩大部分:一是構建測試的標準,二是測試管理的行政規定。此次會議在托福發展歷程中占據重要地位。在歷經1962年會議及多次磋商后,于1963年7月1日T0EFL考試正式運行。T0EFL考試的領導人物有:David Harris和Leslie Palmer分別任處長及副處長Lois McArdle任行政助理,Elizabeth Shanahan任秘書。T0EFL考試一開始就與政治利益有千絲萬縷的關系。
3.T0EFL考試的社會、經濟驅動力
T0EFL考試的前期工作基本就緒后,就如同任何消費品一樣必須存在買賣兩方市場。1964年,政府采用游說手段建議各院校使用T0EFL考試錄用外國學生,當年有2,600位校長收到政府建議信,超過80所院校表示接受T0EFL考試。然而,T0EFL考試所涉及的費用問題仍懸而未決,國家托福考試委員會在華盛頓召開會議,Leslie Palmer作了財務報告中,$2,500用于相關文件起草人員,從1963年5月至9月T0EFL考試共帶來收益$13,742,44。會上達成協議:今后工作中的開銷全由T0EFL考試買單。美國教育考試服務處(ETS)的財務分配以與國家托福考試委員會的合同為準。然而ETS并不滿足合同中的條款力爭擁有獨立控制財務權的自由。其后針對T0EFL考試控股權的爭端風起云涌。
最先介入T0EFL考試的David Harris等人認為:一旦考試這一形式盛行,那么就會涉及到施考者的諸多陰謀。如果事實如此,T0EFL考試就會遠離心理—結構主義測量的原則及采用交際—綜合的測試方法。T0EFL考試一旦被ETS獨吞就一定以工業模式發展:重效益,輕能力。隨后,參加T0EFL考試人數倍增,政府干預T0EFL的機構也更趨復雜,實現政府與企業在T0EFL考試中雙贏的目標。到1977年,T0EFL考試已實現收入$1,927,000利潤$206,000(Nairn,1980:488)。1977年起,系列的“托福研究報告”發表,托福的改變不是因為研究的結果而是因為技術的革新和巨大的消費需求。1976年,托福研究委員會通過調查決定采用機器錄音進行口語測試;1986年進行的寫作測試(The Test of Written English,TWE)。這些改革不是來自交際測試理論的發展,而是來自測試的實際需求和使用者。它的出現是市場驅動而非測試理論的研究。所以,商業上的可行性和所謂的測試信度壓倒了對效度的關注。
T0EFL考試不僅有直接的經濟效益,社會效益也是顯而易見的。1999年,國內學者張保昆以事實為基礎,應用最新的資料整理和比較分析方法研究T0EFL考試。他得出的結論是:該項考試已不是一項單純的語言考試,而是一項每年為美國從全球600多萬考生中選拔幾十萬優秀人才輸送到美國的人才競爭手段,使本來高層次科技人才就多的美國人才更多、更為豐富,使本來軍事、經濟、科技、教育就相當強大的美國更強大。美國 ETS已成為從全球延攬人才,為美國進行國際人才競爭戰略的重要機構。美國ETS考試這種十分隱蔽但相當有效的人才競爭中的戰略性功能,不僅值得我國學習,而且也應十分警惕。他從T0EFL考試吸引全球考生數、考試內容及T0EFL給考生到來的效益闡述其藏其背后的社會目的。
四、結論
對語言測試的社會性關注拓展了我們的視野,使我們認識到,主宰語言測試實踐的發展并不是測試的方法和理論,而是那些外部的、非理論的社會因素。T0EFL考試就是最佳例證之一,作為一項國際性的考試,它一直不斷變革以順應語言學理論及相關學科發展給測試帶來的影響。例如,新托福順應現代英語交際功能教學的思想,注重測試學生聽說讀寫能力的統一。另一方面,T0EFL考試改革也有競爭上的考慮。目前,在國際普遍承認的考試還有IELTS(International English Language Testing System雅思)考試,例如,在英國幾乎100%大學都承認T0EFL和IELTS成績。因此,我們對于考試設計和使用要有清晰的認識,使考試充分地為教學服務、為選拔人才服務。
參考文獻:
[1]Alderson.J.C,Clapham.CWall.D: Language Test Construction and Evaluation [M].Cambridge University Press,外語教學與研究出版社,1995.
[2] Bachman Lyle F:Fundamental Considerations in Language Testing [M].上海外語教育出版社,1999.
[3] Spolsky,Bernard.Measured Words [M].上海外語教育出版社,1999.
[4]Wood,R Assessment ad Testing: A Survey of Research [M].外語教學與研究出版社,1999.
[5]楊惠中.語言測試與語言教學[J].外國語,1999,(1).
[6]楊惠中,桂詩春.語言測試的社會學思考[J].現代外語,2007, 30(4).
[7]張保昆.世紀交替談考試——關于美國托福考試的國際人才競爭功能考察[J].北京聯合大學學報,1999,l3(4).
(作者單位:貴州黔南民族師范學院)