高思暢 王建勤
[關鍵詞] 社會文化理論;動態評估;語言能力評估;漢語作為第二語言
[摘 要] 動態評估理論認為,對學習者語言能力的評估不是靜態的、單一的結果,而是評估與發展的結合。動態評估的結果可以體現學習者的發展潛力、學習的遷移能力等多方面的狀態,而不只是一個靜態的測量分數。因此,不同于傳統心理測量學方法,動態評估更強調學習者的發展潛力,即學習者現有水平和學習者通過專家、計算機等幫助調節下可以達到的水平之間的發展程度。自1997年社會學轉向開端,動態評估已經被廣泛地運用于特殊教育、學科教育、心理診斷以及心理康復領域,動態評估在語言評估與測試領域也越來越受到學者、測試開發人員以及教師的關注,然而,在漢語作為第二語言評估領域卻鮮有研究。和動態評估相關的已有研究和理論評述中,大多將動態評估認為是另一種形式的形成性評估或檔案袋評估,這是對動態評估理論基礎與實施方式的誤解。動態評估植根于Vygotsky的社會文化理論,本文首先從社會文化理論的視角來解讀第二語言能力發展的本質,闡釋動態評估的理論構建過程,并通過對動態評估和與之相關的其他重要理論的梳理,解讀動態評估的真正內涵。通過對比動態評估和基于心理測量學的傳統評估方式,總結動態評估的具體實施方式,以期為漢語作為第二語言研究者和教學實踐者提供評估語言能力的新思路。
[中圖分類號]H195.3 [文獻標識碼]A [文章編號]1674-8174(2018)02-0001-012
1. 引言
語言能力的評估一直都是語言測試、語言教學和實證研究中的重要環節,也是人才選拔、等級評定等重要的社會活動之一,自1997年社會學轉向(social turn)開端,社會文化理論學派的學者認為應該弱化測試的“考試”作用,而將評與教結合起來,以推動學習者語言能力的發展為目標。因此,植根于社會文化理論的動態評估以評估學習者的發展能力為目標,成為評估語言能力的一種新的理論。語言測試,從傳統角度來看是指一種測量活動,通過使用語言測驗這樣的測量工具來衡量學習者的語言能力。現有的語言測試,如英語四六級、托福、雅思以及漢語水平考試等,大多通過兩個方面來考查學習者的語言能力:語言要素知識(如語音知識、詞匯知識、語法知識等)和語言技能(聽、說、讀、寫、譯等)。傳統的心理測量學手段考查的是學習者在某一個階段、某一個時刻語言能力的體現,在評估過程中盡量避免學習效應的出現。然而,動態評估認為,評估和教學是一個統一的活動,學習者不僅僅在學習的過程中實現發展,在評估的過程中也應該實現發展,學習效應不應該被當作評估的干擾因素而排除,相反,應該成為考量學習者潛在發展能力的重要因素。因此,將二者結合起來才能理解發展,并推動發展。動態評估同傳統的心理測量學最大的不同在于:動態評估注重評估學習者的發展能力,而非某一個階段、某一個任務下的靜態的水平。同時,動態評估認為評估者的角色不再是觀察者和測試者,評估者要和被評估者通過互動解決問題,以此來幫助被評估者實現發展。因此動態評估從認識論和本體論上對個體能力的解讀都區別于傳統的心理測量學。
動態評估認為學習者對于幫助的回應也體現了認知能力和發展能力,這種在幫助下才能體現出來的能力是“未發展全面”(not yet fully developed)的(Poehner,2007),但是是具有發展潛力的,更應該成為教師和評估者關注的重點。在合適的調節下,個體可以實現比獨立完成任務時更佳的表現,這樣的調節行為無疑促進了個體的發展。所以,動態評估的目標是為了找出個體在他人協助下能完成什么,而不是考查個體在獨立情況下能完成什么(Sternberg & Grigorenko,2002)。本文主要討論動態評估的理論源起和理論構建,從理論的角度去闡釋動態評估在評估語言能力方面的思路和與之相應的評估手段,并總結了現有的動態評估模型,綜述了根據模型而開發的具體評估方式,為未來可操作性的動態評估提出了建議,為第二語言能力評估的應用、研究與教學提出建議。
2. 動態評估的理論框架
動態評估的理論框架植根于Vygotsky的社會文化理論,因此,動態評估的理論構建和社會文化理論下的調節論、最近發展區理論、遷移能力以及潛在學習能力密不可分,要深入地理解動態評估理論的內涵,則需要厘清動態評估理論與其他理論之間的關系。
Vygotsky(1986)認為,學習者的能力和水平并不是一個靜止的、不變的狀態,而是一個不斷地與外界互動而動態發展變化的狀態。因此,動態評估認為,在評估學習者能力的過程中,評估者對學習行為的調節(包括暗示、提醒、導向性問題等)和學習者如何回應這些調節是理解學習者能力的非常重要的部分,這些評估過程中的調節也有利于學習者能力發展。“動態評估更專注于修正和產生有利于學習者成功的建議”(Lidz,1991:6)。基于動態評估理論的這一基本的評估參照準則,本節將通過綜述動態評估的理論起源以及與動態評估理論相關的最近發展區理論、調節論來理解動態評估的評估參照,并通過綜述動態評估的兩個相關指標遷移能力和潛在學習能力分數,來探討實施動態評估的現實困難與發展方向。
2.1 動態評估起源
動態評估這一概念最早由Vygotsky的同事Luria(1961)提出,被以色列的教育學家 Feuerstein(1979,1980,1988)所發展。動態評估中的“評估”和傳統心理學和教育學中的評估的意義不同。動態評估中的“評估”是指:“為了了解個體的內在能力,觀察和記錄個體行為,包括對評估者和學習者在互動中產生的學習能力遷移的評估。”(Poehner,2007:325)
所謂動態,有以下幾個含義:(1)Vygotsky認為學習者個體的能力是動態變化發展的過程,而不是單一靜止的狀態;(2)評估者在評估學習者行為時,需要根據學習者的表現而采用相應的調節方式,調節方式應該以能滿足學習者的認知需求并能激發學習者的發展為前提;(3)動態評估的目的并不是為了考查出學習者的現有水平,而是根據學習者對調節的回應以及能力的遷移程度而為未來的教學提供參考。因此,動態評估的目的本身也是根據學習者的發展而動態改變的。也就是說,動態評估認為學習者的語言認知能力以及語言發展能力都是可塑的,評估者和被評估者雙方在評估的過程中不斷進行著信息的傳遞、交流,形成一種互動合作關系,并且,評估者需要運用動態的眼光去看待、評價被評估者的發展變化。
因此,評估的參照準則、評估手段、評估者與被評估者的關系、被評估者的能力都是動態的,這是動態評估之所以被稱為“動態”的原因。但動態評估的這一特點,也為評估的實施、結果的呈現帶來諸多困難。
2.2 動態評估和最近發展區(ZPD)①理論
在語言課堂中,教師不難發現,兩個考試成績相當的學生,在課堂表現和課后交流中都體現出不同的語言能力水平。教師往往會把這種現象歸因為“有的學生不擅長考試”。除去考生心理因素在考試中的影響作用,在ZPD理論看來,這是學習者現有水平和潛在發展水平之間的差距不同所帶來的結果。ZPD理論認為,學習者的發展有兩種水平,一種是學習者的現有水平(zone of actual development, 以下簡稱ZAD),指學習者獨立活動時所能達到的解決問題的水平;另一種是學習者潛在的、可能的發展水平,是通過接受幫助所獲得的水平,兩者之間的差異就是ZPD(Vygotsky, Rieber & Carton,1987)。Vygotsky舉了例子:“假設我們同時考查兩個心理年齡為七歲的兒童,這兩個兒童可以完成大部分七歲兒童可以完成的任務。但是,當我們實施評估的時候,兩個兒童的結果卻截然不同。其中一個兒童在導向性問題、示例、示范等幫助下可以實現相當于九歲兒童的發展,而另一個兒童在同樣條件下卻只能實現超越現有年齡半歲的發展(轉引自Wertsch,1985:68)。”Vygotsky認為,這兩個兒童看似相同,其實不同,他們的獨立完成任務的能力相同,但是他們的潛在發展能力卻大大不同。ZPD理論就是強調這種潛在發展能力的重要性。這也是為什么有的學生在課堂教學中能體現出更好的與教師互動的表現,而在考試中卻和其他同學的成績無區別,因為課堂互動以及教師的引導和暗示激發了他的潛在發展能力。
兩個兒童的例子說明,在調節作用下,我們不僅僅可以考查到學習者成熟的、現有的發展水平,也可以考查到學習者將要形成的、正在成熟的、正在發展的能力。Vygotsky (1998:200)認為:“實際發展水平并沒有全面體現學習者的發展狀況,而只是體現了并不重要的一部分。”獨立完成任務的能力只展現了學習者能力全圖的一部分,要想了解到學習者發展的全圖,我們必須通過動態評估的手段。因此,有效的動態評估也都是發生在被評估者的最近發展區之內,動態評估的目的,也是為了全面地展現出被評估者的ZPD,從而為被評估者提供專門針對其ZPD的、適合的、恰當的調節手段。因此,ZPD本身不僅是一個發展模式,也是一個診斷工具。Lantolf and Poehner(2011)認為動態評估不只是評價工具,也不只是評價方法,而是一種“教評合一”的詮釋性框架。要實現知識的發展,需要經歷從心理間到心理內的過程,而這個過程一定要經歷內化才能完成。內化,是指社會成員把交際活動中的符號產物轉化成心理產物,以反映自己的心理活動的過程,也是學習者個體的認知能力發展從他人調控逐漸發展到自我調控的歷程(Lantolf,2006)。內化是高級心理功能形成的關鍵因素。內化過程根據個體差異而不同,不同的個體是處于不同的發展階段的,而個體的發展也是動態變化的。因此,內化的實現需要靠外在的輔助工具來幫助,即通過外在的調節手段達到內化,實現逐漸的發展。內化通過使用輔助工具(例如活動、語言、圖片、PPT、表格等等)使復雜任務變得易于理解,使概念的難度降階,簡化為新手所能理解的概念,從而實現內化。因此,在動態評估過程中,專家只是調節者,通過給新手搭一個支架,幫助新手跨越現有水平和潛在發展水平之間的鴻溝,實現更高水平任務的完成。在這個過程中,概念就通過人與人之間的調節過程實現了個體間到個體內的傳遞。
動態評估的目的是要發掘出被評估者的ZPD,而動態評估要想實現幫助學習者發展的目的,則需要發生在被評估者的ZPD內,二者相輔相成,不可分割。然而,一個個體并不只有一個單一維度的ZPD。對于語言學習過程來說,ZPD可能是某一個語言知識或者某一項語言技能的ZPD,也可能是學習者整體語言認知能力的。對于一個漢語學習者來說,他學習漢語時態的ZPD可能很大,但是對于和時間副詞有關的語言知識的ZPD又很小,而隨著時間副詞的學習,可能又會改變漢語時態學習的ZPD。一名學習者的語言能力的發展過程非常復雜,受到他的學習方式、所學教材、周圍環境以及課堂教學等多種因素的影響,對一名學習者的ZPD的考查非常困難,這也是最近發展區理論的研究重點與挑戰。如何利用ZPD作為動態評估的一個維度或者評估指標,也是動態評估理論的研究重點與難點。
2.3 動態評估和調節論
如前文所述,ZPD的核心是調節,人類的高級認知能力是具有文化性和社會性的,是通過不斷地與外界互動而發展起來的。在互動過程中,調節工具——如其他個體、書籍、電腦、表格、數字、語言等——都起到非常重要的調節作用。我們與外部世界的關系并不是直接的,是通過調節工具的參與才實現的。如何調節、調節什么、怎么調節是動態評估領域的專家們所研究的重點。
Aljaafreh & Lantolf(1994)考查了兩名英語學習者和一名專家在一對一修改作文中對調節量表的運用。專家根據學習者的表現給予恰當的調節。研究得出,ZPD內有效的幫助應該符合三個特點:(1)幫助是循序漸進的(graduated),即提供學習者所需要的最低水平的指導;(2)幫助是根據情況而定的(contingent),即在學習者需要時提供,學習者有獨立完成能力時立刻撤退;(3)幫助是以合作式對話(dialogic)的形式展開的。而專家調節的方式遵循以下調節量表:
在此調節尺度量表中,如果學習者需要的調節朝尺度的隱性端靠近,他們被認為是朝著獨立和自我調節的行為靠近,這是學習中值得肯定的一面,這種對他人調節的需要減少說明了學習者ZPD的微觀變化發展。該研究通過對兩名學習者行為的微觀發生分析發現,在專家的調節下,學習者的語法能力逐漸得到了提高,學習者在發現錯誤和糾正錯誤中,對他人調節的依賴不斷減少,自我糾錯能力得到發展,專家對學習者的調節實現了從隱性到顯性。這說明對于有的學習者,內隱式的糾錯可以誘導學習發生,而對于有的學習者來說,只有外顯式的糾錯才可以誘導學習發生。有效的語言學習發生在學習者ZPD內的協作、互動、交流的過程中,由此,學習者才可以將專家的調節內化為自己第二語言系統的一部分。
雖然Aljaafreh & Lantolf(1994)并沒有從動態評估的角度去討論調節的作用,但是他們所設計出的調節尺度量表是互動式調節的經典示例。Nassaji & Swain(2000)驗證了Aljaafreh & Lantolf提出的觀點,即有效的互動要根據學習者ZPD的狀態而定。對于第一名學習者,研究者按照調節尺度給予反饋,而第二名學習者不按照調節尺度給予反饋,隨意選取顯性或隱性的反饋,實驗結果表明第一名學習者體現出進步,而第二名并沒有。
Aljaafreh & Lantolf (1994),Nassaji & Swain (2000) 都從調節者的角度出發,為了滿足被調節者的需求而動態改變調節方式,根據調節方式從而衡量被調節者的能力和水平。Poehner(2007)在Aljaafreh & Lantolf(1994)的調節量表的基礎上,對調節類型進行了更詳細的劃分,形成一套調節類型量表,如表2所示:
該量表遭到一些動態評估專家的質疑(Budoff et al,1987),學習者是在評估者調節的情況下成功完成任務的,那么,這個過程中,有多少是學習者自己的貢獻?又有多少是源于評估者的作用?Lidz(1991)認為,對話互動的過程中有雙方共同的參與和貢獻,因此學習者貢獻(learner reciprocity)應被考慮到互動過程中來。Lidz認為學習者貢獻可以表明專家調節中有多少是被學習者真正接受了的。學習者對專家的調節是不是接受,有沒有額外的或者更加具體的幫助需求,愿不愿意接受等等問題也是互動過程的重要組成部分。對學習者貢獻的討論體現學習者對專家調節意圖的反應程度,用于解釋動態評估過程中學習者的行為。因此,將學習者貢獻考慮到互動分析中來是必要的。
因此,Poehner在Van der alsvoort & Lidz(2002)的調節回應量表(response to mediation rating scale)的基礎上形成了學習者貢獻類型量表(learner reciprocity typology)(如表3所示)。通過微觀發生分析,對學習者在互動過程中的貢獻做詳細分析。在此類型量表中,學習者對任務的掌控程度由第1條到第9條逐漸加強,對完成任務的貢獻逐漸加大。
綜上所述,調節是實施動態評估的核心手段,這是動態評估與傳統的基于心理測量學的靜態評估在實施手段上面的不同。從專家調節的角度和從學習者如何回應調節的角度來理解動態評估的作用和價值必不可少,調節的過程應該包含調節者和被調節者雙向的貢獻,只有通過雙向的綜合考查才能更全面的理解調節的本質,從而更清晰地解讀動態評估。然而,如何將調節的數量和質量用于評估學習者的能力,以及如何利用調節的指標來區分能力不同的學習者依然是待研究的問題。
3. 動態評估模型
已有的動態評估模型多運用于教育心理學和特殊教育領域(Feuerstein,2003;Guthke & Beckmann, 2000; Grigorenko & Sternberg, 1998;Haywood & Lidz,2006;Lidz & Gindis,2003)。
Poehner & Lantolf(2005)按照具體實施方式,將動態評估模型分為介入式(interventionist)和互動式(interactionist)。盡管動態評估在特殊教育、學科教育、心理診斷等領域已有諸多成果,卻較少受到語言測試專家的關注,在漢語測試領域更鮮有研究。動態評估在特殊教育、心理診斷等更關注認知能力的發展的領域頗有成效,語言能力是認知能力不可分割的一部分,動態評估認為學習者的語言認知能力以及語言發展能力都是可塑的,因此,將動態評估引入語言評估領域,將為語言評估提供一種新的思路。
介入式動態評估為被評估者提供標準化的調節方式,所有的被評估者接受設定好的、相同的調節方式。介入式調節手段考慮了心理測量學的要求,會得出一個量化的評估結果,符合標準化測試的指標,也適用于大規模水平測試。互動式動態評估的調節手段通過評估者和被評估者之間的互動而動態浮現,并沒有一個既定的考查目標,而是專注于學習者的發展狀況,高度體現了動態評估理論,更能體現動態理論框架下語言能力評估的本質。
Sternberg & Grigorenko(2002)將介入式動態評估根據不同的評估方式又分為了兩種:“三明治模式”(sandwich format)和“蛋糕模式”(cake format)。“三明治模式”被Budoff和他的同事(1964, 1968)所推崇,遵循的是一種“前測-介入/訓練-后測”的模式。因此,三明治模式可以被大規模的應用。Budoff(1964)提出了學習潛能測量(learning potential measurement)的模型,是第一個將最近發展區理論引入測試領域的西方模型。“蛋糕模式”為被評估者提供標準化的調節方式,調節方式包括從內隱到外顯的暗示。Guthke(1982)的Leipzig學能測試(leipzig learning test)也采用了該模式。Guthke(1993)認為個體的學習能力和智力水平并不只有一個ZPD,而是根據不同的學科領域有不同的ZPD。因此,Leipzig學能測試不僅僅針對智力測試,也考查語言學能。另一個“蛋糕模式”的模型是Brown等人(1984,1985)的分等級調節法(graduated prompt approach)。分等級調節法采用了更加標準化的方式實施調節,用于調節的手段方式在實施評估之前已經寫好,并按照從內隱到外顯的形式排列,對于任何學習者,都遵循這個事先排序好的調節順序和調節方式來進行。
在互動式動態評估模型下,Feuerstein等(1979,1980,1988,2003)提出了認知結構可塑性理論(structural cognitive modified ability theory)來解釋學習者認知能力的發展。該理論認為人的智力發展是生理發展和社會文化歷史發展調節互動的結果。大腦的生物屬性和個體的行為互動調節,大腦指導行為,行為塑造大腦。因此,認知結構可塑性理論認為人的智力并不是靜態的,也是可塑的,個體的認知結構應該是始終處于動態發展變化的開放性系統中。由此得知,人的學習潛能并非靜態不變,而是動態發展的。和前文所述的調節論一致,Feuerstein認為環境對個體的影響并不是直接的,而是要通過其他人利用調節工具來使個體實現和環境的互動。所以,學習者個體認知能力的發展是可以通過調節而改變的,要提高學習者的學習潛能,實現認知能力發展,家長或老師需要扮演好調節者的角色,為學習者的能力發展創造調節學習的環境。Feuerstein的互動式評估是最能實現Vygotsky發展為核心的教育理念的模型,但是這并不是說其他的模型就不值得探索。面對不同的問題,不同的模型可能會發揮更好的作用。互動式評估更適合在需要全面展現學習者發展能力的情況下使用,而當需要對大規模的學習者進行量化考核以及排名時,介入式會更高效地實現目的。
已有的模型中,無論是介入式還是互動式,都不專門針對語言能力的發展研究,在語言評估領域,雖未有專門針對語言能力的評估模型出現,但是Aljaafreh & Lantolf(1994)、Nassaji & Swain(2000)、Poehner(2007)等語言評估領域的專家已經嘗試了將已有的動態評估方式引入語言評估領域。然而,已有研究多專注考查互動式評估在語言測試領域的運用,而關于介入式評估的實證研究較少。正如前文所述,因為評估的參照準則、評估手段以及被評估者的能力都是動態的,這為動態評估的實施和結果的呈現帶來困難,這也是動態評估領域發展所面臨的挑戰。
4. 動態評估結果的呈現
在一項測試或者評估活動中,參與測試和評估的人一定會獲得一項結果報告,用來評定或者闡釋被評估者的能力水平。在動態評估中,評估結果的呈現也是研究者們重點考查的方面。在前文的討論中,調節的數量和質量是動態評估結果呈現的兩個指標,這里將增加對遷移能力、潛在學習能力這兩個指標的討論,進一步討論動態評估的理論內涵如何在呈現結果時體現出來。
4.1 動態評估和遷移能力
Vygotsky(1998)認為真正的能力不只體現在完成眼前的評估任務,而且體現在學習者能否將在現有任務中發展起來的能力遷移到新任務中。遷移(transcendence or transfer),是指學習者將他們的學習能力運用到更復雜的語境中的行為。Feuerstein et al(1979,1988)對遷移的概念和實施方式做了詳細的闡釋。Feuerstein認為,遷移能力不局限于學習者完成特定任務的能力,學習者有超越現有能力并完成其他語境任務的一系列的能力。學習者獨立完成任務表明他們是否將調節內化了,但是,內化的程度只有通過他們是否能遷移該學習能力來體現。Poehner(2007)的遷移任務中,一名學習者在與評估者互動中采用了之前并沒有接觸過的語法形式,這個語法形式完全是在學習者和評估者互動中產生的,這說明學習者在現有語法知識的基礎上發展出了與之相關的語法形式,在此語法范疇內建立了關聯。
Palinscar,Brown & Campione(1991)提出了分等級調節法(graduated prompt approach,以下簡稱GPA)。GPA模型通過三種遷移任務考查了學習者的遷移能力。三種遷移任務分別是:近遷移 (near transfer)、遠遷移(far transfer)和超遠遷移 (very far transfer)。近遷移是指遷移任務和原任務擁有相同的條件,只不過用了新的內容組合;遠遷移是指學習者需要在新環境中使用新的、相關的條件;超遠遷移是指更加復雜的新環境和新問題的結合。雖然Brown提出了通過考查學習者遷移能力來判斷學習者對知識的內化程度,并對遷移任務進行分等級定義,但是他們并沒有對三種不同程度的遷移任務進行細致的分類說明,沒有給出可操作的遷移任務例子和分類方法。
動態評估的研究者們也考查了遷移任務在評估學習者的能力發展中的作用。在遷移任務評估中,評估者依然和被評估者通過互動來完成更復雜和更有難度的任務,研究表明不同的學習者雖然在某個任務上表現相同,但是當遇到新問題時,他們的表現卻大不相同。Poehner(2007)的實驗中采用了兩個遷移任務,讓學習者在經過評估后,再參與具有相同的模式和條件但是更加復雜的遷移任務,以此來考查學習者是否內化了所接受的調節。只有通過考查學習者的能力是否遷移,才有可能知道學習者的ZPD是否已經發展成了ZAD。實驗結果表明,兩個參與者在動態評估中表現相似,需要的調節幫助也較少,而在遷移任務中,兩個參與者的表現卻非常不同。其中一位可以保持在動態評估中的表現,另一位卻不能。這樣的結果表明,前者更大程度地內化了互動中的調節,并且更有獨立完成任務的能力。
遷移任務是動態評估的重要組成部分,增加了任務復雜度可以有效地考查學習者能力提高的程度,并且預測學習者在未來學習中的表現。但是,已有研究都沒有給出如何設計遷移任務(如近遷移、遠遷移、超遠遷移)的方法。對遷移任務的定義都局限于“具有相同的模式和調節,但是更加復雜的遷移任務”,而該定義中并沒有定義何為“更加復雜”,并不具有可操作性。如何設計具有難度或者復雜度差異的遷移任務和如何使用這些遷移任務都是未來設計動態評估任務的重點和難點。
4.2 動態評估和潛在學習能力分數(LPS)①
LPS是除了遷移任務、調節的數量和質量之外的第四個可以作為動態評估結果呈現的指標。Poehner & Lantolf(2013)不認為動態評估的作用是將“藏著的”或者“固定了的”潛力激發出來,他們認為,人的能力并不是藏在大腦里的,知識是來源于心理間的。因此,潛在學習能力始終呈現對調節開放的狀態(openness to mediation),學習者通過控制調節的過程來主動調節自己的學習活動。LPS是反應潛在學習能力的指標,是獨立完成任務所得分數和通過調節后完成任務的所得分數之間的差(Budoff, 1987; Feuerstein & Rynders, 1988; Sternberg & Grigorenko, 2002)。
Kozulin & Garb(2002)提出了計算獨立完成任務水平和通過調節完成任務水平之間的LPS的范式。LPS將學習者分為高收獲者(high gainer)、中收獲者(mid-level gainer)和低收獲者(low gainer)。研究發現,前測分數相同的學習者在LPS上卻可能有較大差異。Kozulin & Garb(2002)認為他們提出的計算范式為區分高發展潛能者和低發展潛能者提供了理論基礎(見圖1)。因此,一個低水平學習者可能有比高水平學習者更高的LPS,而這樣的信息無法通過標準化考試獲得。
在以上范式中,如果一個被評估者在前測中獲得一個非常低的分數50分,但是經過調節后獲得了極大的進步,在后測中獲得了100分滿分,那么該被評估者的LPS就是1.5。相反,如果該被評估者沒有獲得進步,在后測中依然只得了50分,那么他的的LPS就是0.5。根據Kozunlin & Garb的實驗結果可以推測,如果根據學習者的學習潛能分數制定的教學策略會更有針對性。但是該范式所針對的調節并不是動態評估的過程中調節,而只是通過設計公式而將調節前和調節后之間的水平差距量化表現了出來,因此,該范式所體現的更接近于學習者的最近發展區,即學習者潛在的發展能力。
Poehner & Lantolf(2013)借鑒了Kozulin & Garb(2002)的LPS范式展開了關于學習者語言發展能力的實驗研究,并將調節結合到了動態評估過程中。在Poehner & Lantolf的基于計算機輔助的動態評估過程中(見表4),測試者在同一個題目下有多次答題機會,答題次數增加所獲得的分數依次降低。LPS的分數體現的是動態評估過程中所發掘出的學習者潛在學習能力。
Poehner & Lantolf(2013)實驗結果表明,具有相同實際水平分數(actual score)的學習者,調節后分數(mediated score)卻可能不同,LPS也不同,在遷移題目中的表現也不同。LPS和遷移能力的實際分數的相關性表明LPS是可以體現學習效應的,也就是說,LPS可以作為評估學習者的有效工具。
但是,這樣的范式可能只適合小樣本的情況,因為它忽略了評估者自身所帶來的誤差因素。在實施調節的過程中,我們很難確保一個評估者對不同的學習者的調節是一致的。這和主觀性試題的評分者一致性信度和評分者間一致性信度分析類似。Kozulin & Garb(2002)也認為,LPS范式的潛在問題是評估者不同的調節風格可能會影響LPS的信度,所以,需要考慮LPS的信度問題。同時,Poehner & Lantolf(2013)的研究結果也表明,調節結果也有可能受到個體差異的影響。
綜上所述,調節的質量與數量、遷移能力的考查、LPS這四項是現有的對動態評估結果呈現的指標,然而這四項指標分別體現學習者語言能力的哪一個維度卻并未在已有研究中闡釋清楚,這四項指標是不是足以體現動態評估的參照準則?是不是需要有新的指標來體現動態評估所要評估的能力?這也是動態評估亟待解決的問題。
5. 動態評估理論的信度、效度和可實施性問題
動態評估所面臨的研究難點和研究重點已在前文中有所陳述,不管是在特殊教育、心理診斷、學能測試等領域還是在語言測試領域都有學者質疑動態評估的信度、效度和可實施性的問題。本小節從動態評估理論的理論構建出發,解答動態評估領域的信度、效度和可實施性提出的質疑。
5.1 信度問題
信度和標準化是測試領域所關注的基本問題,也是傳統測試領域的學者對動態評估理論批評最多的地方。然而,動態評估理論構建的前提是:人類的高級認知能力是在與社會環境的互動中不斷發展變化的。動態評估的目的是了解學習者在調節過程中所需的幫助,從而實現學習者能力發展。因此,動態評估在實施的過程中就是因人而異的,根據每個人的發展階段的不同,實施的調節也是不同的,因為每個人的發展能力不同,帶來的評估結果也不同。對于同一個人,同一時間參加兩次動態評估的結果也可以是不同的,因為動態評估以在評估中實現學習者的發展為目的,那么第一次動態評估后,學習者的發展階段已經被改變,接下來的第二次的動態評估結果就并不一定和第一次一致。如果一致,反而說明第一次動態評估并不成功——沒有促進學習者的發展。Swain(1993)表明,好的二語能力評估應該具有低內部一致性。如果通過兩次對學習者的動態評估結果并無太大差別,反而表明調節者未能為學習者提供恰當幫助,未能成功調節學習者的發展。因此,從動態評估的理論構建和核心目標來看,傳統心理測量學對信度問題的討論并不適用于動態評估。
介入式動態評估考慮了信度的問題,并試圖通過調節方式的標準化來增加評估的信度。然而,互動式動態評估領域的學者認為,人類的能力本身就是一個不斷變化的狀態,調節手段就應根據不同個體的需求來調整,從而最大程度實現個體的發展,這個過程必然會影響到標準化的實施,影響到信度的提高。因此,在動態評估理論學者看來,信度越高,反而越阻礙學習者發展能力的提高。Lidz(1991)認為傳統測試通過種種方法想要獲得一個靜態的結果,但是卻忽略了這個現實的世界總是不斷變化的事實。
因此,由于動態理論對知識的產生、知識和能力的發展的理論構念與心理測量學的理論構念并不相同,兩種評估體系對信度的解讀也并不一致。
5.2 效度問題
從內容效度上來看,動態評估與靜態評估使用的測量工具或任務可以是相同的,因此其內容效度的驗證可與靜態評估相同(孔文、方潔,2013)。但是,動態評估的構念效度受到了質疑, Haywood & Tzuriel (2002) 認為動態評估的理論構念尚不明確,更未使用具體的方法來證明評估結果是對其理論依據各方面的反映。然而,Haywood & Tzuriel的觀點并不準確,動態評估的目的是為了實現個體語言能力的發展,實現了發展這一目的,效度也即實現。同信度問題一樣,因為動態評估和傳統的靜態評估的理論構建、評估對象和評估手段均不相同,因此衡量評估效度的方法也不同,靜態評估領域對效度問題的討論也并不適用于動態評估。
從標準效度來看,動態評估的評估工具也廣受批評,因為動態評估是通過一對一的互動調節方式,不同的個體所接受的調節不可避免地會有所差異,因此,有學者質疑評估過程中的調節和幫助難以推斷學習者在實現任務中所做的貢獻。但是Poehner(2007)的研究中考慮到了學習者貢獻類型(reciprocity typology),并在研究中考慮了學習者回應調節的類型和數量。動態評估的優勢體現在后果效度上,因為該評估方式可以直接幫助被試在評估中發展,具有良好的反撥效果(孔文、方潔,2013)。
5.3 可實施性
關于動態評估的實施目前主要集中于一對一的評估方式,已有研究證實了這種評估方式的有效性和重要意義,但是,這種評估方式所消耗的時間成本和人力成本均過高,如何大規模地實施動態評估手段、如何高效地評估一個群體的語言能力和語言發展能力是動態評估需要解決的現實問題。目前基于計算機的動態評估工具(computerized dynamic assessment)已投入大規模的使用①,但是可利用的領域依然局限在閱讀和聽力技能方面,對于寫作、口語技能相關的可以大規模展開的評估手段還未實現。基于計算機輔助的動態評估在對分數解讀上也需要得到信度和效度的驗證,否則無法成為選拔、評定的標準。此外,不同的學習者所處的發展階段不同,如何有效地對不同的個體進行調節也依然存疑。
6. 動態評估的未來研究領域
動態評估為課堂教學和課堂以外的評估都提供了一個理論基礎,但是,如何將動態評估的程序標準化、可實施化以及量化都是動態評估所面臨的挑戰。不同的測試,其實都是妥協的結果,無論是經典的測試理論或者是基于項目反應理論的自適應測試體系都有自身的局限,有的測試為了實現效度,則不免犧牲測試的公平性,有的為了實現大規模、標準化的實施,則不免犧牲了部分效度。動態評估的目的是為了評估發展,評估的目標、手段都更有利于了解到學習者的現狀和可發展的程度、能力可以遷移的程度等等,但是其操作方式和過程不適用于大規模的展開,如何權衡這兩個目的就需要通過實驗考察驗證和測試的研制與開發。
遷移能力被視為考查學習者未來發展能力的重要指標,然而,已有研究沒有給出遷移任務具體分級方法以及分級后的有效性,設計合適的遷移任務來有效地考查學習者的遷移能力也是未來研究需要解決的問題。
對于動態評估的運用范圍來說,除了如前文所述將其大規模、標準化的實現以外,是不是可以發展出一套可供課堂語言教師操作的評估手段呢?在學習者日常學習中,往往會經歷一個學期或者一個假期班長度的學習,因此,用一個期末成績或者階段性測試的成績決定其這一階段的學習狀況是不公平和不具體的。“檔案袋評價”(profile)和形成性評估(formative assessment)是課堂教學中常用的記錄、評估學生的能力變化和成長狀況的方法,盡管動態評估和檔案袋評價與形成性評估的目的不同,但是根據動態評估的目的來看, 在課堂教學中實施動態評估更有利于教師實現教評合一的目的,也能淡化評估為學生帶來的“焦慮感”,提高評估過程中的學習效應,幫助學生實現能力的發展。因此,在課堂教學和評估中的具體實施方案也是動態評估未來可發展和研究的重要方向。動態評估也可以借鑒現有的檔案袋評價和形成性評價的操作模式,形成專門針對語言能力的課堂評估。在英語教學界,已有在課堂寫作教學中使用動態評估的例子(孔文、方潔,2013;張艷紅,2010),但是在漢語教學界,關于動態評估的應用和研究都非常匱乏,此外,動態評估對調節者也就是評估者或者老師的要求更高,好的評估者可以為被評估者提供適合的、循序漸進的調節方式,從而才能更精確地確定學習者的發展階段,每一個不同的學生都具有自己的ZPD、每一個不同班級也具有不同的集體最近發展區(group ZPD),因此,如何評估每一個個體和班級也是課堂教師和研究者可以挖掘的方向。因此,對評估者、課堂教師的培養也是動態評估需要解決的問題和面臨的挑戰。
[參考文獻]
孔 文,方 潔 2013 另類評估的新發展: 動態評估面面觀[J]. 解放軍外國語學院學報(1):57-61. // Kong Wen & Fang Jie 2013 The new development of alternative assessment: An overview of dynamic assessment[J]. Journal of PLA University of Foreign Languages (1): 57-61.
張艷紅 2010 大學英語寫作教學的動態評價體系建構[J]. 解放軍外國語學院學報(1):46-50. // Zhang Yanhong 2010 Constructing dynamic assessment mode in college English writing class[J]. Journal of PLA University of Foreign Languages 33(1):46-50.
Aljaafreh, A. & J. P. Lantolf 1994 Negative feedback as regulation and second language learning in the zone of proximal development[J]. Modern Language Journal 78(4): 465-483.
Budoff, M. 1968 Learning potential as a supplementary assessment procedure[J]. Learning disorders 3: 295-343.
1987 The validity of learning potential assessment[A]. Dynamic assessment: An interactional approach to evaluating learning potential[C]. New York: Guilford Press: 53-81.
Budoff, M. & M. Friedman 1964 “Learning potential” as an assessment approach to the adolescent mentally retarded[J]. Journal of Consulting Psychology 28(7): 434-439.
Feuerstein, R. 1980 Instrumental Enrichment: Redevelopment of Cognitive Functions of Retarded Performers[M]. University Park Press.
Feuerstein, R., Y. Rand & J. E. Rynders 1988 The learning potential assessment device[A]. In Dont Accept Me as I am[C]. Springer US: 191-207.
Feuerstein, R. , Y. A. Rand & M. B. Hoffman 1979 The Dynamic Assessment of Retarded Performers: The Learning Potential Assessment Device, Theory, Instruments, and Techniques[M]. Scott Foresman & Co.
2003 Dynamic Assessment of Cognitive Modifiability[M]. ICELP (The International Center for the Enhancement of Learning Potential).
Grigorenko, E. L. & R. J. Sternberg 1998 Dynamic testing[J]. Psychological Bulletin 124(1): 75-111.
Guthke, J. 1982 The learning test concept: An alternative to the traditional static intelligence test[J]. German Journal of Psychology 6(4): 306-324.
1993 Developments in learning potential assessment[A]. Learning potential assessment: Theoretical, methodological and practical issues[C]., 43-67.
Guthke, J. & J. F. Beckmann 2000 The learning test concept and its application in practice[J]. Dynamic assessment: Prevailing models and applications: 17-69.
Haywood, H. C. & D. Tzuriel 2002 Applications and challenges in dynamic assessment[J]. Peabody Journal of Education 77(2):40-63.
Haywood, H. C. & C. S. Lidz 2006 Dynamic Assessment in Practice: Clinical and Educational Applications[M]. Cambridge University Press.
Kozulin, A. & E. Garb 2002 Dynamic assessment of EFL text comprehension[J]. School Psychology International 23(1): 112-127.
Lantolf, J. P. 2006 Sociocultural theory and L2: State of the art[J]. Studies in Second Language Acquisition 28(1): 67-109.
Lantolf, J. P. & M. E. Poehner 2010 Dynamic assessment in the classroom: Vygotskian praxis for second language development[J]. Language Teaching Research, 15(1): 11-33.
Lidz, C. S. 1991 Practitioners Guide to Dynamic Assessment[M]. Guilford Press.
Lidz, C. S. & B. Gindis 2003 Dynamic assessment of the evolving cognitive functions in children[A]. Vygotskys educational theory in cultural context[C]., 99-116.
Luria, A. R. 1961 Study of the abnormal child[J]. The American Journal of Orthopsychiatry 31: 1-16.
Nassaji, H. & M. Swain 2000 A Vygotskian perspective on corrective feedback in L2: The effect of random versus negotiated help on the learning of English articles[J]. Language Awareness 9(1): 34-51.
Qin, T. & R. A. van Compernolle 2017 Computerized Dynamic assessment of L2 Chinese pragmatics comprehension[Z]. Paper presented at American Association for Applied Linguistics. Portland, USA.
Sternberg, R. J. & E. L. Grigorenko 2002 Dynamic Testing: The Nature and Measurement of Learning Potential[M]. Cambridge University Press.
Swain, M. 1993 The output hypothesis: Just speaking and writing arent enough[J]. Canadian Modern Language Review 50(1): 158-164.
Palinscar, A. S., A. L. Brown & J. C. Campione 1991 Dynamic assessment[A]. Handbook on the assessment of learning disabilities: Theory, research, and practice [C]. 75-94.
Poehner, M. E. 2007 Beyond the test: L2 dynamic assessment and the transcendence of mediated learning[J]. Modern Language Journal 91(3): 323-340.
Poehner, M. E. & J. P. Lantolf 2005 Dynamic assessment in the language classroom[J]. Language Teaching Research 9(3): 233-265.
2013 Bringing the zpd into the equation: Capturing L2 development during computerized dynamic assessment (C-DA) [J]. Language Teaching Research 17(3): 323-342.
Van der Aalsvoort, G. M. & C. S. Lidz 2002 Reciprocity in dynamic assessment in classrooms: Taking contextual influences on individual learning into account[A]. Learning potential assessment and cognitive training: Actual research and perspectives in theory building and methodology 7(1): 111-144.
Vygotsky, L. S. 1986 Thought and language[M]. Cambridge, MA: MIT Press.
1998 Mind in society: The Development of Higher Psychological Processes[M]. Harvard University Press.
Vygotskij, L. S., R. W. Rieber & A. S. Carton 1987 The Collected Works of LS Vygotsky.(Vol.1), Problems of General Psychology Including the Volume Thinking and Speech[M]. Springer.
Wertsch, J. V. 1985 Adult-child interaction as a source of self-regulation in children[J]. The growth of reflection in Children, 69-97.
Key words:sociocultural theory; dynamic assessment; evaluation of language proficiency; Chinese-as-a-second-language
Abstract: Dynamic assessment (DA) is rooted in the sociocultural framework outlined by the psychologist L. S. Vygotsky and his colleagues. Contrary to the innatist view, sociocultural theory considers human cognition as developing with the ongoing interaction between the individual and with the environment. Instead of giving a static score, DA distinguishes itself from other approaches by maintaining that the unification of development and assessment during the assessment procedure is crucial to understanding learners abilities and for promoting development during the assessment process itself. Unlike traditional psychometric tools, DA lays emphasis on learners development potential implied by the difference between learners independent performance and the performance which the learner can achieve with the assistance of an expert or a computer. Ever since the 1997 social turn, DA has been widely applied in education and psychology whereas in the second language assessment area it has received scant attention. The present paper outlines the theoretical framework for the application of dynamic assessment procedures to second language assessment and pedagogy by reinterpreting the concept of second language ability from the perspective of sociocultural theory. The paper concludes with a discussion of the criticisms leveled against DA and makes some suggestions for further research on DAs potential contributions to language assessment.
【責任編輯 匡小榮】