


摘 要:學業評價是外語課程教學中的重要環節。外語專業的《英語專業本科教學質量國家標準》明確了外語學業評價要以實現促進學生學習為目標,注重形成性和終結性相結合的方式。本文辨析在形成性評價、終結性評價和檔案袋評價幾個概念的區別和聯系的基礎上,以《綜合英語》課程為例,創造性地提出了以“終結性評價為主導,形成性評價為輔助”為原則的,適合外語單科課程教學的復合檔案袋評價范式,以實現形成性和終結性評價的有效結合并使之融入學校的課程評價體系。
關鍵詞:復合檔案袋評價;形成性評價;終結性評價;結合
中圖分類號:G42 文獻標識碼:A 文章編號:1003-6822(2016)04-0095-07
1. 引言
學業評價是高校外語課程教學的一個重要環節?,F有的外語教學研究主要聚焦于教學環節而忽視學業評價環節。例如,2000版《高等學校英語專業英語教學大綱》(以下簡稱“《大綱》”)主要強調培養目標、課程設置、教學要求、教學原則以及教學方法和手段。至于學業評估環節,《大綱》只談到作為終結性評價的測試和畢業論文,沒有強調評價對教學的作用,也沒有提及形成性評價。實際上,教學與評價是不可分割的,尤其在我國這樣一個考試大國,無論對教師還是學生而言,學業評價有著舉足輕重的地位。因此,我們有必要注重外語教學的學業評價,尤其是形成性評價。所幸的是,在教育部2015年出臺的《英語專業本科教學質量國家標準》(以下簡稱“《國標》”)中,學業評價已被列為其重要內容?!秶鴺恕返慕K稿對學業評價的表述為:
評價應以促進學習為目的,根據培養方案確定評價的內容和標準,選擇科學的評價方式和方法,合理使用評價結果,及時為教學提供反饋信息。注重形成性和終結性評價相結合。(仲偉合、潘鳴威,2015: 118)
《國標》明確了評價的目的是“以評促學”(assessment for learning)而不僅僅是“學業的評價”(assessment of learning)。這意味著,形成性評價在學業評價中的地位將得到凸顯,而終結性評價則要合理使用,尤其不可過度使用。“注重形成性和終結性評價相結合”已成為評價體系的核心思想。無獨有偶,除了教育部出臺的外語《國標》外,全國各地的教育行政部門也在近年的文件中明確提出促進學業評價方式轉變的思想。以浙江省為例,在2014年《浙江省教育廳關于印發《浙江省高校課堂教學質量創新行動計劃(2014-2016)的通知》也明文規定:“建立形成性評價與終結性評價相結合的評價方法。完善平時成績評定制度,增加日常考試評價在總成績的比重,把學生的注意力轉到學習過程上來”(浙教高教[2014]102號)。
雖然在我國目前的外語教學實施中,終結性評價還是作為最主要的學業評價方式一統天下,形成性評價融入教學還有待發展,但是對形成性評價的理論研究及其在外語教學中的應用研究已經在本世紀得到了起步和發展。然而,縱觀現有的文獻,我們發現,我國的外語形成性評價研究往往是完全脫離終結性評價的單方面研究,怎樣與終結性和學習評價體系相結合的研究比較匱乏,且多半局限于理論引介和探討,其必要性、重要性和實施原則談論過多,而可操作性強的實施方法不足。雖有相關實證研究表明,形成性評估對學習自主性和學習成績產生了顯著的影響(如:章木林、宋紅波,2014;洪民等,2011),但僅憑問卷調查和短期的成績前后測比較,可信度并不高。此外,這些研究沒有厘清形成性評價、終結性評價和檔案袋評價之間的關系,通常把形成性評價和檔案袋評價混為一談,認為實施檔案袋評價就是實現了形成性評價;同時也把大規??荚嚭推谀┛荚嚺c終結性評價混為一談。本文將試圖厘清這些概念之間的關系以消除對它們的誤解,并同時以《綜合英語》課程為例提出一套可操作性強的單科課程評價方式以實現形成性評價和終結性評價的有效結合并使之融入學校評價體系。
2. 運用復合檔案袋評價,實現兩種評價功能的有效統一
雖然西方學者早在上個世紀就提出形成性評價的概念并使之與終結性評價相區別(Hein Price,1994; Black William, 1998),國內學者(如王華、富長洪,2006)也專門從目的、時間、發生環境等不同角度對這兩種評價方式做了區分。一般而言,兩種評價的主要區別在于:形成性評價是在教學過程中為改進教與學的診斷性評價;終結性評價是在學習結束后所作的鑒定性評價。但是,筆者認為,在實際教學中,形成性和終結性評價沒有明確的分割點。換句話說,形成性評價是相對于終結性評價而言的。形成性和終結性評價的區別首先取決于教學任務時間的界定。如果把一門課的每個章節看作為一個獨立的教學任務,在章節結束后所作的單元測試就可以視作為終結性評價,而在這個階段過程中的評價與反饋才有可能成為形成性評價。如果我們把這門課的學習階段放大至整個學期,期末考試則應該視作為終結性評價,在此之前的評價都有可能成為形成性評價。但如果我們只把英語專業學習階段定義為初級和高級兩個階段,學生在兩個學年的所有評價都有可能成為形成性評價,專業四級和八級考試才應該是終結性評價。所以,要明確形成性和終結性評價的界定,首先要明確教學任務階段的界定。通常,我們把一個學期的單科課程的教學任務看作為一個學習階段,期末測試就自然可以視作為終結性評價。但是,這并不意味著,平時的課堂測試和期中測試等就是形成性評價。在明確學習階段的基礎上,形成性評價還必須滿足學生在評價中發揮主體作用這一基本條件。這就是說,學生要與教師、同伴進行互動;學生在對評價內容進行自評、同伴互評、教師評價的基礎上需要對學習過程和學習方法進行回顧和反思,從而促進學生的學習。因此,如果評價過程缺少了學生的主動性,平時課堂測試和課外作業的數量再多,它們在總評分中的比值再高都只能視作為經常性或者多階段的終結性評價而不是形成性評價。反過來說,即便在平時的學習過程中,學生發揮了主動性,也不能完全擺脫終結性評價,因為平時測試的評價還是終結性的。純粹的形成性評價幾乎是不存在的。與其說形成性評價是和終結性評價相對應的一種評價方法,不如說形成性評價是一種評價理念。這種理念讓原本純粹的終結性評價方式產生變化,使評價主體從教師轉變為學生,使評價由注重結果向注重過程轉變。因此,評價的終結性是絕對的,而形成性是相對的。
值得注意的是,部分研究者把形成性評價與檔案袋評價(portfolio assessmemt)混為一談,或者認為形成性評價的具體操作方式就是檔案袋評價。例如,姚蘭芝(2012)認為形成性評價就是檔案袋評價。她同時認為,檔案袋評價就是“學生把自己一段時間內所有的成績、歷次的作業、各種測試成績等都放在一起并加以文字記錄(姚蘭芝,2012: 95)”的一種測試評估形式。這是一種對形成性評價的嚴重誤解。形成性評價的具體方式是多種多樣的,weir Roberts (1994)就列舉了13種可以在外語教學中使用的形成性評價方式,包括課堂觀察、日志、訪談、檔案記錄等。由此可見,檔案袋評價只是評價的一種具體方式和工具。檔案袋評價也可以是形成性的,也可以是終結性的。檔案袋評價可以分為不同的類型,常見的分類有學習檔案袋和評價檔案袋。學習檔案袋通常發揮檔案袋形成性評價功能,而評價檔案袋則發揮終結性功能。把歷次的作業和各種測試成績放在一起的檔案袋評價是典型的評價檔案袋。這種檔案袋評價是終結性評價。如果把檔案袋兩種功能都發揮起來,這種評價方式就被稱為復合檔案袋評價(comprehensive portfolio assessment)。因此,復合檔案袋評價的方法可以發揮形成性和終結性兩種功能,在外語教學中具有較高的應用價值。本文接下來要解決的問題便是:在外語單科課程的學業評價中怎樣在教學實踐中實施復合檔案袋評價,使得這種評價方式發揮其雙重功能并融入學校評價體系。
3. 基于雙重評價功能的復合檔案袋法的具體實施
3.1 復合檔案袋評價的應用原則
復合檔案袋評價之所以適合于外語單科課程的學業評價是因為這種評價方式體現了三種復合特征:評價功能的復合;材料結構的復合;參與主體、評價主體、使用主體的復合以及評價標準的復合(洪民等,2011)。這樣的復合評價方式使得學生既能注重學習結果也能重視學習過程,做到過程和結果的統一。值得探討的是,復合檔案袋評價作為雙重評價工具,在評價過程中,到底應該發揮形成性功能為主還是終結性功能為主?筆者認為,結合我國的實際情況,仍然應該讓終結性評價發揮決定性作用,讓形成性評價作為其有效補充。以下為復合檔案袋評價實施過程中的原則:
(1)發揮終結性評價功能的決定性作用。我國是考試故鄉,是考試大國。各種層面的考試,從國家級的到省級的,從四六級考試到期末期中考試,歷來都是終結性評價。雖然在西方國家包括香港地區已經開始廣泛使用形成性評價,但是在我國要使形成性評價成為評價體系中主要部分,短期來看可行性不大。究其原因是因為考試與評價多半是高風險的,即考試成績往往決定了考生在升學、畢業、謀職、評優評獎的命運,而我國考生更關注結果而非過程。這就意味著評價的效度(validity)和信度(reliability)必須得到保障,也就是說,評價必須是有效合理的。形成性評價因為評價標準的非定量性和評價主體不穩定性造成評價缺乏效度和信度。雖然,國內外專家(如Messick, 1989; 李清華、孔文,2015)都對形成性評價的效度和信度提出了驗證框架,但是形成性評價是完全不同于終結性評價的個性化評價,它和終結性評價在效度和信度檢驗的出發點上存在根本性的區別。比如,李清華、孔文(2015: 24)認為形成性評價的效度取決于“評價結果的解釋和使用是否和多大程度上真正促進了學生學習的進步”。這種過程為導向的效信度框架和目前我國學生以結果為導向的終結性評價效信度框架處于不同的層面,這就決定了形成性評價和終結性評價相結合的難度。假設形成性評價融入到學校評價體系并發揮主體作用,這種評價結果或許會遭到學生的質疑。因此,為了保證評價結果的說服力,有必要繼續讓復合檔案袋評價中的終結性評價功能成為評價的主體,發揮其有效的反撥效應(washback effect)和決定性作用。
(2)發揮形成性評價功能的輔助性作用。形成性評價的意義不在于評價結果,而在于它的后效,即形成性評價多大程度上促進了學生的學習。大量的實證研究都表明,形成性評價對學習成績、學習自主性和學習動機都起到了積極的效果。因此,在學業評價中,我們需要逐漸增大形成性評價的比重。檔案袋評價中的形成性評價功能主要體現在:學習過程材料、報告、反思日志以及在此基礎上的自評和互評等。學生在形成性評價過程中參與了目標的設定、材料的收集、學習的反思以及成績評定。這個以學生為主體的自我反思、自我監控、自我評定、自我發展以及與教師、同伴互動的過程是終結性評價不可替代的,對教學的促進具有重要意義。因此,形成性評價的結果應該以一定的比例納入課程的總體評價系統。如果形成性評價結果完全脫離于課程評價系統之外,評價過程和結果不容易引起學生足夠的重視,這最終影響到形成性評價的效果和反撥效應;但如果形成性評價結果在課程評價系統所占的比重過大,學生容易對總評結果產生質疑,影響了效度、信度和可接受度。因此,筆者認為,立足于當前形勢,形成性評價結果應該以較小的比例(課程總評的5%-20%之間)納入課程評價系統中,發揮其輔助性功能。
3.2 與學校評價體系的融合的復合檔案袋評價范式構建
筆者以自己所教的《綜合英語》課程為例,設計出一套具有一定可操作性的復合檔案袋評價框架。首先,按照現有多數學校百分制的單科課程評價體系,我們把課程的學業評價內容分解為不同的項目并確定各項的比重。例如,我們把課程評價內容大致分為平時評價、期中評價和期末評價三大項,確定它們的比例分別是70%、10%和20%;把平時評價內容細分為若干項(如表1所示)。這里值得一提的是,平時評價所占的比例一般不能低于50%。因為期中(如果學校不硬性規定需要期中評價,也可以由其他平時學習任務替代)和期末評價主要體現了評價的終結性功能,平時評價中仍然包含了終結性為主的評價,如果平時評價比例過低,很難體現出檔案袋中的形成性評價的功能。從單個項目的角度看,項目的數量不能太少,單個項目的比例不能過高??紤]到期末測試信度和效度較高,學生可接受度也高,仍然可以列為所占比重最高的項目。
其次,我們需要明確單個項目的項目內容、項目評價目的、項目評價內容、項目次數、項目活動流程和評價標準。項目評價的重點在于構成平時成績的單個項目的組成和設計。《綜合英語》是英語專業低年級段的核心課程之一,其教學首要任務是訓練外語聽、說、讀、寫、譯等基本功。平時項目內容應該從基本技能所涵蓋的方面去選擇,同時也要考慮到班級的現狀。如果所教授的班級的閱讀能力較差就多設置有關閱讀能力的評價項目;如果教授班級的寫作水平較差就多設置有關寫作的項目,最終做到查漏補缺,均衡發展。此外,平時項目內容還應該體現課堂表現和測試、課外作業和課外自主學習等不同層面。尤其是體現課外自主學習的項目是不可缺少的,因為提高學習自主性是實施形成性評價的一個重要目的??紤]到英語專業學生課堂練習的機會比較少,我們可以設置課外口語作業。下面以課外口語項目為例,分別制定單個項目的評價目的、項目評價內容、項目次數、項目活動流程和評價標準。
課外口語項目的實施流程如下(見表2):學生以3-5人為一組進行自由組合,運用課外錄制微視頻的方式完成該口語項目。為了發揮學生的主體性,由學生以小組為單位確定活動主題和活動目標,并填寫“口語活動計劃表”。計劃包括:活動目標、學習資源、活動方式、組員分工、口語訓練安排、預期成果等,要求每次活動前由組員填寫,明確本次口語活動的目標并合理規劃。該步驟完成后,以小組為單位制作微視頻,在此基礎上進行組內評價與反思,填寫“小組活動監控表”?!靶〗M活動過程監控表”主要采用“成員自評+組內成員互評+成員反思”?!盎ピu”采用抽簽鏈式結構,每員負責連續監控下一位組員的口語參與情況,并做出書面評價; 被評組員進行反思撰寫反思日志,以促進個體的自我監控。課外準備工作結束后,學生以小組為單位在課堂展示微視頻,由教師和其他組代表做出個性化即時評價,并提出建設性意見。最后,學生根據這些評價進行進一步反思并重新制作微視頻,隨后,由教師審閱“口語活動計劃表”、“小組活動過程監控表”和微視頻作出終結性評價,填寫課外口語項目總評表。
該課外口語的總評成績應該把對學生學習過程的形成性評價和對學習成果的終結性評價都計入在內。因此,這里必須按照項目總評的評價內容、評價標準和評分比例制作項目總評表。表3為課外口語項目總評表的一個范例。在該總評表中,筆者把學習過程的評價(包括活動計劃、自評、互評和反思等)和教師的終結性評價融合在一起,并對每次評價內容確定評價標準和評分比重。基于“終結性評價為主體”的原則,教師終評的比例應該占主導。具體的評分比重,不同的教師可以有不同的選擇。但是,形成性評價的比重在單個項目中的比例需要得到控制。這個比例一旦失控,學生容易對總評結果產生質疑和不認可或者產生形成性評價趨同,失去其意義。
最后,我們需要在項目評價完成后進行存檔。教師在期末根據所有單個項目的存檔(包括平時項目、期中測試和期末測試)填寫檔案袋總評分表并計算學生在這門課的總評分(表1)。項目實施中,有些項目的次數是限定的,比如期中測試和期末測試,一般只進行一次。但是有些項目可以多次實施,比如聽力、聽寫、口語等。多次項目一般采取最高成績為該項目評價分。假設課外口語項目在一個學期中總共進行三次,每次活動結束后會得到項目總評分。三次口語活動的所有過程材料(微視頻保存于U盤)都需要按要求整理納入檔案袋。學期末以總評得分最高的成績作為該項目的得分。這樣做的是為了給予學生更多的主動權,達到進一步提高學生學習動機和發揮學習自主性的目的。
4. 結語
《綜合英語》課程可以實行檔案袋評價的項目繁多,因為篇幅有限,本文不再一一列舉。不同的項目所采取的評價方式有所區別。比如,課堂表現適合用觀察法進行評價,課堂測試適合采取試卷+反思日志的形式,而課外自主學習則更多使用自評、互評和反思。雖然應用形成性評價來完成課外自主學習項目在教學實施中剛剛起步,但是相關研究表明,其效果和意義都十分顯著。如洪民等(2011)用形成性評價實施的課外自主閱讀既提高了學生的閱讀成績又激發了學生的閱讀興趣。因此,用形成性評價實施課外學習項目的數量和比重隨著形成性評價的推廣,應該得到逐步提升,改變目前終結性評價一統天下的狀態。此外,考慮到目前學生還不完全適應形成性評價,一線教師對形成性評價的了解也不多,有必要對一線教師進行適當的培訓,教師在實施形成性評價之前也應該給學生足夠的意識提升。外語學業評價從完全終結性評價到“形成性評價與終結性評價相結合”必定是個漫長的過程。在目前條件尚未成熟的情況下,教師也可以利用復合檔案袋方式將“多次平時測試+期中+期末”型的多階段性的終結性檔案袋評價作為過渡評價形式,然后逐步實施“形成性”與“終結性”相結合的評價。外語教學課程中,不僅《綜合英語》課程可以實施復合檔案袋評價,其他多數技能課程和知識課程,如《英語寫作》、《英語閱讀》、《英美國家概況》《英美文學作品選讀》等也都有較大的可行性。
評價方式關系到人才培養的教學效果。要改革現有的高校外語專業教學,我們除了要改變課程設置也需要實行多元化的評價方式和評價標準,并把《國標》提及的技能性、知識性和思辨性充分的融入進課程評價中,以促進教與學的發展。復合檔案袋評價是具有較大可行性和可操作性的評價方式。隨著電子檔案袋系統平臺的開發和電子檔案袋評價的應用,其資源共享的功能將得到進一步凸顯,這種評價方式也必將會有更好的發展。
參 考 文 獻
Black, P. D. William. Inside the black box: Raising standard through classroom assessment[J]. Phi Delta Kappan, 1998,(2):139-148.
Hein, G. S. Price. Active Assessment for Active Science [M]. Portsmouth, NH: Heinemann, 1994.
Messick, S. Validity In Linn, R. L. (ed.). Educational Measurement [C]. New York: Macmillan, 1989: 13-103.
Weir, C. J. J. Roberts. Evaluation in ELT [M]. London: Blackwell Publisher,1994.
高等學校外語專業教學指導委員會英語組. 高等學校英語專業英語教學大綱[Z]. 上海:上海外語教育出版社,2000.
洪民、詹先君、趙景梅.復合型檔案袋評價對外語閱讀能力的影響[J]. 外語界,2011,(2): 82-89.
李清華、孔文.外語形成性評價的效度驗證框架[J]. 外語教學理論與實踐,2015,(1): 24-31.
王 華、富長洪.形成性評估在外語教學中的應用研究綜述[J]. 外語界,2006,(4): 67-72.
姚蘭芝.試論形成性評價在高校教學中的作用[J]. 江蘇高教,2012,(2): 95-96.
章木林、宋紅波.檔案袋評價與英語自主學習能力培養的關系[J]. 天津外國語大學學報,2014,(2): 42-48.
仲偉合、潘鳴威.論《英語專業本科教學質量國家標準》的制定—創新和思考[J]. 現代外語,2015,(1): 112-121.
The Integration of Formative and Summative Assessment in English Major Courses
——Taking Comprehensive English as an Example
LOU Jie
(Foreign Language College, Zhejiang Shuren University, Hangzhou 310015)
Abstract: Learning assessment is a key part in FL teaching. The FL National Standard proposes that learning assessment needs to integrate both formative and summative assessment, to enhance the learning development. The paper differentiates the key conceptions of formative assessment, summative assessment and portfolio assessment, and analyzes their relations. Based on the analysis, this paper takes comprehensive English as an example to propose applying comprehensive portfolio assessment in FL course. The paradigm is creatively put forward afterwards based on the principle of summative assessment-directed and formative assessment-assisted, aiming to realizing the integration of both formative and summative assessment in school assessment system of FL courses.
Key Words: comprehensive assessment; formative assessment; summative assessment; integration
作者簡介:樓捷,男,碩士,浙江樹人大學外國語學院講師。主要從事二語習得研究。
通訊地址:杭州市樹人街8號浙江樹人大學外國語學院,郵編310015
E-mail:190239999@qq.com
(責任編輯:鄒春燕)