王俊民,林長春
(1.重慶師范大學科技教育與傳播研究中心,重慶 400700;2.重慶市兒童發展與教師教育研究中心,重慶 400700)
當前,包括我國在內的世界各國與國際組織對發展學生核心素養給予了極大關注,并嘗試以核心素養為指導推進課程與教學改革。然而,核心素養的“落地”必須解決的一個關鍵問題就是評價。歐盟提出終身核心素養之后,各成員國對核心素養的評價表示深深擔憂,因為經驗表明課程中被有效評價的部分往往更加受到教師和學生的重視,更有可能被教和學。[1]這從另一角度反映出要實施基于素養的教育,一個非常關鍵的問題是要明確評價的內容與方式。新西蘭從2007年開始以核心素養為指導開展課程改革,2016年,新西蘭教育研究委員會(New Zealand Coun?cil for Educational Research,NZCER)發布的調查報告指出,學校在發展學生核心素養方面沒有取得太大進展,反而少數教師甚至開始為準備國家教育學業水平考試(National Certificate of Educational Achievement,NCEA)而進行專門練習,新課程的實施受到了國家教育學業水平考試的嚴重影響。[2]由此可見,倘若沒有與基于素養的新課程對應的評價體系,核心素養的“落地”必然遭遇困境。
本研究以國際上有關核心素養評價的文獻為研究對象,包括通過“Web of Science”和“ERIC教育資源信息中心”檢索到的少量期刊論文和通過官方網站檢索到的以相關組織機構名義發布的報告與文件,比如新西蘭教育研究委員會關于核心素養評價的研究報告、美國21世紀技能聯盟(Partnership For 21st Cen?tury Skills)關于21世紀技能評價的研究報告、美國國家研究理事會(National Research Council,NRC)關于21世紀技能評價的相關報告、歐盟關于核心素養實踐研究的項目報告以及比利時學者易克薩維耶·羅日葉關于核心素養評價的相關研究成果等。對這些文獻進行梳理分析,歸納總結國際上有關核心素養評價的理論與實踐經驗,從核心素養評價的本質、理念、基礎、方式和實施五個方面對核心素養評價的基本問題進行探討,以期能夠對我國核心素養評價有所啟示。
核心素養的評價必然首先要明確其評價對象——素養的本質。素養(competence)一詞在歐美國家有較長的歷史,且20世紀90年代在人力資源管理領域的文獻中占有主導地位。1987年,英國繼續教育部(Further Education Unit)認為,素養是個體成功表現所需的知識、技能和態度經驗的發展。[3]1996年,歐洲關于素養的一份專題研討報告指出,素養是一種綜合能力(general capability),由基于個人教育實踐所形成的知識、經驗、價值觀、傾向(disposition)等發展而來。[4]該報告同時指出,素養和表現不同,表現是在一個給定的情境下做事,顯示出某種素養或能力以及行動的傾向或潛能,表現是可觀察的,而素養無法觀察,只能通過觀察到的行為表現進行推測。2002年,美國教育部和國家教育統計中心(The National Center for Education Statistics,NCES)聯合發布一項研究報告中,研究小組提出了學習結果的層次結構(參見圖1)。在該模型中,素養是相關工作中知識、技能和能力與個體特質相互作用的結果,是個體學習經驗的整合;表現(demonstrations)是素養引起的外在結果,在這一水平上表現(performance)可以被評價。[5]

圖1 學習結果的層次
根據以上有關素養的界定可以看出,素養本質上是一種理論構想,是知識、技能、經驗、態度價值觀的綜合體,強調的是個體在一定情境下所表現出的綜合能力。而評價是收集信息并依據信息做出推斷、判斷和決策的系統過程[6],因此,對核心素養的評價,本質上就是收集能夠反映學習者綜合能力的表現性信息,包括語言、行為、態度等。有研究提出,核心素養可以被看作是一種復雜的表現,因此,其評價實際上是對復雜表現的評價。[7]
目前,許多研究者已經就復雜表現評價的性質進行了研究,一般來說,研究者的思考是以假設評價有兩個功能為前提:支持能力和品行的發展和提供總結性證據,并認為復雜表現的評價需要與過去的標準化紙筆測驗不同的評價形式。德蘭謝爾(G.Deland?shere)等認為,如果建立評價的總體目的是改善教學和學習,那么只有加強對證據的討論才能實現這一目的,他們注意到,素養從根本上來講是一種基于復雜表現的推論,因此,對復雜表現的評價首先需要確定可以用于推斷素養的證據的性質。[8]瑞琴(Rychen)和薩爾加尼克(Salganik)認為,當相關行為在多個環境中進行多次觀察時,推理得到加強,其表現考慮到認知、激勵、倫理和情感方面。因此,有必要整合一系列來源的證據。[9]對于表現的理解,加德納指出,倘若我們只考慮個人已經暴露的問題,根本無法確定他們是否真正理解,他們可能已經“明白”了,但是他們只是依靠一個良好的記憶,確定理解是否真正實現的唯一可靠的方法是提出一個新的問題或難題,然后看看他們是如何應對的。[10]新西蘭關于核心素養的一份研究報告指出,對核心素養的評價應該聚焦于支持終身學習和學習者的自主性,每個核心素養要多次評價。[11]綜上所述,對復雜表現的評價應該使用若干評價事件或新情境,收集不同類型的證據,并對這些證據進行整合。這就要求對學生進行一系列復雜的任務操作,最好能把學習者也納入評價過程。比利時學者羅日葉認為,通過復雜情境進行的評價是循著“整合的”邏輯進行的,按照這個邏輯,評價是在一個或若干個復雜情境中以“聯結的”方式檢查學生的學業獲得,而不是檢查他們總共學習了多少。他還特別強調,整合不是綜合,綜合是一種智力練習,主要屬于認知領域,而整合要運用屬于認知、動作和社會情感領域的一些能力,更多地針對具體任務,它只有在針對某一既定情境,或某一類既定情境的時候才有意義。[12]他稱之為“學業獲得的整合”。
由此來看,作為對復雜表現的評價,核心素養的評價要關注其情境性,在一個或多個新情境下對學習者的表現進行多次評價,強調學業獲得的“整合”,強調學習者的自主參與。
雖然各國都提出了核心素養框架,但核心素養的評價還需要對學習結果進行進一步的分類與細化,描述與素養相關的中間學習過程。正如PISA測試中對問題解決能力的具體細化一樣,學習結果需要被細化為一些次級領域。
美國21世紀技能聯盟為了開展對21世紀技能的評價,將21世紀技能按照思維方式、工作方式、工作工具和生活四個維度進行分類。思考方式維度包括創造性與革新性;批判性思維、問題解決、決策;學會學習;元認知。工作方式維度包括交流和合作。工作工具維度包括信息素養、ICT素養。生活維度包括公民素養(區域性和全球性);生活與職業;個人與社交責任(包括文化意識和素養)。[13]同時又將21世紀技能按知識、技能、態度與價值觀三個維度展開,從三個維度對21世紀技能進行具體描述,提出了每個能力評價的可能性。以思維方式維度的“批判性思維、問題解決、決策”為例,將其定義為六種認知思維能力:解釋、分析、評價、推理、解釋和自律,并從知識、技能、態度與價值觀三個方面進行了詳細闡述(參見表1)。
美國國家研究理事會的一份研究報告對2007年提出的5項21世紀技能進行評價研究,將其分為認知技能領域、人際技能領域和個人內省技能領域,并在此基礎上探討每一類素養評價的可能性和方法。認知技能領域包括解決非常規問題、批判性思維、系統思維三個認知技能,其中批判性思維是該研究單獨加上去的,并不直接體現在NRC的5個21世紀技能中。該研究報告指出,要開發一個有用的測試工具,定義就必須要足夠具體以便于寫下評價問題或者準備評價任務,而首先面臨的問題就是這些技能到底是各領域普遍通用還是某一領域具體使用的。該研究報告對包括PISA在內的多個評價項目進行分析,認為雖然批判性思維可能在某些領域因為訓練而有所提升,但并不意味著在其他領域也能夠更好地開展批判性思維,遷移僅僅只有在給予這一遷移以關注并促使其發生時才可能發展,也就是當學生學習了促進技能從一個領域向另一領域遷移的策略之后。[14]該研究指出,每個認知能力一定是基于一定的具體情境去教和學的,要想以一種普遍的方法通過讓學生記憶法則來達到發展認知能力的想法并不現實。對認知能力的評價首先要立足于具體領域,在具體領域的知識背景下去學習去評價,然后要更多地考慮將這種認知領域的能力遷移到其他領域需要滿足的條件,以便于學生更好地遷移。人際技能領域包括復雜交流、社交技能、小組協作、文化敏感性、處理多樣性。該研究通過對人際技能領域的內涵分析,借用了克萊恩(Klein)等在2006年提出的人際技能表現模型,這一模型包含了個人特質、生活經歷以及情境特質對人際技能表現結果的影響。從這一模型來看,人際技能要在一定的情境下使用,這就意味著若要評價組成社交技能的態度、認知過程和行為,就要在一種適宜的理想情境下進行。個人內省領域包括自我管理、時間管理、自主發展、自律、適應能力和執行功能。該研究報告對自我管理進行了界定,并指出評價自我管理的方法有自我報告、觀察者報告和任務表現。

表1 思維方式:批判性思維、問題解決和決策
不僅美國對21世紀技能進行細化,其他組織、國家以及個人研究都對核心素養進行分類或細化,大衛·柏伯(David Pepper)在梳理了歐盟各成員國目前對核心素養的評價之后指出,將核心素養進行拆分使其與學習結果對應是下一步工作的方向。[15]從當前的研究成果來看,對核心素養進行分類和具體化是核心素養評價的必然之路,也是其評價的基礎。
卡蘭齊斯(M.Kalantzis)等指出,傳統的評價措施,如標準化測試,不適合評價多元素養,即新經濟時代所需的技能,比如問題解決與共同協作,作為替代,他們建議采用以下四種方式進行評價:項目評價(需要規劃和解決問題的深入任務)、表現性評價(基于規劃和完成任務)、小組評價(全組或團隊成員)和檔案袋評價(記錄所開展的工作)。[16]針對情感意向的評價,卡爾(Carr)和克拉克斯頓(Claxton)區分了三組評價方法:通過觀察推斷情感意向、通過外部問題和訪談來判斷情感意向以及自我評價,其中自我評價又可以通過李克特量表的調查問卷、與觀察有關的訪談、自主學習故事/期刊、深入訪談、檔案袋(可以包含其他評價方法的信息)五種類型的評價形式來實現。[17]雷德克(Redecke)強調,要根據核心素養的不同內涵來確定評價路徑,目前基于計算機的測試、在線測試或簡化游戲以及電子檔案袋在核心素養評價方面發揮了效用,將來應加強學習分析和嵌入式評價相關技術的開發及其在學校課程評價中的應用。[18]美國21世紀技能評價聯盟的研究結果指出,ICT所支持的電子評價將使新的維度和多種素養的測量成為可能,支持合作解決問題、創造性實踐和交流等實踐素養和人際素養的評價,還可以評價高階思維。[19]
KeyCoNet(2012—2014)是歐盟終身學習計劃資助的一個為期三年的聯合研究項目,聚焦與基礎教育階段核心素養的實施情況分析。項目組收集來自30個國家100多個組織機構的相關資料。研究指出,由于核心素養模型建構的復雜性,其評價方式也十分多樣,需要考慮一系列的評價方式,包括標準化測試、電子評價(E-assesment)、態度量表評價、表現性評價、同齡人評價和自我評價等。[20]項目組發現,一些歐盟成員國設計標準化測試來評價社會與公民素養,但學會學習、主動意識與創業精神、文化意識與表達這三類核心素養卻無法通過標準化測試來完成。不過倘若標準化測試能夠包含以下內容,將對核心素養的評價意義重大:測試結構與內容反映真實的現實生活背景;需要通過一系列的推理或應用一系列素養來完成的多步驟題目;需要不同素養做出回答的一系列試題組合。然而,即便如此,標準化的測試也只能提供有限的學習表現。問卷調查可以用來評價學習者的社交和情感素養,比如評價學習者的學習態度以幫助解釋他們的表現,使用自我報告量表可以評價學習者情感的不同方面,但這些量表主要傾向于評價其影響因素而非學習結果。表現性評價作為一種評價核心素養的方式主要涉及教師在一段時間內通過一系列的任務觀察學習者的表現,可以是表現性目的或終結性目的;然而由于教師的判斷因人而異,這就使得評價結果的可靠性無法保證,不過有證據表明這種風險可以通過培訓和自我調整來進行控制。該研究還指出,教師反饋十分關鍵,教師的反饋要為學生留有反思的時間和空間,以發展他們獨立自主的學習能力。自我評價被認為是形成性評價的一個關鍵方面,為了內化教師的反饋,學習者需要反思他們的學習,同伴和自我評價實踐被認為是促進提升“學會學習”能力的重要策略。
可以看出,標準化紙筆測驗在部分核心素養的評價方面仍將發揮一定的作用,試題的情境性是不可或缺的重要部分,態度量表、表現性評價、學生自我評價以及同伴評價等與標準化紙筆測驗結合將成為學生核心素養評價的必然路徑,信息技術在核心素養的評價過程中將發揮重要作用。
KeyCoNet(2012—2014)研究報告指出,核心素養的評價過程不僅涉及具體的學習結果細化,而且要獲得相關政策領域的協同支持,包括政策與實踐評價、培訓與專業發展以及分享學習者的學習案例。[21]政策與實踐評價主要是通過評價為初期的政策與實踐效果提供反饋;培訓與專業發展主要為教師、學習者、學生家長以及其他人員提供相關培訓,包括使用技術進行評價的方法、支持同伴評價和自我評價的方法、細化學習結果的方法等;分享學習案例主要指充分利用評價核心素養的已有案例來指導培訓工作,促進實踐。美國21世紀聯盟的研究成果指出,無論是終結性評價還是形成性評價都要能夠反映對核心學科知識、學習與思維技能、ICT素養和生活技能的測評,要意識到這一實施過程將是漸進的,需要多個周期的循環與持續跟進。在這一前提下,要從以下方面著手:(1)構建需要的評價標準,為教師和教育工作者使用提供一定的案例和指導;(2)要制定評價計劃,在實施中不斷調整改進評價方案;(3)使評價與課程教學一致,幫助教師理解并在實踐中不斷調整教學策略;(4)開發教師專業發展策略,幫助教師使用策略評價21素養。[22]
可以看出,核心素養評價的實施將是一個循序漸進的系統過程,不僅要依靠政策制定者、教育研究工作者和技術設計者所提供的平臺與資源,還要充分發揮教師和學習者等群體的自主能動性,建立全方位的評價體系,獲取多方支持。
根據以上分析可以看出,核心素養的評價本質上是對學習者復雜表現或綜合能力的評估,評估要基于一個或多個復雜的具體情境,強調學業獲得的“整合”。當前,我國在具體學科領域構建學科核心素養框架,對學科核心素養進行分類界定與具體化描述,強調在具體學科情境下發展學生的學科核心素養,這是我國在具體學科領域保證核心素養“落地”的重要舉措。然而,當前的“學科核心素養”基本只針對認知領域,在個人內省領域、人際領域以及信息領域的體現不足,可能會導致教師對核心素養的理解片面化。[23]因此,對核心素養的評價不僅要關注對學科核心素養的評價,還要在超越學科的范圍內創設更為復雜、更加具有整合性的問題情境,關注人際領域、個人內省領域素養的發展與評價。核心素養的評價是一個循序漸進的系統過程,需要我們不斷打破學校壁壘,超越學科界限,獲取多方支持,構建全方位的評價體系,通過多種渠道獲取能夠反映學生素養水平的信息或證據。▲