圍繞核心素養視界下的課堂建設,本人撰文談了教材開發、活動開發。其實,評價問題才是制約核心素養建設的關鍵所在。有人說 “素養不素養,關鍵在評價” “管用不管用,關鍵在評價”,這種說法看似偏激,卻指出了一個基本道理,即如果評價環節對判定學生的素養水平不管用,那么,前期的教材開發、活動開發都終將退回應試教育的老路。2008年,崔允漷、夏雪梅在 《試論基于課程標準的學生學業成就評價》一文中,從課程標準與評價的關系角度提出這樣的觀點,認為在我國當前的教育大環境下,用課程標準取代教學大綱并不難,難的是要使課程標準真正發揮“標準”的作用,成為教材編寫、教師教學和學生學業成就評價的依據。 “這三點中無論哪一點都不是一件簡單的事,尤以學生成就評價為最。”因為 “只有當評價這一最后的出口是基于標準的時候,前兩者才有可能是基于標準的”。把他們的觀點遷移到當下的核心素養背景下的評價建設,道理也是一樣的。由此可見,評價建設在核心素養建設中非常重要。
這是從宏觀方面來說的。從微觀層面來看,從課堂上教師的 “教”與學生的 “學”這二者的關系來看, 有這樣一個基本事實, “教” 不等于 “學了”,“教了” 不等于 “學了”, “學了” 不等于 “學會”。學生的素養水平或者以考試成績表示的素養質態是“學會”的證據, 而不是 “教了” “學了”的必然結果。因此,作為教師更應該去關注 “學會了沒有”“學會了多少”, 而不是 “教了沒有” “教了多少”。因為 “教”與 “學”只是提升學生素養的手段和過程,而 “學會了”才是課程的追求和結果所在。如何證明 “學會了”,必須依靠評價。可見,無論是從宏觀還是從微觀角度看,評價在核心素養建設中都處于關鍵角色。
從評價本身來說,其內涵和外延都十分復雜。從外延看,評價包括課堂評價和訓練、課后測試、期中和期末考試直至中考、高考。其中,評價的先行者是課堂評價。本文僅以課堂評價為中心展開,可能會涉及一些與高考及其他的相關內容,但本文的主旨就是探討核心素養背景下的課堂評價開發的取向。
評價作為一個行動必須在一定的理論指導之下。從理論指導來看,除了有關評價的教育教學原理之外,當下的理論研究和實踐探索都對核心素養視界下的課堂評價開發有一定的指導意義,值得我們認真學習和借鑒。
辛濤老師在 《學生發展核心素養研究應注意幾個問題》一文中談到 “學生發展核心素養與學業質量標準的關系問題”時提出,質量標準 “可以用來指導教育評價”。并提出有關質量標準的理解及要求。他說,質量標準是描述經歷一段時間的教育之后,學生在知識技能、繼續受教育的準備以及適應未來社會等方面的能力上需要達到的基本水平。同時指出,要避免出現兩個標準的情況,即學科核心素養等級標準和學業質量標準同時并行。因為“這樣會給教育帶來不必要的震蕩”。辛濤老師在這里只是提出了評價的質量標準問題,并未在具體的評價操作層面進行更深入的說明。
李藝、鐘柏昌在 《教育研究》上發文 《談 “核心素養”》,他們的研究從布盧姆的 “三維”目標理論的不足出發,提出核心素養 “三層架構說”。他們認為核心素養有三層,最底層的是 “雙基指向”,以基本知識、基本技能為核心;中間層是 “問題解決指向”,以解決問題過程中所獲得的基本方法為核心;最上層的是 “學科 (廣義)思維指向”,指在系統學習中通過體驗、認識及內化等漸進形成的相對穩定的思考問題、解決問題的思維方法和價值觀,實質是初步得到認識世界和改造世界的世界觀和方法論;它最終發展成學生終身發展的基礎。三層架構形成一個整體,其中, “雙基”層最為基礎,學科思維層最為高級,問題解決層是聯結上下兩層的紐帶。并且提出,人的素養發展必須經歷從低到高三個層次,才是完整的和豐滿的;下面兩個層次,是學科思維形成的基礎;反過來說,一個獲得學科思維素養的人無疑已經具備了總攬下面兩個層次素養的能力。 (見圖1)

圖1 核心素養的 “三層架構”
本人對李藝、鐘柏昌老師的 “三層架構說” 比較感興趣。因為這一觀點試圖用立體架構形式詮釋核心素養中內在的素養要素之間的關系,它們不同于我們看到的一些觀點,如政治學科的學科素養 “國家認同、理性精神、法治意識和公共素養”四要素理論,畢竟, “四要素”之間是一種平面的平行關系;從另一方面說, “三層架構說”在教學實踐上有一定的可操作性。
季成偉老師在 《中學政治教學參考》2016年第一期發文 《學科核心素養內涵的三維思考》,提出 “四階漸進”的辦法是 “核心素養的有效評價”。認為思想政治學科素養的內涵是國家認同、理性精神、法治意識和公共素養的四維一體,對核心素養的有效評價應該是階梯式、漸進式的,要用不同指標來衡量。只有這樣,才能防止核心素養評價的神秘化、庸俗化。并提出評價的四個階梯,即感性體驗、理性表達、比較運用和自覺內化。盡管季老師提出了評價的四階梯思路,總體還停留在原則層面,可操作性不高。
陳曉鳳在 《中學政治教學參考》2015年1~2期發文 《向PISA學習試題命制》,提出命題的立意要關注學生發展,要創設必要的生活情境,要靈活運用設問方式,要充分運用智慧元素提高測試的附加值。就她的文章看,是從一般試題命題的視角來談命題要向PISA學習,沒有基于核心素養建設的視角。客觀地講, PISA作為OECD的 “素養的界定與遴選:理論和概念基礎”的后續研究成果,對于我們今天的評價開發具有很高的借鑒價值,值得我們重視。
另外,Solo分類評價法也是我們評價開發中值得學習的理論。Solo分類評價法是約翰.比格斯首創。Solo的英文全稱是 structure of observed Learning outcome,意思是可觀測學習結果的結構。這一評價理論是在皮亞杰的認知發展階段理論上創建起來的一種以等級描述為基本特征的質性評價方法。它把學生學習的結果分為 “前結構、單點結構、多點結構、關聯結構和拓展抽象結構”共五個層次。其中, “前結構”是一種低于目標方式的應答反應,表現為沒有形成對問題的理解,邏輯上混亂,沒有找到解決問題的辦法;“單點結構”表現為只能聯系某單一事件,從題干中只找出一個解決問題的辦法; “多點結構”則表現為能聯系多個孤立的事件,但沒能將這些孤立事件有機地整合起來; “關聯結構”表現為能聯想多個事件并將其統整為一個整體,能夠解決較為復雜的具體問題;“拓展抽象結構”表現為能夠進行抽象和概括,其結論具有開放性,使得問題本身的意義得到拓展延伸,具備高層次的學習能力。這一理論認為,學生的學習結果經歷著從量變到質變的過程,五個層次之間存在著質的差異,呈現出逐層遞進的關系,思維結構越復雜,思維能力的層次越高。總之,Solo分類評價法作為一種質性評價的方法,從學生的表現入手進行評價,符合今天我們的核心素養建設下評價的需要。
核心素養視界下的課堂評價的開發,既要吸收迄今為止我們在課堂評價活動中取得的優秀成果,這是我們發展課堂評價的基礎;又要認真學習其他國家素養評價開發的先進成果,把二者結合,形成我們自己有效的評價機制和模式,進而以科學的評價引領課堂變革,以課堂發展促進學生素養提升。下面,通過一些案例組合,試圖找出一些評價開發的取向,以期對我們的評價開發有所啟示。
1.關注學生真實的生活,體現學生主體的評價取向。評價作為教育教學的重要環節,對學生素養的評估起著不可替代的作用。另一方面,教書是為了育人,立德是為了樹人。評價開發作為核心素養建設的重要內容,其目標指向不僅在于評價學生素養狀況,更要通過評價促進學生素養發展,真正體現和落實學生的主體地位。
素養是學生自己在生活中長期內化積淀形成的東西,具有根源性、基礎性特征,不是外部強加的東西。素養評價必須找到學生發展的最基礎的東西,因為它對學生的終身發展具有根源性、基礎性的價值。從內容上看,核心素養的內涵非常豐富,但其根源在于學生的日常真實生活。就關注學生的生活,韓震教授有這樣的表述,所謂核心素養不在于知道什么知識,而在于能否創造性地將知識轉化為能力,轉化成日常行為表現。這里日常行為的背后就是日常真實生活。評價圍繞學生生活中的問題展開,評價的才是學生的真素養,這也體現了我們評價的人本取向。從我們現有的資料來看,立足學生的真實生活已經成為評價的一種基本價值取向。
案例1 (引自2012年PISA測試財經素養第6題):

問題:對戴維來說,以下哪個觀點可能是最好建議?在每個觀點后圈 “是”或 “否”。

?
點評:教學和評價都必須以真實的生活為基礎,評價學生在真實生活中處理真實問題的能力和素養。離開具體生活情境,任何投資理財的觀念、任何自我保護和安全意識都是空洞的、無價值的。評價安全意識是否成為學生素養,而不是空話,本案例起到示范作用。回顧我們的教學和評價,我們教給學生不同投資的特點,要求學生學會投資的多元化、分散風險。評價也圍繞投資多元化展開,事實上如果我們走進任何一家銀行,理財顧問會幫你解決這些問題。作為投資者最重要的素養是安全意識,而不是收益的多少。對比PISA題目的創設,我們感到,我們學生學到的只是知識,而不是素養;素養教育要求我們要在轉“識”成 “智”方面下功夫。這啟示我們,評價開發要超越我們考查學生投資多元化的老套路,要在真實的投資理財中考查學生的素養,如PISA案例中的處理金融詐騙郵件信息的安全意識,因為只有學生具有了安全常識、安全素養,學生才有自我保護的行為能力。這種評價才是回應核心素養發展學生的正確做法。
案例2(江蘇高考2016年第35題,節選部分內容)
材料一:某研究就我國資本回報率與銀行貸款利率進行分析,結果如圖3所示。
結合材料,運用《經濟生活》知識,回答下列問題:
(1)請判斷圖3中A和B哪一條曲線代表資本回報率,并說明作出判斷的理由。 (6分)

圖3
點評:這是今年的一道高考題,體現了命題向PISA學習的意向。該題考查了學生的一個基本的生活常識,學生作為潛在的投資者,必須知道這樣一個生活常識,即只有在 “資本的回報率”高于 “銀行貸款利率”時,投資才有回報。如果學生是一個不諳世事的 “書呆子”,答案就不好說了。所以, “書呆子”面對這樣的以生活常識為背景的考題還真不容易,因為,生活從來不只是一句話,生活經歷背后蘊含著人的理性精神、法治意識等多方面的素養。類似這樣的題材在今年高考中還有很多,如江蘇卷的第11題以“谷賤傷農”現象為背景考查供求與價格的變化關系、全國新課標卷Ⅰ卷中的第12題中的互補商品,Ⅱ卷中的第13題中的特別提款權 (SDR),Ⅲ卷中的第38題的 “互聯網+”等為背景的考查,從一定意義上說,考查是基于現代中學生的真實生活底蘊。這樣的考試題目對于我們平時評價開發是很好的示范,即評價要立足于學生的日常生活,要 “于生活中見素養”,不能是低層次的從 “知識”到 “知識”的再現和再認。
2.關注活動開發,體現活動性評價的要求。活動是評價的載體, “活動”開發是核心素養建設中課程建設的重要內容。課程 (Curriculum)一詞是從拉丁文 “currere”一詞派生出來的,本意是 “跑”(Race-course)。可見,活動本應成為貫穿于課程始終的載體,活動對課程本身而言具有特殊的重要性,這里當然包括評價環節。朱明光在 《關于活動型思想政治課程的思考》中也說,所謂活動型,與其說是活動課程承載學科內容的新革命,不如說是學科課程依賴活動實施的新類型。這里的 “學科課程依賴活動實施”中的 “活動”當然包括評價中的“活動”。有專家提出這樣的觀點, “知識+實踐=素養”。這里的實踐當然也是活動。如何把 “活動”與 “評價”結合起來,韓震教授在 《核心素養與活動型課程》講座中就核心素養下的評價有這樣的觀點, 他認為, 把 “內容標準” 與 “社會活動” 整合起來,一并呈現,共同考核。一方面,使知識性內容通過活動教學來實施,另一方面,使活動承載知識性內容的教學,并使學生的素養通過 “社會活動”加以可操作性測評。一句話,評價要活動化,活動設計要評價化。
案例3 (引自2012年PISA測試財經素養第4題):
在市場上你可以按重量 (2.75zeds/kg)或按箱(22zeds/10kg)購買番茄。
問題一:箱裝的番茄比散裝番茄價格更實惠。請給出一個理由來支持該觀點。
問題二:對某些人來說,買一箱番茄可能不是一個明智的財務決策,請解釋原因。
案例4 (來自我校某老師的課堂評價題)國家主席習近平在12月28日到北京西城區慶豐包子鋪月壇店用餐,點了 “二兩豬肉大蔥包子、一碗炒肝和一份芥菜”,共計21元。媒體報道后,人們冠之以“主席套餐”。主席套餐需求量是平時的數倍。這表明 ( )
A.消費對生產具有反作用
B.消費者受從眾心理影響
C.消費者受攀比心理影響
D.價格變化影響商品需求
點評:不比不知道。通過案例3與案例4的比較,我們可以體會核心素養下的評價的取向和開發的方法。案例3是來自PISA的試題,它通過巧妙的活動開發,引導學生作為活動主體參與其中,真實地考查了學生對商品市場價格有關問題的全面認識,通過對購買整箱番茄的利弊和得失的分析,體現了學生理性思維的能力和素養。按學科素養的話說,就是考查了學生的理性精神。這樣的題目實現了從知識立意邁上了能力、素養立意的新臺階,體現了素養評價的指向。按照李藝老師的觀點,既實現了 “雙基”素養的考查,又考查了學生的 “問題解決”能力。符合核心素養下評價的取向和要求。而案例4作為我們的一道常規的課堂跟蹤評價的題目,其立意仍然停留在知識本位。雖然本題涉及教材中的四個考點,但考查的是學生的知識再認水平;就思維能力的考查而言,僅限于考查學生對情境的理解力,層次不高。兩道題目相比,我們可以體會兩種不同教育思想主導下的評價取向和操作是根本不同的。從核心素養視界看,類似案例4的評價開發,有這樣兩個致命弱點:一是考查沒有活動化。這不是說本題的背景沒有人的活動,而是作為被評價的主體,學生無法進入到背景中去 “參與”活動,并在活動中展示自己的素養;第二,從消費心理這個知識點本身在教材中的地位看,它不是主干知識,本課的主干知識應是樹立正確的消費觀。從學科素養的要求看,如何評價學生消費觀的正確性才是關鍵所在。因為消費觀的評價涉及學生樸素的世界觀和方法論層面的素養,它對學生的發展具有更長遠的意義。這也提醒我們,就本課的教學內容而言,從消費觀層面進行命題評價更符合核心素養下評價的要求。因此,通過兩則案例對比,我們有這樣的啟示:一要搞好體現學生作為 “活動主體”的活動開發,讓學生 “融入”其中并成為評價情境中的主體;二要以核心素養為指導,搞好教材研究,圍繞主干知識開發有效的評價活動。
3.以學生在活動性評價中的表現為依據,落實質性評價取向。對于政治課程作為活動型學科課程的評價來說,表現水平是一個關鍵指標。針對政治學科學生的核心素養評價,其度量對象應是 “行為”,而不是“答案”;其分級的證據應是 “表現”,而不是 “要求”。因此,如何開發一個好評價指標體系,通過學生在 “活動”中展示自身的素養的狀況進行科學評價,是評價開發的一個重要內容。從目前的評價情況來看,Solo分類評價法作為一個重要的評價思想和方法已經在我們的高考和平時的考試評價中運用。就政治學科來看,運用Solo分類評價法對學生進行質性評價的,上海的政治高考是全國政治學科第一家,目前他們做得也最好。他們的做法和積累的經驗值得我們學習、借鑒。我們可以這樣概述Solo分類評價法的總體思路:要有效開發相關的活動情境,并針對該情境引申出來有意義的、指向素養的問題,要求被測試者運用學科知識和技能、學科思想和方法完成某 (幾)項任務,從而引發學生預期的行為表現,以證實核心素養的水平。
案例5 (2016年高考上海政治試卷第34題)
從制造大國向制造強國升級是中國制造2025目標,高品質產品是制造強國的標志。有位學者認為,打造制造強國需要具有工匠精神的匠人。工匠精神是一種專業精神,表現在對工作充滿熱愛與激情,工作中堅韌執著、精益求精、開拓創新,他是實現制造強國的金鑰匙。只有大國工匠才能支撐起中國精品。他論證說,歷史上,中國工匠曾經名揚世界。但隨著工業時代流水線生產代替傳統手工生產,工匠角色逐漸淡出。
近年來,一些企業片面追求即時效益,忽視產品靈魂——品質,靠 “山寨”和低價競爭,造成產品品質不高、企業自主創新能力偏弱。淘汰一族不斷擴大,從一個側面反映出國內產品設計人性化不夠,缺乏潮流引領、產品精細化不夠,耐用性不強等問題。如何提高品質是中國制造業面臨的現實問題,做大做強中國企業,需要呼喚工匠精神的回歸。
在全面倡導工匠精神,一個由工匠精神開啟的高品質時代就會到來。運用物質和意識辯證關系的原理,評析這位學者是否完整論證了他的觀點。
示例:物質決定意識和意識對物質的能動作用辯證統一。
物質決定意識。該學者依據制造業現狀,呼喚工匠精神回歸,這一認識符合客觀實際。意識具有能動地認識世界、改造世界的能力和作用。他提出在全社會倡導工匠精神,以此開啟中國制造業高品質時代,具有一定的合理性。但是,使意識的能動作用變成現實,還必須通過人的實踐活動。他在論點中提出了“打造制造強國需要具有工匠精神的匠人” “只有大國工匠才能支撐起中國精品”,而在論證中并沒有涉及實踐主體——匠人。缺少具有工匠精神的匠人,僅僅倡導工匠精神,中國制造高品質時代還是無法開啟。因而,該學者并未完整論證他的觀點。
評分量表:本題采用分析評分法。評分觀察的行為特征:概述評價標準;根據評價標準分析材料;獲得評價結論。
評分項1:概述評價標準 分值 (見表1)

表1
評分項2:運用評價標準分析材料分值 (見表2)

表2
評分項3:獲得評分結論
點評:案例6展示了上海高考對核心素養評價研究的最新水準,用Solo分類評價法,通過 “答案示例”和 “評分項表”對學生的素養表現的水平進行了比較客觀的質性評價。就題目本身看,其活動性稍顯不足,但仍值得我們研究和學習。
總之,如何開發評價作為核心素養建設中一個正在探索的重要內容,目前在國家層面還沒有提出明確的結論,更要求我們對評價的取向、探尋適合的評價方法等內容的高度關注。開發評價其立意要堅持核心素養化,要實現評價立意從知識到能力再到素養的提升;材料要情境化,情境開發生活化,寓素養評價于具體情境之中;評價內容活動化、議題化,把學生作為 “活動”主體, “移”入其中,便于學生更好展示自身的素養;評價要超越過去的 “原理+材料”形式主義、 “八股化”要求,要通過引領學生作出切合具體情境的 “真”答案來考查、評估學生的素養水平,借助solo分析法等工具進行科學測量。