● 邵朝友
三要素表現標準框架的建構與驗證研究
● 邵朝友
表現標準是促進教—學—評一致性的重要保障,而構建一種合理的框架乃是開發表現標準的基礎。結合本國內容標準特征,架構了包括內容要求、表現水平、表現樣例的三要素表現標準框架,并以結構方程模型加以驗證。分析結果表明,模型的各項指標具有良好的適配度。三要素之間的高相關和最終數據分析顯示二階模型的存在。在此基礎上,文末審視了研究局限,探討了進一步研究方向。
表現標準;表現標準框架;結構方程模型
表現描述符和表現等級構成了表現標準基本內容,前者乃關鍵所在。這是因為表現描述符規定了表現標準質量要求,回答了學生掌握內容標準的程度和證據。若使不同用戶更好解讀表現標準,進而達成最大共識,還需要在這兩者基礎上增加一些要素,以便為文本解讀提供多個視角。那么當前有哪些表現標準框架、又存在什么問題、基于現狀應建構一種怎樣的本土化框架,就成為研究者必須直面的現實課題。
伴隨評價實踐的深入,人們發現極需要一種清晰界定學生學習達成程度的評價標準。它不僅可以為課堂教學提供規范,也為大規模考試提供標尺,進而為校內外的教學—評價—學習一致性提供技術保障。
這種評價標準就是表現標準。西方國家,特別是美國,早在上世紀80年代就開展了相關研究。目前各州基本都開發了表現標準,建立了綜合評價體系。在我國,教育部門和學界也逐漸認識到其重要性,開發學科質量標準(其本質是表現標準)已得到共識。但如何基于實際需要建構一種本土化框架乃是將來開發表現標準的重要議題。就此有必要考察、借鑒西方相關表現標準框架。
表現水平層級和描述符是構成表現標準最基本單位。縱向上,表現水平層級說明不同年級或年段應達成的水平層級,橫向上則描述出同一學習主題/內容/內容標準不同的表現水平層級,如 “高級”、“熟練”、“基本”三種水平。描述符則描述出不同水平的內在要求,如1996年美國國家評估管理委員會(National Assessment Governing Board)就規定了學生在8年級科學中獲得“熟練”水平必須達到的要求[1]:學生應知道和/或能收集基本信息以應用于物理、生活、社會環境。學生應能聯系簡單的思想來理解匯報與權衡。學生能分析原因與結果之間的關系,比如掠食性動物/犧牲者、生長/降雨量。學生應能設計實驗來回答包含兩個變量的簡單問題,能控制某個變量,收集、呈現數據,并以此做出結論。學生應能開始理解各種關系(如力與運動、物質與能源),并能開始理解作用于生物與非生物上的規律。
就目前文獻而言,構成表現標準框架的主要“變量”還包括認知復雜度、表現性任務、學生作品等。這些不同因素和表現水平的組合形成了各種表現標準框架。
1.五種典型表現標準框架
綜合各方文獻,可歸納出5種典型的表現標準框架(見表1)。下面簡要地對表中相關要素做一說明。
——認知復雜度指內容標準分解后各條表現期望的認知要求,其中馬扎諾四種認知水平包括:提取、理解、分析、知識運用。韋伯知識深度包括四種水平,即回憶與再現、應用基本技能/概念、策略性思維、擴展性思維。
——表現性任務是表現性評價的兩大組成要素之一,它對應于傳統標準化測試多項選擇題,更注重學生解決問題能力的形成。
——學生作品是指學生完成評價任務的作品或表現,評注則是對學生作品或表現的點評,也包括評價任務所涉及相關表現要求的陳述。

表1 五種典型表現標準框架匯總
2.分析維度與結果
可從相互一致、基于認知、邏輯嚴密分析表現標準質量。一致性指各構成要素的相互匹配關系。如描述符能明確地劃分不同表現水平,同一水平表現能包容不同表現水平的表現;或者表現樣例中的學生作品本身就與某表現水平相互匹配。基于認知包括兩層意思,一是開發表現標準過程要以認知心理學為基礎,二是表現標準開發結果要基于認知來呈現,特別是有關學生典型錯誤表現的作品。邏輯嚴密維度主要指向于表現水平。表現水平的設置需要采取邏輯約定,如對于含有多個要素的某條內容標準,達到“熟練”水平的規定為:在絕大多數要素上達到“熟練”表現;此外,邏輯嚴密維度還要求表現標準呈現不同表現水平。三個維度相互關聯、缺一不可,它們整體構成了判斷表現標準的分析架構。應用三個維度可對表1做如下分析。
——阿拉斯加州科學學科表現標準:部分考慮了用表現水平與內容標準的一致性;缺乏認知復雜度,不能把表現標準建基于認知心理學基礎上;表現水平層級的缺乏不能讓使用者了解內容標準的不同水平表現。
——科羅拉多州框架語文閱讀表現標準:缺乏認知復雜度:從其描述情況來看,表現水平還非常寬泛,在具體和抽象之間沒有平衡,沒有考慮學情,表現樣例的缺乏也使得教師、學生失去一個解讀表現水平的參考點。
——阿拉斯加州歷史學科表現標準:在內容標準—表現標準—認知復雜度上,部分體現了相互一致維度,但沒有具體說明評價任務與三者關系,其結果是不能很好地為評價設計提供參考;在基于認知維度上,沒有呈現學情,減少了教學的重要參考點,也使得難以據此進行評價設計;在邏輯嚴密維度上,沒有考慮如何確定表現水平層級。
——雷斯尼克等學科表現標準:在相互一致維度上,有表現要求和表現性任務,但沒有明確表現性任務的認知復雜度,使得表現標準難以發揮評價引導作用,評價設計與內容標準失去聯結;考慮了學情,并用評注的方式加以描述,很好地為教師和評價設計者提供參考點,也為學生提供示范;在邏輯嚴密維度上,沒有呈現表現水平層級。
——肯德爾等表現標準:規定了認知復雜度,但試題的四種表現水平不是表現標準的表現水平,前者只是來自試題的評分規則,后者應來自內容標準;此外,學生作品也沒有呈現,不能為每個水平做具體的參考點。
1.框架構成
為解決上述問題,本文嘗試提出一種三要素表現標準框架,它們分別是內容要求(包括表現期望、認知復雜度)、表現水平、表現樣例(包括表現性任務、學生作品)。
2.要素說明
——內容要求。它包括表現期望和認知復雜度。前者針對我國一些學科課程標準還不夠具體清晰而提出。換句話說,它是內容標準被分解后得到的陳述。但表現期望還沒有回答一個問題,即需要達到什么樣的認知類型,因此還必須考慮如何在認知要求上規定內容標準的掌握程度。本研究借鑒了韋伯的四類知識深度水平理論。
——表現水平。雖然認知復雜度規定了認知復雜層次,但還是顯得比較籠統。處于同樣的認知復雜水平的不同學生,其表現亦可能有所不同。例如兩位學生處于“應用基本技能/概念”,但表現未必完全相同,可能體現在熟練程度、細節、速度、流暢性上的差異。因此還需要對不同學生的表現做進一步劃分。
——表現樣例。表現樣例包括表現性任務和學生作品,二者相伴出現,為用戶提供解讀認知復雜度、表現水平參考點。特別當學生表現處于不同表現水平臨界點時,表現性任務和相應學生作品為區分不同表現水平提供具體參考。同時,劃定水平時可能發現不合理甚至錯誤的典型表現,呈現這些表現一方面它代表學生真實表現,另一方面它幫助教師把握學情。
驗證設計應用了結構方程模型,運用了Amos6.0分析軟體。圖1呈現了設計的路徑圖。

圖1 三要素表現標準框架假設模型
表2描述了模型變量對應表,具體交代了三個潛在變量、以及代表觀察變量的6個問卷題目。

表2 模型變量對應說明
調查范圍覆蓋浙江、山東、河南三省,相關信息見下表。數據收集乃通過問卷方式,剔除無效問卷,有效問卷共500份。具體調查時采取隨機方式進行,如調查當日在校教師,要求被調查者在20分鐘之內完成問卷并上交。

表3 調查對象基本信息
Amos6.0運行后輸出各類數據,其中顯著性概率值P=0.002<0.05,表明模型被拒絕,需要修訂。點選修正指標項(Modification Indices),輸出結果如下。從中可發現,若是將誤差變量e3、el由固定參數改為自由參數,則至少可減少卡方值10.290,因此增加兩者的共變關系。

表4 修正指標信息
Amos6.0重新運行后,得到圖2。內容要求、表現水平、表現樣例三個潛在變量之間的標準化后相關系數為0.77、0.70、0.84,表明模型總體具有很高一致性。Alpha(=0.6610)>0.6,表明修正模型具有較高內部信度。

圖2 標準化后的三要素表現標準框架驗證模型
模型的自由度為 5(Degrees of freedom=6),適配度卡方值為7.870(Chi-square=7.870),顯著性概率值為 0.164(Probability level=.164),未達 0.05 的顯著水平,接受虛無假設,即表明觀察數據與假設模型間可以適配。
Amos 還 輸 出 了 Baseline Comparisons、RMR、GFI、RMSEA、AIC、ECVI、HOELTER 等各項模型適配度指標,它們是判斷模型是否成立的關鍵表征,現以表5統整如下。
圖2顯示三個要素之間的路徑系數較高(0.77、0.84、0.70,皆不小于0.70),表明三個要素之上還存在一個更上位概念。從本研究來看,該上位概念就是表現標準。該二階模型構造如下。數據分析表明,各項適配度指標保持不變,進一步確證了該二階模型的存在。

表5 “三要素表現標準框架”驗證性因素分析的整體模型適配度檢驗摘要

圖3 標準化后的二階驗證模型
數據分析表明,三要素表現標準框架模型有較好適配度,是一個有機整體,并非“水果拼盤”架構,而各個要素之間的內在一致性有利于用戶多渠道解讀表現標準。
上述研究更多是指向框架本身是否成立,較少關注各要素的研究,加上研究樣本本身的限制,因此還需要在以下若干方面做進一步探討。
第一,擴大樣本數量與類型。這乃因為本研究樣本數量只有500例,雖然對于結構方程來說已基本足夠,但如果要做更廣泛外推,還需要更多樣本來驗證。同時由于樣本類型僅局限于某省城比較好的三所學校,因此還需要在全國范圍選擇更多類型的樣本。
第二,深化認知復雜度研究。本研究采用韋伯知識深度理論,雖然該理論已在美國20多個州得到廣泛應用,但還需要結合我國具體學科認識知復雜度分類進行驗證或調整。
第三,加強表現水平描述符研究。制訂描述符可能是最難的一個研究領域,描述符有什么特征、怎樣開發等等,都需要結合具體學科內容標準開展實證研究。
[l]Mills,C.N.,&Jaeger,R.M.Creating descriptions desired student achievement when setting performance standards[A].in Hansche,L.N.Meeting the requirements of Title I:Handbook for the development of performance standards[M].Washington,DC:U.S.Department of Education,1998:82.
[2][4]Alaska State Board Education&Early Development.Content and Performance Standards for Alaska Students[OB/EL].http://www.eed.state.ak.us/standards/pdf/standards.pdf.2005:119、138.
[3]Hansche,L.N.Meeting the requirements of Title I:Handbook for the development of performance standards.Washington,DC:U.S.Department of Education,1998:26.
[5]美國國家教育經濟中心、匹茲堡大學著,上海市教育科學研究院組譯.美國初中學科能力表現標準[M].北京:人民教育出版社,2004:3-18.
[6]John S.Kendall,Susan E.Ryan,Amy T.Richardson.The systematic Identification ofPerformance Standards[R].http://www.mcrel.org/pdf/Standards/5041TG PerfStnds.pdf.2010-2-9.
[7]Karin K.Hess,Dennis Carlock,Ben Jones,and John R.Walkup.Cognitive Rigor:Blending the Strengths of Bloom’s Taxonomy and Webb’s Depth of knowledge to Enhance Classroom-level Processes[R].Education Resources Information Center publication Ed517804.
邵朝友/華東師范大學課程與教學研究所教育學博士生
(責任編輯:張 斌)