[中圖分類號]G424.74[文獻標識碼]A [文章編號] 1673—1654(2025)04—058—009
《義務教育歷史課程標準(2022年版)》提倡教師建立“教—學—評”一體化意識[7,但該理念較為抽象,影響了教學實踐效果。SOLO分類法是對學生思維水平的質性評價方式,對學生的思維結構進行了五種層次劃分,即前結構層次、單點結構層次、多點結構層次、關聯結構層次、抽象拓展結構層次,體現學生的思維由簡單到復雜、從量變到質變的過程2]。基于SOLO分類法的學業質量評價注重分析學生答題時呈現的思維結構與認知水平,在學生外顯行為與內隱思維之間建立關聯,結合評價工具解釋學生的行為表現,對學生完成評價任務所達到的思維廣度與深度予以科學評定,打通內隱思維能力和外顯行為表現之間的邏輯閉環,解決學生思維成果內隱問題3,以評價學生的學習和教師的教學,實現“以評促教”“以評促學”。確定評價目標和設計評價任務是實現“教一學一評”一體化的重要環節。為了解國內SOLO分類法應用于歷史學業質量評價的研究現狀,選用中國知網為檢索源,以“SOLO分類法”“SOLO分類理論\"\"歷史學業評價\"為主題進行檢索,剔除無關文獻(即重復、相關度不高、專家訪談等文獻)后,對2004年至2024年發表的297篇文獻進行分析。梳理后發現,研究成果主要從宏觀層面探討SOLO分類法應用于學業質量評價的價值與啟示,確定具體評價維度、指標建構和制定評價量表等微觀層面研究較少。因此,研究將深入分析SOLO分類法應用于歷史學業質量評價實踐的可行性,為中學教師的日常教學評價提供評價框架和實踐路徑。
一、可行性分析
教師在開展相關評價工作時需要以SOLO分類理論為依據,使實施學業質量評價的過程符合SOLO分類法的理論特質。首先,基于SOLO分類法的學業質量評價與傳統評價的根本區別在于答案的開放性。題目的開放性表現在評價者的評價方式,而不是題目的設問方式。如果答案本身具有封閉性,那么再開放的提問也會禁錮被評價者的思維。其次,SOLO分類法的本質是依據學生的學習表現分析思維水平,教師在實施相關工作時,需要根據題目的考查要求劃分不同層次的評價標準,提煉出能夠區分學生思維層次的評價要素,并將這些要素與SOLO分類層次一一對應,體現遞進性和層級性。
學業評價任務的深度在一定程度上會影響學生的答題水平,教師在設計評價標準時不應要求每位學生都能夠達到抽象拓展水平,題目考查學生的思維水平不必涵蓋SOLO分類法的五種思維結構層次,有些題目可以低于五種思維層次,這與題目的考查要求有關。例如,要求學生比較“代田法\"和“壟作法”的異同,考查學生的概括能力,比較史實的共性和差異,學生在這類題型上不太可能呈現抽象拓展水平的答案。教師可以從題目組成的要素和維度切入,以確定題目的考查層次。要素即考查的具體要求,如把握史實之間的關系、理解特定環境對史實的影響;維度即學生目前所處年齡階段在完成任務時應達到的學習行為水平,如能夠區分史料的類型、能夠辨析不同出處或者不同觀點的史料。教師也可以從評價目標中探尋要素,以此確定維度。最后,教師在評價反饋階段需要總體分析學生的答題思路,對學生的行文邏輯和總體表述進行綜合判斷,不能像傳統評價一樣僅依據采分點進行打分。SOLO分類法作為一種新的思維能力評價理論,要求教師做到以上方面,方可有利于提高其應用于歷史學業質量評價的可行性,進而全面、客觀地評價學生的歷史學業質量。
SOLO分類法的評價方案會因學科性質的不同而有所差異,大部分教師表示此方法應用至教學實踐中比較困難。下文以九年級歷史學科為例,呈現SOLO分類法應用于日常學業質量評價的實踐流程,教師可以將實踐流程與具體學科性質相融合,抽象成評價體系,形成一套模型或原則,使用起來比較便捷有效。
二、應用實踐
(一)選擇研究對象
實驗對象選取江蘇省某市一所初級中學的九年級學生,參與研究的班級共有52人。在參與研究調查前,本班學生從未接觸過SOLO分類理論。關于該班級的歷史學業水平,依據學校的歷史任課教師描述:學生的歷史學業整體質量水平偏低,該班屬于其中較為良好的班級,部分學生的歷史學科核心素養水平和學科能力較強,但學業水平分層情況較為嚴重。在測試之前,告知學生測試與學習成績無關,僅作為科學研究使用,遇到不會的題目或困惑的地方盡量在試題旁邊寫下思路,以便收集更真實的數據信息。
(二)確定評價目標
以《義務教育歷史課程標準(2022年版)》的相關要求和學情為基點,以“一核三層三翼\"的內容為線構建評價目標框架,以初中歷史內容為面覆蓋考查范圍,確定評價目標。測試時長為40分鐘,鑒于選擇性試題側重考查學生對歷史知識的掌握程度,在綜合考查學生的邏輯思維能力方面不具有優勢,因此,測試采用非選擇性試題考查學生的歷史學業質量。為平衡測評的全面性和學生答題速度,對試題進行了簡化,測試共6題,均為材料分析題,可應用SOLO分類法對學生的答案進行評價。下面選取項目2.1為例,對不同思維結構層次的評價目標進行說明(見表1)。
中國共產黨不忘初心、牢記使命,立志于中華民族的偉大復興,譜寫新時代中國特色社會主義的絢麗華章。某歷史興趣小組開展以“堅守初心·汲取力量”為主題的探究活動,請你參與完成。
材料二:擁有先進理論武裝和高度先進性的革命政黨—中國共產黨應運而生脫穎而出,民族復興的大任歷史地落到了中國共產黨肩上…開辟了具有中國特色的革命道路和中國特色社會主義道路…創造了一個又一個奇跡。
摘編自張燕、周書煥《大黨魅力》
(2.1)材料二中的“革命政黨”成立的歷史意義是什么?

(三)修訂評價標準
為提升評價標準的有效性和可行性,確保研究的準確性和科學性,評價標準初步構建后,采用問卷調查法,向專家征詢建議,確立評價標準。
1.確定評議專家
為確保評議專家具備高度的專業素養,特邀兩名具有相關研究經驗的高校教師和三名從教多年的歷史教師作為評議專家。向專家們詳細介紹SOLO分類法的理論基礎與實踐應用,保證專家們充分明晰理論特質和實踐要求后,將評價標準編制成問卷,分別發放給每位專家,驗證評價標準和例述的準確性。
2.征詢專家意見
問卷圍繞SOLO分類法不同層次的典型表現[8],針對項目2.1進行分析,制定評價標準和例述,對符合度設置五個等級:1完全不同意,2不同意,3無意見,4同意,5完全同意,專家針對初步制定的評價標準與例述進行匹配度評分。如專家選擇了“1\"或“2”,需要在對應層次的\"修改意見\"欄中反饋修改建議。問卷發放五份,回收五份,回收率為 100% ,回收后對專家們的打分結果進行整理,結果見表2。


如表2所示,五位評議專家對此學業質量評價標準的評分,平均數都在4分左右,標準差均小于1,說明專家們都比較認可評價標準和例述。
(四)分析測評結果
前文僅針對項目2.1,從評價目標和評價標準兩個方面對SOLO分類法應用于學業質量評價的流程進行了詳細闡述,本部分針對測試項目的整體情況進行分析。
本次測試回收試卷共52份,回收率為 100% ,剔除無效測試卷2份,有效率為 96% 。應用Excel對數據進行整理后,導人Winsteps軟件進行Rasch模型分析,檢驗評價任務質量、學生整體作答情況、學生的歷史學科能力和評價任務難度、學生與學生之間的關系,以減少評價誤差。
1.測評工具質量評估(1)整體指標分析
Rasch模型檢測時,整體指標反映了測評工具和被試的整體情況。應用Winsteps軟件進行數據處理,得出項目的整體擬合統計結果,見表3。其中,S.D.為標準差,衡量數據的離散程度;MNSQ為均方擬合統計量,用于評估數據與模型的擬合程度,具體又分為加權(InfitMNSQ)和未加權的均方擬合統計量(OutfitMNSQ);ZSTD為標準化形式下的MNSQ,用于評估數據的擬合情況。

由表3可知,當項目的平均難度值為0時,被試的平均能力水平估計值為0.52,高于項目難度水平,說明被試有能力解答項目;被試和項目的誤差值分別為0.70和0.29,在合理范圍內;被試和項目的
MNSQ檢測值均在0.5\~1.5之間,說明測評工具整體擬合情況較好;被試和項目的ZSTD均在-2\~2之間;項目的分離度大于2,信度為0.92,表明測評方案整體信度較高,能夠檢測不同能力水平的被試。總體而言,測評工具符合Rasch模型的參數要求,可以進一步分析。
(2)具體項目擬合度檢測
除了對項目的整體質量進行檢驗,還應對不同題目的擬合度進行具體分析。通過數據處理,形成具體項目擬合檢驗結果,見表4。其中,S.E.為標準誤差,衡量項目難度或被試能力估計值的精確度;PT-MeasureCORR.為點-測量相關數值,用于評估單個項目與測試整體之間的關聯程度。

從表4中能夠看出,項目的難度在-1.40\~1.66,項目1.1難度最低,項目2.2難度最高;誤差在 0.21~ 0.39,屬于合理范圍;MNSQ和ZSTD數據也分別在合理范圍內;點-測量相關數值在0.21\~0.74,數值均大于0,說明每個項目與其他項目間存在良好的關聯,各項目與整個測評工具的一致性較好。總體來看,各項目的擬合程度符合Rasch模型的參數要求,測評工具呈現較好的質量,為研究奠定了堅實基礎
(3)項目難度與被試能力匹配性檢驗
Rasch模型的特色之一是能夠將項目難度與被測能力劃分至同一標度尺上進行對比,以懷特圖的形式呈現,即同時將項目難度與被測能力轉換成等距的Logit分數,直觀地表現出項目與被試的對應關系,應用Rasch模型對數據進行檢驗后,生成懷特圖(見圖1)。
懷特圖中間的豎線稱為Logit標尺,能夠比較項目與被試的分布情況,標尺左側代表被試能力水平分布情況,右側代表不同項目的難度分布情況,從下至上代表項目難度不斷增加,被試能力也逐漸增高。圖中每一個X代表一個學生,X的數量越多說明對應項目得分的人數越多。依據圖1,從被試分布角度分析,被試分布較為理想;從項目難度的角度分析,項目難度分布在-2\~2之間,分布比較均勻;從二者對應關系的角度分析,處于中間水平的人較多,缺少與高能力水平和低能力水平被試相對應難度的項目。說明項目的總體難度適中,適合大部分學生,對于高水平被試,項目相對較為簡單,針對低水平被試的題目略少,能夠看出學生之間差異較大,結果在預料范圍內。綜上,項目與被試對應符合理想狀態,能夠支撐后續研究。
以上對測評工具進行的信度、分離度、項目與被試匹配度、具體項目擬合度等多個角度的質量檢驗,均證明了測評工具的科學性和有效性,能夠依據數據對結果展開后續分析。
2.整體作答情況分析
整理測評結果所得數據,對學生整體的歷史學業質量進行分析,依據評價標準劃分思維結構層次。樣本平均分為20.94分,最高分為28分,最低分為14分,極差為14分,表明學生之間的差異較大,完成試題時所表現的思維水平差異較大。對學生整體作答情況進行整理,形成總體思維水平情況統計表(見表5)。


從表5中能夠看出學生的思維結構層次最低處于單點結構水平,最高處于抽象拓展結構水平。50% 的學生思維結構層次處于多點結構水平,說明大部分學生能夠從材料中提取到多方面的信息,但綜合概括能力較弱,不能將信息按照一定的標準進行歸類; 34% 的學生思維結構層次處于關聯結構水平,說明小部分學生能夠從材料中提取不同方面的信息并進行歸納,建立信息之間的聯系,論證完整,論點清晰,體現出較強的邏輯性;有 4% 的學生思維結構層次處于抽象拓展結構水平,說明只有極少數學生能夠對問題進行抽象概括,從理論上分析歷史現象的成因及發展規律;有 12% 的學生思維結構層次處于單點結構水平,表明少數學生只能依據材料聯想到單一的歷史信息。由此可見,學生的歷史學業質量水平大多數處于多點結構,其次為關聯結構,總體分布情況較為正常,被測試班級學生的總體思維發展水平良好。
(五)落實評價反饋
以項目2.1為例,本題側重考查學生對中國共產黨成立意義的理解,要求學生在作答時,能夠從材料中提取有效信息,對中國共產黨成立的歷史意義進行準確解釋,并結合史實辯證地評價,感悟偉大建黨精神。試題同時考查學生的知識獲取、歷史思維、歷史探究和歷史表達能力,要求論述應完整清晰、邏輯嚴謹。下文選取不同思維結構層次的典型答案,分析學生的思維水平差異,根據作答示例進行評價。
1.前結構(見圖2)
庚我們擁有了革命政黨:中國共產黨。
教師評價:該生沒有給出觀點,只回答了基本史實,沒有任何思維加工,題意理解錯誤,答案與題目無關,體現的思維水平較低。2.單點結構(見圖3)

教師評價:該生只能簡單了解題意,能夠提出觀點,但表述中不能使用充分的論據解釋論點,只能簡單說明,快速得出結論。學生僅從“開天辟地的大事”這一論據支撐論點,不能多角度闡釋,不足以支撐論點。
3.多點結構(見圖4)
中國共產黨的成之使中國革命的面貌從此煥然一新,而“新“體現在領導核心:中國共產黨,指導思想;馬克鬼主義、奮斗目標:實現共聲主義,領導階級:無產階級以上方面。
教師評價:該生能夠提出多樣化的史實對論點進行論證,作答時有意識地運用了相關史實,但所列出的論據之間沒有明顯的關聯性,僅僅是對提煉的信息進行了簡單組合。如圖4所示,學生提到了中國共產黨的成立使中國革命的面貌從此煥然一新,并從多方面論證自己的論點,但未將這些方面聯系論證,沒有考慮各因素的內在關系,整體思維水平不高。
4.關聯結構(見圖5)
自從中國有了中國共產黨,中國革命的面貌就此煥然一新。鴉片戰爭以后,中國逐步成為半殖民地半封建社會,在近代以后中國人民救亡圖存的斗爭中,中國共產黨誕延生了。經過北代戰,上地革命戰爭抗日戰爭、解放戰爭的浴血奮戰,中國共產黨成功地團結和領導人民,切底結來了中國半有民地半封建社會的歷史,實現了民方族獨立和人民解放。
教師評價:該生能夠根據題目要求聯系到記憶中原有的知識,進行聯系、探究,形成個人觀點,基本做到了緊扣題意。同時,學生能夠將論點和論據聯系分析、正確論述,歸納和概括能力較強。論述條理清晰、邏輯連貫,思維水平層次較高,但沒有進行更深層次的思考。
5.抽象拓展結構(見圖6)
教師評價:該生做到史論結合進行分析,論述完備,條理清晰,能深人思考與分析問題。學生不僅從新的“領導階級\"\"指導思想”\"奮斗目標\"等不同方面進行分析,還能聯系資本主義的殖民與擴張進行綜合分析,深刻理解相關史實,提出更深層次的內容,答案體現的思維層次水平較高。
三、結語
研究的目的旨在分析SOLO分類法應用于初中日常學業質量評價的可行性,從實踐流程和結果上看,結論基本上是肯定的。實踐流程方面,研究針對實施障礙,如不了解具體操作、缺乏可直接使用的評價體系等問題,以及目前研究現狀中具體評價維度、指標建構等研究成果較少的情況,從不同方面進行了詳細闡述,搭建了實際、詳細的評價框架。在確定評價目標和評價標準方面,基于題目的考查要求,詳細闡述了不同思維結構層次的評價目標、“典型表現”和具體題目中每一層次的答題例述。在評價反饋方面,提煉不同層次的“典型表現”,如單點結構層次的學生只能認識到問題的單一方面,抽象拓展結構層次的學生能對問題的認識上升到抽象的理論認識層面,當學生答案水平符合某一層次的“典型表現”,即可判斷學生處于什么思維結構層次。培養學生的學科核心素養需要重視學生在學習過程中的思維發展,開展思維結構考查是促進學生學科素養形成的重要途徑。從實驗結果上看,評價效果優于傳統教育評價,在一定程度上扭轉了“唯分數”的教育評價導向,能夠發現學生思維成果的內隱問題,幫助學生提高思維結構層次,發展學生的學科核心素養。
總之,將SOLO分類法應用于學業質量評價能夠分析學生的學習行為表現,評價其思維結構層次,進而采取相應的教學策略,使學生的學科素養和關鍵能力得到提升。同時,也為實現\"教一學一評”一體化提供了新視角,明確了“教師應該教到什么程度、學生應該學到什么程度”“學生的學習效果如何、教師的教學效果如何\"等問題,有助于課堂教學效果達到最優化。
參考文獻:
[1]教育部.義務教育歷史課程標準(2022年版)[M].北京:北京師范大學出版社,2022.
[2]潘瑜,吳維寧,孫元平.SOLO試題質量檢測的實證研究[J].考試研究,2020,(03):53-59.
[3]馬志強,沈詩淼,杜鴻羽.基于SOLO分類理論的思維發展表現性評價研究[J].遠程教育雜志, 2024,42(03):52-58+67
[4]黃牧航.歷史教學與學業評價[M].廣州:廣東教育出版社,2005:212.
[5]郁蓓.SOLO分類法在高中歷史試題命制的應用研究——以
歷史開放性試題為例[J].課程教學研究,2024,(09):95-100.
[6]戴羽明,張曉靜,樊穎,等.指向高中歷史學科核心素養的關鍵能力考查與培養——以2023年天津市普通高中學業水平等級性考試考生水平表現為例[J].考試研究,2024,20(03):40-51.
[7]謝梅沁.基于2022年版課程標準的中考命題探索與實踐[J].福建教育學院學報,2024,25(02):102-105.
[8]劉冰一.基于SOLO分類評價理論的高中歷史開放性試題評價工具研究[D].河南大學,2022:32-33.
[9]羅金永,楊艷,任洪來.基于平穩過渡致力素養提升—2022年天津中考歷史學科的轉型探索[J].考試研究,2023,(01):20-25.
A Practical Study on the Application of SOLO Taxonomy in Middle School Daily Academic Evaluation: Taking the Ninth Grade History Subject as an Example
Yu Bei Yu Fuye CollgeofHistory and Culture,Bohai University,Jinzhou,Liaoning,121000
Abstract:It is found that most secondaryschool teachersare afraidof SOLO taxonomy applied to history academic quality evaluation,facing the problems such asnot knowing the specific operation,lack of evaluation system thatcan beused directly,tooacademicand difficult topractice,etc.Inorder tosolvethe above problems, we take the ninth grade history subject as an example,and design SOLO taxonomy applied to junior high school daily academic quality evaluation to provide practical references for secondary school teachers.Based on the characteristics of the theoretical natureof SOLOclasification,theevaluation objectivesandevaluationcriteria areset basedonthe descriptionof historyacademicquality.Inorder toensure thevalidityand feasibilityof the evaluation tool,theevaluationcriteriaarerevisedbyusing the“questionnairemethod”.Intheevaluation feedback process,Winsteps software is used toanalyze the results of the Rasch model and provide feedback based on the students‘ learning results,presenting the whole process of SOLO classification applied to the evaluation practice of historyacademic quality and providing a practical example for daily academic quality evaluation.
KeyWords:SOLO Taxonomy,Assessment of Academic Quality,Ninth Grade History
(責任編輯:陳暢)