摘要:盡管經過多年的探索,綜合素質評價在各地的實踐中仍面臨諸多現實困境。因此,厘清政策視角下綜合素質評價的定位和實施路徑,以為其有效落地提供方向指引尤為關鍵。該研究基于大語言模型和K-means聚類等量化分析方法,對1985年至今的80份國家上位政策文件展開分析,深入挖掘政策文件中關于綜合素質評價內涵定位、目標定位、評價方法、結果應用的核心話語主題,并系統梳理這些主題在不同發展階段的演進脈絡及相互關系。基于研究結果提出以下發展建議:完善理論體系建設,體現綜合素質評價全面性與發展性的內涵定位;構建長周期診斷性評價體系,平衡選拔與育人雙重目標定位;加強技術賦能,建立兼具方法科學性與地方適應性的評價體系;探索數據轉換機制,提升綜合素質評價在教育宏觀治理中的調控作用;構建內涵定位、目標定位、評價方法與結果應用四位一體的閉環機制,推動綜合素質評價向與社會需求相適應的動態優化體系發展。
關鍵詞:綜合素質評價;評價改革;政策文本分析;大語言模型;K-means
中圖分類號:G434 文獻標識碼:A
*本文系國家重點研發計劃“社會治理與智慧社會科技支撐”2021年度揭榜掛帥項目“大規模學生跨學段成長跟蹤研究”(項目編號:2021YFC3340800)、2023年度北京師范大學中央高校基本科研業務費專項資金資助項目“智能技術支持的學生綜合評價方法和技術的創新研究”(項目編號:1233200007)階段性研究成果。
改革開放以來,隨著社會不斷發展進步,對大規模高素質人才的需求愈發迫切。傳統應試教育模式的弊端日漸凸顯,已無法滿足現實社會發展和人才培養的多元化需求[1]。在此背景下,素質教育成為我國教育改革與發展的主旋律。而綜合素質評價,作為扭轉傳統考試與評價制度的關鍵一環,也由此應運而生,并在過去幾十年的實踐探索中,從初步嘗試逐步走向全面實施。盡管如此,綜合素質評價仍面臨評價內容不明確、方式不可靠、結果難使用等諸多現實困境,致使其始終未能充分發揮應有的導向作用。因此,厘清我國綜合素質評價的定位與實施路徑,梳理其發展關鍵節點和痛點,探尋未來突破方向尤為重要。
政策文本,作為高度凝練國家意志和精神的重要載體,是洞察特定時代背景下領域發展戰略走向和演進過程的重要依據[2]。綜合素質評價作為一項在頂層設計下不斷獲得推動與支持的重要制度,深入解析國家層面的相關政策文本,有助于全面理解掌握其發展歷程、洞悉其發展機遇、預見其未來走向。盡管已有學者就綜合素質評價相關政策文本進行分析和梳理[3-5],但多采用解釋主義視角下的定性研究,一定程度上限制了對文本內容特征與規律的客觀提煉和直觀呈現。此外,已有研究多圍繞教育部發布的操作層面的政策文件,對國家上位文件的分析略顯不足。
鑒于此,本研究旨在從新經驗主義視角出發,聚焦于綜合素質評價相關上位文件,借助大語言模型和K-means聚類等量化研究方法對政策文本進行分析,旨在從更宏觀的政策視角來分析我國綜合素質評價的內涵與實施路徑及其演進發展歷程,并基于此提出發展建議,以期為綜合素質評價的落地提供參考。本研究主要圍繞三個研究問題展開:(1)政策視角下我國綜合素質評價的定位是怎樣的?(2)政策視角下我國綜合素質評價的實施路徑是怎樣的?(3)政策視角下我國綜合素質評價的定位與實施路徑之間呈現怎樣的關系?
(一)研究范式選擇
研究范式是指研究者所秉承的基本信念和研究立場,指引著研究者明確要研究什么、如何開展研究以及如何來理解和闡釋研究結果[6]。既有相關研究多遵循解釋主義研究范式,基于定性研究方法來理解政策文本背后的含義、意圖和社會語境。然而,解釋主義強調研究者個人對文本的理解與闡釋,研究過程往往缺乏充分的客觀證據支撐,研究結果也就難以避免地高度依賴于研究者的主觀判斷和個人經驗,缺乏足夠的普遍性。鑒于此,本研究將遵循新經驗主義(New Empiricism)研究范式[7],基于大語言模型和K-means聚類等量化數據分析手段,識別和挖掘出國家政策文本中蘊含的規律,并結合社會文化與政治背景對其進行解讀和闡釋,以更全面和深層次地理解政策視角下我國綜合素質評價的定位與實施路徑。
(二)政策文本選擇
1985年,鄧小平在第一次全國教育工作會議上指出:“我們國家,國力的強弱,經濟發展后勁的大小,越來越取決于勞動者的素質,取決于知識分子的數量和質量”[8]。同年發布的《中共中央關于教育體制改革的決定》明確指出:“在整個教育體制改革過程中,必須牢牢記住改革的根本目的是提高民族素質,多出人才,出好人才”[9],這成為素質教育以及后來綜合素質評價實踐的思想源頭。基于此,本研究將1985年作為起點收集相關政策文件。考慮到本研究旨在從宏觀政策視角,圍繞上位文件探索綜合素質評價發展情況,因而將對綜合素質評價定位和落地實施具有重要指導意義和價值的國家層面政策文件、法律法規、教育方針以及黨的教育指導思想作為文本選取依據,選取歷次黨代會報告、政府工作報告、五年計劃(規劃)綱要、教育法律、全國教育大會(工作會議)領導人講話以及中共中央、國務院發布有關教育評價重要指導性文件6種類型的政策文件。對于黨代會報告、政府工作報告、五年計劃(規劃)綱要等綜合性文件,僅截取與教育直接相關的內容段落,以確保研究的針對性。最終確定80份政策文件共計239819字作為本研究分析樣本(如表1所示)。

(三)文本分析框架
為更深入地回答本研究的三個研究問題,即理解政策視角下我國綜合素質評價定位、實施路徑及其關系,研究將定位細化為內涵定位和目標定位,將實施路徑細化為評價方法和結果應用,并圍繞這四個維度對相關政策進行分析。內涵定位作為綜合素質評價定位的邏輯起點[10],決定了評價所承載的教育理念和價值取向;目標定位確保了評價的方向和重點是否與教育遠景目標和社會發展需求相匹配;評價方法是綜合素質評價從政策概念走向落地實踐的關鍵橋梁;而綜合素質評價結果的應用則是確保評價發揮指揮棒效用的重要一環。
為把握我國綜合素質評價政策的演進脈絡,研究對其發展階段進行劃分,并分析各階段的主題演進規律。對綜合素質評價起關鍵導向作用的政策文件作為階段劃分的依據。1985年《中共中央關于教育體制改革的決定》推動應試教育向素質教育轉變,奠定了綜合素質評價的思想基礎。1999年《中共中央國務院關于深化教育改革全面推進素質教育的決定》正式提出要突出對能力和綜合素質的考查,成為綜合素質評價探索實踐的關鍵起點[11]。2014年《國務院關于深化考試招生制度改革的實施意見》正式將綜合素質評價納入考試招生制度改革,推動其走向常態化實施[12]。2020年發布的新中國首個有關教育評價的系統性文件《深化新時代教育評價改革總體方案》則為評價體系的創新和完善指明方向[13]。鑒于此,研究將綜合素質評價發展劃分為4個階段:1985-1998年的基礎奠定期、1999-2013年的探索實踐期、2014-2019年的常態實施期、2020年至今的創新完善期,并據此展開分析。
(四)文本分析方法
在新經驗主義范式指導下,研究基于大語言模型、文本聚類等量化分析手段提取海量政策文本數據中的特征和規律,以洞察綜合素質評價在上位政策文件視角下的定位與實施路徑。文本分析大體可分為以下五個步驟:
(1)數據預處理:研究首先依據句號、問號、感嘆號、換行符作為自然分隔符對所有政策文本進行分句處理,并移除句中空格。考慮到語義信3e703d056c1250dc043f5256053a42783af501c98576753ee7b116f1a86a58d5息的完整性與豐富度,舍棄文本長度不足10個字符的語句片段,最終得到5417個內容豐富、結構完整的語句。
(2)文本向量化:研究首先將內涵定位、目標定位、評價方法、結果應用四個維度轉換成對應的查詢問題(如下頁表2所示),然后使用訊飛星火大模型向量化接口將所有政策文本及查詢問題進行向量化處理。依托大語言模型的深度語義理解能力,確保轉換后的向量能夠精準地反映原始文本的語義內容和上下文信息。
7849191611b0c216d1a34c7883dcd41e80acc33281ddec9e5e654bc335edaef6當余弦相似度閾值提高,平均匹配量(每個查詢問題匹配到語句數量的平均值)與重疊率(不同查詢中重復出現的語句比例)均開始下降。當閾值達到0.8261時,重疊率降到最低并開始回升,平均匹配量趨于穩定。這表明在此閾值前提高相似度能有效減少不精確匹配,超過則可能導致信息損失和查詢結果混淆。因此,研究選擇0.8261作為最佳閾值,以平衡信息精確度和完整性。為確保匹配準確性,進一步進行人工篩選,去除相關程度較低的匹配項。最終得到551條匹配語句。
(4)向量聚類:為識別政策文本中的潛在主題特征,研究采用K-means算法對每個查詢問題匹配的語句進行向量聚類,遵循肘部法則(Elbow Method)確定最優聚類個數[14]。通過分詞提取及詞頻統計,以初步掌握文本中的關鍵特征。
(5)主題演化分析:為考察綜合素質定位和實施路徑的政策變遷,研究依據四個階段分析主題間演化規律。首先通過余弦相似度量化連續時間區間內主題間距離(如公式2所示),距離越小表明兩個主題在內容上更接近,有演化基礎[15]。然后將距離關系進行最小-最大標準化(Min-Max Normalization)處理,分析主題間相對位置變化[16]。


(6)主題共現關系分析:為考察綜合素質評價定位與實施路徑間的關系,研究對內涵定位、目標定位、評價方法和結果應用四個維度的主題共現關系進行分析。若不同查詢問題下的兩個主題在同一政策文件中同時出現,則視為一次共現,通過計算共現頻次揭示主題間的關聯和互動。
(一)政策視角下的綜合素質評價定位
研究首先對政策文本中內涵定位和目標定位相關語句進行主題聚類分析,提煉出政策視角下的核心話語主題。然后對這些主題在綜合素質評價四個發展階段的演進進行分析。通過繪制桑基圖(如圖1所示),直觀展示其演進脈絡。圖中,從左到右依次展示了四個發展階段的主題分布,線條表示各階段間主題的流向,流域的寬度則反映了前后主題間關系的強弱。

1.內涵定位話語主題及其演進脈絡
政策文件對綜合素質內涵概念的探討共涉及五個主題。第一,強調學生的全面發展。從1993年《中國教育改革和發展綱要》提出要培養“四有”新人[17],到2018年全國教育大會上習近平總書記提出的德智體美勞全面發展[18],全面發展的理念不斷深化,也逐漸成為綜合素質評價的根本遵循。第二,關注學生面向終身學習的素養能力。政策文件多次指出,素質教育應為學生的終身發展奠定基礎,要培養與終身學習密切相關的能力[19][20]。第三,強調愛國主義精神,將其作為實現培養社會主義建設者和接班人教育目標的必要條件。如《國務院關于基礎教育改革與發展的決定》便明確要求學生具備愛國主義和集體主義精神[21]。第四,強調文化修養,特別是對中華優秀傳統文化與革命傳統的繼承與發揚,如《關于深化教育教學改革全面提高義務教育質量的意見》便明確提出傳統文化教育是發展素質教育的重要一環[22]。第五,強調社會實踐能力。多個政策文件均強調理論與實踐結合,倡導培養學生的創新和實踐能力[23][24]。
從主題演進分析結果可以看出,“全面發展”和“愛國主義”是政策文件中綜合素質內涵的核心主題,保持著高度的政策連續性和穩定性。自1999-2013年的探索實踐期起,“文化修養”也融入并擴充了兩個主題的內涵。推動人的全面發展是馬克思主義教育理論的基本觀點,是社會主義教育的本質追求;愛國主義則在任何歷史時期都對國家的凝聚力和向心力有重要影響,因而這兩個主題始終被視為學生綜合素質的核心要素,其內涵隨著時代發展不斷豐富和擴展。“社會實踐”和“終身學習”兩個主題自探索實踐期以來也逐漸被強調,并持續至今。隨著知識經濟和信息技術的飛速發展,個體持續學習和理論實踐能力日漸成為現代社會人才所必備的關鍵素質。
2.目標定位話語主題及其演進脈絡
綜合素質評價目標定位相關語句經聚類后得到5個主題。第一,貫徹全面發展的教育理念。這一目標根植于馬克思主義哲學思想,強調人的全面發展是歷史發展的必然要求和終極目標,因而綜合素質評價實施也致力于促進學生在知識、能力、品格、價值觀等各方面的全面發展。第二,強調推進教育高質量發展。如黨的二十大報告指出,要加快建設高質量教育體系、發展素質教育[25]。綜合素質評價作為素質教育的核心組成部分,即成為實現教育質量全面提升的關鍵策略。第三,強調促進學校制度改革。綜合素質評價旨在推動教育評價體系的多元化和科學化,打破應試教育模式,如《國家中長期教育改革和發展規劃綱要(2010-2020年)》[26]與《關于深化教育體制機制改革的意見》[27]均提出,建立科學、多樣的評價標準是促進學生全面發展的長效機制。第四,強調推進考試招生制度改革。通過綜合素質評價,突破“一次考試定終身”的局限,引導考試招生制度向更多元化、科學化的方向發展。第五,強調培養學生綜合能力。通過科學的評價體系,培養具有學習、創新、實踐、合作等多方面能力的高素質人才,推動社會的進步與創新。
盡管各主題間經歷了相互分流與合并,但整體u02re6JkBkf/A77Bi1zZgA==來看,自1985年我國從應試教育向素質教育轉型以來,“貫徹全面發展理念”“推進教育高質量發展”“促進學校制度改革”“推進考試招生制度改革”以及“培養學生能力”五個主題在不同歷史階段的政策文件中始終受到關注,展現出極強的政策穩定性和連貫性,反映出這些目標與國家長期的教育發展戰略以及社會需求之間的高度契合。
(二)政策視角下的綜合素質評價實施路徑
研究對政策文本中評價方法和結果應用相關語句進行主題聚類分析,并對各主題間演進脈絡進行分析,繪制桑基圖如圖2所示。

1.評價方法話語主題及其演進脈絡
從主題聚類結果來看,綜合素質評價方法包含六層意蘊。第一,強調對學生過程表現的客觀記錄。政策多次提到要注重過程性評價,如《國家中長期教育改革和發展規劃綱要(2010-2020年)》便提出要做好學生成長記錄,完善綜合素質評價[28]。第二,強調評價的科學性。如《深化新時代教育評價改革總體方案》就明確提出要充分利用信息技術,提高教育評價的科學性、專業性、客觀性[29]。第三,鼓勵建立政府、學校、社會等多方協同參與的評價督導制度,以提高綜合素質評價的透明度和可信度。第四,強調需要建立完善綜合素質評價使用辦法。多個文件均強調要根據城鄉差異和學生群體等實際情況制定綜合素質評價的具體實施和使用方案[30][31]。第五,倡導評價與課堂教學活動的有機結合。政策文件認為教學活動與資源是學生綜合素質發展的重要載體,評價活動應融入教育活動的各個環節,實現以評促教和以評促育。第六,鼓勵地方因地制宜制定具體辦法,允許地方展現自主性和靈活性,以適應不同地區的教育需求和特色。
根據主題演進分析結果,政策文件中對綜合素質評價方法的探討逐漸豐富和深入。在1985-1998的基礎奠定期,綜合素質評價尚處于理念萌芽階段,政策主要集中于“結合課堂教學活動”這一主題,旨在通過日常教學活動來提升學生的綜合素質。從1999年往后,隨著政策文件的不斷發布,“記錄學生過程表現”“提高評價科學性”“建立評價督導制度”“建立健全使用辦法”“結合課堂教學活動”“制定地方具體辦法”等主題相繼涌現,并在發展過程中不斷演化、分流和合并,可見綜合素質評價逐漸從理論構想走向實踐應用,并在實施中不斷完善。
值得注意的是,“提高評價科學性”這一主題雖然自1999-2013年的探索實踐期起一直是政策文件中反復強調的重點,但在2020年至今的創新完善期,這一主題并未從前一階段的任何主題中演進或分流而來,而是作為獨立主題重新出現,這表明當前階段綜合素質評價的科學性面臨著新的挑戰,傳統評價體系亟需進一步改革和創新,以適應新時代教育發展的需求。
2.結果應用話語主題及其演進脈絡
主題聚類結果顯示,政策文件對綜合素質評價結果應用的探討集中在三個層面。首先,強調將綜合素質評價結果作為招生錄取的重要參考依據。如《國家中長期教育改革和發展規劃綱要(2010-2020年)》便提出要完善綜合素質評價,為高中招生錄取提供更加科學的依據[32]。其次,強調將評價結果作為教育發展質量的評價標準,既用于對學生個人發展質量的評估,也用于對學校辦學質量及義務教育質量的全面評價。最后,強調評價結果承擔社會導向和調控的職能,引導社會對人才素質的重視,調整教育政策與資源配置,以推動社會整體教育質量提升和人才培養的優化。
隨著綜合素質評價逐漸發展推進,政策對其結果應用賦予的期待愈加豐富和細化。在1985-1998年的基礎奠定期,文件主要聚焦于“教育發展質量標準”這一主題,旨在建立和確保基礎教育質量的統一標準和規范。到了1999-2013年的探索實踐期,隨著經濟社會的發展和對高素質人才的需求增加,“教育發展質量標準”逐漸細化并分流出“招生錄取參考依據”這一新主題,旨在通過完善評價體系為招生錄取提供更科學、公正的依據。在2014-2019年的常態實施期和2020年至今的創新完善期,政策文件進一步豐富,“社會導向調控診斷”這一主題出現,反映出社會對綜合素質評價的期待已超越教育質量保障和招生制度優化,還希望其能夠在更廣泛的社會層面發揮導向和調控作用。
(三)政策視角下的綜合素質評價定位與實施路徑關系

研究分析了不同發展階段中內涵定位、目標定位、評價方法與結果應用四個維度主題間的共現關系,并通過無向帶權圖展現各主題間的關聯(如圖3所示)。線條越粗,代表主題之間的共現頻率越高,關聯程度越緊密。
可以看出,在1985-1998年的基礎奠定期,內涵定位與目標定位的共現頻率較高,而與其他主題間的關聯相對較少,表明該階段政策更多集中于如何將綜合素質這一抽象理念轉化為明確的目標框架,而尚未落實到實操層面。進入探索實踐期和常態實施期后,四個維度間的共現關系明顯增強,特別是目標定位與評價方法的聯系更為緊密,反映出政策愈發重視如何通過具體評價方法實現目標,將理念付諸實踐。然而,2020年至今的創新完善期,內涵定位與其他維度間的共現關系明顯減弱,結果應用與其他維度間的聯系增強,這可能意味著在這一時期政策更加注重通過評價方法和應用手段達成既定目標。這種對操作導向的強化,導致內涵定位與其他操作性維度間的聯系相對弱化。
(一)圍繞全面性和發展性的內涵定位核心,推動評價理論體系建設
從研究結果來看,政策文件對綜合素質內涵的探討主要聚焦于兩個核心方面。一方面是對學生全面性基礎素質的關注,特別是學生在德、智、體、美、勞等多個維度的均衡發展。政策文件尤其突出對學生愛國主義情懷與中華傳統文化認同方面的重視。這些素質不僅是個體健康成長的基石,也是塑造具有全球視野、同時深植本土文化土壤的全面發展人才的關鍵要素。另一方面則是對發展性高階素養的關注,即注重培養學生獨立思考、創新思維、語言表達等面向學生終身學習的素養能力。特別是當前百年未有之大變局下,這些高階素養能力對學生適應快速變化的世界和個人持續成長至關重要,因而在政策層面被愈發強調。總體而言,政策視角下對綜合素質的內涵定位可以歸結為以德智體美勞全面性素質為基礎,以面向終身學習的素養能力為追求,旨在培養出合格的社會主義建設者和接班人。
盡管政策上對綜合素質內涵提出了較為明確的原則性指向,但“綜合素質”這一概念該如何準確界定,仍然缺乏清晰統一的答案。對于具體實施而言,內涵上的模糊性致使其難以為評價實踐的探索提供清晰、有效的理論支持與操作指導。2014年,教育部發布的《關于加強和改進普通高中學生綜合素質評價的意見》,將評價內容界定為思想品德、學業水平、身心健康、藝術素養、社會實踐五個維度[33]。隨后,各地政策制定者與實踐者便遵循這一文件,試圖通過逐步細化和拆分這五個維度,以此來詮釋究竟何為“綜合素質”。然而,文件中這所提出的五個維度更多是為了滿足實際操作和量化評估需求而設計出的“操作性邏輯”,其本質在于為評價提供一套可操作、可實施的框架,而非對綜合素質內涵的全面闡釋,且尚未完全體現出政策層面對其內涵的原則要求。若簡單將其等同為綜合素質的完整內涵,則可能在評價與培養中忽視學生成長發展的多樣性。為解決這一問題,亟需進一步明確綜合素質的內涵,并依此構建融合全面性與發展性原則的科學的評價理論體系。目前,國內學者在該領域已進行了初步探索,為綜合素質內涵與評價體系的完善提供了有力參考。例如,柴喚友等人提出,綜合素質可被界定為“學生在受教育過程中形成的跨越學科的關鍵能力、必備品格和深化價值觀的個性化有機融合”,并構建了以自主發展、文化修養、社會參與三大維度為基礎的評價理論模型[34]。此外,張治等人基于核心素養視角,構建了涵蓋學生品德發展、學業發展、身心發展、人文底蘊、實踐創新等維度的綜合素質評價指標體系[35]。但當前理論研究在地方實踐中的轉化仍然有限,因而需要在完善綜合素質理論體系建設的同時,加大政策層面的推動和支持,以促進理論研究在地方實踐層面的有效轉化和廣泛應用。
(二)聚焦選拔與育人雙重目標定位,構建長周期診斷性評價體系
政策視角下綜合素質評價的目標定位緊扣全面發展的教育理念,旨在以選拔和培育作為突破口,扭轉長期以來的應試教育傾向。具體而言,政策文件強調將綜合素質評價作為考試招生制度改革和學校制度改革的撬動點,期望通過將其納入高利害考試的選拔依據,從根本上打破過去以分數為唯一標準的選拔機制。同時,政策進一步突出綜合素質評價在學生培養中的核心作用,視其為培育學生全面發展能力和素養的關鍵途徑,試圖通過評價的育人功能,在潛移默化中逐步引導社會形成對素質教育的正確認識,推動教育理念的轉型和社會觀念的革新。
然而,選拔和育人雙重目標的實現卻面臨現實上的困境,根源在于選拔背后的功利主義導向與育人背后的人本主義導向的內在沖突與矛盾。當前,各地綜合素質評價實踐大多遵循2014年教育部發布的《關于加強和改進普通高中學生綜合素質評價的意見》[36],以學生日常表現的客觀記錄作為重要質料來進行評級與賦分。盡管這種評價手段在一定程度上能夠反映學生全面而長期的成長過程,并關注能力、品格、價值觀的培育,但基于質性材料的簡單粗暴的主觀評價難以保證評價結果在選拔中的科學有效性。另一方面,若評價體系過于注重其在升學和選拔中的決策功能,并傾向于通過快速、標準化的方式衡量學生的能力,則極易導致育人價值被邊緣化,從而背離綜合素質評價的初衷[37]。因此,如何有效平衡兩個目標之間的張力,使綜合素質評價的目標定位能夠真正指導實踐落地,成為當前亟待解決的難題。在此背景下,素質導向的長周期診斷性評價或可為育人和選拔之間的矛盾提供解決方案。即通過建立一套面向學生成長發展的科學評價工具體系,以持續、周期性的診斷和反饋方式,精準、客觀地衡量學生在各個素養和能力維度上的發展情況。此類評價既可以通過多元化的評價標準,引導社會更加重視學生全面而個性化的成長,使育人價值回歸教育評價的核心;同時,也為高利害選拔提供了更加科學、全面的量化數據支持,從而提高了評價結果在選拔中的公信力和有效性。
(三)強化評價方法科學性與地方適應性,加大技術賦能探索力度
從研究結果來看,政策層面對綜合素質評價方法的探討主要集中在兩個核心層面:評價科學性與地方適應性。首先,政策文件強調評價的實施應該以科學性為首要前提。尤其是自2020年綜合素質評價進入全新發展階段以來,政策文件開始以新的話語體系,強化了對評價科學性、專業性和客觀性的要求。這也反映出政策層面期望通過信息技術,特別是人工智能、大數據等先進技術手段的應用,構建起更加具有可信度和公正性的評價體系,以在全球競爭加劇、人才需求迫切的背景下,讓綜合素質評價真正肩負起選拔與育人的雙重使命,來幫助識別和培養出符合國家發展戰略需求的人才。其次,地方評價的適應性與自主性也是政策文件中另一重要討論點。政策層面強調各地能夠根據自身的教育環境、資源配置、學生情況等特點,設計符合本地的綜合素質評價督導制度、評價具體實施辦法以及學評融合方案,形成適應本地需求的教、管、評一體化方案。
但遇到的現實阻礙在于,技術賦能的評價方案往往需要大量的前期投入與持續的維護成本,而各地區在經濟發展水平、資源條件、技術基礎等方面存在顯著差異。對于欠發達地區而言,面臨技術基礎設施薄弱、資金匱乏、專業人才短缺等多重挑戰,其在構建適宜本地的評價體系時不得不選擇技術要求較低、易于實施的替代方案,進而可能導致其評價體系的科學性上受到削弱。而政策方面其實已意識到技術賦能在綜合素質評價實踐中的潛在瓶頸,開始集中調動資源,探索全國范圍內技術支持的評價解決方案。2022年,教育部發布《關于開展信息技術支撐學生綜合素質評價試點工作的通知》[38],并在全國范圍內遴選了30余試點區域,計劃通過五年的先行探索,由國家牽頭組織建設評價工具和平臺,提供專項培訓和技術指導,最終形成適應不同地區的技術驅動的綜合素質評價方案。然而,試點工作受限于時間和區域,成果覆蓋范圍仍顯不足。要確保技術賦能的評價體系能夠在更大范圍推廣應用,未來仍需依賴長期的政策支持,將試點的成功經驗輻射到更多區域。同時,需進一步加大對技術支撐教育評價的研究投入,加速科研成果向地方實踐的轉化,以推動綜合素質評價向更科學和專業的方向發展。
(四)深化評價結果宏觀調控功能,探索構建評價數據轉換機制
政策視角下對綜合素質評價結果應用的期待逐漸豐滿。首先是從微觀層面,綜合素質評價結果被賦予作為招生錄取參考依據的重要功能,用以建立更加符合全面發展教育理念的評價選拔機制,滿足社會對高質量人才的迫切需求。隨著政策實施的不斷深入,對綜合素質評價結果應用的期望也逐漸擴展至宏觀調控層面。政策期待將其作為把握教育質量發展全局的關鍵工具。通過對評價數據的持續收集和系統分析,為全面掌握全國教育發展水平提供客觀的決策數據,并據此來優化教育政策、促進教育資源的合理配置,調整和完善人才培養戰略布局,以確保教育體系能夠持續回應社會和經濟發展需求。
然而,當前政策層面存在著一定的沖突矛盾,阻礙了評價結果的有效應用。一方面,想要綜合素質評價結果為宏觀戰略調整提供科學依據,這就要求評價結果在跨學校、跨區域間具備可比性,方可對全國教育發展狀況進行全局把握。而另一方面,如前所述,政策鼓勵各地因地制宜建立綜合素質評價方案,甚至許多地區的綜合素質評價已實施了“一校一案”的靈活評價模式,導致評價結果的適用范圍往往僅局限于校內或區域內。這種地方適應性與國家一致性需求之間的割裂,使得綜合素質評價結果難以在國家層面發揮其預期的調控作用。綜合素質評價政策在地方已積累了長期實踐,無論教育行政部門、學校亦或社會,都在現有政策框架下形成了路徑依賴。如完全推翻現有評價方案,強制執行統一的評價標準,以獲取全國性的可比結果,可能會增加執行成本,引發地方的抵觸情緒,甚至導致教育系統的不穩定性。鑒于此,如何在保留原有評價框架的基礎上,協調地方與國家層面的政策需求,實現各地綜合素質評價結果的可比、可用,成為亟待解決的問題。在此背景下,建立綜合素質評價數據的轉換機制,或可作為一種低成本且高效的解決方案。依托人工智能、大數據等先進技術,對不同區域和學校的評價數據進行標準化處理和轉換,以實現全國范圍內數據的有效整合。但各地評價理論體系的差異如何協調?如何構建適用于多樣化評價數據的標準化算法,實現統一的轉換和比較?這些理論和技術上的關鍵問題仍需進一步探索,以確保轉換機制的可行性和科學性。
(五)打破評價定位與實施脫節困境,建立四位一體評價體系
從研究結果可以看出,早期政策文件中,綜合素質評價內涵定位與目標定位間呈現出相對緊密的聯系,隨著政策的逐步推進和綜合素質評價的不斷發展,目標定位與評價方法及結果應用的聯系日益加強,然而,內涵定位與其他維度的聯系卻逐漸減弱。這轉變反映出政策層面已從理念構建過渡到實踐執行階段,但在過程中卻忽視了對綜合素質內涵的持續關注和動態更新,導致實際操作層面的反饋未能有效反哺理論構建,進而削弱了理論對實踐的指導作用。這種缺乏閉環的反饋機制可能使綜合素質評價改革陷入局部優化、全局乏力的困境。即便如何在評價方法改進、技術手段應用上進行深入探索,都無法觸及其背后的教育理念,致使所謂的改革創新最終淪為一場缺乏廣度和深度的形式化表演。因此,當下亟需完善綜合素質評價的閉環機制,構建起“內涵定位、目標定位、評價方法、結果應用”四位一體的綜合素質評價體系,確保各環節的內在一致性和邏輯連貫性(如圖4所示)。

具體而言,綜合素質評價的內涵定位是評價體系的基礎,決定了評價的理念與價值取向能否契合當下時代發展與人才培養需求;目標定位為評價提供了方向指引,確保在實施過程中既能服務于選拔功能又不偏離育人初衷;評價方法則是實現內涵和目標的關鍵橋梁,通過科學、有效的評價手段將理念落地執行;結果應用不僅是評價方法的輸出成果,更是對整個評價體系的反饋與檢驗,推動體系的動態更新和自我完善。而想要實現這一評價體系,仍需要政策層面加大對綜合素質評價的系統性研究力度。目前綜合素質評價相關研究眾多,部分學者專長于對其理論構建,部分聚焦于技術賦能。這樣分散的研究格局雖然有助于推動評價的局部優化,但難以支撐形成具有完整邏輯鏈條的評價體系。為此,建議國家層面進一步設立融合理論、技術和實踐的綜合性課題,促進各學科和領域的學者共同參與,通過集體智慧推動綜合素質評價的整體改革與創新。
本研究在新經驗主義范式的指導下,利用大語言模型和K-means等量化數據分析手段,深入剖析1985至2024年間我國發布的80份關鍵政策文件,重點挖掘了政策層面對綜合素質評價內涵定位、目標定位、評價方法與結果應用四個維度的核心話語主題,并系統地梳理了這些話語主題在不同歷史階段的演變過程及主題間的關聯關系,以明晰政策視角下對綜合素質評價的導向與期待,并提出針對性的發展建議。然而,當前的研究框架主要聚焦于綜合素質評價的內涵、目標、評價方法和結果應用四個維度,對于評價實施過程中其他環節的關注尚有不足。未來將對分析框架進一步細化和完善,以更全面、更深入地理解政策視角下綜合素質評價的發展導向,為教育評價改革提供更加豐富、更加精準的理論支持和實踐指導。
參考文獻:
[1] 劉志軍,徐彬.綜合素質評價與核心素養:關系辯證和聯動發展[J].課程·教材·教法,2023,43(10):33-41.
[2][3][11] 王洪席.我國綜合素質評價政策的演進歷程及特征分析——基于(1999—2014年)政策文本的分析[J].課程·教材·教法,2016,36(12):28-34.
[4] 鄧凡,余亮.我國學生評價政策的回顧與展望——基于NVivo11的政策文本分析[J].中國人民大學教育學刊,2022,(4):91-106.
[5] 饒麗,盧德生.學生綜合素質評價改革的政策走向及階段特征[J].教學與管理,2019,(31):76-79.
[6] xN5PW/l5nyw+zbgRX+QvMPjjof77BRunJ+CZX32aeXU=Bryman A.Social research methods [M].Oxford:Oxford University Press,2016.
[7] 張婧婧,于玻.指向復雜性的“新經驗主義”:論教育研究的范式演進與創新[J].中國遠程教育,2024,44(2):47-61.
[8] 求是網.鄧小平文選第三卷[EB/OL].http://www.qstheory.cn/books/2019-07/31/ c_1119485398_39.htm,2024-07-01.
[9] 中國共產黨中央委員會.中共中央關于教育體制改革的決定[EB/OL]. https://www.gov.cn/gongbao/shuju/1985/gwyb198515.pdf,2024-07-01.
[10][37] 肖磊,陳雪純.論綜合素質評價定位的偏差及其回歸[J].教育發展研究,2020,40(22):42-48.
[12] 肖磊,李本友.綜合素質評價的制度化:歷程回眸與系統謀劃[J].教育研究,2018,39(4):68-74.
[13] 檀慧玲,王玥.貫徹落實《深化新時代教育評價改革總體方案》的幾個關鍵問題[J].中國考試,2021,(8):14-20.
[14] Syakur M A,Khotimah B K,et al.Integration K-Means Clustering Method and Elbow Method for Identification of The Best Customer Profile Cluster [EB/OL].https://doi.org/10.1088/1757-899X/336/1/012017,2024-07-01.
[15] Nakamura T,Taki K,et al.A shape-based similarity measure for time series data with ensemble learning [J].Pattern Analysis and Applications,2013,16(4):535-548.
[16] Patro S G K,Sahu K K.Normalization: A Preprocessing Stage [EB/OL]. https://doi.org/10.48550/arXiv.1503.06462,2024-07-01.
[17] 中共中央、國務院.中國教育改革和發展綱要[J].中國高等教育,1993, (4):8-17.
[18][24] 新華社.習近平出席全國教育大會并發表重要講話[EB/OL].https:// www.gov.cn/xinwen/2018-09/10/content_5320835.htm,2024-07-01.
[19][21] 國務院.國務院關于基礎教育改革與發展的決定[EB/OL].https:// www.gov.cn/gongbao/content/2001/content_60920.htm,2024-08-01.
[20][22] 新華社.中共中央 國務院關于深化教育教學改革全面提高義務教育質量的意見[EB/OL].https://www.gov.cn/zhengce/2019-07/08/ content_5407361.htm,2024-08-01.
[23] 中共中央、國務院.中共中央 國務院關于深化教育改革全面推進素質教育的決定(1999年6月13日)[J].中國高等教育,1999,(Z1):3-7.
[25] 新華社.習近平:高舉中國特色社會主義偉大旗幟 為全面建設社會主義現代化國家而團結奮斗——在中國共產黨第二十次全國代表大會上的報告[EB/OL].https://www.gov.cn/xinwen/2022-10/25/ content_5721685.htm,2024-06-29.
[26][28][30][32] 新華社.國家中長期教育改革和發展規劃綱要(2010-2020年)[EB/OL].https://www.gov.cn/jrzg/2010-07/29/content_1667143. htm,2024-08-01.
[27] 新華社.中共中央辦公廳 國務院辦公廳印發《關于深化教育體制機制改革的意見》[EB/OL].https://www.gov.cn/zhengce/2017-09/24/ content_5227267.htm,2024-08-01.
[29] 新華社.中共中央 國務院印發《深化新時代教育評價改革總體方案》[EB/OL].https://www.gov.cn/zhengce/2020-10/13/content_5551032. htm,2024-06-29.
[31] 國務院辦公廳.國務院辦公廳關于新時代推進普通高中育人方式改革的指導意見[EB/OL].https://www.gov.cn/zhengce/content/2019-06/19/ content_5401568.htm,2024-02-08.
[33][36] 教育部.教育部關于加強和改進普通高中學生綜合素質評價的意見 [EB/OL].http://www.moe.gov.cn/srcsite/A06/s3732/201808/t20180807_344612. html,2024-02-08.
[34] 柴喚友,陳麗等.學生綜合評價研究新趨向:從綜合素質、核心素養到綜合素養[J].中國電化教育,2022,(3):36-43.
[35] 張治,劉小龍等.基于數字畫像的綜合素質評價:框架、指標、模型與應用[J].中國電化教育,2021,(8):25-33+41.
[38] 教育部.教育部辦公廳關于開展信息技術支撐學生綜合素質評價試點工作的通知[EB/OL].http://www.moe.gov.cn/srcsite/A16/s3342/202211/ t20221118_995825.html,2024-02-08.
鄭勤華:教授,博士,博士生導師,研究方向為在線教育、人工智能教育、教育大數據、學習分析。
劉司卓:在讀博士,研究方向為智能技術支持的教育評價。
宋義深:在讀博士,研究方向為人工智能教育應用。
Positioning and Implementation Pathways of Comprehensive Quality Evaluation from a Policy Perspective
Zheng Qinhua, Liu Sizhuo, Song Yishen
The Research Center of Distance Education, Beijing Normal University, Beijing 100875
Abstract: Despite years of exploration, the practical implementation of comprehensive quality evaluation continues to face numerous challenges. Therefore, clarifying the policy perspective on the positioning and implementation pathways of comprehensive quality evaluation is critical to providing clear guidance for its effective execution. The study utilizes qualitative analytical methods, including large language models and K-means clustering, to analyze 80 national-level policy documents from 1985 to the present. Then, the study explores the key discourse themes in these documents concerning the connotation positioning, goal positioning, evaluation methods and result application in comprehensive quality evaluation, and traces the evolution and relationships of these themes across different developmental stages. Finally, the study proposes the following recommendations: enhancing the theoretical framework to reflect the dual connotation positioning of comprehensiveness and developmental orientation; constructing a long-term diagnostic evaluation system to balance the dual goals of selection and student development; strengthening technology-enabled solutions to establish an evaluation system that combines methodological rigor with local adaptability; exploring data conversion mechanisms to enhance the role of comprehensive quality evaluation in educational governance; and building a closed-loop mechanism to drive comprehensive quality evaluation toward a dynamically optimized system aligned with societal needs.
Keywords: comprehensive quality evaluation; evaluation reform; policy analysis; large language models; K-means
收稿日期:2024年9月25日
責任編輯:趙云建