王懷波,柴喚友,郭利明,劉紫荊,鄭勤華①
(1.北京師范大學 系統科學學院,北京 100875;2.北京師范大學 遠程教育研究中心,北京 100875)
學生綜合素質評價的本質是改變以往“唯分數”衡量學生發展的單一傾向,倡導在日常教育教學過程中綜合考察學生多方面素質的發展情況,鼓勵和引導學生全面而有個性的發展[1]。為此,學生綜合素質評價自提出以來就被視作是一項能夠有效解決“應試教育”的種種弊端,進而變革教育評價方式,促進學生全面發展的重要舉措。然而,學生綜合素質是學生成長發展過程中復雜狀態的綜合體現。對于這種復雜性的呈現,尤其是學生成長經歷的不同、個性特征的復雜多樣,既缺少必要的認識工具和手段,也缺乏理論上的認識,從而使得學生綜合素質評價在實踐應用過程中存在簡單化處理和流于形式的現象。另外,由于學生綜合素質評價在實踐中過于強調與招生考試等高利害評價相關聯,使得對于綜合素質評價的整體認知側重于對學生的“評”,而忽略對學生的“育”的定位。這種功利化處置和定位不清進一步導致了大眾對評價結果的存疑,繼而影響最終的應用。
過程的簡單化處理、結果的存疑以及定位不清等因素,使得學生綜合素質評價在實際應用中陷入進退兩難的現實困境,繼而暴露了學生綜合素質評價在理論與實踐之間存在“脫鉤”。包括評價條目的分立性導致無法從整體上反映學生的綜合表現,過程記錄不足、數據存疑無法保證測評結果的真實客觀等。為此在理論上,研究提出更為綜合的術語“綜合素養”,并將其定義為學生在受教育過程中形成的跨越學科的價值觀、必備品格和關鍵能力,是學生綜合素質和核心素養的融合[2]。
同時在實踐上,研究也發現伴隨著大量新技術在教育領域實踐應用的經驗積累,智能技術與學生綜合素質評價的內部耦合性,為突破現有評價困境,改革評價方式提供了堅實的技術支撐[3][4]。具體來說,伴隨著智能技術的迅猛發展和在教育領域中廣泛應用,其所具有的“感知、連接、計算、處置”優勢,正逐步滲透到教育評價改革中,并成為賦能學生綜合素養評價的重要支撐。在感知數據上,5G、物聯網等技術帶來的伴隨式采集技術,能夠實時感知獲取反映學生綜合素養的教育大數據,將原本信息采集的范圍從校內延伸到校外、從正式學習拓展到非正式學習,囊括線上與線下、包含學生全方位活動信息,從而保證數據的根源的客觀與準確[5];在連接增強上,人工智能、大數據等技術帶來的人機混合增強范式轉變,通過連接領域專家和技術專家知識,實現學生綜合發展的理論與實際活動的信息的映射關聯,挖掘學生發展的內部機理,為學生綜合發展帶來可解釋性模型[6];在智能計算上,大數據、云計算等技術帶來的音頻、視頻、文本、圖片等多模態數據智能處理,既能夠將各類所采集的數據與學生綜合發展相互關聯,實現從“碎片”到“集約”,從“非量化”到“可量化”的數據表征,也能夠保障處理過程的真實與高效[7];在結果處置上,人工智能、大數據等技術提供可視化的呈現技術,可以直觀地呈現學生發展的狀態與趨勢,從而聚焦育人本質。此外,大數據、區塊鏈等技術的發展還為綜合素養評價過程中,實現對數據的加密防偽、安全保護[8]。
科學合理應用智能技術開展學生綜合素養評價不僅能夠解決傳統評價方法層面的諸多局限和不足,而且能夠以此深化引領新一輪的教育評價改革。為此,本文嘗試從智能技術的感知、連接、計算、處置等方面,設計學生綜合素養評價的框架體系,并設計具體的實施路徑,科學、客觀推進學生綜合素養評價發展進程,發揮學生綜合素養評價的“指揮棒”作用。以此期望突破學生綜合素質評價的現實困境、填補學生綜合素質評價理論與實踐之間的溝塹。
自學生綜合素質評價實施以來,在推進教育評價改革、促進學生全面發展方面取得了一定的成效,但依然存在一些無法忽視的現實困境——評價內容的條目化與分立性,無法反映學生的綜合表現;評價材料的真實性存疑、評價方法的客觀性不足,導致社會大眾對評價結果持審慎的態度;評價定位上與招生考試過度關聯,偏離了育人的本質。
教育部在2014年發布的《關于加強和改進普通高中學生綜合素質評價的意見》中明確指出學生綜合素質評價的內容包括思想品德、學業水平、身心健康、藝術修養以及社會實踐等五個方面,這為后來綜合素質評價提供了一個基本的量綱[9]。據此,各地在涵蓋上述5個方面評價內容的基礎上,依據不同學段性質和地方特征,細化評價指標,完善學生綜合素質評價框架。固然學生綜合素質評價通過指標的分解能夠有效克服評價落地應用的難題,但正因為細化所帶來的條目化和分立性,將原本較為復雜的學生綜合素質評價簡單化處理,引起了科學性上的質疑[10]。這種框架式、標準化的細化指標,采用了統一的標準來判斷學生發展水平,其結局是不可避免地削弱了學生的個性化特征;同時,框架設立的維度、指標也在很大程度上割裂了綜合素質整體性特征。這種試圖通過幾個指標、幾個觀測點來表征一個人的綜合素質整體面貌,難免讓綜合素質評價陷入“以偏概全”的困境。
鑒于學生綜合素質評價自身具有過程性、表現性、內部性、主觀性等本質特征,如何保證每個環節的評價客觀、數據真實、結果公正成為評價的現實難題,尤其在將學生綜合素質評價納入到招生考試的高利害評價中,更是易招致舞弊行為的發生[11]。這種功利化、高利害的舉措,促使學生綜合素質評價過程流于形式、弄虛作假,最終使得評價結果陷入科學性不足、信任感缺失和合法性質疑等窘境[12]。隨著對評價材料真實性的期盼,我們看到許多地方開始重視對支撐材料的提供。例如貴州省教育廳關于普通高中學生綜合素質評價中強調要提供相關事實材料的有關活動過程的照片、錄像、報告,實踐證明材料、獲獎證書等[13]。但如何保證支撐材料是否為擺拍?實踐材料是否存在造假?僅憑學生提供事實性材料是不夠的,還需納入各種過程性的活動信息加以佐證。這種通過學生成長數據的記錄,能夠從多方位保證學生綜合素質評價結果的真實性,同時也是對現有素質評價維度單一、結果片面的補充和完善。
“堅持客觀性,如實記錄學生成長過程中的突出表現”是國家對學生綜合素質評價的基本原則[14]。然而在實際應用中受限于技術手段,以測驗、調查、觀察和主觀記錄為主的評價手段和以結果性評價為抓手的評價方式依然是學生綜合素質評價的常見方式[15]。這種方式固然有其自身的優勢,包括容易操作、成本低、成效快等,但由于實施過程中存在填報過程的主觀性較強、人為干預因素較多,導致大眾對評價結果存疑,從而制約了綜合素質評價結果的實際教育應用。例如,在主觀評定中,學生需自主記錄活動,但通常對于學生來講存在“不清楚需要記錄什么、怎么記錄”等問題,從而導致學生填報的信息看似“面面俱到”卻又“不具代表”;看似“感情豐富”卻又“言之無物”,更為甚者虛構事實、教師代筆等等問題層出不窮[16]。另外,這種評價方式也是一種典型的結果性評估方法,忽視了大量過程性感受的事實記錄與存留。例如,學生在具體問題解決中感情的變化、興趣的轉向、策略的選取、方法的嘗試極易體現學生的思維模式與能力素養,但這些過程性的嘗試很難體現在學生的最終成長記錄中,取而代之的是給出一個主觀的“分數”或主觀的“評價”。
教育是一種培養人的活動,作為教育系統內的教育評價,其根本目的也不是為了證明什么或區分什么,而是為了改進發展過程,更好地促進人全面而有個性的發展[17][18]。因此,學生綜合素質評價也不是為了通過素質等級劃分來證明學生的能力水平存在差異,而是通過過程性評價以一種發展的眼光來看待學生未來的發展。關于學生綜合素質評價不少學校通常做法是對學生課堂內外表現、日常勞動、實踐活動的全部量化,最終形成一個可具對比的評價分數。這種分數化的處置思維,極易將流程簡化,走入“評必量化”“量必排名”的極端,進入了將復雜的教育現象簡單化處置的境地。例如在評價等級設置上,不少學校通過固定分數或設置學生人數比例,將學生綜合素質的表現劃分成“優秀、良好、合格”或“A、B、C”等不同等級。但無論哪種設置最終的指向都是在強化甄選的功能,即成為服務于高一級學校招生體系中遴選的依據,而忽略了學生發展多樣化和個性化的特征,同時也忽略了評價的育人導向。
新一輪科技革命和產業的迅猛發展,為技術變革教育創造了前所未有的歷史機遇[19]。以人工智能為核心的新一代信息技術被賦予重要的時代價值,如何發揮智能技術的潛能,推進教育評價的變革,促進教育公平,不僅是智能時代教育創新與變革的重要命題,更是學生綜合素養評價改革的訴求。鑒于此,研究基于學生綜合素質評價的現實困境,結合智能技術的感知、連接、計算、處置的賦能表現,設計“智能技術賦能學生綜合素養評價的實踐框架”,保證評價的綜合性、科學性和客觀性,同時滿足測評結果的可解釋性,提升結果的導向改進作用,最終突破評價困境,助力學生綜合素養評價的改革與推進(如圖1所示)。

圖1 智能技術賦能下學生綜合素養評價框架設計
具體來說:借助技術的感知能力,實時獲取學生全過程活動信息,保證測評結果的綜合、客觀;借助技術的連接能力,將專家的理論知識與數據的量化表征相互關聯,構建可解釋、可操作的評價模型;借助技術的計算優勢,計算學生綜合素養表現,保證測評結果的科學、準確;借助技術的處置能力,將測評結果應用于教育實踐中,以發揮測評結果的育人導向作用。智能技術的感知、連接、計算、處置為學生綜合素養評價提供閉環反饋:感知為連接提供數據支撐,連接為計算提供模型指導,計算為處置提供結果指導,處置為感知提供應用反饋。同時,通過智能技術賦能下四個環節的迭代循環,既可以豐富學生綜合素養評價的方法體系,引領智能技術驅動評價的研究新方向,也可以發揮“以評促育”功能,真正發揮綜合素養評價結果的育人導向作用。
學生綜合素養是學生綜合發展的體現,它既涵蓋德智體美勞全素質要素,也吸納了與文化基礎、自我發展和社會參與均關聯緊密的素養成分。這種綜合性表現僅憑學校單一場景學生活動信息無法完整的刻畫,為此需要獲取學生在學校、家庭、社區等多場域中全過程活動。伴隨著人工智能、物聯網等傳感設備的出現,智能技術賦予了實時感知能力,為獲取不同場景下學生全過程活動信息提供了可能,因此也成為突破現有評價困境,推進綜合素養評價的關鍵所在。
智能技術賦能學生綜合素養評價的“感知”,包含“感”和“知”兩層含義[20]。其中“感”強調對學生所處的外界環境以及學生內部心理狀態的信息與數據的接收,實現信息的識別和獲取。它是對過程信息的伴隨式識別與獲取,包括對場景的識別、表情的識別、知識的識別、能力表現的識別、成效的識別等等,這些伴隨式、無感知的信息與數據的識別,一改以往評價內容受限于條目化、分立性框架所忽視的大量過程性信息。例如孫波等人基于張量分解的表情識別方法,對智慧學習環境下學生視頻圖像信息表情識別的分析,以此為后續判斷學生專注度、注意力狀態和對知識點的理解提供基礎的數據支撐[21]。“知”強調對伴隨式感覺到的信息進行有目的的加工和處理,實現對數據的理解和知曉。它是對獲取數據的教育理解與認識,包括對基礎數據的匯聚、教育層面的標注和數據的存儲。伴隨式識別的學生活動信息涉及不同場景下學生的各類表現,為此需要結合智能技術中的數據匯聚技術,實現對不同場域下同一學生主體的數據整合與打通。同時,在自然狀態下識別的音頻、視頻、文本、圖像等多模態數據,存在數據噪點、精度較差問題,也需借助數據清洗技術,解決數據的缺失、冗余以及錯誤等基礎性問題,同時還需要在教育理論的指導下完成對基礎數據的教育標注和教育解讀,保證從教育層面對數據的理解。最終,還需結合數據存儲技術完成對數據的存儲和表征,以服務后續綜合素養的表征與評測。
感知獲取的海量多模態學生相關的活動信息本身并不能發揮教育的價值與潛能,某種程度上這些數據僅僅是一堆用作統計的簡單“數字”。如何將這些“冷冰冰”的數字轉變成能夠反應“活生生”學生的綜合素養表現,關鍵在于多模態數據與綜合素養對應關系的合理解讀。尤其是在數據密集型新范式下,數據催生出大量超出預期的有意義變量,如何處理好這些變量或者底層數據與學生綜合素養相關理論兩個層面的價值關系,建立數據/變量與綜合素養理論指標的映射關系顯得至關重要。
智能技術賦能學生綜合素養的“連接”,其核心在于連接學生綜合素養相關理論與學生全過程活動信息,并通過數據信息實現對理論層面的表征。其中,由于學生綜合素養的表現不僅涉及教育領域,還涉及社會、文化、心理、生理等不同層面,因此要想全面客觀地解讀所感知的數據,評估學生最終綜合素養表現,需要在理論上連接多領域專家協同攻關、共同推動[22]。即教育領域工作者協同各領域專家厘清綜合素養評價的內涵特征,明確育人價值導向,回答“評什么”“怎么評”“如何用”的根本性問題,并通過學理上的探究,從可行性、共通性、融合性、發展性等方面進一步提煉和確定符合時代發展和教育實踐需求的綜合素養評價指標體系。唯有此,才能從根上破解當下學生綜合素質評價存在的價值導向不清、理論框架分立、評價指標體系不明等現實問題。理論上的突破為學生綜合素養評估提供可解釋性機理,但僅憑理論上的突破并不能保證評價過程的客觀與真實,為此還需要借助智能技術手段實現理論指標與數據特征的關聯映射。通常來說感知過程中獲取的行為、心理、生理數據,基本完成了對數據的基本特征標注。如常見的完成作業次數、課外勞動時長、學習成績等,這些都是有效的特征。但如何將這些低階特征數據與理論上的指標體系進行關聯,則需要借助一些隱藏條件隨機場(JHCRF)、支持向量機(SVM)、隱馬爾可夫模型(HMM)等智能技術算法進行專門的訓練,從而建立從低階數據特征到高階綜合素養理論指標的映射關系[23]。例如,北京師范大學遠程教育研究中心創新性地提出連接領域專家理論知識與數據客觀精準優勢的理念,研發人機增強智能支持下的敏捷教育建模平臺——DMTS。該平臺通過神經網絡算法初步建立細粒度指標與粗粒度高階指標的映射關系,并通過設置置信度實現對映射關系的質量判斷[24]。
為發揮技術賦能優勢,實現對學生綜合素養的綜合、科學、客觀評價,離不開計算的支撐。所謂計算是指通過計算機模擬實驗或數據統計分析方法,計算教育現象、符號化表達教育過程以及事實性描述教育問題[25]。這是一種受計算主義哲學思潮影響,在教育領域逐漸衍生形成的新范式。由于“計算”具有將過去那些無法量化、不可計算、難以存儲的東西進行數據化表征的優勢,因此也成為保證學生綜合素養評價科學性的關鍵“鎖鑰”。
智能技術賦能學生綜合素養評價的“計算”,既包括算法模型、軟件工具所帶來的數據計算,還包括從計算的視角思考人類教育領域的教育計算。其中數據計算,本質上是借助數學形式對學生綜合素養表現情況的一種精確性表達。它是一種操作流程,即在算法模型指導下,通過云計算、邊緣計算等不同計算方法,按照一定規則將海量的多模態數據進行計算、分析和處理,最終形成素養的表現。數據計算緩解了計算中心的壓力、提高了計算結果的可用性,并能夠在一定程度上保證數據安全和隱私。然而,對于學生綜合素養評價來說,所要計算的對象并不僅僅是單純的事件,而是這些事件背后所能蘊含的素養表現。這就需要關注事件計算背后的教育計算問題,即將素養評價的教育理念融入其中,關注涉及學生素養發展的認知過程、行為表現和環境特征等具體計算問題。這種融合認知計算、行為計算、環境計算的“綜合素養評價”,將使學生綜合素養評價中更聚焦于素養本身、弱化環境影響、降低偶然因素,保證測評的科學準確[26]。
健全學生綜合素養評價、發揮評價的指揮棒作用,關鍵在于如何處置綜合素養評價結果。目前國家和各地區在處置學生綜合素質評價方面存在兩種明顯趨勢,即與畢業升學進行“軟掛鉤”或“硬掛鉤”。前者淡化了學生綜合素質評價結果的影響使得評價結果毫無“參考”價值,后者引發功利性對待繼而導致新類型的“唯分數”論。無論是“軟”還是“硬”,當下這種依據綜合素質評價的最終等級或分數來篩選學生的處置方式,均與學生綜合評價的初衷背道而馳,也與新時代人才培養的目標相去甚遠。如何合理處理和安置學生綜合素養評價結果,去除功利化價值取向,真正發揮測評結果的導向、鑒定、診斷、調控和改進作用,體現新時期育人目標,成為技術賦能素養評價最為關鍵的環節之一。
智能技術賦能學生綜合素養評價的“處置”,是一種利用技術手段通過搭建評價平臺、研發實時反饋系統,改變評價的“考核”功能,回歸育人的“改進”本質,使在落實學生綜合素養評價過程同時落實立德樹人的育人本質。這種利用智能技術處置測評結果與實踐應用,因其豐富了結果的細節和個性化,更易發揮實踐應用中的調控、改進作用。具體來說,以往評估或為教師寫評語的概念化評估方式或為純粹的分數等級式評估方式,此類方法籠統、抽象且沒有具有內容,無法發揮具體的實踐調控作用;而智能技術賦能之下,借助伴隨式數據采集技術能夠將學生在活動場景中自然形成、反映綜合素養發展的各類信息及時記錄下來。這些所記錄的關鍵信息除了能夠提供綜合素養結果的呈現,還提供追蹤溯源的豐富細節與關鍵要素。同時,智能技術的賦能一改以往所有學生評語相差無幾的同質化現象,而是借助豐富的數據細節,形成對每個個體品格與能力的“數字畫像”,切實為每個學生提供個性化綜合素養反饋,并通過實時的反饋,使評價成為學生自我認識、發展的有力助手[27]。
為進一步有效推進學生綜合素養評價的落地應用,發揮智能技術在感知、連接、計算和處置框架中的優勢,還需要在學生綜合素養評價框架的基礎上設計具體的實施路徑。具體包括:建設學生成長跟蹤平臺,支撐評價改革的核心業務;設立標準規范,約束技術賦能下的新型評價;創新技術方法,保證科學實施評價過程;制定數據共享機制,保障評價結果科學有效。
建設學生成長跟蹤平臺是發揮智能技術賦能學生綜合素養評價的首要工程。借助智能技術,集學生活動信息感知獲取、素養模型的數據表征、素養評價的計算和素養結果的應用實踐等業務于一體的學生成長跟蹤管理服務平臺,既為綜合素養評價的應用和開展提供了基礎性的支撐,也為家長、教師和教育管理者等多方利益相關者提供全面了解學生素養發展的接口與渠道。學生成長跟蹤平臺將使新時期學生綜合素養評價愈加綜合、客觀、科學和智能。該平臺將遵循“有效集成,多元共享”的基本原則,一是將感知、連接、計算和處置等關鍵智能技術有效集成,實現包含數據采集、數據存儲、數據處理、隊列建設、成長溯源以及安全保障等功能的學生跨學段成長跟蹤研究平臺。同時,平臺還集成教育學、心理學、腦認知科學以及計算機科學等多學科領域專家智慧,提供敏捷建模工具,發揮人機混合增強的優勢。二是實現學生綜合素養測評數據的有效溯源和終點事件的追蹤分析,使教育工作者、家長、學生等相關主體,能夠追根溯源,從根本上解決影響個體發展的關鍵因素,最終發揮測評結果的導向、調節作用。三是結合學生綜合素養評價需求,針對不同場景、不同主體開發智能化監測分析系統,并提供針對性的訪問入口,以此,在最大程度上將學校老師、家長、社區工作者、場館負責人等評價主體吸收進來,克服評價主體單一的局限。
嚴謹合理的評價標準與操作程序是綜合評價有序進行、減少區域與學校評價工作隨意性的依據[28]?;卺槍W生綜合素養評價流程的系統全面分析,本文認為,需要建立管理規范、數據規范、質量標準、技術標準“四位一體標準規范”。第一,管理規范是指服務于學生綜合素養評價的一系列配套政策、制度、章程、規定等的總稱,是有關評價人員的行為規范和準則。例如,針對評價活動實際開展而制定的實施方案、行動計劃、具體安排、推進策略、工作機制和組織機制等均屬于管理規范的范疇。第二,數據規范是指對不同來源、不同類型、不同結構的綜合素養評價數據進行標準化處理的規則體系?;跀祿幏?,相關數據能夠在信息技術迭代更新后仍能保持優異的兼容性,且能在必要時實現相互之間的交換和集成[29]。此外,良好的數據規范還能有助于增強評價人員的數據意識,進而提高其教育評價能力[30]。第三,質量標準是指基于綜合素養的概念與內涵及其測評的研究思路,結合區域實際所制定的綜合素養評價指標體系。作為針對學生綜合素養評價任務的具體描述和說明,質量標準對具體評價活動進行了可細化可操作的落地式處理。第四,技術標準是指針對綜合素養評價數據感知獲取、連接分析、計算處理和處置應用過程中所涉及的智能技術進行標準化后的準則體系。借鑒一般意義上的教育評價系統或平臺,綜合素養評價技術標準可通過遵循國家技術標準、借鑒國際技術標準和制訂地方技術標準三種形式來加以構建[31]。
技術與方法創新是學生綜合素養評價得以順利開展的“動力”和關鍵,其落腳點在于針對綜合素養評價數據的各個流轉階段科學開發并創新應用相關大數據技術。第一,在感知階段,需要重點解決過程性數據難存留、各類數據難打通、數據標注精度和自動化程度低、數據權責不清晰等技術難題。針對上述難題,亟待突破伴隨式數據采集、多源異構數據匯聚、數據標注精度增強、主體行為自動標注以及數據確權存儲與隱私保護等關鍵技術,從而為學生綜合素養表現數據的采集提供技術支撐。第二,在連接階段,需要重點解決的技術難題是如何采用多模態分析技術,對多場域采集的非結構化數據進行智能處理,并發現行為與指標特征的映射關系,甚至通過數據發現新的評價指標。針對上述難題,亟待根據學生綜合素養模型與指標體系,研究融合音頻、視頻、文本、圖片以及其它傳感器數據的多模態數據智能處理技術與特征分析技術,完成各類采集與分析數據向學生綜合素養模型特征的轉化。第三,在計算階段,如何避免智能技術在學生綜合素養結果計算過程中,忽視教育問題,簡單化操作,最終帶來計算思維對價值性的蒙蔽等困境。針對上述難題,亟需攻克人機混合增強的智能技術,融入教育領域專家智慧,提升教育的計算能力。第四,結果處置階段,如何利用大數據輸出技術直觀清晰地呈現學生綜合素養的發展過程和結果、優勢和劣勢是需要重點解決的技術難題。針對上述難題,亟待突破計算機圖形學和圖像處理技術,從智能化、共享化和可視化三個方面入手對學生綜合素養結果進行系統、精準地輸出。
作為學生綜合素養評價中最重要的“資產”,數據是確保評價目標得以實現的核心和依傍。綜合素養評價數據具有大規模、長周期、多場域等特點,因此需要遵循教育倫理,在安全保障機制下,促進各類型評價數據的開放共享。第一,開放共享的前提是數據安全,特別是涉及個人身份、家庭等方面的隱私數據。如敏感數據的合規化使用方案、異構系統接入與多模態數據傳輸安全保障機制、面向隱私和倫理規范的數據分級保障機制以及評價平臺數據的使用監管與訪問控制體系。尤其是隨著《數據安全法》《個人信息保護法》的頒布實施,對數據安全與學生個人隱私保護有了更高的要求,為此亟需制定數據安全保障機制,同時借助人工智能區塊鏈、聯邦學習等相關技術保證學生個人的隱私難篡改、不外泄。第二,開放共享的主要步驟包括數據集選擇、開放許可協議和數據集的發現與獲取。其中,數據集選擇要求不同來源數據的提供者事先制定數據開放標準并對數據進行分級保障處理,開放許可協議要求數據提供者對數據集進行許可協議設置(包括“誰可以使用?”“如何使用?”等),數據集的發現與獲取要求數據是可訪問可獲取的,且提供機器能夠訪問和二次處理的文件格式。第三,開放共享的目標是推動學生綜合素養評價的科學性和有效性,確保各相關主體的核心利益。對于學生個體而言,要以個性化評價為導向深度挖掘開放共享數據,以便為學生個體提供個性化的評價結果和發展建議[32]。對于教師而言,要以差異化評價為導向深度分析開放共享數據,以便有效開展富有針對性的干預措施。對于學校和教育部門管理者而言,要以發展性評價為導向進行問題挖掘和趨勢分析,幫助管理者實施科學管理和動態調整教育決策。
在這技術賦能教育變革的時代,結合智能技術的感知、連接、計算、處置的賦能表現,變革學生綜合素養測評實踐,既能保證評價過程的科學性和客觀性,也能滿足測評結果的可解釋和能指導。基于此,研究所設計的智能技術賦能下學生綜合素養評價框架,具備了破解當下綜合素質評價的評價內容條目化與分立、保證評價方法的客觀性、打破評價材料真實性存疑、并最終發揮評價結果的育人導向等作用。
然而由于教育系統自身的特殊性和復雜性,智能技術賦能學生綜合素養評價的變革并非一蹴而就,而是一個在各項阻力中砥礪前行的實踐過程。面臨著相關體制機制的完善、配套政策的支持、師生理念的轉變、評價范式的變革等現實困境。唯有正視這些問題,并積極應對,才能更好地發揮智能技術對學生綜合素養評價的賦能作用,彌合綜合素養理論與實踐應用之間的“鴻溝”,打破現有評價的局限,繼而真正發揮測評結果的導向、鑒定、診斷、調控和改進作用。