2025年1月14日,教育部辦公廳關于印發《中小學科學教育工作指南》的通知中提出:將學生平時實驗操作和參加科學探究實踐活動等表現納入綜合素質評價內容;將數字技術等智能化手段引入實驗操作考試,提高實驗考查的可行性和有效性。隨著人工智能技術和互聯網的發展,智能化和自動化的測評方式正逐漸成為測評領域研究的重要內容,智能化和自動化不僅可以降低人工測評的重復勞動,還降低了由個體認知、思維模式和情感態度等不同造成的評價差異,提高了評價的效率和精準度。
王慧、孫可等人的研究報告《全國各地中考實驗操作考試實施現狀調查報告(一)》表明,當下實施實驗操作考試的均采用人工考評的模式,即一名監考老師對一名或多名學生同時進行監考和打分,這樣容易導致教師無法同時兼顧操作細節和實驗結果,評價主觀性強,對于爭議性評分無法追溯。隨著人工智能技術和互聯網技術的飛速發展,基于AI(人工智能) +IoT (物聯網)的教育測評方式融合了AI的智能分析能力和IoT的廣泛連接性,實現了簡單物聯到融合智聯的跨越,讓大規模進行實驗操作測評成為可能。
一、 Al+10T 測評體系構建的邏輯思路
1.構建 AI+IoT 測評緣起:順應教學“測評\"工作變革的政策導向
教學測評內容與測評方式的轉變是新時代面向教學“測評\"工作變革的重要領域,也是新時代教育評價改革政策治理關注的焦點議題3。中共中央、國務院印發的《教育強國建設規劃綱要(2024-2035年)》中明確指出:要促進人工智能助力教育變革,加強課程體系改革,打造人工智能教育大模型,建設云端學校等,建立基于大數據和人工智能支持的教育評價和科學決策制度。AI+IoT的評測體系整合了大數據感知、萬物互聯、存儲、計算等優點,有利于形成基于證據和大數據的教育測評體系,為結果評價、過程評價、增值評價等多元評價方式賦能。
2.構建 AI+IoT 測評基石:指向精準高效的“測 評\"載體
智能化測評是突破紙筆測驗,實現對學習過程或作答過程數據建模的重要手段,具有自動化、高效性、實時性和動態性評價的優點4。AI技術依托于深度學習(神經網絡模擬人腦處理復雜數據)機器學習(機器通過數據學習)和自然語言處理(機器理解和生成人類語言)等技術,實現了信息的自動識別、語言翻譯和數據提取等功能,具有強大的數據分析和處理能力。IoT技術利用傳感器收集數據、通信模塊實現數據傳輸、數據中心存儲和處理數據,實現了數據的實時采集和傳輸,為AI算法提供豐富的數據源。AI與IoT的融合實現了數據的實時采集、數據的傳輸和分析、結果的智能精準評價(見表1),顯著提升了測評的效率和拓寬了測評的場域。

3.構建 AI+IoT 測評路徑:探索多元化“測評” 場景
傳統教學測評依賴于紙筆測試、課堂觀察等手段,而AI+IoT技術的引入,則為教學測評帶來了全新的視角和更豐富的手段。(1)拓寬測評形式。AI+IoT 技術不再局限于傳統線下環境,實現了從線下到線上評價的突破。(2)豐富測評內容。AI+IoT技術提供了多元化的手段,除了紙筆測試外,還可以通過智能語音識別、人臉識別、計算機視覺技術等方式進行測評,實現了從單一到多元評價的轉變。如可通過智能語音識別技術實現對學生口語表達能力的評價、通過計算機視覺技術實現對實驗操作技能的評價。(3)完善過程評價。 AI+IoT 技術可實時收集學生的學習數據,進行過程性評估,實現學習情況的動態記錄和精準反饋。
二、 Al+10T 測評物理實驗操作系統解構
AI+IoT 測評物理實驗操作系統的整體架構是一個融合人工智能(AI)與物聯網(IoT)技術的高度集成、智能化的復雜系統,通過AI實現實驗操作的高效評價以釋放人工成本,IoT實現數據信息化、流程自動化、過程可視化以拓寬測評場景。我校與某科技公司建立合作關系,并承擔區域的AI實驗測評活動,通過數據分析發現:AI評測的準確率超過95% ,同時隨著樣本數據的增大,其準確率會進一步提升,因此,實踐證明通過 AI+IoT 進行課堂實驗操作測評、區域考試測評均有較大的推廣性。
1.AI+IoT 核心智能硬件終端:實驗操作行為的數據采集
實驗操作評價的核心在于對實驗操作規范性的評價,因此,完整和全方位地記錄實驗操作行為是評價的關鍵。 AI+Io′T 硬件終端通過多個攝像頭實現了對操作行為全程、切片式的記錄,核心智能硬件終端包括全局攝像頭、細節攝像頭、前置攝像頭、AI輔助桌布和智能化一體機(如圖1)。全局攝像頭實現了俯視視角的攝像記錄,除了捕捉操作行為外,還可分析整體操作布局、空間利用、實驗器材擺放位置是否合理、也可對實驗數據進行記錄(例如俯視讀取電流表和電壓表的示數);細節攝像頭提供側面視角的攝像記錄,輔助捕捉操作行為,更聚焦實驗細節的操作和側面的實驗數據記錄(例如在側面讀取測量液體溫度時溫度計的示數);前置攝像頭用于人臉識別和提供正面拍攝視角,主要用于考試時的身份核查和正面的操作行為記錄;AI輔助桌布的主要功能有兩個,其一是為了限定學生的操作區域,便于攝像頭記錄操作行為,其二是為了增加桌布與實驗器材的對比度,提升AI評分的準確度;智能化一體機是硬件終端的控制中心,負責數據的收集、處理和分析,以及實驗結果的展示,其可以作為顯示屏呈現任務單和播放內置實驗視頻,也可以作為接收器將攝像頭或者傳感器等數據接入,還可以作為數據存儲和傳輸的中轉站。

2.架構IoT網關數據傳輸網絡系統:實驗數據的實時傳輸
IoT網關作為物聯網系統中的關鍵組件,起到了連接和控制各種設備,并將數據傳輸到云平臺或本地服務器的作用。核心智能硬件終端將學生的實驗操作行為轉化為數字化、可視化的數據和信息,然后通過IoT網關數據傳輸到云平臺或者學校終端,并利用加密技術確保數據的安全性,數據中心接收數據后進行存儲、處理和分析。依托于 lot 網關系統的數據傳輸實時性,教師的教學視頻同屏、學生實驗操作視頻即時查看均可輕易實現,初步實現了集伴隨式采集、學情跟蹤和設備監管等功能于一體的智慧實驗室構建(如圖2)。得益于IoT網關系統的實時性和安全性,不僅可以構建校內的局域網數據傳輸系統,也可以實現區級或市級IoT網關數據傳輸系統(如圖3),為實現區域測評提供可能。


3.AI智能測評系統:實驗操作的高效精準評價
AI智能測評系統內有豐富的實驗資源,教學應用覆蓋教材中所有必做實驗,其中包括實驗教學視頻、儀器使用規范、實驗仿真模擬、實驗挑戰、實驗練習等欄目,已經形成了完備的實驗教學、實驗練習、實驗評價的教學評一體化模式。在豐富的資源庫支持下,AI智能測評系統通過對大量考生實驗操作和儀器使用行為的反復識別和深度學習,已經建立了考查學生實驗操作數據庫,形成了標準化的實驗操作流程5。在現場評測中,通過攝像頭捕捉學生的實驗操作視頻,再通過lot設備將數據傳輸至AI智能測評系統,測評系統將學生實驗操作行為與標準實驗流程進行比對,賦予相應的分值(扣分則會顯示扣分原因),并截取賦值對應的實驗操作視頻,便于后續通過回放視頻進行成績復核(如圖4)。學生操作時攝像頭可同時捕捉正面、側面和俯視三個角度的視頻,AI根據學生操作行為進行即時的評分,對于實驗中的讀數問題則可通過對比學生填入的數值與AI識別出的示數(如圖5),進而進行賦分。


三、 Al+10T 測評物理實驗操作的實踐應用
1.前期準備,開發適配的任務單和實驗操作評價標準
實驗操作任務單是進行實驗測評的驅動性任務,實驗操作評價標準是進行實驗操作的評分依據,兩者必須高度適配,主要體現在內容的一致性和要求的對應性,評價標準還應具有可操作性,便于AI智能測評系統進行自動化評分和人工復核。雖然AI智能測評系統中已有成熟的任務單和評分標準,但是只有開發更多具有普遍性的實驗案例才能讓AI測評更具有推廣性和適用性。區別于系統中測量小燈泡電功率實驗,筆者在其基礎上增加了電路圖的繪制、實驗數據表記錄和實驗分析的簡述題(如圖6),以更加全面地測試學生的實驗素養和評測智能測評系統的實用性。為此,相應的評分標準也進行了調整和優化(見表2)。



2.關聯系統,導入任務單和評分標準
使用管理員賬號登錄智能測評系統,將指定的任務單和評分標準導人系統中,再通過智能教學終端發放到學生終端,學生便可在一體機的屏幕上看到任務單。學生的實驗操作可通過攝像頭捕捉動作的形式進行AI評分,但是涉及到電路圖的繪制、數據的填寫和實驗分析的簡述等操作之外的評價,則需要通過系統提供的在線編輯工具或圖片上傳功能實現電腦端的數據輸入或者紙質拍照上傳。
3.系統測試,尋找測評優化點
組織學生進行現場實驗操作測評,組織教師根據實驗操作PTA量表進行人工評分,并將AI評分與人工評分進行對比,尋找優化點。經過測試發現AI對于電路圖和簡答題的評分錯誤率最高,可能原因是學生電路圖中各元件位置與標準答案存在差異、簡答題的表述AI評分準確率低導致。其次是表格數據的評分錯誤率,主要是學生填寫順序與所給答案順序不一致導致。而對于實驗操作的評分上,錯誤率最高的是電壓表和電流表的量程選擇,由于顏色對比度問題,AI未能精準識別所連接電表的量程,而在更換顏色對比度更大的導線和電極片后,AI評分的準確率大大提升。綜上分析,選擇特征更鮮明的儀器更有利于AI的評分,而對于主觀題和畫圖題的評分人工評分準確率更高。因此,當下探索AI主體 + 人工輔助評分相結合的實驗測評模式更具信度,而隨著人工智能的逐步優化,AI的比重會逐步加大,人工才可以更大程度地得到釋放。
4.系統統計,以評促教
在測評后系統可自動生成參與測評的每一位學生的個性化得分報告和全體學生的整體報告,其中包括了平均分、每個操作的得分率、平均耗時等,為學生精準發現自己的薄弱操作點和教師捕捉班級整體薄弱點提供了依據,有利于以評促改、以評促教。
四、反思與成效
1.變革測評方式:客觀高效評價
傳統的實驗測評需要大量教師做監考和評分工作,耗時長、評分主觀性強,且對于爭議性操作無法追溯。 AI+IoT 測評實驗操作具有高效、客觀和可追溯等特點,實現了實驗操作測評的實時反饋,避免了人工評分耗時長和主觀性的弊端,為爭議性操作提供回放視頻以保證公平性。該測評模式對硬件設備要求高、運行成本高,但隨著DeepSeek等國內人工智能科技公司的迅捷發展,其成本會大大降低,測評的精準度也會進一步提升, AI+IoT 測評實驗操作模式在不久的將來會更具有推廣性。
2.拓寬測評場景:探索多元評價
依托IoT的儲存和傳輸功能,測評場域實現了從線下到線上的可能,學生的操作評價實現了從靜態到動態的突破,為過程性評價在教學中的實施提供了強有力的支撐。得益于AI強大的智能語音識別、自然語言處理、計算機視覺等技術,我們不僅可以實現對學生知識掌握的評價,更可以實現口語表達能力、操作能力等評價,進一步拓寬了測評內容和能力維度。當下在已大面積開展人工評分下的實驗技能和科學探究能力融合測評以挑選拔尖人才,在此背景下,探索AI+IoT賦能下的實驗技能和科學探究能力融合測評具有較高的實踐價值。
3.構建測評閉環:實現“教一學一評\"一體化
“教一學一評”一體化旨在將教學、學習和評價有機融合,以評價促進教學,以教學改進評價,最終實現教學質量的提升,而構建測評閉環是實現“教一學—評”一體化的關鍵環節。AI+IoT測評系統通過全方位收集學生的測評數據,并進行多維度考情分析和可視化呈現,幫助教師精準掌握學情,從而實現差異化教學和動態教學調整,在測評閉環中精準提升學生的實驗操作能力。
參考文獻
[1]黃華,張睿,潘鑫.AI+環境下學生科學探究能力測評研究.物理與工程,2022,32(06):49-56+65.
[2]王慧,孫可,楊凱風,等.全國各地中考實驗操作考試實施現狀調查報告(一)].中國現代教育裝備,2022(12):4-10
[3]趙國宏,蓋延,龍馬蕓,等.面向教學“測評”的智能教育軟件評估指標體系——《2023人工智能促進教育發展報告》節選六[].中國教育信息化,2024,30(07):64-72.
[4]駱方,田雪濤,屠焊然,等.教育評價新趨向:智能化測評研究綜述[].現代遠程教育研究,2021,33(05):42-52.
[5]屈寶峰,田園,楊佳 .5G+ 流動推進實驗操作, AI+ 智慧助力考試公平[].教育與裝備研究,2023,39(04):76-80.
[6]高文蓓,王新福,凌一洲.基于人工智能的化學實驗現象評價與反饋系統開發[J].化學教學,2024(06):63-67.