徐睿



摘要: 從國家課程教學(xué)改革背景下化學(xué)實(shí)驗(yàn)操作考試對智能賦分系統(tǒng)的迫切需求出發(fā),在實(shí)際應(yīng)用場景中對四家公司的智能賦分系統(tǒng)開展試驗(yàn),通過對試驗(yàn)數(shù)據(jù)的收集和分析,評估系統(tǒng)的賦分能力和存在的典型問題,并對系統(tǒng)的進(jìn)一步開發(fā)與應(yīng)用提出建議。
關(guān)鍵詞: 初中化學(xué); 實(shí)驗(yàn)操作考試; 智能賦分
文章編號: 10056629(2024)03002207中圖分類號: G6338文獻(xiàn)標(biāo)識碼: B
1背景
1.1改革的導(dǎo)向和成效
2019年11月,教育部發(fā)布《關(guān)于加強(qiáng)和改進(jìn)中小學(xué)實(shí)驗(yàn)教學(xué)的意見》,其中主要舉措的第6條“健全實(shí)驗(yàn)教學(xué)評價(jià)機(jī)制”中明確指出“2023年前要將實(shí)驗(yàn)操作納入初中學(xué)業(yè)水平考試,考試成績納入高中階段學(xué)校招生錄取依據(jù)”[1]。截至2021年12月,全國共有19個(gè)省(自治區(qū)、直轄市)統(tǒng)一加試實(shí)驗(yàn)操作考試,其中8個(gè)省采取省級統(tǒng)一命題、統(tǒng)一組織實(shí)施[2]。
2021年5月,根據(jù)《上海市進(jìn)一步推進(jìn)高中階段學(xué)校考試招生制度改革實(shí)施意見》,上海實(shí)施了中考改革后的首次化學(xué)實(shí)驗(yàn)操作考試,考試由上海市教育考試院統(tǒng)一命題并組織實(shí)施。化學(xué)實(shí)驗(yàn)操作考試作為上海市初中學(xué)業(yè)水平考試綜合測試的一個(gè)組成部分,滿分5分,考試時(shí)長15分鐘,為減少實(shí)驗(yàn)操作考試的偶然性,每位考生需要連續(xù)完成2次化學(xué)實(shí)驗(yàn)操作考試,取2次考試中的高分記入中考總分[3]。
將實(shí)驗(yàn)操作考試納入中考計(jì)分的改革舉措,對一線的實(shí)驗(yàn)教學(xué)起到了很好的導(dǎo)向作用。教師在教學(xué)中普遍增加了學(xué)生動手開展真實(shí)化學(xué)實(shí)驗(yàn)的機(jī)會,關(guān)注學(xué)生實(shí)驗(yàn)操作規(guī)范性的落實(shí),對提高學(xué)生開展科學(xué)探究活動的效率、豐富學(xué)習(xí)經(jīng)歷、增強(qiáng)學(xué)習(xí)體驗(yàn)、全面發(fā)展核心素養(yǎng)具有重要意義。在2021年秋季對上海某區(qū)的課程與教學(xué)調(diào)研中發(fā)現(xiàn),某節(jié)高一、高二學(xué)生均可選修的化學(xué)拓展課中,新入學(xué)才兩個(gè)多月的高一新生(新中考政策的第一屆初中畢業(yè)生)在實(shí)驗(yàn)操作的規(guī)范性和效率等方面明顯優(yōu)于已就讀一年多的高二學(xué)生,并由此影響到學(xué)習(xí)的積極性和方案設(shè)計(jì)、觀察記錄、數(shù)據(jù)處理、結(jié)論獲取等各個(gè)探究環(huán)節(jié)的質(zhì)量。可見改革舉措產(chǎn)生了立竿見影的效果。
1.2實(shí)驗(yàn)操作考試面臨的挑戰(zhàn)
中考的實(shí)驗(yàn)操作考試是實(shí)作評價(jià)的一種形式,具有大規(guī)模、高利害的性質(zhì),相比紙筆測試,必然在考試的組織和公平性等方面面臨巨大的挑戰(zhàn)。
2021年上海的實(shí)驗(yàn)操作考試采用現(xiàn)場一評和在集中評閱點(diǎn)的視頻二評相結(jié)合的方式開展,由于現(xiàn)場一評1人監(jiān)考4名考生,監(jiān)考教師具有一定的缺口,有的區(qū)需要組織高中化學(xué)教師參加為期2天的一評。二評幾乎需要投入所有的初中化學(xué)教師,周期也較長,由于5月份正值學(xué)生復(fù)習(xí)迎考的關(guān)鍵階段,給學(xué)校和教師造成較大的壓力。人員多、周期長也給各區(qū)的經(jīng)費(fèi)投入造成了一定的壓力。2023年,該考試取消現(xiàn)場評分,全部改為視頻評分,盡管隨著評分方式和考務(wù)流程的優(yōu)化,組織工作壓力有所減小,但仍無法解決視頻閱卷中人員多、周期長的問題。
撇開命題、評分標(biāo)準(zhǔn)、考試組織管理等方面的因素,盡管事先對相關(guān)的評分人員都有專門的培訓(xùn),但無論是現(xiàn)場評分還是視頻評分,都存在評分員的個(gè)體差異性和主觀性造成的公平性問題。現(xiàn)場評分中評分員有時(shí)很難同時(shí)觀察多個(gè)考生的關(guān)鍵動作,甚至很難做到長時(shí)間的高度關(guān)注;視頻評分中鏡頭視角的信息往往不夠全面,需要評分員進(jìn)行主觀推測。
開發(fā)和應(yīng)用智能賦分系統(tǒng)不僅是解決上述問題的一種重要思路,也可以促進(jìn)日常教學(xué)中對學(xué)生實(shí)驗(yàn)操作的訓(xùn)練、矯正和過程性評價(jià)等。上海在新中考方案設(shè)計(jì)之初,就為實(shí)驗(yàn)操作考試的智能賦分預(yù)設(shè)了各種硬件條件。截至2021年5月,共建成理化實(shí)驗(yàn)操作考點(diǎn)391個(gè),每個(gè)考點(diǎn)至少有一個(gè)化學(xué)標(biāo)準(zhǔn)化考場。標(biāo)準(zhǔn)化考場中的儀器配備實(shí)現(xiàn)了區(qū)內(nèi)統(tǒng)一,每個(gè)實(shí)驗(yàn)臺上都至少配有前視和俯視兩路高清攝像頭,可以記錄學(xué)生在實(shí)驗(yàn)臺上規(guī)定范圍內(nèi)完成的所有操作。這些條件已經(jīng)在兩年的真實(shí)考試運(yùn)行中發(fā)揮了重要作用,也是智能賦分的基礎(chǔ)。
智能賦分系統(tǒng)的核心是智能算法,全國已有多家公司在實(shí)驗(yàn)操作考試智能賦分方面投入了研發(fā)力量,這些已有的方案能否滿足大規(guī)模高利害考試的要求,需要開展基于實(shí)證的教學(xué)研究。
2實(shí)驗(yàn)操作考試智能賦分的試驗(yàn)
2.1試驗(yàn)的對象
K、 L、 M、 N四家公司的實(shí)驗(yàn)操作考試智能賦分系統(tǒng),每家公司的系統(tǒng)除了智能賦分的軟件和考試管理軟件,還包括實(shí)驗(yàn)臺、攝像設(shè)備、相關(guān)實(shí)驗(yàn)儀器設(shè)備、網(wǎng)絡(luò)傳輸系統(tǒng)、數(shù)據(jù)存儲系統(tǒng)、算法服務(wù)器等。其中L公司在一些玻璃實(shí)驗(yàn)儀器上做了一些標(biāo)記,在天平中植入了藍(lán)牙模塊用于傳輸天平讀數(shù)給系統(tǒng);M公司采用了三攝像頭的方案,第三個(gè)攝像頭位于實(shí)驗(yàn)臺的側(cè)面。
2.2使用的試題
試驗(yàn)采用歷年上海化學(xué)實(shí)驗(yàn)操作技能考試的2組試題,其考查內(nèi)容和評分點(diǎn)見表1。2組試題涉及的實(shí)驗(yàn)操作具有一定的代表性和覆蓋面,可以較好地檢驗(yàn)智能賦分系統(tǒng)在實(shí)驗(yàn)操作考試中的可靠性。
2.3試驗(yàn)的設(shè)計(jì)
試驗(yàn)由12位青年教師模擬考生參加測試,每位教師先后完成A、B兩組試題,由智能賦分系統(tǒng)進(jìn)行打分。表1試題考查內(nèi)容和評分點(diǎn)〖XB,HT8.H,J*2;Y2<續(xù)表>〗組別考查內(nèi)容評分點(diǎn)編號A氣密性檢查氣密性檢查操作正確A1氣密性檢查中現(xiàn)象與結(jié)論一致A2搭建制備二氧化碳的裝置儀器選擇正確A3集氣瓶口向上A4用電子天平稱取一塊大理石放上稱量紙,正確“歸零”A5質(zhì)量記錄準(zhǔn)確A6將大理石轉(zhuǎn)移至大試管底部固體由試管口緩緩滑到試管底部A7將稀鹽酸倒入大試管中傾倒方法正確A8鑒別氫氧化鈉溶液與氫氧化鈣溶液現(xiàn)象描述正確A9結(jié)論正確A10B量取20mL蒸餾水量筒讀數(shù)方法正確B1液體體積正確B2攪拌使粗鹽溶解玻璃棒攪拌動作正確B3制作過濾器濾紙緊貼漏斗內(nèi)壁B4搭建過濾裝置漏斗下端尖嘴處緊靠燒杯內(nèi)壁B5過濾操作轉(zhuǎn)移液體時(shí)燒杯緊靠玻璃棒,玻璃棒末端輕抵三層濾紙?zhí)嶣6液面低于濾紙邊緣B7用滴管吸取濾液后滴加入試管中膠頭滴管使用正確B8鑒別硝酸鋇溶液與硝酸銀溶液現(xiàn)象描述正確B9結(jié)論正確B10測試前一天專門組織參加測試的教師開展研討,完成以下任務(wù):
(1) 明確每個(gè)評分點(diǎn)得分的操作要領(lǐng),例如B3的動作要領(lǐng)包括:①玻璃棒不敲擊燒杯內(nèi)壁;②液體不濺出;③可溶性固體完全溶解。
(2) 通過討論盡可能羅列每個(gè)評分點(diǎn)可能出現(xiàn)的錯(cuò)誤操作,例如B3可能出現(xiàn)的錯(cuò)誤操作有:①使用玻璃棒以外的物件(如滴管、藥匙等)進(jìn)行攪拌;②玻璃棒敲擊燒杯內(nèi)壁;③攪拌時(shí)有液體濺出;④有攪拌動作,但玻璃棒未伸入液面甚至未伸入燒杯;⑤玻璃棒伸入液面,但沒有攪拌;⑥用玻璃棒碾壓燒杯底部未溶解的固體;⑦有攪拌動作,但是持續(xù)時(shí)間很短,可溶性固體未完全溶解……
(3) 明確每位教師在測試時(shí)的分工:在哪些評分點(diǎn)得分,哪些評分點(diǎn)故意做錯(cuò)失分,以何種錯(cuò)誤動作失分。
最終,每位教師在參加測試前都會拿到一份個(gè)性化的任務(wù)清單,明確每個(gè)評分點(diǎn)需要做出的動作,例如6號教師的任務(wù)清單如表2REF_Ref155130302所示。
對各公司導(dǎo)出的原始評分?jǐn)?shù)據(jù)進(jìn)行處理后得到的總正確率、對正確操作判斷的正確率、對錯(cuò)誤操作判斷的正確率、逐個(gè)評分點(diǎn)正確率情況如圖1、圖2所示。
圖1總正確率、對正確操作判斷的正確率、對錯(cuò)誤操作判斷的正確率
圖2各評分點(diǎn)正確率
(1) 從圖1可知,幾家公司的智能賦分系統(tǒng)評分的總正確率普遍不高,其中M公司由于數(shù)據(jù)導(dǎo)出時(shí)出現(xiàn)錯(cuò)亂,無法在規(guī)定時(shí)間內(nèi)解決問題,故正確率接近猜測概率50%,即接近理論上系統(tǒng)最差的表現(xiàn),因?yàn)檎_率達(dá)到0與達(dá)到100%具有同樣的難度。鑒于M公司的數(shù)據(jù)已不具有分析價(jià)值,在后續(xù)分析中將其剔除,其三攝像頭的方案是否更加有效也無從分析。
(2) 從圖1還可以發(fā)現(xiàn),各系統(tǒng)對正確操作和錯(cuò)誤操作的判斷能力各不相同,K判斷正確操作的正確率遠(yuǎn)高于判斷錯(cuò)誤操作,N正好相反,而L兩者比較接近。自動賦分的要求是兩者相當(dāng)且都比較高,顯然三個(gè)系統(tǒng)都沒有達(dá)到這樣的要求。K可能是對正確的標(biāo)準(zhǔn)定得比較低;也可能是研究正確的操作比較多,而忽視了研究各種可能出現(xiàn)的錯(cuò)誤操作。而事實(shí)上,考生在實(shí)驗(yàn)操作過程中可能出現(xiàn)的錯(cuò)誤情況是遠(yuǎn)多于正確操作的,賦分系統(tǒng)如何進(jìn)行判斷需要投入更多的研究。N可能對正確的標(biāo)準(zhǔn)定得過于嚴(yán)苛,造成很多正確操作被判為錯(cuò)誤。當(dāng)然,以這樣的標(biāo)準(zhǔn)來評判錯(cuò)誤的操作正確率就高了。
(3) 從圖2REF_Ref155209370可以發(fā)現(xiàn),同一系統(tǒng)在不同評分點(diǎn)、不同系統(tǒng)在同一評分點(diǎn)的正確率都存在較大差異,各系統(tǒng)未體現(xiàn)出應(yīng)有的可靠性和穩(wěn)定性。在有些評分點(diǎn)上,部分系統(tǒng)的準(zhǔn)確率已經(jīng)可以達(dá)到90%以上甚至100%。例如:A4、 A5、 A7、 A9、 A10、 B10。其中A4、 A5、 A9都是對狀態(tài)而不是過程的判斷,相對容易實(shí)現(xiàn)。A7的操作盡管是一個(gè)過程,但是其中的狀態(tài)和過程相對比較容易量化評判,所以有的系統(tǒng)能達(dá)到較高的正確率。A10、 B10在提供考生實(shí)驗(yàn)用品時(shí)就有固定答案,因此輸入系統(tǒng)的判斷標(biāo)準(zhǔn)非常明確。但各系統(tǒng)獲取考生答題信息的方式不同,有的是通過讓考生在屏幕上直接選擇或輸入,有的是通過攝像頭拍攝考生答卷中的手寫內(nèi)容進(jìn)行識別,顯然前者在評分時(shí)的難度較小,正確率較高的正是前者。另外考生的書寫也會出現(xiàn)各種可能,如“氫氧化鈉”“氫氧化鈉溶液”“NaOH”“NaOH溶液”等,再加上手寫筆跡的識別、答卷放置的位置和角度等因素,需要系統(tǒng)具有一定的“應(yīng)變能力”,這也是有些系統(tǒng)在這兩個(gè)評分點(diǎn)正確率不高的原因。
(4) 從圖2中部分正確率較低的評分點(diǎn)出發(fā),結(jié)合測試前對這些評分點(diǎn)的一些操作預(yù)設(shè),發(fā)現(xiàn)K、 L、 N三個(gè)系統(tǒng)都將錯(cuò)誤操作判斷為正確的有:①用手捂試管進(jìn)行氣密性檢查,但是持續(xù)時(shí)間很短,只有1秒,然后下結(jié)論(A1、 A2);②用燒杯作為收集二氧化碳的容器(A3);③電子天平讀數(shù)比示數(shù)略大(A6);④用量筒量取液體時(shí)刻度未朝向自己(B1);⑤有攪拌動作,但玻璃棒未伸入燒杯(B3);⑥攪拌時(shí)玻璃棒敲擊燒杯內(nèi)壁(B3);⑦濾紙緊貼漏斗壁,但側(cè)面或底部已有破損(B4);⑧實(shí)驗(yàn)現(xiàn)象中沒有沉淀,但是試卷上回答“有沉淀”(B9)。三個(gè)系統(tǒng)都將正確操作判斷為錯(cuò)誤的有:①將大理石轉(zhuǎn)移到大試管底部(A7);②過濾器的制作(B4);③使用滴管滴加液體入試管中(B8)。這些問題的產(chǎn)生,主要有以下方面的原因:①系統(tǒng)對正確操作的“理解“不夠全面細(xì)致,判斷時(shí)利用的信息不夠全面,斷章取義抓局部來進(jìn)行評判;②對持續(xù)的過程進(jìn)行評判的能力不足;③在多個(gè)評分點(diǎn)之間存在關(guān)聯(lián)時(shí),評判邏輯存在問題;④對實(shí)驗(yàn)中的某些信息捕捉不夠全面、精準(zhǔn),影響后面的評判;⑤對某些評判標(biāo)準(zhǔn)的閾值設(shè)定與人工判定存在差距。
(5) 從圖2中L系統(tǒng)的表現(xiàn)來看,由于其在一些儀器上使用了一些輔助手段,使容器口等部位更加容易判斷,實(shí)驗(yàn)數(shù)據(jù)更容易傳輸,使得A4、 A6、 A7、 B2、 B8等相關(guān)評分點(diǎn)正確率高于平均值。但提升并不顯著,遠(yuǎn)未達(dá)到優(yōu)秀水平。測試過程中也發(fā)現(xiàn),由于在天平增加藍(lán)牙模塊后降低了天平的靈敏度,嚴(yán)重影響了正確的稱量操作和讀數(shù)。
3試驗(yàn)中反映出的問題
從測試的情況來看,各家公司都能通過智能賦分系統(tǒng)多角度地捕捉考生的行為,并能通過一定的算法校正圖像畸變后對考生的行為進(jìn)行進(jìn)一步的判斷,判斷一般都是通過物體識別、空間定位、關(guān)鍵幀捕捉等方式實(shí)現(xiàn)。但在真實(shí)環(huán)境中的測試結(jié)果并不理想,還遠(yuǎn)未達(dá)到大規(guī)模、高利害考試自動賦分的要求。通過試驗(yàn)中的數(shù)據(jù)分析和日常的調(diào)研訪談,可以提煉出以下一些需要解決的問題或困難。
3.1系統(tǒng)獲取信息的完整性
各系統(tǒng)獲取考生實(shí)驗(yàn)操作信息的方式比較單一,即依靠固定式雙路攝像頭的純視覺方案來獲取信息。
即使考生嚴(yán)格按照要求,所有操作都在實(shí)驗(yàn)臺劃定的框線范圍內(nèi)進(jìn)行,也可能無意中發(fā)生以下情況:手部或頭部在活動過程中遮擋部分或全部攝像頭,就算只是瞬間,也可能丟失關(guān)鍵信息;實(shí)驗(yàn)過程中可能有液體濺到攝像頭上或者產(chǎn)生霧氣影響視頻質(zhì)量;儀器之間互相有遮擋,甚至個(gè)別儀器直接放在完全遮擋鏡頭的位置……
另外,考生在實(shí)驗(yàn)過程中肯定優(yōu)先滿足自己的實(shí)驗(yàn)和觀察需要,而攝像頭卻是從正對考生的視角進(jìn)行信息采集,從而導(dǎo)致丟失關(guān)鍵信息。例如:考生在使用量筒時(shí)會優(yōu)先將有刻度的一側(cè)對準(zhǔn)自己,而攝像頭就只能拍到量筒沒有刻度的一側(cè)。
3.2系統(tǒng)所獲信息的準(zhǔn)確識別
通過記錄的視頻進(jìn)行準(zhǔn)確的識別對系統(tǒng)也極具挑戰(zhàn)性。化學(xué)實(shí)驗(yàn)中的很多儀器、試劑都是無色透明的,有時(shí)還存在反光的問題,這些因素會對其識別增加很大的難度,更何況還有光強(qiáng)、顏色、照射角度等環(huán)境因素的變化。
化學(xué)實(shí)驗(yàn)中,有些時(shí)候會涉及微小量或微小變化的判斷,例如:一滴水是否滴到試管以外,漏斗下端是否緊靠燒杯內(nèi)壁,固體是否完全溶解,顏色是否全部變白……這些都對系統(tǒng)提出了很高的要求。
此外,如何識別考生視角的信息也有難度。例如:如何從視頻中判斷考生視角下的量筒讀數(shù),如何準(zhǔn)確識別考生在屏幕上或者答卷上書寫的文字、符號、圖示等。
3.3評分的標(biāo)準(zhǔn)把握
系統(tǒng)不會天生就有評分的標(biāo)準(zhǔn),一定需要人為提供基本的原則或者典型的案例來生成。但是,人不可能給系統(tǒng)窮舉出所有可能的情況,甚至無法提供一個(gè)明確的劃分標(biāo)準(zhǔn)。例如:在固固加熱制氧氣的裝置中,要求試管口略向下傾斜。從系統(tǒng)開發(fā)者的角度,當(dāng)然是希望能從化學(xué)教師這里問出這個(gè)試管傾斜的角度在幾度到幾度的范圍內(nèi),但我們能說得出來嗎?即使說得出來,考生如果超出0.5°就要扣分嗎?我們只知道這個(gè)傾斜的程度要讓固體不會滑向試管口而水卻能流向試管口,系統(tǒng)開發(fā)者的任務(wù)就是要將這樣的要求轉(zhuǎn)化為系統(tǒng)的評判能力。
3.4系統(tǒng)的普適性
好的系統(tǒng)應(yīng)該能夠在面對不同的場景、不同的考生、不同的實(shí)驗(yàn)內(nèi)容、不同的儀器設(shè)備、不同的操作方法等時(shí)都有很好的適應(yīng)性和穩(wěn)定性。例如,同一個(gè)基本實(shí)驗(yàn)操作會在不同的實(shí)驗(yàn)中進(jìn)行考查;有的實(shí)驗(yàn)會有多種合理的操作順序;有的考生會在實(shí)驗(yàn)失敗后在考試允許的時(shí)間內(nèi)進(jìn)行重做等。這就需要系統(tǒng)有能力從一個(gè)過程的角度對實(shí)驗(yàn)行為的規(guī)范性、合理性等方面進(jìn)行全面判斷,而不是僅從一個(gè)時(shí)間點(diǎn)或一個(gè)關(guān)鍵幀。
4對于化學(xué)實(shí)驗(yàn)操作考試智能賦分系統(tǒng)開發(fā)與應(yīng)用的建議
4.1基于課標(biāo)要求和考試測量規(guī)范
智能賦分系統(tǒng)的開發(fā)是為教學(xué)和評價(jià)服務(wù)的,應(yīng)嚴(yán)格遵守化學(xué)課程標(biāo)準(zhǔn)規(guī)定的內(nèi)容與要求,不能為了系統(tǒng)開發(fā)的方便而隨意改變教學(xué)內(nèi)容、操作方法、實(shí)驗(yàn)儀器等。
如果為了智能賦分的方便,而專門制造一些看上去非常特殊的儀器,往往會對教學(xué)和評價(jià)產(chǎn)生很多負(fù)面影響。例如,有的公司在量筒的底部裝了一個(gè)綠色LED燈珠,讀數(shù)的時(shí)候打開燈光,凹液面一目了然,人和系統(tǒng)辨識起來都非常容易。但是,這樣的量筒可能會對液體顏色的觀察造成干擾,依賴特殊燈光的讀數(shù)方法對學(xué)生實(shí)驗(yàn)?zāi)芰Φ呐囵B(yǎng)也未必是好事,另外這樣的厚底量筒也顯得很笨重,操作起來并不方便。有的公司在有些玻璃儀器的特殊位置畫上粗線條,如試管口、距試管底部三分之一處等。這樣的儀器有可能會影響學(xué)生對凹液面的觀察,在考試中也會對考生產(chǎn)生提示作用(有時(shí)可能是誤導(dǎo))。
在考試過程中,系統(tǒng)不應(yīng)對考生提出額外的要求。例如,有的系統(tǒng)為了方便將考生的行為與評分點(diǎn)對應(yīng),要求考生在每個(gè)小題的操作完成后都要通過點(diǎn)擊才能進(jìn)入下一環(huán)節(jié)的操作。這樣的額外要求不利于原本連貫的實(shí)驗(yàn)操作順利進(jìn)行,也必然會影響考試評價(jià)的效度,因?yàn)樵趯?shí)驗(yàn)操作技能之外還附加了“考試技能”的要求。
4.2利用多元的信息采集設(shè)備
系統(tǒng)在視頻采集方面,除了原有的固定式攝像頭,還可以增加考生視角的攝像頭,將很大程度解決遮擋和視角差異造成的一系列問題,智能眼鏡、頭戴式攝像頭等都是可以考慮的方案。
目前在智能駕駛方面,除了極個(gè)別品牌還堅(jiān)持用“純視覺”方案外,很多廠商都采用了包括攝像頭、激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)等傳感器在內(nèi)的多傳感器融合方案。這也可以為智能賦分系統(tǒng)的建設(shè)打開思路。例如,在實(shí)驗(yàn)臺面和試劑瓶底部埋設(shè)霍爾傳感器,就可以很方便地感知試劑瓶被動用的時(shí)間、順序等;如果再加上質(zhì)量傳感器,就還可以知道試劑的用量;其實(shí)前面提到的天平增加藍(lán)牙模塊也是很好的思路,前提是不能影響天平原有的性能。
多元信息采集設(shè)備使用時(shí),不能改變原有的教學(xué)要求和操作方式等,要“無感”地發(fā)揮作用。另外,在系統(tǒng)開發(fā)時(shí),要關(guān)注不同采集設(shè)備獲取到的信息之間的相互印證。例如,前面提到的攪拌過程中玻璃棒是否敲擊燒杯壁不容易判斷的問題,就可以結(jié)合視頻和音頻進(jìn)行綜合判斷。當(dāng)然,成本也是需要考慮的重要因素,但是在探索階段不妨可以大膽一些,畢竟有些硬件在技術(shù)成熟和大規(guī)模使用后成本會大幅降低。
4.3加強(qiáng)系統(tǒng)的智能算法研究
算法是智能賦分系統(tǒng)的核心和靈魂,僅靠窮舉和簡單的條件判斷還算不上真正的智能。智能的系統(tǒng)應(yīng)該具有不斷學(xué)習(xí)和優(yōu)化的能力,需要用人工標(biāo)注的數(shù)據(jù)集來對其進(jìn)行訓(xùn)練。訓(xùn)練素材一定要保證高質(zhì)量,需要組織優(yōu)秀教師團(tuán)隊(duì),通過研討、培訓(xùn)統(tǒng)一標(biāo)準(zhǔn),然后才能生成可靠、優(yōu)質(zhì)的訓(xùn)練素材,促進(jìn)系統(tǒng)的不斷迭代優(yōu)化。歷年的實(shí)驗(yàn)操作考試中積累的視頻素材和賦分未必符合系統(tǒng)初期訓(xùn)練素材的質(zhì)量要求。
4.4形成應(yīng)用和完善的良性循環(huán)
優(yōu)秀的智能賦分系統(tǒng)不可能一蹴而就,需要在實(shí)踐中發(fā)現(xiàn)問題、不斷完善。我們可以讓其先在簡單的場景中使用起來,一是可以積累更多的系統(tǒng)訓(xùn)練素材,二是可以減輕部分工作壓力。例如,可以讓系統(tǒng)先在一些客觀性強(qiáng)、變數(shù)少的評分點(diǎn)取代人工進(jìn)行評判;或者在教師對視頻進(jìn)行評分時(shí),通過系統(tǒng)的算法對需要教師重點(diǎn)觀看的時(shí)間段進(jìn)行提示,從而提高教師閱卷的效率。
除了將智能賦分系統(tǒng)應(yīng)用于實(shí)驗(yàn)操作考試外,還可以探索在日常教學(xué)中將其用于化學(xué)探究能力的訓(xùn)練、評價(jià)和反饋,包括實(shí)驗(yàn)設(shè)計(jì)、操作、測量、觀察、數(shù)據(jù)和現(xiàn)象的呈現(xiàn)、分析、結(jié)論、評價(jià)等各個(gè)方面[4]。這樣的應(yīng)用不僅可以推動系統(tǒng)充分發(fā)揮文本分析、圖形分析等方面AI技術(shù)的優(yōu)勢,還可以進(jìn)一步提升系統(tǒng)的利用率并提高教學(xué)效率,同時(shí)也讓我們的實(shí)驗(yàn)教學(xué)更貼近育人的本源。
4.5提高標(biāo)準(zhǔn)化考場的利用率
化學(xué)實(shí)驗(yàn)操作考試的標(biāo)準(zhǔn)化考場不應(yīng)是每年只用一次或只用一季的教學(xué)場所,其價(jià)值更應(yīng)該體現(xiàn)在日常應(yīng)用中。從標(biāo)準(zhǔn)化考場的建設(shè)階段就要考慮其將來的利用率問題,提前從設(shè)計(jì)上實(shí)現(xiàn)考試和日常教學(xué)的兼顧。目前不少建成的標(biāo)準(zhǔn)化考場中顯示屏、攝像頭林立,且無法方便拆卸。在不使用視頻記錄功能時(shí)弊端盡顯,一是擋視線,不利于教學(xué)中交流活動的開展;二是不方便,實(shí)驗(yàn)活動時(shí)礙手礙腳,且容易損壞設(shè)備。于是平時(shí)教師不愿意用,校長舍不得用,造成閑置浪費(fèi)。建議在標(biāo)準(zhǔn)化考場建設(shè)時(shí),相關(guān)的裝備要考慮能夠方便拆卸,按需組裝,提升使用的靈活性。
L3級別的自動駕駛已經(jīng)在國內(nèi)獲準(zhǔn)路試,期盼化學(xué)實(shí)驗(yàn)操作考試的智能賦分系統(tǒng)也能早日投入實(shí)際應(yīng)用。
參考文獻(xiàn):
[1]中華人民共和國教育部.教育部關(guān)于加強(qiáng)和改進(jìn)中小學(xué)實(shí)驗(yàn)教學(xué)的意見[EB/OL]. http://www.moe.gov.cn/srcsite/A06/s3321/201911/t20191128_409958.html.
[2]王慧, 孫可, 楊覬風(fēng), 陳謙, 何智. 全國各地中考實(shí)驗(yàn)操作考試實(shí)施現(xiàn)狀調(diào)查報(bào)告(一)[J]. 中國現(xiàn)代教育裝備, 2022, (6): 4~10.
[3]盧致杰. 數(shù)字化考試背景下的上海初中理化實(shí)驗(yàn)操作考試實(shí)踐[J]. 招生考試研究, 2022, (2): 23~41.
[4]梁正譽(yù), 鄧峰, 石子欣, 楊維震. 新加坡GCE OLevel化學(xué)實(shí)驗(yàn)操作考查評介與啟示[J]. 化學(xué)教學(xué), 2023, (10): 85~91.聚焦課堂案例研究聚焦課堂案例研究“模型認(rèn)知”素養(yǎng):內(nèi)涵與教學(xué)進(jìn)路*全國教育科學(xué)規(guī)劃教育部重點(diǎn)課題“指向核心素養(yǎng)的中學(xué)化學(xué)深度學(xué)習(xí)教學(xué)評價(jià)研究”(課題編號:DHA210347)的研究成果。——以“電解原理的應(yīng)用”為例