殷建華,解問鼎
(1.西南大學 教育學部,重慶 400715;2.蘇州市教育質量監測中心,江蘇 蘇州 215004)
中學生物理實驗操作能力測評系統的設計與應用研究
殷建華1,解問鼎2
(1.西南大學 教育學部,重慶 400715;2.蘇州市教育質量監測中心,江蘇 蘇州 215004)
實驗操作能力是中學理科課程核心素養的重要組成,是新課程要求培養的重要能力。實驗操作能力主要體現在真實的實驗操作過程當中,只有通過對真實的實驗過程進行考查,才能真正反映出學生的實驗能力情況。然而,現有的實驗操作能力測評形式依然拘泥于紙筆測驗,關注容易評價的、確定性的知識。該文以物理實驗操作能力測評為例,通過開展相關理論與實踐研究,建構物理實驗操作能力測評系統模型,利用教育信息技術手段設計和開發中學生實驗操作能力測評系統,并通過專家系統等智能化測評技術的引入,實現對實驗操作能力的真實、有效和智能化測評。
實驗操作能力;測評系統;計算機輔助測評
學生實驗操作能力的培養是素質教育和基礎教育課程改革的重點環節。對于物理課程而言,培養學生的實驗操作能力是提升學生科學素養的必由之路[1]。然而,目前對物理實驗操作能力單一的紙筆測驗方式造成了“紙上學實驗”和“做題練實驗”的現實。雖然紙筆測驗的成績可以間接地反映學生的實驗操作能力,但這種反映是不全面的,有時甚至是不真實的,這就直接導致在物理教學實驗能力培養中出現各種各樣的問題。因此,如何更客觀、真實地評價學生的實驗操作能力是一個亟待探索的重要課題。
沒有真實的實驗操作能力評價,就難以實現真正的實驗操作能力培養。破解這一矛盾,亟需一種真實有效的評價方法和工具。在信息技術推動下,教育信息技術手段為實現實驗操作能力的計算機輔助測量與評價提供了可能。將現代教育技術與物理實驗操作能力評價進行結合,可以創建理想的實驗教學與評價環境,改變傳統的教學與評價模式,解決教學中存在的問題或困境。
1.實驗操作具有過程性與瞬時性特點,評分難度較大
傳統的實驗操作測評需要評分員對學生的實驗操作過程進行現場觀察評分。評分員需注意力高度集中,才能捕捉學生操作細節。另外,對評分人員有較高的實驗素養要求,否則難以在短時間內捕捉并判斷學生的關鍵操作情況。同時,評分人員觀察的位置、角度等因素,也會影響評分結果,甚至還會干擾學生的實驗操作,現場評分難度較大。
2.評判過程無法重復,評分信度低
實驗操作測評不能要求學生重復多次實驗,評分過程也無法重現,評判結果缺少必要證據支持。一旦評分結果出現爭議,就很難進行處理。有些實驗操作測評采取“一對一”甚至“多對一”的評分方式提高測試信度,但實施效率較低、成本較高,一般只在參與測評人數較少的競賽中使用。
3.評分標準不精確,評分存在主觀隨意的問題
實驗操作測評一般通過學生對關鍵過程、關鍵環節的處理來判斷其對實驗的掌握情況。由于評分員無法完全實現對操作過程的全面精確觀察,評分標準一般只會規定學生需進行何種操作,無法準確描述操作的精確程度。同時,對實驗的過程性數據也難以做出要求,僅能對實驗結果和實驗現象作規定,這就造成了大量的實驗操作細節被忽略。另一方面,評分人員的責任心、精神狀態等,對評分結果的準確性和穩定性會產生一定的影響,評分的客觀、公正性難以保證。
計算機輔助評價的出現,為現代教育技術與學科的融合打下了基礎,也給實驗操作能力測評帶來諸多啟示。計算機輔助測評可以勝任大范圍群體的測評,考試服務人員數目較少,組織工作相對簡化;可以引入更復雜、更準確的測評手段,有利于更有效地測量被試的知識和能力水平;測試的時間和地點不再嚴格要求同時和同地[2][3]。
具體來說,在配備標準實驗測評環境的實驗室中,利用計算機輔助測評技術分割實驗操作與評分之間的“時空”聯系,首先通過多角度的視頻錄像,準確記錄學生實驗操作的過程,然后通過“計算機閱評”的方法實現對實驗操作的在線評分。通過引入“多人評分”和“專家復核”的機制,提高評分者間信度,并通過計算機程序自動監控評分者內部信度,確保評分的前后一致性。
然而,這種方法雖然保證了實驗操作評分的可重復性,但相當于實施了“一對一”實驗操作評分,增加了評分人員的工作量。那么,如何才能提高實驗操作評分的效率?筆者認為“智慧學習”視角為解決這一問題提供了思路。智慧學習環境的感知性、適應性、多向交互性特征可以為綜合評價學習成果提供靈活的支持[4]。通過帶有“時間軸標記”功能的交互視頻技術和數字實驗的計算機信息采集、分析和輔助評分技術,輔助測評系統自動感知實驗操作過程,并將分析結果反饋給評分者,評分者便可以根據需求對具體操作環節進行評分,提高評分的效率;同時,系統可以通過分析評分員狀態數據,自動地適應評分員的工作節奏;通過建立實驗操作測評專家系統,將評分要點作為提示信息加入到交互視頻中,提高計算機輔助測評的有效性。最后,數字化實驗室的引入,可以運用多種傳感器收集實驗過程中的過程性數據,并通過后臺分析學生實驗操作的準確程度,輔助評分者做出更精準的判斷,減少評分員在客觀數據評判上花費的時間。
1.實驗能力結構模型的相關理論
物理實驗能力是復雜的心理認知結構的具體表現,一般認為物理實驗能力包含物理思維、科學觀察和操作技能等幾個方面的因素,但是這些因素并不是獨立存在的,各種能力的有機結合成為物理實驗能力[5]。因此要對這一綜合性的能力進行評價,必須依賴具有一定維度的物理實驗能力評價模型。在各種物理實驗能力的模型中,實驗操作能力處于核心位置的認識是統一的。實驗能力是多維度、多因素、多品質的綜合性能力也是共識[6]。通過對相關實驗能力模型的梳理,筆者認為喬際平提出的實驗能力結構模型層次清晰,結構分明,比較有利于對實驗能力進行考核和評價[7]。
2.計算機輔助測評理論
計算機輔助評價即把計算機用于測評的過程,計算機可以為教學測評提供模塊化、快速、準確、客觀的評價,并且能夠對結果進行自動統計分析[8]。
計算機輔助評價的優點有:(1)應用范圍廣:包括了技能、知識和實際操作能力等諸多方面;(2)自動化程度高:對于客觀題可以實現自動化評分和統計,大大提高效率;(3)客觀性強:對答題者信息的保密性強,除了客觀題的自動評分外,主觀題也實現了異地評分和多人評分,提高了評分的客觀程度;(4)時間、空間相對自由:借助網絡可以實現測評的同時異地或異時異地,自由度大大提高,組織形式也更便捷[9]。
3.專家系統
專家系統是一種模擬專家解決問題的計算機程序,是一個智能計算機程序系統。通過把大量的某個領域專家水平的知識與經驗轉化成計算機數據或算法,利用人類專家的知識和解決問題的方法處理該領域的問題。通俗來講專家系統就是一個具有大量專門知識與經驗的程序系統[10]。
通過分析課程標準中對實驗能力的具體要求,筆者從學科能力、內容領域、表現水平三個方面建構實驗能力的測評框架。能力維度包括實驗設計能力、實驗動手能力、實驗觀測能力、實驗數據處理能力與實驗解釋能力。與喬際平的實驗能力模型相比,筆者在實驗能力模型中增加了“實驗解釋能力”這一維度。實驗解釋可以看作是實驗設計的逆過程,強調對物理原理和方法的逆向運用,是逆向思維的體現。實驗解釋能力中包含了對實驗過程和現象的表征,是以語言表征能力為外顯的能力。基于課標要求,結合中學物理實驗領域與表現水平的要求,本研究的實驗操作能力測評模型如下頁圖1所示。根據實驗能力測評框架,建立實驗操作評價指標體系。
1.系統的功能定位與需求
測評系統的定位是能夠獨立完成對學生實驗操作能力的測評工作,彌補傳統實驗操作考試缺乏有效測評的問題,實現實驗操作能力測評的數字化、標準化、可測量。系統的必須滿足以下需求:(1)對實驗操作過程的科學量化功能;(2)對實驗操作能力的評價功能;(3)測評組織管理功能;(4)數據庫維護功能;(5)測評結果的存儲、統計、分析及輔助評價決策功能。

圖1 面向過程的實驗操作能力測量與評價框架模型
2.系統功能模塊結構
為了實現系統的這些功能,將系統分解成如下子系統:試題庫管理子系統、智能組卷子系統;能力量化子系統(評分系統)、能力評價子系統、考試管理子系統、測評結果統計分析子系統、云端管理子系統。
試題庫管理子系統:用于管理維護實驗操作能力測試試題數據庫。實驗操作試題庫的屬性分為“試題基本參數”和“測評參數”兩部分。基本參數包括實驗操作題的編號、名稱、知識點、難度、區分度、使用次數、最近使用時間、測試對象等;測評參數包括試題的能力維度構成、實驗方案、評分細則、常見錯誤提示、實驗儀器、實驗方法、實驗參數、誤差范圍、實驗技巧等。
能力量化子系統:包括考試界面及考生信息錄入模塊、考試模塊以及閱卷模塊。考試模塊負責呈現試題信息,并錄制保存學生實驗操作視頻。閱卷模塊是教師完成學生實驗能力評分的模塊,教師根據實驗視頻中的提示信息對實驗操作進行評判,同時教師評分的結果和評分時間軌跡也會被同步記錄保存下來,以便對評分質量進行分析,監控評分過程。
實驗能力評價子系統:負責呈現實驗能力的評分結果,并結合實驗能力結構模型對學生的實驗能力進行綜合評價,生成實驗能力評價成績單。依據評分細則列舉學生在實驗操作過程中的失分項目,及其對應的實驗操作環節,供學生和教師針對性地發現學生實驗能力培養中的薄弱環節。
云端(網絡)管理子系統:負責實驗考試的遠程組織、管理與閱卷的功能,將考生考試信息備份上傳到網絡服務器上,以便開展異地統一閱卷。
在測評系統中,實驗操作試題庫及其管理系統、智能組卷子系統、實驗能力量化子系統和結果統計分析子系統是專家系統中密切聯系的功能模塊。其信息傳遞關系結構如圖2所示。

圖2 測評系統信息關系結構圖
實驗操作測評系統主要利用交互視頻技術+數字化實驗平臺+計算機輔助測評系統,實現對中學物理實驗操作的“實測機評”。交互視頻技術是實驗操作過程的采集階段,數字化實驗平臺是系統的實驗工具,計算機輔助測評系統是實驗能力評價工具,也是實驗測評系統智能化的核心構成。
1.交互視頻技術
交互視頻就是指通過各種信息技術手段將交互體驗融入到線性視頻的一種新型視頻。測評系統用到的交互技術主要包括實驗視頻的關鍵操作標記和視頻播放時的定位、變速播放、回看等。對于數字實驗,實驗儀器的每一次使用都會觸發數字實驗平臺軟件產生數字信號,將這些信號產生的時間記錄下來就能得到一個時間軸,將不同的信號進行梳理和分類,就能根據每個實驗的特征和操作規范,分析出在這個信號產生前后對應發生的關鍵操作,從而實現對關鍵操作的識別與標記。
2.視角與獨立時間軸
實驗操作的錄制應該是多視角的,同時有多個攝像頭從不同的角度記錄實驗操作,并通過屏幕錄制記錄數字實驗平臺的使用情況。同時,實驗視頻播放與控制的時間軸要獨立于視頻之外,以便配合從不同的角度觀看時,同步定位實驗操作。關鍵操作在時間軸上進行“幀”標記,同時加入與時間軸標記對應的操作評分細則作為評分參考依據,如下頁圖3所示。
3.實驗測評數據庫
實驗測評系統的“智能化”主要體現在把人的實驗經驗轉化成數字信息,使軟件系統像專家一樣“解”物理實驗,通過建立詳細的實驗測評數據庫(包括:實驗操作觀察與量化評分量表、操作細則、規范、注意事項、易犯錯誤、數據范圍、能力表征等)使得對實驗操作沒有專門研究的評分人員也可以在系統的提示下客觀的對實驗操作進行評分,降低對評分人員的專業要求。

圖3 交互視頻錄制與播放示意圖
實踐階段選擇“驗證牛頓第二定律實驗”作為應用案例。通過具體實驗操作過程來測評學生的實驗能力,驗證實驗測評系統的有效性與可行性。
1.驗證牛頓第二定律實驗的能力考查點歸納
實驗設計:(1)如何運用控制變量法,探究加速度與力、質量的關系;(2)選擇什么器材、設計什么方案進行實驗;(3)用什么方法測量小車加速度。
實驗操作:(1)打點計時器的使用;(2)天平的使用規范;(3)斜面小車的調節和使用。在具體的儀器使用技巧中,包含了實驗動手能力的考查項,例如實驗操作順序、實驗儀器使用規則、實驗關鍵操作和技巧等。
實驗觀測能力:(1)摩擦力平衡是否到位;(2)天平讀數是否準確。
實驗數據處理能力:(1)物體受力的計算;(2)加速度的計算;(3)用圖像法處理實驗數據。
實驗解釋能力:(1)通過實驗數據呈現的圖像規律解釋實驗結果;(2)將實驗結果總結成物理結論,即牛頓第二定律。
2.考場布置
三個攝像頭分別從俯視角度、左前視角、右前視角進行拍攝,確保對實驗操作區域的全覆蓋。
3.測試安排
測試環節選擇5位被試參與,實驗操作時同時進行“錄像”和現場評分。現場由兩名評分人員自由選擇位置觀看學生的實驗操作情況并評分。實驗結束后一個月左右,同樣兩位評分人員利用輔助評分軟件再次對學生實驗操作進行評分。
評分人員通過調取5位被試的測試視頻資料,依據評分標準和相關提示進行評分。
1.結果分析
(1)計算機輔助方法與傳統方法的評分差異
在計算機輔助評分方法中,計算機評分要比傳統評分更加嚴格,失分率更高。分數差出現在熟練程度的評判上,計算機輔助評分由于固定視角觀看實驗操作,不太容易感覺到學生實驗操作時的情緒、心態等心理狀態,在變速播放時也不容易判斷學生的熟練度。在對學生操作熟練程度的評判上計算機輔助評分稍弱于傳統方法。
計算機輔助評分在實驗細節的記錄和再現能力方面有明顯優勢。如,C被試在計算機評分與傳統評分最大分差為4分。從C的數據可以發現,兩位評分人員在傳統方法中均未發現C被試“用手操作游碼”的錯誤操作,而在計算機輔助測評中發現了這一問題。同時,C被試在測量小車的質量時也出現了錯誤(也可能是書寫錯誤導致),這一錯誤在其他被試實驗時均已發生,甲、乙兩位評分人員現場評分均未發現該問題。通過計算機輔助測評錄像,評分人員發現了這一數據與其他被試測量數據之間的差別較大,發現了該錯誤。
(2)計算機輔助方法的優勢
除了細節記錄和再現能力外,計算機輔助測評在實驗效果觀察中也有較大優勢。例如:在被試進行平衡摩擦力的操作時,評分員現場通過肉眼觀察只能看到被試進行了該步驟的操作,但很難判斷出差異。通過實驗視頻中對數字實驗平臺的屏幕錄像,評分員可以清晰看出被試在平衡摩擦力時是否達到理想的實驗效果。值得注意的是,在計算機輔助評分和傳統評分方法中都可能出現誤判的情況,但是對存在爭議的評判,計算機輔助評分方法可以進行有效補救。
2.輔助評價舉例
根據統計出的五位被試在實驗能力方面每個評分項的得分情況,教師就可以結合學生的總分、平均分、位比、失分率等數據對學生或學生整體的實驗能力情況進行診斷分析,利用數據完整地刻畫出學生的實驗能力發展情況。如利用可視化工具將實驗數據制作成極區圖、折線圖、面積圖、散點圖等數據圖像。以雷達圖為例:如下頁圖4所示,將A、C被試的得分情況生成雷達圖(圖中各維度能力得分已轉化成該維度得分率)。
從雷達圖中可以看出A、C被試能力發展的差異。雖然A、C在總分上相同,但C被試的能力發展情況要比A被試均衡;A被試在實驗解釋能力上存在欠缺;C被試實驗設計能力和實驗觀測能力上有待提高;A、C被試的實驗數據處理能力發展較好。

圖4 A、C兩位被試成績雷達圖
通過實踐證明,本研究設計的實驗操作能力測評系統的方案是可行的,能夠解決現有實驗操作測試的問題。專家系統的應用使測評系統實現了基本的智能化,能夠大大提高測評的效率,節約實驗考試的人力成本。信息技術輔助下的實驗能力測評能夠達到預期效果。
從實驗操作測評實踐的效果來看,測評系統實現了預定的目標,具有較高的可行性。測評方法是具體可操作的,測評結果也有較高的可信度,能夠達到對實驗能力測評的客觀、科學性要求。同時,通過傳統觀察測評與計算機輔助測評兩種方法的比較,證明了計算機輔助評價在實驗能力測評中的優勢。雖然測評系統仍需進一步改進完善,測評系統軟件仍需進一步優化,但測評系統和方法的科學性、有效性已經得到了檢驗,為進一步推進深入研究、實現實驗操作能力測評系統的應用與推廣奠定了基礎。同時,在實驗操作考試的基礎上,本測評系統還可以用于學生日常實驗活動記錄和管理,有效保障日常實驗教學活動的質量。
[1] 陶洪. 物理實驗論[M].廣西:廣西教育出版社,2007.
[2] 黃榮懷,劉黃玲子等. 計算機輔助評價的發展趨勢[J].電化教育研究,2002,(5):15-21.
[3] 馬光仲,蔡旻君.計算機輔助評價發展的回顧與思考[J]. 電化教育研究,2010,(4):49-53.
[4] 吳洪燕. 智慧學習視角下個性化在線學習系統設計與應用[J].中國電化教育,2015,(6):127-131.
[5] 續佩君. 物理能力測量研究[M]. 廣西:廣西教育出版社, 1999.
[6] 于海波,王雙維.物理實驗能力的認知分析及相應教學策略的探討[J].物理通報,2000,(5):33-35.
[7] 喬際平. 物理學科教育學[M].北京:首都師范大學出版社,2000.
[8] 姜振鳳,劉力.基于計算機輔助評價的主觀題自動評測研究[J].重慶師范大學學報(自然科學版),2013,(2):74-78.
[9] 蔡旻君. 計算機輔助教育測量與評價[M].北京:中國水利水電出版社,2010.
[10] 史忠植.高級人工智能[M].北京:社會科學出版社,2006.
Design and Application Research on the Measurement System of Students’ Ability in Physics Experiment Operation
Yin Jianhua1, Xie Wending2
(1.Faculty of Education, Southwest University, Chongqing 400715; 2.Suzhou Education Quality Monitoring Center,Suzhou Jiangsu 215004)
As an important component of the key competences of middle school science courses, the experimental operation ability is required by the new curriculum. The experiment operation ability is mainly re fl ected in the operation process, only by testing the real experiments process, can we truly reveal the students’ ability. However, the current measurement form of experimental operation ability, concentrate more energy on easy, doubtless knowledge, and still limited to paper-pencil tests. In the research, we take the physics experiment operational ability assessment as an example, construct the measurement system model based on some related research. In order to implement the veritable, e ff ective and intelligent of the measurement, we utilize such as expert system information and intelligent measurement technology in education to develop students’ experimental operation ability measurement system.
Experimental Operation Ability; Measurement System; Computer Assisted Assessment
G434
A
殷建華:在站博士后,中學高級教師,研究方向為教育監測與評價 (63236528@qq.com)。
解問鼎:碩士,助理研究員,研究方向為課程與教學論(353697581@qq.com)。
2016年8月10日
責任編輯:趙興龍
1006—9860(2016)12—0073—05