999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能賦能的可信同伴互評模型構建與驗證

2023-05-30 20:10:37孔維梁于曉利韓淑云鄧敏杰
現代遠程教育研究 2023年3期
關鍵詞:人工智能

孔維梁 于曉利 韓淑云 鄧敏杰

摘要:同伴互評是培養高階思維、提升學習績效的重要學習策略。然而在教學實踐中,同伴互評存在嚴重的低信任問題,即學習者對同伴的評價存在質疑或漠視,整體接受度不高。究其緣由,學習者的認知差異性是導致低信任問題的關鍵誘因:客觀上,學習者的認知差異性導致同伴評價的不一致現象;主觀上,學習者面對評價不一致現象時會產生確認偏誤。人工智能賦能的可信同伴互評模型,使用可信系數標明評價的有效性,引導學習者建立正確的認同與信任,可以降低學習者的確認偏誤。該模型的智能化實現過程分為4個階段:評價及可信系數的表征、評分關系加權圖構建、基于加權隨機游走算法的同伴間認知水平關系挖掘、可信系數計算及評價反饋。基于該模型的教學實踐表明:其能夠依據評價者與被評者的相對認知水平為評價計算合理的可信系數;有助于提高學習者對同伴評價的接受度,在感知有用性、行為意愿2個維度上顯著優于傳統同伴互評模型;對學習者批判性思維傾向的培養具有顯著的正向影響,在分析性、系統性、求知欲和思想開放性4個子維度上均有顯著提升。

關鍵詞:人工智能;同伴互評;認知差異;低信任度;可信系數

中圖分類號:G434? ?文獻標識碼:A? ? 文章編號:1009-5195(2023)03-0093-10? doi10.3969/j.issn.1009-5195.2023.03.011

基金項目:河南省哲學社會科學規劃項目“數據驅動的在線協同知識建構干預策略研究”(2021BJY021);河南省高等學校重點科研項目“自我調節學習視角下在線學習支持服務研究”(21A880009)。

作者簡介:孔維梁,博士,講師,碩士生導師,河南師范大學教育學部(河南新鄉 453007);于曉利,碩士研究生,河南師范大學教育學部(河南新鄉 453007);韓淑云,博士研究生,華中師范大學人工智能教育學部(湖北武漢 430079);鄧敏杰,博士,副教授,碩士生導師,河南師范大學教育學部(河南新鄉 453007)。

一、引言

適時、適度的評價能為教學提供重要的導向,也對學習者認識自我、激發動機起著良好的促進作用(黃濤等,2021)。同伴互評作為一種新興評價方式,通過組織學習者對同伴或其作品進行評價,為學習者觀點的交互創新、知識的遷移應用創造了良好的環境(張紅英等,2019;Gamage et al.,2021)。同伴互評是實現“以學習者為中心”的有效教學策略,在培養高階思維能力(鐘啟泉,2020;Lin et al.,2021)、提高知識建構水平(許瑋等,2022)和激發學習動機(Rico-Juan et al.,2019)等方面均有顯著效果。

雖然同伴互評具有諸多優勢,但其在教學實踐中仍面臨嚴重的低信任度問題,即學習者對同伴的評價存在質疑或漠視,整體接受程度不高(Luo et al.,2014)。信任度是影響同伴互評成功與否的核心因素。低信任度容易將潛在的積極學習體驗轉化為消極學習體驗,降低學習者參與同伴互評的意愿,從而阻礙同伴互評有效性的發揮(Pond et al.,1997;Admiraal? et al.,2014)。目前,由學習者的認知差異性導致的低信任度問題仍普遍存在,依然是教育教學中亟待解決的關鍵問題。

本文聚焦由學習者的認知差異性導致的低信任度問題,引入人工智能技術(Artificial Intelligence,AI)構建可信同伴互評模型,使用可信系數標明評價的有效性,幫助學習者建立更合理的注意與認同,以提升對同伴互評的接受程度。此外,本研究還將對上述模型進行實踐驗證,從學習者的同伴互評接受度水平和批判性思維傾向兩個方面對模型的有效性進行檢驗。

二、相關研究綜述

1.同伴互評促進學生的發展

同伴互評也被稱為同伴反饋或互動評價,指學習者在相同的學習環境中,對該環境中的其他學習者或其作品進行的等級評分或者評論,是學習者互相評價的過程(Zundert et al.,2010)。在同伴互評中,學習者同時扮演評價者和被評價者的雙重角色。一方面,作為評價者,學習者在已有知識和經驗基礎上,經過內化、遷移等認知加工過程,對相同環境中同伴或其作品進行評價;另一方面,作為被評價者,學習者在同伴的評論或提問下,將隱藏的思維過程外化,清晰地觀察到自己的推理和分析過程,能更好調動元認知參與和自我調節(畢景剛等,2020;Chien et al.,2020)。

研究表明,同伴互評在激發動機和提高學習績效方面具有良好的效果。Rotsaert等(2018)指出同伴互評可以作為形成性評價,能有效改善教學中的薄弱環節,有助于提高學習者的學習成績。Heyman等(2011)認為同伴互評是以學生為中心的教學策略,能夠給予學生主人翁意識,對激發學習動機、促進學習參與度具有良好的效果。白清玉等(2016)基于活動理論對同伴互評的成效進行了研究,發現互評活動對學生的成績有顯著的積極影響。此外,黃國禎等(Hwang et al.,2014)通過教育游戲應用證實了同伴互評可以有效提高學習者的學習成績和學習動機。

同時,同伴互評也是培養學習者高階思維發展的有效策略之一。高階思維是產生在較高層次上的心智活動或認知能力,主要包括問題解決能力、批判性思維(傾向和能力)、決策力以及評價能力等(潘星竹等,2019)。Yastibas等(2015)指出在同伴互評過程中,不同觀點的碰撞能夠強化學習者的反思和邏輯推理意識,促進認知結構不斷重組,推動學習者問題解決能力的發展。汪瓊等(2019)對MOOC課程中同伴互評數據進行深入分析后發現,即使在無干預的狀態下,大部分學習者的推理、綜合、解釋等批判性思維能力都有一定程度的提升。Li等(2019)指出相較于教師評價,處于同等地位的同伴之間進行的互評能夠削弱評價者的權威地位,減輕被評價者的心理壓力,有利于促進評價雙方進行深入辯論,對學習者的求知欲、自信心等批判性思維傾向有積極影響。張生等(2021)認為評他能力是學評融合新理念的核心內容之一,同伴互評是培養學習者辨別好壞的過程,能有效提升學習者的評他能力。

2.同伴互評面臨的低信任困境

理論與實踐證明,同伴互評可以促進學習者的知識建構和高階思維培養。然而,在實際教學應用中,學習者對同伴的評價往往持質疑或不信任態度,同伴互評面臨嚴峻的低信任困境(吳遐等,2020)。

為明晰觸發低信任的誘因,學者們從不同的視角開展歸因探究。柏宏權(2018)發現友誼和情感沖突等人際關系會影響學習者對評價公平性的感知,而對公平性的負面感知會降低評價質量,增加同伴對互評的不信任度。李紅霞等(2020)指出評價不一致現象是引起低信任問題的關鍵誘因之一,其中,評價標準的不統一會降低對評價者的約束力,增加互評的隨意性,造成不同評價者對相同被評者的評價不同甚至是完全相反,即評價不一致現象。李菲茗等(2018)也證實了評價不一致現象是低信任問題的重要根源,同時指出評價者認知水平的差異性是造成同伴評價不一致現象的主要原因之一。

在歸因研究的基礎上,學者們設計了相應的模型與方案以解決同伴互評的低信任問題。為解決人際關系滲入造成的低信任問題,學者們提出匿名評價模型,使評價者能夠更自由地表達自身意見,提供更坦率和更具有針對性的反饋,而被評價者也可以更多地關注評價內容,而不是評價者的身份(Van Gennip et al.,2010;Chang et al.,2011)。然而,Yu等(2016)指出,匿名評價會促使學習者的自我意識減弱和對自我社會行為管制的放松,降低社會責任感,導致評價隨意性的增加。為解決隨意性以及評價標準不統一造成的低信任問題,梁云真(2018)在匿名的基礎上提出基于量規的同伴互評模型,認為評價量規能夠為評價者的評價活動提供支架輔助,能有效規范評價者行為,幫助評價者明確評價要求,減少評價的不一致性和主觀隨意性。

綜觀上述研究,學習者人際關系的滲入、評價標準不統一和認知差異性等因素是導致同伴互評低信任問題的關鍵誘因;同時,匿名、量規等互評模型的提出也有效解決了人際關系和評價標準不統一導致的低信任問題。然而,由同伴認知差異性造成的低信任問題卻少有研究關注,仍是同伴互評實踐中亟待解決的關鍵問題。

3.認知差異性與低信任問題

認知差異性是指不同的個體在不同的認知維度上有著各自獨特的智能優勢。在同伴互評中,認知差異性會導致相同評價者在不同評價維度或者不同評價者在相同評價維度上的評價存在差異,即評價不一致現象,進而造成低信任問題。劉興華等(2018)指出,受自身認知水平或偏好的影響,同伴互評結果很難做到較大程度上的合理統一。

評價不一致現象是引發學習者對同伴評價低信任的重要根源,確認偏誤理論則對這一問題給予了機理性的解釋。確認偏誤(又稱證實偏差)是指無論合乎事實與否,人們總是趨向于看見期望看見的,相信愿意相信的,當認定了一個觀點,大腦會持續、有選擇地去尋找證據來證明該觀點是正確的,而對那些證明該觀點錯誤的證據,則會有選擇地忽略或解讀(Marsh et al.,2007)。

在同伴互評中,學習者會為自身覆蓋一層自我認識的強化濾鏡。當面對諸多不一致的同伴評價時,學習者更認同對自己有利的描述或與自身觀點一致的同伴評價,而對于不一致觀點的評價則本能地認為對方是能力不足或惡意評價,從而導致其所認同的評價被高估和不認同的評價被低估。研究者指出在評價不一致現象中,學習者難以甄別有效性評價,樂于接受認同自己或支持自身觀點的評價,而對持有不一致觀點的評價持懷疑態度,繼而否定并忽視該評價(叢璽夢,2020;李紅霞等,2020)。由此可見,學習者在無外界干擾的情況下,易于按照支持自我的角度選擇、解讀評價反饋,即引發確認偏誤,導致學習者對評價的整體信任度不高。

綜上,認知差異性引起的低信任問題主要體現在兩方面:(1)學習者的認知差異性導致同伴評價的不一致現象,這是引起低信任問題的客觀因素;(2)學習者面對評價不一致現象時產生確認偏誤,這是引起低信任問題的主觀因素。由此,為解決認知差異性帶來的低信任問題,可以從上述兩方面入手。

三、人工智能賦能的可信同伴互評模型構建

1.賦予評價有效性的可信系數

個體差異理論指出認知差異性普遍存在且不可避免,評價不一致這一客觀現象難以消除,故而,從主觀因素上降低學習者的確認偏誤成為解決低信任問題的可行方案。為此,本研究提出為同伴評價提供可信系數,即為每條評價標明其客觀有效性,值越大則表明評價越有效。可信系數為評價的有效性賦予一個權威性聲明,使有效的評價引起學習者的注意與認同,即使評價與自身觀點沖突,被評價者也不會輕易否定該評價,進而促使學習者對評價進行深層次的反思或與評價者進行交流,從而降低或消除學習者對評價的確認偏誤。

可信系數為解決由確認偏誤引起的低信任問題提供了一種可行方案,而如何科學、客觀地計算可信系數成為該方案的核心。有研究發現認知水平對評價有顯著影響,認知水平高的學生對作品的評價更為準確,評價的質量也就更高(李曉菲,2018;Meek et al.,2017)。此外,成績優秀者的評語更為具體全面,認知廣度更大,也更能同時兼顧課程知識的多個維度(李梅等,2016;劉迎春等,2019)。

基于此,本研究提出將評價者和被評價者的認知水平關系作為可信系數的計算依據,即相對于被評價者,如果評價者在某方面的認知水平越高,則其評價在該方面的可信系數也就越高,反之亦然。可信系數與評價者和被評價者的相對認知水平關系密切相關,因此,相同評價者對不同被評價者的評價,其可信系數是不同的。例如,學習者A、B、C的認知水平分別為0.8、0.6、0.9,則A對B評價的可信系數為0.8/0.6≈1.33;而A對C評價的可信系數則為0.8/0.9≈0.89。

2.人工智能賦能的可信同伴互評模型

可信系數的計算需要依據評價者和被評價者的認知水平關系,面對大量學習者和多維度認知水平,僅依靠個體的智慧與能力難以發現及厘清兩兩學習者在多維認知水平上的相對關系,也就難以為評價計算精準、客觀的可信系數。人工智能技術的發展為可信系數的計算提供了技術支撐,其通過對學習者間的評分信息進行深度挖掘,以統一的尺度標明所有學習者的認知水平,從而極大推進了可信系數的智能化計算。

本研究在匿名和量規評價的基礎上,以可信系數為著力點,以智能算法為支撐,提出了人工智能賦能的可信同伴互評模型(如圖1所示),以解決認知差異造成的低信任問題。模型主要包括四大功能模塊:

匿名同伴互評模塊。系統隨機為每個作品分配固定數量的評價者,評價者則需要在規定時間內按照給定量規對作品進行在線匿名評價。匿名評價使得同伴互評的公正性得以保證,而量規則消除了同伴評價的隨意性。

評價表征模塊。該模塊將同伴的每條評價分為評分與評語兩部分,并對評價進行形式化表征。其中,評分是對作品的量化認同程度,而評語是質性的說明或建議。

可信系數計算模塊。該模塊主要包含2個步驟:首先,將所有的評價關系和評分數據轉換成有向圖,生成評分關系加權圖;其次,利用人工智能技術中的加權隨機游走算法,從評分關系加權圖中挖掘出學習者間的認知水平關系,并根據評價者與被評價者的認知水平關系,為評價計算可信系數。

評價反思與交流模塊。系統將每條評價及其可信系數反饋給被評價者,被評價者則在可信系數的基礎上修正自身的認知注意力,并參照評語有選擇地批判或接受相關評價,對有疑惑的地方與相應評價者進行在線匿名交流,在交流中修正認知不足并促進知識體系的深層次建構。

四、可信同伴互評模型的智能化實現

可信同伴互評模型的實現核心與難點在于可信系數的計算,而可信系數的計算本質上可以轉換為挖掘評價者與被評價者間的相對認知水平關系。

在眾多人工智能算法中,加權隨機游走算法是一種用來在加權圖上挖掘所有節點相對重要性的有效算法。該算法具有統一尺度、并行性好、魯棒性高、不易陷入局部極小值等優點,在網頁重要性排行、全局最優化等領域得到了廣泛的應用(馬慧芳等,2018),尤為適合認知水平關系的挖掘。為此,研究引入加權隨機游走算法進行可信系數的計算,從而完成可信同伴互評模型的智能化實現。其核心實現過程分為4個階段:評價及可信系數的表征、評分關系加權圖構建、同伴間認知水平關系挖掘和可信系數計算及評價反饋。

1.評價及可信系數的表征

評價及可信系數的表征是定義評價數據和可信系數的結構化形式,該步驟是數據處理的前提與基礎。研究所關注的同伴評價包含兩部分內容:評分與評語。其中,評分是一個多維度的打分列表,其維數由所使用的評價量規決定,表示評價者在多個量規指標上對被評作品的認同程度;評語則是一段文字說明,是對評分的解釋說明或修改建議等,評語是被評價者與評價者進行交流反思的基礎。如表1所示,依據3個指標進行評分,每個指標滿分為10分,最后給出了整體評語。

2.評分關系加權圖構建

評分關系加權圖是同伴間評價關系的形式化表示,是可信系數計算的結構化數據支撐。評分關系加權圖是一個加權有向圖,例如表1對應的評分關系加權圖如圖2所示。圖中節點(“人”形符號)表示學習者或其作品,當表示出鏈時為評價者,表示入鏈時為作品;有向鏈接則表示學習者間的評價關系,鏈接上的權值為評價的評分。

圖2中每個作品均被2個評價者評價,如學習者A分別對學習者B和學習者F的作品進行了評價(即A的出鏈),評分分別為{7,5,7}和{8,5,6},而學習者A的作品又被學習者B和學習者E評價(即A的入鏈)。

3.同伴間認知水平關系挖掘

在評分關系加權圖的基礎上,為計算可信系數,需要挖掘同伴間的認知水平關系。加權隨機游走算法能夠以統一的尺度標識出所有節點的相對重要性,適用于同伴間認知水平關系的挖掘。

加權隨機游走算法的基本原理為:節點被鏈接(圖2中入鏈)的分值越大,該節點的重要性就越高;重要性越高的節點對別人的鏈接(圖2中出鏈)也越重要。應用于評分關系挖掘,加權隨機游走算法會使用統一的尺度標識出所有同伴的認知水平,該值為一個向量,其維數與評分保持一致,研究中以PR表示(圖2中節點上方框內的值)。例如,圖2 中學習者A的認知水平PR(A)={0.138,0.111,0.127}。基于加權隨機游走算法的同伴間認知水平關系挖掘的步驟如下:

(1)節點初始化。為每個節點的認知水平PR賦初始值,如公式(3)所示。其中,PR0(u)表示節點u的初始值,pr0(uk)表示節點u在指標k上的初始值,N表示所有節點的個數,初始時每個學習者在每個評價指標上的初始化值均為1/N。例如,圖2中有7個學習者,則學習者的初始認知水平PR0(u)={1/7,1/7,1/7}。

(2)更新節點值。根據評分關系加權圖為每個節點更新PR值,方法是:將每個節點當前的PR值以加權的方式分配到其所有出鏈上,而每個節點的新PR值計算方法如公式(4)所示,公式包含兩部分,前一部分是其自身入鏈的PR值總和,后一部分是隨機轉移值。其中,prt+1(uk)表示節點u在指標k上、第t+1次迭代時的PR值,I表示節點u的入鏈節點集合(即節點u的所有評價者集合),α表示隨機跳轉概率,一般取經驗值0.85(彭珠,2009)。wk(v,u)表示在指標k上,節點v對節點u評分的權重,其計算方法如公式(5)所示。其中,rk(v,u)表示在指標k上節點v對節點u的評分,O表示節點v的出鏈節點集合(即被節點v評價的所有節點集合)。

以圖2中節點A為例,2個評價者B和E的評分為B:{7,5,6},E:{8,4,7}。在第一輪更新時,節點A入鏈的PR值分別為B→A:(0.061,0.055,0.056),E→A:(0.061,0.041,0.053),根據公式(4)可計算節點A的第一輪PR值為{0.143,0.117,0.131}。

(3)節點的認知水平計算。迭代執行步驟(2),直至所有節點的PR值逐漸收斂或達到迭代次數為止,此時獲得的每個節點的PR值即為其認知水平。

4.可信系數計算及評價反饋

挖掘出所有同伴間的認知水平關系之后,即可以認知水平關系為基礎計算評價的可信系數。評價者的相對認知水平越高,其評價越有效,可信系數也越高。為此,評價的可信系數被定義為該評價的評價者與被評價者的認知水平的比值,計算方式如公式(6)所示。其中,C(u,v)表示學習者u對學習者v評價的可信系數,PR(u)表示學習者u的認知水平。例如,圖2中節點B對節點A評價的可信系數為(0.139/0.138,0.134/0.111,0.145/0.127)=(1.007,1.207,1.142),其中,可信系數大于1表明評價者在該方面的認知水平高于被評價者,低于1則相反。

及時有效的反饋可以觸發學習者在學習過程中積極的反應,發現與彌補現有認知錯誤與不足,促進知識體系全面、深層次的建構。為了促進同伴互評的有效性,降低學習者對評價的確認偏誤,本研究將評價與可信系數綁定并同時反饋給學習者,以幫助學習者對評價建立正確的認知,即反饋包含評分、評語以及評價可信系數3個部分,例如,圖 2 中節點A的一條評價反饋為{(7,5,6),“選題尚可……”,(1.007,1.207,1.142)}。

五、可信同伴互評模型的實踐驗證

1.實驗設計

研究以某師范大學選修“現代教育技術”課程的20級物理學1班和物理學2班的本科生作為研究對象。1班的54人作為實驗組,采用可信同伴互評,2班的55人作為控制組,采用傳統同伴互評,兩組學習者都有至少一學期的在線學習平臺使用經驗。課程內容以主題形式組織,并采用“線下學習+線上評價交流”的混合式教學模式。其中,線下學習是指學習者在課堂學習主題知識并完成作品;線上評價交流是學習者對同伴上傳作品進行在線匿名評價并與自身作品的評價者進行匿名交流。

為探究本文提出模型的有效性,研究將從可信系數計算的合理性、學生的同伴互評接受度、學生的批判性思維傾向3個方面進行實踐驗證。實驗中量規滿分100分,包含內容性(40分)、教學性(30分)、呈現度(30分)3個一級指標,一級指標又分別細分為2、3、3個二級指標。學生的同伴互評接受度和批判性思維傾向均使用量表測量。其中,同伴互評接受度量表是在胡畔等人量表(胡畔等,2019)的基礎上改進得到,包括感知有用性等3個測量維度和18個測量題項,采用5級李克特量表測量。批判性思維傾向量表選擇Facione等(1992)開發的加利福尼亞批判性思維傾向量表,選用了思想開放性、分析性等5個維度,共50個測量題項,采用6級李克特量表測量。研究使用Cronbachs α系數和KMO系數對兩個量表的信效度進行檢驗,結果均高于0.75,表明量表具有較高的信效度。

研究的實驗流程如圖3所示。課程開始之前,使用量表對兩組學生進行同伴互評接受度和批判性思維傾向的前測,并向學習者講解學習方式、評價量規等相關知識。課程學習過程中,要求學生每學習一個主題后,需完成一個作品并提交至在線互評平臺,隨后互評系統為每個作品隨機分配3個評價者(每個評價者也評3個作品),開展同伴互評活動。實驗組在互評后會得到系統反饋的評分、評語和可信系數。而控制組則得到評分和評語。得到反饋后,兩組學生均可通過在線留言工具與匿名評價者開展交流,并對作品進行修改后再次上傳。學期末,再次使用量表對學習者進行同伴互評接受度和批判性思維傾向的后測,并總結反思課程的實施效果。

2.研究結果與分析

(1)可信系數計算結果

為驗證模型可信系數計算的合理性,研究隨機選取了第6周S27學生以及其3位評價者(S8,S38,S47)的原始評分和可信系數,如表 2 所示。從表中數據可知:其一,同一評價在不同評價指標上的可信系數存在差異。例如,S8對S27的評價可信系數分別是{(1.01,1.14),(1.00,1.09,0.99), (0.96,1.02,1.17)} ,這一結果表明評價者在每個評價維度上的認知水平并不相同,符合學習者個體內的認知差異性原則。其二,不同評價在相同評價指標上的可信系數并不相同。例如,S27在一級指標1的第2子指標上的可信系數分別為1.14、0.99、0.98,這一結果表明不同的評價者在相同維度上的認知水平并不相同,符合學習者個體間的認知差異性原則。其三,學習者的作品在某評價指標上取得的評分越高,其對他人的評價中在該指標上的可信系數也越大。例如,S8的作品在一級指標1的第2子指標上得分最高(16.59),S27在該指標上的所有評價中,S8的可信系數最高(1.14),這一結果表明學習者的認知水平越高,則其對他人評價中的可信系數也越大,計算符合研究的預期。

由此可見,認知差異性客觀存在,并且本研究提出的可信同伴互評模型能夠依據評價者與被評價者的相對認知水平為評價計算合理的可信系數。

(2)可信同伴互評模型對同伴互評接受度的影響

接受度是同伴互評有效性以及學生是否會持續使用該學習方式的重要衡量指標。為探究可信系數對同伴互評接受度的影響,研究從感知有用性、感知易用性和行為意愿3個維度對學生學習前后的接受度進行對比檢驗。首先,使用獨立樣本t檢驗對兩組學生的前測結果進行分析,結果如表3所示。可以看出,兩組學生在3個維度上的均值接近,顯著性值p均大于0.05(分別是0.970、0.929和0.951),未達到顯著水平,說明兩組學生在學習前具有一致的接受度。

然后,使用獨立樣本t檢驗方法對兩組的后測結果進行分析,結果如表4所示。由表可知:在感知易用性維度,兩組無明顯差異(p=0.906>0.05);而在其他2個維度上,兩組差異性顯著(p分別為0.030和0.031)。結合前后測均值不難發現,學習后實驗組在感知有用性和行為意愿2個維度上有所提升,而控制組在2個維度上基本保持穩定或下降。

實驗結果反映出實驗組學生在可信系數的引導下,能有效利用同伴評價改進作品,認為同伴評價策略對學習有較大促進作用;而控制組學生則認為同伴評價的作用不大,與評價者進行交流的意愿也較低。

(3)可信同伴互評模型對批判性思維傾向的影響

為探究模型對學習者高階思維培養的影響,研究對學習者的批判性思維傾向進行了對比。首先,使用獨立樣本t檢驗對兩組學生的前測結果進行分析,結果顯示,兩組學生在5個維度上的均值及標準差都接近,p均大于0.05,未達到顯著水平,說明兩組學生的前測結果一致,具有相同的批判性思維傾向。

然后,研究使用配對樣本t檢驗方法對兩組學生的“后測—前測”成績進行分析,結果如表5所示。由表5可知,兩組學生在分析性、系統性和求知欲3個維度上均比學習前有顯著提升(差值均值>0,且p<0.05);此外,實驗組在思想開放性維度也有顯著提升,而控制組沒有;并且實驗組的總體提升度高于控制組(24.019>16.891)。結合后測的統計結果可知,實驗組在總體結果上得分更高(Mean實驗=223.24,Mean控制=214.33)。實驗結果表明,可信同伴互評模型相較于傳統同伴互評,能夠更有效地激發學習者的思想開放性;對學習者的批判性思維傾向發展具有更加顯著的正向影響。

六、總結與思考

同伴互評是促進學習者深度知識建構和高階思維培養的有效策略,然而,低信任問題會削弱學習者參與反思活動的積極性,引發評價焦慮,嚴重阻礙策略有效性的發揮。針對由同伴認知差異性導致的低信任問題,研究引入人工智能技術,構建可信同伴互評模型,通過可信系數幫助學習者降低確認偏誤,更大程度包容與自己觀點相互沖突的評價。通過實踐證明,相較于傳統同伴互評模型,本文提出的模型對學習者的接受度和批判性思維傾向均有更優的正向影響。本研究對同伴互評的教育應用實踐有以下啟示:

一是注重同伴互評的形成性評價。形成性評價通過診斷教學過程中存在的問題,為正在進行的學習活動提供反饋信息,在改善未來學習方面,比總結性評價具有更好的效果。在同伴互評教學中,評價不應以區分評價對象的優良程度為重心,而是要充分利用評價反饋和討論,引導學習者通過個人的反思和彼此間的交流來理解所收到的評價,將反饋信息融入自身認知策略調整和知識建構中,最終完成問題的解決、知識的遷移和高階思維的培養。因此,要想同伴互評有效,它必須是對話的,而不是單向的信息傳遞過程(Filius et al.,2018)。

二是關注學生對評價的確認偏誤。評價的不一致性使得學習者需要直面質量參差不齊,甚至是沖突矛盾的評價。學習者往往會不自覺地以自身情緒或喜好判定同伴評價的好壞,產生確認偏誤。確認偏誤會導致學習者關注的評價不全面,易使學習者沉浸在主體構造的一個支持自我的世界里。為此,除卻技術方面的信息補足,還可以引導學習者養成換位思考的習慣,使用逆向思維來思考決策的對立面甚至其他面的利弊,然后一一進行對比分析,保持從理性和客觀的視角去做學習決策。

研究在一定程度上解決了由同伴的認知差異性導致的低信任問題,為充分發揮同伴互評在教學中的獨特優勢提供了有效的支持。但是,除研究所涉及的認知水平外,評價者的評價能力、評價態度等也是影響評價質量的重要因素,如何整合多方面影響因素,構建更全面完善的可信指標,以解決低信任困境對同伴互評造成的不良影響是研究接下來的關注重點。

參考文獻:

[1]白清玉,張屹,沈愛華等(2016).基于同伴互評的移動學習對小學生學習成效的影響研究——以科學課程為例[J].中國電化教育,(12):121-128.

[2]柏宏權(2018).基于移動學習環境的大學生同伴互評的公平性研究[J].教育發展研究,38(7):75-81.

[3]畢景剛,韓穎,董玉琦(2020).技術促進學生批判性思維發展教學機理的實踐探究[J].中國遠程教育,41(7):41-49,76-77.

[4]叢璽夢(2020).在線作業同伴互評與教師評分一致性的影響因素研究[D].沈陽:沈陽師范大學:2-8.

[5]胡畔,蔣家傅(2019).中小學生對數字教材的技術接受度及其影響因素研究[J].現代遠距離教育,(4):77-83.

[6]黃濤,趙媛,耿晶等(2021).數據驅動的精準化學習評價機制與方法[J].現代遠程教育研究,33(1):3-12.

[7]李菲茗,李曉菲,黃亞平等(2018).訓練對同伴互評評分準確性的影響——以“三維動畫設計與建模”課程為例[J].中國遠程教育,(5):63-67,78.

[8]李紅霞,趙呈領,蔣志輝(2020).匿名與量規對基于SPOC的混合式同伴互評投入度的影響[J].現代教育技術,30(10):20-27.

[9]李梅,劉英群,周潛(2016).同伴評價的可信度與特點分析[J].電化教育研究,37(9):48-54.

[10]李曉菲(2018).同伴互評評分準確性影響因素研究[D].杭州:浙江工業大學:25-27.

[11]梁云真(2018).基于量規的同伴互評對在線學習認知、情感投入度及學習成效的影響研究[J].電化教育研究,39(9):66-74.

[12]劉興華,紀小凌(2018).大學英語寫作同伴評分的可行性和有效性研究[J].外語界,(5):63-70.

[13]劉迎春,朱旭,陳樂(2019).精準教學中基于同伴互評的評價者認知網絡分析[J].遠程教育雜志,37(1):85-93.

[14]馬慧芳,劉芳,夏琴等(2018).基于加權超圖隨機游走的文獻關鍵詞提取算法[J].電子學報,46(6):1410-1414.

[15]潘星竹,姜強,黃麗等(2019).“支架+”STEM教學模式設計及實踐研究——面向高階思維能力培養[J].現代遠距離教育,(3):56-64.

[16]彭珠(2009).一種求解PageRank問題的修正乘冪法(英文)[J].徐州師范大學學報(自然科學版),27(4):45-47.

[17]汪瓊,歐陽嘉煜,范逸洲(2019).MOOC同伴作業互評中反思意識與學習成效的關系研究[J].電化教育研究,40(6):58-67.

[18]吳遐,高記,劉兵(2020).以評促學:基于三元交互決定論的同伴互評研究[J].中國遠程教育,41(4):58-64,77.

[19]許瑋,祝思璇(2022).同伴互評對學習者知識建構過程的實證研究——基于時間序列的認知網絡分析[J].現代教育技術,32(1):44-53.

[20]張紅英,陳明選,馬志強等(2019).基于自評與互評的網絡協作學習貢獻度評價[J].現代遠程教育研究,31(2):95-102.

[21]張生,王雪,齊媛(2021).評他能力:人工智能時代學生必備的高階思維能力[J].中國電化教育,(11):24-31.

[22]鐘啟泉(2020).批判性思維:概念界定與教學方略[J].全球教育展望,49(1):3-16.

[23]Admiraal, W., Huisman, B., & Van de Ven, M. (2014). Self- and Peer Assessment in Massive Open Online Courses[J]. International Journal of Higher Education, 3(3):119-128.

[24]Chang, C. C., Tseng, K. H., & Chou, P. N. et al. (2011). Reliability and Validity of Web-Based Portfolio Peer Assessment: A Case Study for a Senior High Schools Students Taking Computer Course[J]. Computers & Education, 57(1):1306-1316.

[25]Chien, S. Y., Hwang, G. J., & Jong, M. S. Y. (2020). Effects of Peer Assessment Within the Context of Spherical Video-Based Virtual Reality on EFL Students English-Speaking Performance and Learning Perceptions[J]. Computers & Education, 146:103751.

[26]Facione, P. A., & Facione, N. C. (1992). The California Critical Thinking Disposition Inventory(CCTDI)[EB/OL]. [2022-11-21].

https://edinstruments.org/instruments/california-critical-thinking-

disposition-inventory-cctdi.

[27]Filius, R. M., de Kleijn, R. A. M., & Uijl, S. G. et al. (2018). Strengthening Dialogic Peer Feedback Aiming for Deep Learning in SPOCs[J]. Computers & Education, 125:86-100.

[28]Gamage, D., Staubitz, T., & Whiting, M. (2021). Peer Assessment in MOOCs: Systematic Literature Review[J]. Distance Education, 42(2):268-289.

[29]Heyman, J. E., & Sailors, J. J. (2011). Peer Assessment of Class Participation: Applying Peer Nomination to Overcome Rating Inflation[J]. Assessment & Assessment in Higher Education, 36(5):605-618.

[30]Hwang, G. J., Hung, C. M., & Chen, N. S. (2014). Improving Learning Achievements, Motivations and Problem-Solving Skills Through a Peer Assessment-Based Game Development Approach[J]. Educational Technology Research and Development, 62(2):129-145.

[31]Li, H., Xiong, Y., & Hunter, C. V. et al. (2019). Does Peer Assessment Promote Student Learning? A Meta-Analysis[J]. Assessment & Evaluation in Higher Education, 45(2):193-211.

[32]Lin, H. C., Hwang, G. J., & Chang, S. C. et al. (2021). Facilitating Critical Thinking in Decision Making-Based Professional Training: An Online Interactive Peer-Review Approach in a Flipped Learning Context[J]. Computers & Education, 173:104266.

[33]Luo, H., Robinson, A., & Park, J. Y. (2014). Peer Grading in a MOOC: Reliability, Validity, and Perceived Effects[J]. Journal of Asynchronous Learning Networks, 18(2):119-126.

[34]Marsh, D. M., & Hanlon, T. J. (2007). Seeing What We Want to See: Confirmation Bias in Animal Behavior Research[J]. Ethology, 113(11):1089-1098.

[35]Meek, S. E. M., Blakemore, L., & Marks, L. (2017). Is Peer Review an Appropriate form of Assessment in a MOOC? Student Participation and Performance in Formative Peer Review[J]. Assessment & Evaluation in Higher Education, 42(6):1000-1013.

[36]Pond, K., & Ul-Haq, R. (1997). Learning to Assess Students Using Peer Review[J]. Studies in Educational Evaluation, 23(4):331-348.

[37]Rico-Juan, J. R., Gallego, A. J., & Calvo-Zaragoza, J. (2019). Automatic Detection of Inconsistencies Between Numerical Scores and Textual Feedback in Peer-Assessment Processes with Machine Learning[J]. Computers & Education, 140:103609.

[38]Rotsaert, T., Panadero, E., & Schellens, T. (2018). Peer Assessment Use, Its Social Nature Challenges and Perceived Educational Value: A Teachers Survey Study[J]. Studies in Educational Evaluation, 59:124-132.

[39]Van Gennip, N. A. E., Segers, M. S. R., & Tillema, H. H. (2010). Peer Assessment as a Collaborative Learning Activity: The Role of Interpersonal Variables and Conceptions[J]. Learning and Instruction, 20(4):280-290.

[40]Yastibas, G. C., & Yastibas, A. E. (2015). The Effect of Peer Feedback on Writing Anxiety in Turkish EFL (English as a Foreign Language) Students[J]. Procedia Social and Behavioral Sciences, 199:530-538.

[41]Yu, F. Y., & Sung, S. (2016). A Mixed Methods Approach to the Assessors Targeting Behavior During Online Peer Assessment: Effects of Anonymity and Underlying Reasons[J]. Interactive Learning Environments, 24(7):1674-1691.

[42]Zundert, M. V., Sluijsmans, D., & Merri?nboer, J. V. (2010). Effective Peer Assessment Processes: Research Findings and Future Directions[J]. Learning & Instruction, 20(4):270-279.

收稿日期 2022-12-11責任編輯 李鑫

Abstract: Peer assessment is an important learning strategy to cultivate learnershigh-order thinking and improve learning performance. However, in practice, peer evaluation has a serious problem of low trust, that is, learners question or ignore peer evaluation and the overall acceptance is not high. Cognitive differences among learners are the key contributing factor to this problem: objectively, cognitive differences among learners lead to inconsistent peer evaluations; subjectively, learners may experience confirmation bias when faced with inconsistent evaluations. The trusted peer evaluation model empowered by artificial intelligence uses a credibility coefficient to indicate the effectiveness of the evaluation to guide learners to establish correct identification and trust, which can reduce learnersconfirmation bias. The intelligent implementation of this model can be divided into four stages: the representation of evaluation and credibility coefficient, the construction of weighted graph of scoring relationship, the mining of peer cognitive level relationship based on weighted random walk algorithm, the calculation of credibility coefficient and evaluation feedback. The teaching practice based on this model shows results as follows. First, the model can calculate a reasonable credibility coefficient for evaluation based on the relative cognitive level of the evaluator and the respondent. Second, learnersacceptance of peer evaluation has improved, especially in terms of perceived usefulness and behavioral willingness, which are significantly better than traditional peer evaluation models. Third, it has a significant positive impact on the cultivation of learnerscritical thinking tendency, of which the four sub dimensions including analysis, systematicness, curiosity and openness have been greatly improved.

Keywords: Artificial Intelligence; Peer Assessment; Cognitive Differences; Low Trust; Credibility Coefficient

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 国产精彩视频在线观看| 欧美亚洲一区二区三区导航| 亚洲精品色AV无码看| 免费A∨中文乱码专区| 欧美激情伊人| 无码高潮喷水在线观看| 国产在线小视频| 日韩av无码DVD| 亚洲香蕉在线| 日本久久久久久免费网络| 中文字幕资源站| 99精品国产自在现线观看| 国模视频一区二区| 成人福利在线观看| 在线永久免费观看的毛片| 欧美色综合网站| 国产精品视频3p| 漂亮人妻被中出中文字幕久久| 久久人搡人人玩人妻精品| 亚洲区第一页| 麻豆精品在线播放| 国产亚洲欧美在线人成aaaa| 欧美色综合久久| 日本欧美中文字幕精品亚洲| 色综合久久无码网| 一本一道波多野结衣一区二区| 伊人久久精品亚洲午夜| 福利在线一区| 成人午夜精品一级毛片| 在线观看国产精品一区| 国产欧美精品午夜在线播放| 午夜视频日本| 亚洲第一成年人网站| 亚洲无线视频| 国产亚洲欧美日韩在线一区| 日韩福利在线观看| 欧美三级不卡在线观看视频| 欧美视频在线观看第一页| 色135综合网| 91久久国产综合精品女同我| 精品五夜婷香蕉国产线看观看| 在线观看视频99| 国产成人喷潮在线观看| 91在线播放国产| 国产成人1024精品下载| 国产91精选在线观看| 欧美日本二区| 福利一区在线| 国产乱子伦无码精品小说| 美女视频黄频a免费高清不卡| 潮喷在线无码白浆| 97综合久久| 精品夜恋影院亚洲欧洲| 日韩精品成人在线| 毛片在线播放a| 激情综合网激情综合| 老司机精品一区在线视频| 自慰高潮喷白浆在线观看| AV片亚洲国产男人的天堂| 亚洲AV无码久久精品色欲| 免费A级毛片无码无遮挡| 国产欧美日韩91| 91精品在线视频观看| 欧美成人第一页| 青青青草国产| 亚洲三级视频在线观看| 色有码无码视频| 99久视频| 亚洲日韩精品综合在线一区二区| 国产精品hd在线播放| 极品尤物av美乳在线观看| …亚洲 欧洲 另类 春色| 久久鸭综合久久国产| a天堂视频在线| 日韩视频福利| 91网址在线播放| 亚洲永久免费网站| 性欧美精品xxxx| 国产精品刺激对白在线| 91精品啪在线观看国产| 久久综合伊人77777| 免费激情网站|