999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能方法在探究小學(xué)生作業(yè)作弊行為及其關(guān)鍵預(yù)測(cè)因子中的應(yīng)用*

2024-02-18 09:25:44趙均榜傅根躍
心理學(xué)報(bào) 2024年2期
關(guān)鍵詞:小學(xué)生作業(yè)模型

趙 立 鄭 怡 趙均榜 張 芮 方 方 傅根躍 李 康

(1 杭州師范大學(xué)心理學(xué)系;2 杭州師范大學(xué)經(jīng)亨頤教育學(xué)院,杭州 311121)(3 浙江師范大學(xué)兒童發(fā)展與教育學(xué)院,杭州 311231) (4 杭州市夏衍小學(xué),杭州 311121)(5 北京大學(xué)心理與認(rèn)知科學(xué)學(xué)院,行為與心理健康北京市重點(diǎn)實(shí)驗(yàn)室,北京 100871)(6 加拿大多倫多大學(xué),安大略教育研究所,安大略 M5R 2X2)

1 引言

學(xué)業(yè)作弊是古往今來(lái)困擾教育工作者的難題。它是指學(xué)生為獲得理想的學(xué)業(yè)成績(jī)或排名而采取的秘密且有意破壞學(xué)業(yè)誠(chéng)信準(zhǔn)則的行為,其重要表現(xiàn)形式之一為作業(yè)作弊。雖然自“雙減”以來(lái),我國(guó)小學(xué)生的課業(yè)負(fù)擔(dān)明顯減輕,但不可否認(rèn),較之國(guó)外,“作業(yè)”依然是我國(guó)義務(wù)教育階段小學(xué)生最主要的學(xué)業(yè)任務(wù),作業(yè)作弊行為在小學(xué)生中仍普遍存在。小學(xué)階段是個(gè)體道德意識(shí)形成及道德行為習(xí)慣塑造的關(guān)鍵期,這一階段學(xué)生做出的作業(yè)作弊行為既會(huì)導(dǎo)致其學(xué)業(yè)成績(jī)不佳進(jìn)而在考試中作弊,久而久之,又容易使其作弊行為習(xí)慣化。并且,對(duì)兒童期的作弊行為若不重視并加以及時(shí)引導(dǎo)和干預(yù),很容易導(dǎo)致個(gè)體在成人后表現(xiàn)出更嚴(yán)重的問(wèn)題行為,如違法亂紀(jì)或犯罪(Williams &Williams,2012)。且“雙減”政策在強(qiáng)調(diào)“減負(fù)”的同時(shí),也明確了提高作業(yè)質(zhì)量的需求,并提倡杜絕“唯成績(jī)論”。可以預(yù)期,相較于考試成績(jī),小學(xué)生的作業(yè)質(zhì)量等平時(shí)學(xué)業(yè)表現(xiàn)在未來(lái)的學(xué)業(yè)評(píng)價(jià)體系中可能更為重要。為此,本研究就作業(yè)作弊行為在小學(xué)階段的發(fā)展及其關(guān)鍵性影響因素進(jìn)行深入考察,以期為探索作弊的發(fā)展機(jī)制以及提出有針對(duì)性的早期干預(yù)方法提供科學(xué)依據(jù)。

在學(xué)術(shù)界,有關(guān)學(xué)業(yè)作弊的研究已有近百年歷史(Hartshorne &May,1928)。縱觀現(xiàn)有的實(shí)證研究,絕大多數(shù)都來(lái)自國(guó)外,且研究對(duì)象幾乎全部聚焦于大學(xué)生和中學(xué)生群體(參見(jiàn) Anderman &Midgley,2004;Cizek,1999;Hrabak et al.,2004),極少有研究關(guān)注小學(xué)生群體(Hartshorne &May,1928)。雖然,早在1928 年,Hartshorne 和May 的研究就已揭示小學(xué)階段兒童會(huì)自發(fā)地做出學(xué)業(yè)作弊行為。但在此之后,因西方教育體制改革導(dǎo)致國(guó)外小學(xué)階段的考試和作業(yè)一度被取消,故針對(duì)小學(xué)生作弊的實(shí)證研究也一度停滯。與此同時(shí),在研究?jī)?nèi)容方面,國(guó)外學(xué)業(yè)作弊的研究主要集中于考試作弊(Bong,2008;Freire,2014),針對(duì)作業(yè)作弊的研究非常少。可以說(shuō),到目前為止尚未有研究專門考察過(guò)小學(xué)生的作業(yè)作弊行為。

與國(guó)外相比,國(guó)內(nèi)有關(guān)學(xué)業(yè)作弊的實(shí)證研究起步更晚,且研究對(duì)象全部集中于大學(xué)生群體(如:舒首立 等,2018;易曉明,2021),針對(duì)小學(xué)生作弊(尤其是作業(yè)作弊)的實(shí)證研究尚屬空白。雖然有關(guān)大學(xué)生學(xué)業(yè)作弊的研究結(jié)果可以為小學(xué)生作業(yè)作弊研究提供一定的思路和借鑒。但與大學(xué)生相比,小學(xué)生的道德認(rèn)知發(fā)展水平更低,故針對(duì)前者的研究結(jié)果是否適用于小學(xué)生群體尚不明確。鑒于此,本研究將立足我國(guó)國(guó)情,以國(guó)內(nèi)外現(xiàn)有實(shí)證研究結(jié)果為基礎(chǔ),重點(diǎn)考察影響當(dāng)前我國(guó)小學(xué)生作業(yè)作弊行為的可能因素,并從中尋找關(guān)鍵性影響因素。本研究結(jié)果旨在為建構(gòu)兒童誠(chéng)信行為發(fā)展的理論模型,以及道德行為發(fā)展理論的完善和本土化提供重要的科學(xué)依據(jù)。

具體說(shuō)來(lái),本研究將以2 至6 年級(jí)小學(xué)生為研究對(duì)象,采用大樣本問(wèn)卷調(diào)查法和機(jī)器學(xué)習(xí)(Machine Learning,Pedregosa et al.,2011)相結(jié)合的方法,考察小學(xué)生作業(yè)作弊行為的年級(jí)發(fā)展趨勢(shì),重點(diǎn)分析不同因素對(duì)作業(yè)作弊的影響及其相對(duì)重要性。

機(jī)器學(xué)習(xí)是數(shù)智時(shí)代新興的數(shù)據(jù)分析方法,也是人工智能的核心方法,它依賴于計(jì)算機(jī)算法,旨在通過(guò)數(shù)據(jù)分析和建模實(shí)現(xiàn)對(duì)人類行為的模擬。近年來(lái),不少心理學(xué)研究者已將機(jī)器學(xué)習(xí)應(yīng)用于諸如情緒(Just et al.,2017)和精神病理學(xué)等方面的研究(如Bartlett et al.,2014;Livieris et al.,2018),也有少數(shù)研究者開(kāi)始將該方法用于兒童研究(Bruer et al.,2019;Zanette et al.,2016)。與傳統(tǒng)的統(tǒng)計(jì)建模相比,機(jī)器學(xué)習(xí)具有以下4 個(gè)方面的優(yōu)勢(shì)。

首先,機(jī)器學(xué)習(xí)對(duì)原始數(shù)據(jù)的處理有助于提高最終模型的外部效度。傳統(tǒng)分析方法(如,廣義線性模型GLM、廣義估計(jì)方程GEE,等等)通常將所有數(shù)據(jù)統(tǒng)一納入分析,往往導(dǎo)致模型過(guò)度擬合,所獲模型的概化能力即外部效度較差。與之不同,機(jī)器學(xué)習(xí)(往往需要較大的樣本量)事先將數(shù)據(jù)分為3 個(gè)子集:訓(xùn)練集(train set)、測(cè)試集(test set)和留出集(holdout set)。首先用訓(xùn)練集數(shù)據(jù)來(lái)擬合模型,然后用測(cè)試集數(shù)據(jù)來(lái)檢驗(yàn)?zāi)P汀T賹?duì)這兩個(gè)子集進(jìn)行重組,重新隨機(jī)劃分為新的訓(xùn)練集和新的測(cè)試集,進(jìn)行模型擬合和驗(yàn)證。這個(gè)過(guò)程將重復(fù)多次,并產(chǎn)生多個(gè)可預(yù)測(cè)結(jié)果變量的模型。最后,用事先預(yù)留的留出集數(shù)據(jù)對(duì)這些模型的預(yù)測(cè)力做進(jìn)一步評(píng)估,即驗(yàn)證這些模型的預(yù)測(cè)力能否概化到新的數(shù)據(jù)中。這種驗(yàn)證實(shí)現(xiàn)了對(duì)模型外部效度的評(píng)估(Campbell,1986)。

其次,機(jī)器學(xué)習(xí)囊括了多種算法,可被靈活應(yīng)用于處理各類復(fù)雜多變的變量間關(guān)系。本研究將采用近年來(lái)廣受關(guān)注的集成學(xué)習(xí)法(Ensemble Learning,參見(jiàn)Ykhlef &Bouchaffra,2017)。該方法首先通過(guò)不同機(jī)器學(xué)習(xí)算法對(duì)同一樣本群體進(jìn)行訓(xùn)練。具體算法包括描述變量間線性關(guān)系的邏輯回歸(Logistic Regression,Yarkoni &Westfall,2017),描述變量間非線性關(guān)系的多層感知機(jī)(Multilayer Perceptron,MLP)、極端梯度提升(eXtreme Gradient Boosting,XGBoost)和隨機(jī)森林(Random Forest)等(參見(jiàn)Golino et al.,2014)。隨后,將所有算法的訓(xùn)練結(jié)果整合起來(lái)。集成法的優(yōu)勢(shì)在于能夠集各種算法之長(zhǎng),最大程度上對(duì)預(yù)測(cè)變量和結(jié)果變量的關(guān)系進(jìn)行解釋,從而使最終模型的預(yù)測(cè)效果達(dá)到最佳。

第三,機(jī)器學(xué)習(xí)可通過(guò)Shapley 值,量化不同影響因素在整個(gè)模型中的相對(duì)重要性。Shapley 值于1953 年由諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者Lloyd Shapley 提出(Shapley,1953),主要用于衡量各個(gè)預(yù)測(cè)變量對(duì)結(jié)果變量的相對(duì)貢獻(xiàn)大小,是機(jī)器學(xué)習(xí)結(jié)果的重要參考指標(biāo)之一(Smith &Alvarez,2021)。該值越大,代表該預(yù)測(cè)因素對(duì)結(jié)果變量的預(yù)測(cè)力越強(qiáng);反之,則代表該因素的預(yù)測(cè)力越弱。若該值趨近于零時(shí),則代表該因素對(duì)結(jié)果變量幾乎不存在有效預(yù)測(cè)力。

最后,機(jī)器學(xué)習(xí)能夠?qū)⑺蓄A(yù)測(cè)變量對(duì)結(jié)果變量的預(yù)測(cè)效應(yīng)進(jìn)行量化,從而創(chuàng)建一個(gè)關(guān)于結(jié)果變量(如“小學(xué)生作業(yè)作弊的概率”)的預(yù)測(cè)模型。模型建立后,若將某個(gè)學(xué)生在相應(yīng)預(yù)測(cè)變量上的得分輸入模型,即可輸出該學(xué)生作業(yè)作弊的可能性(即作弊的概率)。依據(jù)這一結(jié)果,能夠初步預(yù)測(cè)學(xué)生有多大的可能性會(huì)在作業(yè)中作弊,以便于教師或家長(zhǎng)進(jìn)行必要的關(guān)注,并結(jié)合學(xué)生的實(shí)際表現(xiàn)采取針對(duì)性的教育和干預(yù)措施。

基于上述機(jī)器學(xué)習(xí)的優(yōu)勢(shì),本研究將重點(diǎn)考察部分因素(即預(yù)測(cè)因素)對(duì)小學(xué)生作業(yè)作弊行為的影響。在影響因素選取方面,由于國(guó)內(nèi)外對(duì)小學(xué)生作業(yè)作弊行為影響因素的研究幾乎為空白,故本研究主要參考了Murdock 和Anderman (2006)的學(xué)業(yè)作弊動(dòng)機(jī)模型,以及以往針對(duì)大中學(xué)生作業(yè)作弊行為的研究成果。

Murdock 和Anderman (2006)的學(xué)業(yè)作弊動(dòng)機(jī)模型是目前為止在作弊(尤其是考試作弊)研究領(lǐng)域影響力最大且應(yīng)用最廣的模型之一。該模型整合了一系列以大中學(xué)生為主要研究對(duì)象的研究成果,從“作弊的代價(jià)”、“作弊的目的”及“作弊前對(duì)自我和結(jié)果的認(rèn)知(我能做到嗎)”三個(gè)方面對(duì)學(xué)業(yè)作弊動(dòng)機(jī)進(jìn)行了劃分。其中,“作弊的代價(jià)”主要包括作弊后被抓的后果、個(gè)體道德水平、同伴作弊的后果、關(guān)于誠(chéng)信的規(guī)章制度等等;“作弊的目的”包括同伴壓力、智力、課堂氛圍等因素;“作弊前對(duì)自我和結(jié)果的認(rèn)知”則主要為自我效能及個(gè)體對(duì)結(jié)果的預(yù)期(Murdock &Anderman,2006)。

依據(jù)上述學(xué)業(yè)作弊動(dòng)機(jī)模型,在綜合考慮了研究成果未來(lái)在小學(xué)中的可實(shí)踐性和可推廣性,同時(shí)參考了以往有關(guān)大中學(xué)生學(xué)業(yè)作弊的實(shí)證研究結(jié)果,本研究對(duì)可能影響小學(xué)生作業(yè)作弊行為的因素(即小學(xué)生作業(yè)作弊的預(yù)測(cè)因素)進(jìn)行了篩選,重點(diǎn)包括以下幾方面。

第一,作弊后果的嚴(yán)重性。一方面,在Murdock和Anderman (2006)的學(xué)業(yè)作弊動(dòng)機(jī)模型中,作弊的后果被看作是學(xué)業(yè)作弊的主要?jiǎng)訖C(jī)之一。隨后更多的實(shí)證研究也表明,作弊的后果嚴(yán)重性對(duì)大中學(xué)生學(xué)業(yè)作弊行為存在影響(Kam et al.,2017;McCabe &Trevi?o,1997;Molnar &Kletke,2012)。另一方面是基于實(shí)踐證據(jù)。眾所周知,“懲罰”一直被我國(guó)教育實(shí)踐工作者視作防止作弊發(fā)生的“最有效/最佳措施”。然而,無(wú)論是古時(shí)將科舉舞弊者量刑入罪,還是如今教育主管部門及各級(jí)各類學(xué)校制定的針對(duì)作弊的處罰制度(如取消考試成績(jī)、取消考試資格、通報(bào)批評(píng)等),均只針對(duì)考試作弊。相較于考試作弊,目前少有學(xué)校對(duì)學(xué)生的作業(yè)作弊行為予以重視和深究。這既是因?yàn)樽鳂I(yè)作弊相對(duì)不容易被發(fā)現(xiàn),又是由于其頻繁性和參與人數(shù)可能更高。正是因?yàn)樽鳂I(yè)作弊往往被看成是一種風(fēng)險(xiǎn)極低且無(wú)不良后果的違規(guī)行為,導(dǎo)致了作業(yè)作弊的普遍性和頻率往往較高。因此,本研究假設(shè),作弊后果嚴(yán)重性程度是影響小學(xué)生作業(yè)作弊行為的首要因素。

第二,作弊的可接受性。Murdock 和Anderman(2006)的學(xué)業(yè)作弊動(dòng)機(jī)模型認(rèn)為,個(gè)體的道德水平是影響學(xué)業(yè)作弊的另一個(gè)重要因素。以往針對(duì)大學(xué)生和中學(xué)生的實(shí)證研究表明,個(gè)體的道德意識(shí)水平影響其對(duì)作弊可接受程度的判斷(Cheung et al.,2016;Lee et al.,2020),以及他人對(duì)作弊接受程度的判斷(Ives &Giukin,2020)。錯(cuò)誤的判斷很可能導(dǎo)致個(gè)體美化或弱化學(xué)業(yè)作弊行為。故本研究假設(shè),個(gè)體自身以及他人對(duì)作弊的可接受性是影響小學(xué)生作業(yè)作弊行為的重要因素。

第三,小學(xué)生對(duì)作業(yè)作弊預(yù)防措施的有效性評(píng)價(jià)。Murdock 和Anderman (2006)的學(xué)業(yè)作弊動(dòng)機(jī)模型指出,學(xué)校與誠(chéng)信相關(guān)的規(guī)章制度對(duì)作弊行為具有一定的影響。這一觀點(diǎn)在之后的實(shí)證研究中也得到了證實(shí)(Ramberg &Modin,2019)。但另一些調(diào)查發(fā)現(xiàn),學(xué)生對(duì)于學(xué)校制定的學(xué)業(yè)誠(chéng)信政策或許并不十分了解(Bretag et al.,2014;Gullifer &Tyson,2014),這可能是導(dǎo)致學(xué)業(yè)作弊屢禁不止的潛在原因之一,即相關(guān)政策并未發(fā)揮應(yīng)有的約束作用。因此,本研究假設(shè),學(xué)生對(duì)作弊預(yù)防措施的評(píng)價(jià),能夠有效預(yù)測(cè)其作業(yè)作弊行為。

第四,同伴作弊行為。以往在大中學(xué)生中開(kāi)展的實(shí)證研究曾表明,觀察到同伴做出作弊行為,可能會(huì)導(dǎo)致個(gè)體對(duì)作弊這一行為進(jìn)行合理化(Jurdi et al.,2011;McCabe et al.,2008),進(jìn)而影響其自身參與作業(yè)作弊行為的概率(Hrabak et al.,2004)。而另一方面,觀察到同伴參與作弊行為,也可能使觀察者產(chǎn)生“不公平感”,進(jìn)而更傾向于作弊。故本研究假設(shè),同伴作弊行為能夠有效預(yù)測(cè)小學(xué)生的作業(yè)作弊行為。

除了上述預(yù)測(cè)變量外,本研究還考察了包括年齡、性別、以及自我報(bào)告的自身學(xué)業(yè)成績(jī)水平等一系列人口統(tǒng)計(jì)學(xué)或個(gè)人背景變量對(duì)小學(xué)生作業(yè)作弊行為的預(yù)測(cè)作用。其中,以往針對(duì)大中學(xué)生的研究發(fā)現(xiàn),成績(jī)較差的學(xué)生更易為了獲得好成績(jī)而參與學(xué)業(yè)作弊行為(Newstead et al.,1996;?zcan et al.,2019),且自我效能感低(即對(duì)自身能力認(rèn)知較差)的學(xué)生作弊的可能性也越高(see Murdock &Anderman,2006);而諸如年齡、性別等人口統(tǒng)計(jì)學(xué)變量(B?achnio,2019;Cizek,1999;Freire,2014;Jurdi et al.,2011)與個(gè)體的學(xué)業(yè)作弊行為也存在相關(guān)。故本研究假設(shè),上述變量對(duì)小學(xué)生作業(yè)作弊行為存在顯著預(yù)測(cè)作用。

綜上,本研究將采用問(wèn)卷調(diào)查法,結(jié)合機(jī)器學(xué)習(xí)技術(shù),考察(1)作業(yè)作弊對(duì)個(gè)體可能造成的后果及其嚴(yán)重性的感知,(2)個(gè)體自身及感知到同伴對(duì)作業(yè)作弊的接受程度,(3)對(duì)各種預(yù)防作業(yè)作弊措施的有效性評(píng)價(jià),(4)感知到同伴的作業(yè)作弊行為,以及(5)年齡、性別等人口統(tǒng)計(jì)學(xué)變量對(duì)小學(xué)生作業(yè)作弊行為的影響;在此基礎(chǔ)上,構(gòu)建機(jī)器學(xué)習(xí)模型,采用集成法分析比較上述因素對(duì)作業(yè)作弊行為的預(yù)測(cè)效應(yīng)。

2 方法

2.1 被試

本研究事先經(jīng)過(guò)了杭州師范大學(xué)學(xué)術(shù)倫理委員會(huì)的倫理審查,并征得了學(xué)生所在學(xué)校及學(xué)生家長(zhǎng)的知情同意。在浙江省某地級(jí)市選取了3 所不同類型的小學(xué):普通公辦小學(xué)(以下簡(jiǎn)稱“公辦小學(xué)”)、含外來(lái)務(wù)工人員較多的公辦小學(xué)(以下簡(jiǎn)稱“民工子弟小學(xué)”)及民辦小學(xué)各1 所,選擇2 至6 年級(jí),從每個(gè)年級(jí)中隨機(jī)抽取若干班級(jí),進(jìn)行問(wèn)卷調(diào)查(考慮到1年級(jí)小學(xué)生的識(shí)字水平和閱讀理解能力均十分有限,且其家庭作業(yè)很少,故本次調(diào)查未將其納入;張芮,2019)。共計(jì)2300 名小學(xué)生參與了本次問(wèn)卷調(diào)查。其中,157 份問(wèn)卷完成率不足70%,45 份問(wèn)卷結(jié)果變量相關(guān)題目未作答,予以剔除。最終得到有效問(wèn)卷2098 份。有效樣本的平均年齡為10.04±1.40 歲(男生占53%),全體學(xué)生均為漢族,年級(jí)、性別及學(xué)校等分布情況見(jiàn)表1。

表1 2098 名有效被試的部分人口統(tǒng)計(jì)學(xué)信息情況

2.2 研究工具

2.2.1 問(wèn)卷編制與施測(cè)

考慮到國(guó)內(nèi)外尚未有專門針對(duì)小學(xué)生作業(yè)作弊行為的問(wèn)卷,故本研究采用自編的問(wèn)卷進(jìn)行測(cè)量,問(wèn)卷在以往針對(duì)大中學(xué)生學(xué)業(yè)作弊的相關(guān)研究的基礎(chǔ)上編制而成。問(wèn)卷編制過(guò)程分為3 個(gè)階段。

第一階段是訪談。基于Lim 和See (2001)對(duì)大學(xué)生學(xué)業(yè)作弊的現(xiàn)狀、態(tài)度、后果嚴(yán)重性等的問(wèn)卷調(diào)查結(jié)果,編制訪談提綱。訪談主要針對(duì)學(xué)生和教師兩類群體開(kāi)展。在學(xué)生層面,訪談內(nèi)容主要涉及當(dāng)前小學(xué)生作弊(尤其是作業(yè)作弊)行為的現(xiàn)狀、表現(xiàn)形式及其對(duì)作弊的認(rèn)知和態(tài)度等;在教師層面,除上述內(nèi)容外,訪談還涉及學(xué)校、家庭在應(yīng)對(duì)學(xué)生作弊問(wèn)題方面的一些方法和措施,及其所取得的成效。來(lái)自上述3 所小學(xué)中的39 名學(xué)生(這些受訪學(xué)生不再參與后續(xù)的正式問(wèn)卷調(diào)查)和9 名教師參與訪談。訪談全程錄音,并由兩位不知研究目的的心理學(xué)碩士生進(jìn)行轉(zhuǎn)錄和編碼。訪談結(jié)果表明:作業(yè)作弊在2 年級(jí)小學(xué)生中就已存在,主要表現(xiàn)為抄標(biāo)準(zhǔn)答案和抄同學(xué)作業(yè)等;小學(xué)生普遍認(rèn)為的作弊的嚴(yán)重后果主要涉及被老師或家長(zhǎng)批評(píng),被同學(xué)嘲笑等;其認(rèn)為能夠減少作弊的有效措施主要有努力學(xué)習(xí)掌握知識(shí)點(diǎn)、加大懲罰力度和告知家長(zhǎng)等。

第二階段為小范圍試測(cè)。在訪談的基礎(chǔ)上,進(jìn)一步參考Bucciol 等人(2017)有關(guān)大學(xué)生學(xué)業(yè)作弊的研究問(wèn)卷,編制本研究的初測(cè)問(wèn)卷。在上述3 所學(xué)校,隨機(jī)選取來(lái)自2 年級(jí)、4 年級(jí)和5 年級(jí)的共158名學(xué)生(初測(cè)被試同樣不參與后續(xù)的正式問(wèn)卷調(diào)查)進(jìn)行小范圍試測(cè)。根據(jù)問(wèn)卷作答情況,結(jié)合試測(cè)過(guò)程中學(xué)生的現(xiàn)場(chǎng)反饋,對(duì)初測(cè)問(wèn)卷進(jìn)行修訂,并對(duì)部分表述不清,難以理解,或有疑問(wèn)的條目及選項(xiàng)進(jìn)行了修訂和完善。邀請(qǐng)兩位心理測(cè)量學(xué)方面的專家對(duì)修改后的問(wèn)卷進(jìn)行了審定,最終形成本研究的正式問(wèn)卷。

第三階段為正式調(diào)查。在上述3 所學(xué)校,從2至6 年級(jí)的各個(gè)班級(jí)中按一定比例抽取學(xué)生進(jìn)行問(wèn)卷調(diào)查(為保證被試代表性,抽樣時(shí)確保參與調(diào)查學(xué)生的學(xué)業(yè)成績(jī)分布較為廣泛)。問(wèn)卷調(diào)查采用一對(duì)多的方式,在各個(gè)班級(jí)內(nèi)獨(dú)立進(jìn)行。問(wèn)卷現(xiàn)場(chǎng)發(fā)放,當(dāng)場(chǎng)收回。為最大程度地消除學(xué)生的顧慮,問(wèn)卷采用匿名的形式,且問(wèn)卷發(fā)放、填寫和回收的整個(gè)過(guò)程均由研究助理出面組織,班主任或任課教師均未在現(xiàn)場(chǎng),也未參與整個(gè)問(wèn)卷調(diào)查過(guò)程。

2.3 正式問(wèn)卷構(gòu)成

正式問(wèn)卷主要對(duì)兩部分內(nèi)容進(jìn)行測(cè)量。一是研究的關(guān)鍵結(jié)果變量——作業(yè)作弊行為,二是預(yù)測(cè)變量,即作業(yè)作弊行為影響因素,包括個(gè)體心理變量和人口統(tǒng)計(jì)學(xué)變量?jī)蓚€(gè)方面。

2.3.1 結(jié)果變量——作業(yè)作弊行為(簡(jiǎn)稱“作弊行為”)

請(qǐng)作答者就自身“在平時(shí)學(xué)習(xí)中做過(guò)類似抄別人的作業(yè)/抄答案/讓別人幫忙寫作業(yè)等的行為嗎?”,從“1”(從不)到“5”(非常多)進(jìn)行5 點(diǎn)利克特量表評(píng)分。

筆者在后續(xù)的數(shù)據(jù)分析中發(fā)現(xiàn),全體樣本對(duì)該問(wèn)題的評(píng)分呈明顯的正偏態(tài)(即評(píng)分為“1”的學(xué)生比例很高,評(píng)分為“2”~“5”的學(xué)生比例相當(dāng)且均較低),無(wú)法按照近似正態(tài)分布處理。為避免統(tǒng)計(jì)偏差,遂將結(jié)果變量重新編碼為二分變量,其中將評(píng)分為“1”者編碼為“無(wú)作弊行為者”,以0 計(jì);將評(píng)分為“2”~“5”者編碼為“有過(guò)作弊行為者”,以1 計(jì)。

2.3.2 預(yù)測(cè)變量(影響因素)的測(cè)量

(1)對(duì)作業(yè)作弊行為可能導(dǎo)致后果的嚴(yán)重性評(píng)價(jià)(簡(jiǎn)稱“后果嚴(yán)重性”)

根據(jù)訪談結(jié)果,列舉了 5 種作業(yè)作弊行為(Cronbach's α 系數(shù)為0.787)可能導(dǎo)致的后果(如“老師批評(píng)”等),請(qǐng)作答者就每一后果的嚴(yán)重性程度,從“1”(一點(diǎn)也不嚴(yán)重)到“5”(非常嚴(yán)重)進(jìn)行5 點(diǎn)利克特量表評(píng)分。

(2)對(duì)作業(yè)作弊行為的可接受性(簡(jiǎn)稱“可接受性”)

包括兩個(gè)條目:a.小學(xué)生自身對(duì)作業(yè)作弊行為的可接受程度(簡(jiǎn)稱“自我可接受性”);b.感知到同伴對(duì)作業(yè)作弊行為的可接受程度(簡(jiǎn)稱“同伴可接受性”)。請(qǐng)作答者從“1”(完全不能接受)到“5”(完全能接受)進(jìn)行5 點(diǎn)利克特量表評(píng)分。

(3)對(duì)能夠減少作業(yè)作弊行為策略的有效性評(píng)價(jià)(簡(jiǎn)稱“策略有效性”)

根據(jù)訪談結(jié)果,列舉了旨在減少作業(yè)作弊行為的9 種(Cronbach's α 系數(shù)為0.781,具有較高的內(nèi)部一致性)比較常用的策略(如“老師批作業(yè)更加仔細(xì),從而找出那些作弊的同學(xué)”等),請(qǐng)作答者就每一策略的有效性,從“1”(一點(diǎn)兒也沒(méi)有用)到“5”(非常有用)進(jìn)行5 點(diǎn)利克特量表評(píng)分。

(4)觀察到的同伴的作業(yè)作弊行為(簡(jiǎn)稱“同伴作弊行為”)

采用3 個(gè)條目進(jìn)行測(cè)量:a.同伴作業(yè)作弊行為的普遍性(簡(jiǎn)稱“同伴作弊-普遍性”),請(qǐng)作答者就作業(yè)作弊行為在周圍同學(xué)中的普遍性進(jìn)行“1”(從未見(jiàn)有人這樣做過(guò))到“5”(幾乎所有人都會(huì)做)的5 點(diǎn)利克特量表評(píng)分。

b.同伴作業(yè)作弊行為的總體頻率(簡(jiǎn)稱“同伴作弊-總體頻率”),請(qǐng)作答者就周圍同學(xué)做出作業(yè)作弊行為的頻率進(jìn)行“1”(從未)到“5”(經(jīng)常)的5 點(diǎn)利克特量表評(píng)分。

c.同伴所采取的不同形式的作業(yè)作弊行為的頻率(簡(jiǎn)稱“同伴作弊-具體頻率”),列舉了訪談中提及率較高的3 種作業(yè)作弊的具體形式(即做作業(yè)時(shí)抄答案、抄他人作業(yè)、讓他人幫忙寫作業(yè)),請(qǐng)作答者就周圍同學(xué)做出每一種具體作弊行為的頻率,進(jìn)行“1”(從未)到“5”(經(jīng)常)的5 點(diǎn)利克特量表評(píng)分。

(5)人口學(xué)信息

具體包括:學(xué)校類型(公辦小學(xué)、民工子弟小學(xué)及民辦小學(xué))、年齡、性別、年級(jí)(2 至6 年級(jí))、是否為獨(dú)生子女以及有關(guān)學(xué)習(xí)成績(jī)的自我評(píng)價(jià)(自身成績(jī)高于、等于或低于班級(jí)平均水平)。

2.4 機(jī)器學(xué)習(xí)模型建構(gòu)

采用SPSS 24.0 軟件分析數(shù)據(jù)。首先進(jìn)行描述性統(tǒng)計(jì)分析,在此基礎(chǔ)上運(yùn)用機(jī)器學(xué)習(xí)進(jìn)行統(tǒng)計(jì)建模分析。考慮到機(jī)器學(xué)習(xí)算法的多樣性,以及預(yù)測(cè)變量和結(jié)果變量間關(guān)系的未知性,本研究采用集成學(xué)習(xí)法,首先通過(guò)4 種不同算法對(duì)小學(xué)生作業(yè)作弊行為的預(yù)測(cè)模型進(jìn)行擬合,然后基于Stacking 法將4 種不同算法的訓(xùn)練結(jié)果進(jìn)行整合。這4 種算法具體為:邏輯回歸、多層感知機(jī)(MLP)、極端梯度提升(XGBoost)和隨機(jī)森林。

2.4.1 四種機(jī)器學(xué)習(xí)算法及步驟

邏輯回歸是一種廣義線性回歸,是用邏輯函數(shù)解決對(duì)分類變量(以二分變量居多)進(jìn)行預(yù)測(cè)的問(wèn)題。多層感知機(jī)(MLP)是一種前饋人工神經(jīng)網(wǎng)絡(luò)模型,它由輸入層、輸出層和一個(gè)以上的隱藏層組成,每一層均有若干神經(jīng)元,通過(guò)逐步調(diào)整神經(jīng)元間不同連接的權(quán)重來(lái)擬合模型。極端梯度提升(XGBoost)是集成學(xué)習(xí)方法中常用的策略,通過(guò)不斷訓(xùn)練及優(yōu)化決策樹(shù),并將每次訓(xùn)練所得的輸出值相加,以獲得最終預(yù)測(cè)值。隨機(jī)森林算法與XGBoost 具有一定的相似性,但兩者最大的區(qū)別在于隨機(jī)森林的輸出值僅僅是簡(jiǎn)單多數(shù)投票的結(jié)果,對(duì)不同決策樹(shù)的訓(xùn)練結(jié)果也沒(méi)有做進(jìn)一步的優(yōu)化提升。

本研究在MLP 中構(gòu)建的網(wǎng)絡(luò)由隱藏層和雙曲正切激活函數(shù)組成。在訓(xùn)練開(kāi)始前首先將協(xié)變量進(jìn)行標(biāo)準(zhǔn)化處理,訓(xùn)練過(guò)程中則采用共軛梯度下降法(Conjugate Gradient Descent,λ=0.0000005,σ=0.00005,區(qū)間中心0,區(qū)間偏移±0.5)來(lái)調(diào)整神經(jīng)元間連接的權(quán)重,以達(dá)到將連續(xù)訓(xùn)練過(guò)程中的預(yù)測(cè)誤差(針對(duì)劃分至訓(xùn)練集的樣本)最小化的目的。該算法還將在每次訓(xùn)練結(jié)束時(shí)計(jì)算測(cè)試集中的預(yù)測(cè)誤差,以確保每次訓(xùn)練后預(yù)測(cè)誤差的減少不是由于對(duì)訓(xùn)練集數(shù)據(jù)的過(guò)度擬合所致。XGBoost 是將訓(xùn)練過(guò)程中的所有模型參數(shù)設(shè)置為默認(rèn),并采用基于樹(shù)模型(gbtree)的方法進(jìn)行決策樹(shù)遞增。其中,決策樹(shù)的遞增數(shù)量為 100 棵,η(提升學(xué)習(xí)速率,boosting learning rate)默認(rèn)值為0.3,以其作為特征縮減技術(shù)(shrinkage)的設(shè)定值,同樣用于防止訓(xùn)練集數(shù)據(jù)的過(guò)度擬合。此外,用于訓(xùn)練集和測(cè)試集的協(xié)變量都需預(yù)先進(jìn)行標(biāo)準(zhǔn)化處理。隨機(jī)森林算法在訓(xùn)練中構(gòu)建決策樹(shù)時(shí)采用的是自展法(bootstrap)抽樣,決策樹(shù)的數(shù)量同樣默認(rèn)為100 棵,且尋找最佳分割屬性時(shí),把需要考慮的特征數(shù)量設(shè)置為樣本特征的平方根。上述兩個(gè)參數(shù)可用于提高預(yù)測(cè)準(zhǔn)確性并防止模型過(guò)度擬合。此外,用于訓(xùn)練集和測(cè)試集的協(xié)變量也預(yù)先得到了標(biāo)準(zhǔn)化處理。

上述4 種機(jī)器學(xué)習(xí)算法均包含以下5 個(gè)步驟。第一,將所有數(shù)據(jù)隨機(jī)拆分成3 個(gè)獨(dú)立的數(shù)據(jù)集:訓(xùn)練集、測(cè)試集和留出集(訓(xùn)練集占總被試量的64%,測(cè)驗(yàn)集占16%,留出集占20%)。第二,在訓(xùn)練集中對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練時(shí)共有32 個(gè)特征輸入。其中22 個(gè)特征來(lái)自9 道問(wèn)卷問(wèn)題(為表2 的8 個(gè)問(wèn)題及其選項(xiàng),以及學(xué)生對(duì)學(xué)習(xí)成績(jī)的自我評(píng)價(jià));剩余10個(gè)特征是通過(guò)對(duì)學(xué)校、年級(jí)、性別及是否為獨(dú)生子女等二分變量轉(zhuǎn)換為虛擬變量(啞變量,其中學(xué)校的參照水平為普通公辦學(xué)校,年級(jí)的參照為二年級(jí),性別的參照為女,是否為獨(dú)生子女參照獨(dú)生子女)而得到。最終輸入32 個(gè)特征,通過(guò)訓(xùn)練獲得第一個(gè)模型。第三,將該模型在測(cè)試集中進(jìn)行測(cè)試,以獲得其性能指標(biāo)。第四,將訓(xùn)練集和測(cè)試集結(jié)合起來(lái),重新將這些數(shù)據(jù)隨機(jī)劃分為新的訓(xùn)練集和測(cè)試集,重復(fù)第二和第三步,再次訓(xùn)練得到第二個(gè)模型。通過(guò)重復(fù)100 次第二至第四步的建模過(guò)程(“劃分-訓(xùn)練-測(cè)驗(yàn)-重組-劃分”),最終可獲得100 個(gè)模擬模型,從而確保無(wú)論樣本被劃分到訓(xùn)練集還是測(cè)試集,所得結(jié)果均能保持一定程度的穩(wěn)定性。第五,使用最初分配到留出集的數(shù)據(jù)(此前未參與過(guò)任何一次訓(xùn)練或測(cè)試)對(duì)模型進(jìn)行最終驗(yàn)證,即進(jìn)行外部效度的檢驗(yàn)。

表2 作弊行為預(yù)測(cè)變量的描述統(tǒng)計(jì)結(jié)果

2.4.2 機(jī)器學(xué)習(xí)結(jié)果的集成

在采用上述4 種機(jī)器學(xué)習(xí)算法進(jìn)行分析的基礎(chǔ)上,本研究使用stacking 法對(duì)4 種算法進(jìn)行整合(即集成)。具體說(shuō)來(lái),首先設(shè)置邏輯回歸、MLP、XGBoost 和隨機(jī)森林4 種算法對(duì)原始數(shù)據(jù)進(jìn)行訓(xùn)練,然后將4 種算法的訓(xùn)練結(jié)果進(jìn)行整合(stacking 法設(shè)置為五折交叉驗(yàn)證法),最后再對(duì)整合后的訓(xùn)練結(jié)果進(jìn)行測(cè)試集驗(yàn)證和留出集驗(yàn)證(驗(yàn)證算法設(shè)置為邏輯回歸),從而實(shí)現(xiàn)對(duì)4 種算法的取長(zhǎng)補(bǔ)短,獲得最終且最佳模型。

2.4.3 機(jī)器學(xué)習(xí)模型的關(guān)鍵指標(biāo)

無(wú)論是針對(duì)每一種機(jī)器學(xué)習(xí)算法,還是對(duì)不同算法結(jié)果的集成,采用留出集對(duì)最終模型進(jìn)行驗(yàn)證均可得到模型的兩個(gè)關(guān)鍵指標(biāo)。其一為計(jì)算機(jī)模型的受試者工作特征曲線(Receiver Operating Characteristic,ROC)下方面積(Area under the Curve,AUC)。ROC 和AUC 是常用于衡量機(jī)器學(xué)習(xí)性能的指標(biāo),表現(xiàn)了分類模型的特征。其中,ROC 是通過(guò)真陽(yáng)率(True Positive Rate,正確預(yù)測(cè)出的陽(yáng)性的數(shù)量/所有陽(yáng)性的數(shù)量)和假陽(yáng)率(False Positive Rate,將陰性誤判為陽(yáng)性的數(shù)量/所有陰性的數(shù)量)繪制而來(lái)的曲線(見(jiàn)圖1),AUC 值為ROC 曲線下方的面積,AUC 越大表明分類器的效果越好,它可以用于評(píng)估模型的敏感性(即真陽(yáng)率,本研究中表現(xiàn)為能夠準(zhǔn)確預(yù)測(cè)“存在作業(yè)作弊行為”這一情況的比例)和特異性(1-假陽(yáng)率,本研究中表現(xiàn)為能夠準(zhǔn)確預(yù)測(cè)“不存在作業(yè)作弊行為”這一情況的比例)。敏感性和特異性之間存在著一種函數(shù)關(guān)系,在不同敏感性條件下,特異性會(huì)朝相反的方向變化,而在ROC 曲線的對(duì)角線位置將達(dá)到兩者的最優(yōu)組合。在實(shí)際應(yīng)用過(guò)程中,因具體應(yīng)用情境不同,在ROC 曲線上以多少的敏感性和特異性作為標(biāo)準(zhǔn),需要根據(jù)實(shí)際情況來(lái)決定。

圖1 計(jì)算機(jī)模型的受試者工作特征曲線(ROC)描繪了模型敏感性(真陽(yáng)率)隨著特異性(假陽(yáng)率)變化的規(guī)律。曲線下的面積(AUC)表示模型的整體性能,曲線距離恒等式線(虛線對(duì)角線)越遠(yuǎn),代表模型的分類能力越好,反之則越差。

其二為各個(gè)預(yù)測(cè)變量的Shapley 值。Shapley 值常用于處理復(fù)雜分配問(wèn)題(Shapley,1953)。如A、B、C 三人共同完成一項(xiàng)工作,在為A 分配獎(jiǎng)金時(shí),若要尋求相對(duì)公平,則需通過(guò)Shapley 值法獲得A 在其中的邊際貢獻(xiàn)。該方法首先需要計(jì)算:僅有A 參與時(shí)能夠完成的工作量;B 和C 與A 合作時(shí)所能完成的工作量減去B/C 單人能夠完成的工作量;B 和C與A 合作時(shí)完成的工作量減去僅B 和C 合作時(shí)完成的工作量。然后計(jì)算這些數(shù)值的均值,即為A 最終的邊際貢獻(xiàn)。Shapley 值法全面考慮了在所有合作或單人關(guān)系中,A 所能帶來(lái)的增益,對(duì)A 的邊際貢獻(xiàn)性進(jìn)行了公平且科學(xué)的計(jì)算。正因?yàn)榇?越來(lái)越多的研究者開(kāi)始借助Shapley 值法,對(duì)預(yù)測(cè)變量在預(yù)測(cè)模型中的相對(duì)貢獻(xiàn)性展開(kāi)科學(xué)評(píng)估(Ghorbani &Zou,2019;Lundberg &Lee,2017)。

本研究的機(jī)器學(xué)習(xí)中,對(duì)各預(yù)測(cè)變量(影響因素)Shapley 值的計(jì)算完全遵循上述計(jì)算規(guī)則。其中,“A、B、C”即為不同的預(yù)測(cè)變量,而“工作量”為變量在模型中的貢獻(xiàn)性大小,即預(yù)測(cè)準(zhǔn)確性。預(yù)測(cè)變量的Shapley 值代表其對(duì)總體模型預(yù)測(cè)準(zhǔn)確性的實(shí)際邊際貢獻(xiàn)。通過(guò)計(jì)算每一個(gè)預(yù)測(cè)變量的Shapley 值,Shapley 值的大小代表這些預(yù)測(cè)變量在模型中的相對(duì)重要性大小。

3 結(jié)果與分析

3.1 描述性統(tǒng)計(jì)

3.1.1 作弊行為

圖2 顯示了2 至6 年級(jí)小學(xué)生自我報(bào)告參與過(guò)作弊的人數(shù)百分比。由圖可見(jiàn),作弊行為的發(fā)生率在3 年級(jí)時(shí)有了明顯的增長(zhǎng),而在4 年級(jí)開(kāi)始相對(duì)趨于穩(wěn)定。以年級(jí)為預(yù)測(cè)變量(其中設(shè)2 年級(jí)為參考組),作弊行為為結(jié)果變量,進(jìn)行二元邏輯回歸分析。結(jié)果表明,不同年級(jí)小學(xué)生的作弊率存在顯著差異(p< 0.001),其中2 年級(jí)的作弊率顯著低于其他各年級(jí)(2 年級(jí)vs 3 年級(jí):p=0.002,B=0.51,OR=1.67,95% CI=1.21~2.29;2 年級(jí)vs 4/5/6 年級(jí):ps<0.001,B=0.70,0.57,0.87;OR=2.01,1.77,2.39,95%CI=1.46~2.75,1.30~2.40,1.77~3.22),但3、4、5、6四個(gè)年級(jí)間的作弊率兩兩差異不顯著(ps > 0.05)。

圖2 2~6 年級(jí)自我報(bào)告存在作弊行為的人數(shù)百分比

3.1.2 作弊行為的影響因素

表2 顯示了全體受試者在每個(gè)預(yù)測(cè)變量上的得分均值和標(biāo)準(zhǔn)差。由表可見(jiàn),小學(xué)生普遍認(rèn)為“受老師懲罰”(M=3.65)是作弊的最嚴(yán)重后果,且作弊是不能被接受的(M=1.81,與3 代表“中立”相比,p<0.001)。與此同時(shí),他們也傾向于認(rèn)為周圍同伴對(duì)作弊的接受程度較低(M=2.13,與3 相比,p< 0.001)。此外,小學(xué)生普遍認(rèn)為“加強(qiáng)課堂練習(xí),在課堂上把知識(shí)弄懂”(M=3.28)是減少作弊的最有效策略,“抄他人的作業(yè)”(M=2.01)是同伴作弊最常采用的形式。

3.2 機(jī)器學(xué)習(xí)分析

為了更加準(zhǔn)確地計(jì)算不同變量對(duì)小學(xué)生作業(yè)作弊行為的預(yù)測(cè)效果,研究?jī)H將預(yù)測(cè)變量相關(guān)問(wèn)題作答率達(dá)到100%的被試數(shù)據(jù)納入機(jī)器學(xué)習(xí),故最終進(jìn)入機(jī)器學(xué)習(xí)分析的被試量為1637。如方法部分所述,本研究在使用4 種機(jī)器學(xué)習(xí)算法進(jìn)行分析的基礎(chǔ)上,重點(diǎn)對(duì)4 種算法所獲結(jié)果進(jìn)行集成。

3.2.1 四種機(jī)器學(xué)習(xí)算法及集成學(xué)習(xí)法所獲模型的AUC 均值分析

表3 顯示了4 種機(jī)器學(xué)習(xí)算法所各自模擬出的100 個(gè)模型的AUC 的均值,以及集成學(xué)習(xí)所模擬出的100 個(gè)最終模型的AUC 的均值。由表可見(jiàn),這些AUC 均值均顯著高于隨機(jī)水平(50%,ps< 0.001)。其中,集成學(xué)習(xí)法的最終預(yù)測(cè)模型的AUC 均值達(dá)到了80.46%,意味著該模型有80.46%的概率能夠準(zhǔn)確預(yù)測(cè)小學(xué)生是否會(huì)做出作業(yè)作弊行為。

表3 四種機(jī)器學(xué)習(xí)算法及集成學(xué)習(xí)法下留出集驗(yàn)證所產(chǎn)生的100 個(gè)模型的AUC (%)均值和標(biāo)準(zhǔn)差

圖3 顯示了4 種不同算法以及集成學(xué)習(xí)分別所得的100 個(gè)模型的具體AUC 值。如圖所示,集成學(xué)習(xí)算法下的模型總體具有較高的敏感性和特異性(1-假陽(yáng)性率)。由于集成學(xué)習(xí)法綜合了4 種算法的優(yōu)點(diǎn),故后續(xù)的分析將重點(diǎn)關(guān)注集成學(xué)習(xí)法所獲結(jié)果。將表3 中集成學(xué)習(xí)法的AUC 均值轉(zhuǎn)換為Cohen’sd值,所得的 Cohen’sd均值為 1.214 (95% CI:1.205~1.222),表明該方法所獲的100 個(gè)最終模型的平均效應(yīng)量很大(Cohen,1988;Cohen’sd> 1.2 時(shí)表示效應(yīng)量非常大)。

圖3 四種不同算法及集成學(xué)習(xí)分別獲得的100 個(gè)模型的AUC 值

3.2.2 集成學(xué)習(xí)法所獲最終模型中各變量的Shapley值分析

在集成學(xué)習(xí)中,采用留出集對(duì)最終模型進(jìn)行檢驗(yàn),得到所有預(yù)測(cè)變量的Shapley 均值,這些值均顯著高于0 (ps < 0.05),即所有預(yù)測(cè)變量皆對(duì)該模型具有顯著的邊際貢獻(xiàn)。將這些預(yù)測(cè)變量按照Shapley 值的大小進(jìn)行排列,可直觀顯示這些預(yù)測(cè)變量在模型中的相對(duì)重要性排序。圖4 列舉了對(duì)模型預(yù)測(cè)準(zhǔn)確性的邊際貢獻(xiàn)大于或等于1%的主要預(yù)測(cè)變量。這些變量間的相對(duì)重要性依然存在較大的差異。根據(jù)重要性由高到低可大致將這些預(yù)測(cè)變量分為以下4 個(gè)組。

第一組為小學(xué)生自身對(duì)作弊的接受性(接受性越高,就越有可能作弊)。該預(yù)測(cè)變量的Shapley 值高達(dá) 10.49%,代表其對(duì)總體模型預(yù)測(cè)準(zhǔn)確性的實(shí)際邊際貢獻(xiàn)為10.49%。配對(duì)樣本t檢驗(yàn)結(jié)果顯示,該變量的Shapley 值顯著高于3.83% (排序第二的預(yù)測(cè)變量對(duì)應(yīng)Shapley 值,t=23.88,df=327,p<0.001),表明其在模型中的預(yù)測(cè)力最佳且遠(yuǎn)高于其他變量。

第二組變量的Shapley 值均在2%~4%內(nèi)。首先是同伴作弊的普遍性,該預(yù)測(cè)變量的Shapley 值為3.83%,對(duì)模型預(yù)測(cè)準(zhǔn)確性的貢獻(xiàn)性顯著高于剩余所有變量(vs 3.26%,t=1.98,df=327,p=0.048)。其次是小學(xué)生自身成績(jī)?cè)谌嗤瑢W(xué)中所處的相對(duì)水平(反向計(jì)分)、同伴作弊的頻率,以及同伴做出“抄他人作業(yè)”這一特定作弊行為的頻率。這3 個(gè)變量的Shapley 值間不存在顯著的差異(具體數(shù)值參見(jiàn)圖4,t=0.57,1.78,1.23,dfs=327,p=0.57,0.22,0.08),且后兩者間有顯著的相關(guān)關(guān)系(r=0.21,p< 0.001),即三者對(duì)小學(xué)生作業(yè)作弊行為的預(yù)測(cè)力相當(dāng)。具體說(shuō)來(lái),上述變量均對(duì)作弊行為存在顯著的正向預(yù)測(cè)作用,即自我評(píng)價(jià)的成績(jī)?cè)讲钜苍接锌赡茏鞅?同伴作弊行為發(fā)生得越普遍或越頻繁,個(gè)體自身越有可能作弊。

第三組變量的Shapley 值均在1%~2%內(nèi),在模型中的邊際貢獻(xiàn)較小,該組變量中最大的Shapley值(1.75%)顯著低于2.9% (t=-6.99,df=327,p<0.001)。包括:小學(xué)生所處年級(jí)(6 和4 年級(jí)學(xué)生的作弊率高于2 年級(jí)學(xué)生),感知到的同伴對(duì)作弊行為的接受程度,同伴做出“做作業(yè)時(shí)抄答案”這一作弊行為的頻率(感知到的可接受性/頻率越高,作弊的可能性越大),小學(xué)生對(duì)“受父母懲罰”、“受父母批評(píng)”和“受老師懲罰”這3 種作弊可能帶來(lái)的后果的嚴(yán)重性評(píng)價(jià)(越是認(rèn)為這些后果嚴(yán)重,越不可能作弊;r=0.44,0.34,0.36,ps < 0.001),以及學(xué)校類型(民工子弟學(xué)校的作弊率低于普通公辦學(xué)校)。

除了上述預(yù)測(cè)變量,剩余的變量雖對(duì)模型預(yù)測(cè)準(zhǔn)確性具有顯著的貢獻(xiàn)(ps < 0.05),但重要性非常弱(Shapley 值 < 0.01)。這些預(yù)測(cè)力非常弱的變量主要包括:小學(xué)生對(duì)所有9 項(xiàng)減少作弊的策略的有效性評(píng)價(jià),對(duì)部分作弊可能帶來(lái)后果的嚴(yán)重性評(píng)價(jià)(“受老師批評(píng)”和“受周圍同學(xué)的批評(píng)或嘲笑”),以及人口學(xué)信息(見(jiàn)表4)。

表4 次要預(yù)測(cè)變量在預(yù)測(cè)作業(yè)作弊行為時(shí)的Shapley 值(%)的均值和標(biāo)準(zhǔn)差及其95%置信區(qū)間

4 討論

本研究采用問(wèn)卷調(diào)查及機(jī)器學(xué)習(xí)這一人工智能的核心方法,首次系統(tǒng)考察了小學(xué)生的作業(yè)作弊行為,及其與個(gè)體認(rèn)知和情境變量(對(duì)作弊后果的嚴(yán)重性的感知、自身對(duì)作弊的接受性和感知到的同伴對(duì)作弊的接受性、對(duì)作弊干預(yù)策略的有效性評(píng)價(jià)等)、同伴作弊的普遍性和頻率,以及性別、年級(jí)及學(xué)校類型等人口學(xué)變量之間的關(guān)系,得到以下結(jié)果。

第一,總體而言,約33%的小學(xué)生自我報(bào)告曾經(jīng)有過(guò)作業(yè)作弊行為,且這一作弊發(fā)生率隨年級(jí)的增長(zhǎng)呈現(xiàn)出一定的變化趨勢(shì)。具體表現(xiàn)為:2 年級(jí)為小學(xué)生作業(yè)作弊的萌發(fā)階段;3 年級(jí)為激增階段,隨后進(jìn)入平緩期;到6 年級(jí)時(shí),小學(xué)生作業(yè)作弊率已達(dá)40.5%。這表明,作業(yè)作弊在2 年級(jí)小學(xué)生中就已經(jīng)出現(xiàn),到6 年級(jí)已相對(duì)普遍。導(dǎo)致3 年級(jí)作業(yè)作弊率迅速增長(zhǎng)的原因可能在于3 年級(jí)的作業(yè)量及作業(yè)頻率的增加。而4 年級(jí)及以后表現(xiàn)出的作弊率趨于平緩,這表明了道德發(fā)展水平在小學(xué)階段并非影響其作弊行為的關(guān)鍵因素(該假設(shè)在小學(xué)生說(shuō)謊行為的研究中得到了證實(shí),見(jiàn) Lee,2013)。由此可見(jiàn),作弊作為一種習(xí)慣性行為,一旦形成,若不及時(shí)采取有效的干預(yù)手段,將可能持續(xù)存在甚至呈增長(zhǎng)趨勢(shì),這從側(cè)面也反映出早期誠(chéng)信教育和對(duì)作弊進(jìn)行早期干預(yù)的重要性。

第二,本研究所考察的各個(gè)預(yù)測(cè)變量均對(duì)小學(xué)生作業(yè)作弊行為具有顯著的預(yù)測(cè)效果。機(jī)器學(xué)習(xí)結(jié)果表明,通過(guò)集成學(xué)習(xí)法對(duì)不同算法所獲模型進(jìn)行整合,最終模型在預(yù)測(cè)作業(yè)作弊行為時(shí)具有較高的敏感性和特異性(AUC 均值高達(dá)80.46%)。這一結(jié)果意味著:該模型有80.46%的可能性能夠基于這些預(yù)測(cè)變量對(duì)小學(xué)生是否作弊作出正確預(yù)測(cè)。轉(zhuǎn)化AUC值所得的Cohen’sd也顯示,模型在通過(guò)這些預(yù)測(cè)變量對(duì)小學(xué)生作業(yè)作弊行為進(jìn)行預(yù)測(cè)時(shí),所得結(jié)果的效應(yīng)量很大(Cohen’sd> 1.2)。

第三,機(jī)器學(xué)習(xí)模型各變量的Shapley 值分析結(jié)果進(jìn)一步表明,所有預(yù)測(cè)變量均對(duì)最終模型的較高預(yù)測(cè)準(zhǔn)確率和良好擬合作出了顯著貢獻(xiàn)。然而,這些預(yù)測(cè)變量的重要性存在比較明顯的差異。具體說(shuō)來(lái):

首先,小學(xué)生自身對(duì)作業(yè)作弊行為的接受程度是其是否作弊的最關(guān)鍵的預(yù)測(cè)變量。他們?cè)绞钦J(rèn)為作業(yè)作弊是可接受的,就越有可能報(bào)告自己曾經(jīng)有過(guò)這樣的行為。這一結(jié)果與以往在大中學(xué)生群體中的發(fā)現(xiàn)基本一致(Abaraogu et al.,2016;Ives &Giukin,2020)。Murdock 和Anderman 通過(guò)對(duì)以往研究進(jìn)行綜述后提出,個(gè)體對(duì)作弊行為可接受性的判斷差異可能基于兩種原因:第一,個(gè)體認(rèn)為作弊的可接受性高可能是由于其并不認(rèn)為作弊是不道德的行為;第二,個(gè)體雖然知道作弊是不道德的行為,但出于為自己辯護(hù),故對(duì)其自身作弊行為進(jìn)行了合理化,以此減少作弊行為與自身道德認(rèn)知的沖突(Murdock &Anderman,2006)。由此可見(jiàn),與大中學(xué)生一樣,小學(xué)生對(duì)作弊行為可接受性的判斷可能也受到了這兩個(gè)原因的影響。

其次,同伴做出作業(yè)作弊行為的普遍性和頻率也是個(gè)體是否作弊的重要預(yù)測(cè)變量,即同伴作業(yè)作弊行為是影響小學(xué)生自身作業(yè)作弊行為的重要因素。該結(jié)果與以往針對(duì)大學(xué)生和中學(xué)生群體的研究所獲結(jié)果較為一致,即同伴作弊行為能夠?qū)е聜€(gè)體對(duì)其自身作弊行為進(jìn)行合理化(Hrabak et al.,2004;Ghanem &Mozahem,2019;McCabe &Trevi?o,1993)。近期一項(xiàng)針對(duì)來(lái)自世界多國(guó)研究的元分析也顯示,同伴作弊是個(gè)體學(xué)業(yè)作弊行為的最重要因素之一,且這種“跟風(fēng)效應(yīng)”受到文化因素的調(diào)節(jié)——其在集體主義文化背景下較個(gè)體主義文化背景表現(xiàn)更為明顯(Zhao,Mao et al.,2022)。

同時(shí),對(duì)學(xué)業(yè)成績(jī)的自我評(píng)價(jià)這一預(yù)測(cè)變量也具有與同伴作弊行為相似的重要性。具體表現(xiàn)為,自我評(píng)價(jià)成績(jī)較差的小學(xué)生更有可能報(bào)告自己有過(guò)作業(yè)作弊行為。這一結(jié)果也與針對(duì)大中學(xué)生的研究所獲結(jié)果基本相同(Newstead et al.,1996;?zcan et al.,2019),其反映出作弊行為背后的一種潛在動(dòng)機(jī):成績(jī)較差的學(xué)生希望通過(guò)作弊來(lái)避免失敗(參見(jiàn)Oran et al.,2016)。此外,還有研究發(fā)現(xiàn),成績(jī)好的學(xué)生更容易受到“學(xué)習(xí)、掌握新知識(shí)”這一學(xué)習(xí)動(dòng)機(jī)的驅(qū)動(dòng),成績(jī)較差的學(xué)生卻更容易受到“獲得較高的成績(jī)”的驅(qū)動(dòng),為了考得更好而做出作弊行為(Putarek &Pavlin-Bernardic,2020)。還有一種可能性是,自我評(píng)價(jià)學(xué)業(yè)成績(jī)較差的學(xué)生的自我效能感可能相對(duì)較弱,而自我效能感弱的學(xué)生往往更容易做出學(xué)業(yè)作弊行為(see Murdock &Anderman,2006)。

此外,對(duì)小學(xué)生作業(yè)作弊行為具有一定預(yù)測(cè)作用的因素還包括年級(jí),學(xué)校類型,同伴對(duì)作弊的接受性和作弊后果的嚴(yán)重性,但這些變量的預(yù)測(cè)效應(yīng)相對(duì)較弱。例如,本研究發(fā)現(xiàn),來(lái)自普通公辦小學(xué)的學(xué)生相較于民工子弟小學(xué)的學(xué)生,表現(xiàn)出了更高的作業(yè)作弊率。導(dǎo)致這種學(xué)校間差異的原因可能與校園風(fēng)氣、教學(xué)政策以及師生關(guān)系等有關(guān)(Ramberg &Modin,2019;McCabe et al.,2012),這些因素往往決定了一所學(xué)校所特有的學(xué)習(xí)氛圍。

再如,本研究發(fā)現(xiàn),感知到的同伴對(duì)作弊行為的接受程度對(duì)小學(xué)生作業(yè)作弊行為具有較弱的預(yù)測(cè)作用。并且,該變量的預(yù)測(cè)力明顯弱于小學(xué)生自身對(duì)作弊的可接受性,及觀察到同伴的作弊行為的普遍性或頻繁性。由此可見(jiàn),同伴行為對(duì)作弊的影響主要表現(xiàn)在其被觀察到的外部行為上,即小學(xué)生通過(guò)觀察同伴是否作弊,達(dá)到對(duì)自身行為進(jìn)行合理化的目的(Jurdi et al.,2011;McCabe et al.,2008)。然而,他人的道德意識(shí)水平并非是影響小學(xué)生是否作弊的主要因素。研究發(fā)現(xiàn)“受周圍同學(xué)的批評(píng)或嘲笑”這一作弊后果嚴(yán)重性對(duì)作弊的預(yù)測(cè)作用也非常小,該結(jié)果在一定程度上佐證了上述結(jié)論。

對(duì)作弊后果的嚴(yán)重性感知也是較為次要的預(yù)測(cè)因素,即作弊后果嚴(yán)重性對(duì)小學(xué)生作業(yè)作弊行為的預(yù)測(cè)貢獻(xiàn)性較小。這一結(jié)果與本研究假設(shè)相悖。究其原因,可能是因?yàn)槲覈?guó)并不存在實(shí)質(zhì)性的作業(yè)作弊“懲罰”制度。小學(xué)生對(duì)作業(yè)作弊后果的認(rèn)知非常有限,有限的認(rèn)知主要來(lái)源于對(duì)考試作弊可能導(dǎo)致后果的認(rèn)識(shí)(如被父母、老師懲罰等)。但值得反思的是,盡管各級(jí)各類學(xué)校大多制定了嚴(yán)格的考試作弊“懲罰”制度,卻始終無(wú)法徹底杜絕考試作弊行為。這也表明,過(guò)度依賴于外部強(qiáng)制力量而忽略了對(duì)學(xué)生自身能動(dòng)性的培養(yǎng)(即對(duì)學(xué)生道德價(jià)值觀的培養(yǎng))的作弊懲罰方法是無(wú)法真正起到遏制作弊的效果。

最后,小學(xué)生對(duì)減少作弊策略有效性的評(píng)價(jià)及其他部分人口統(tǒng)計(jì)學(xué)因素是重要性最低的預(yù)測(cè)因素(但其對(duì)模型預(yù)測(cè)的重要性仍然顯著高于0)。其中,就減少作弊策略的有效性而言,之所以其預(yù)測(cè)作用弱,很可能與小學(xué)生普遍傾向于認(rèn)為這些常見(jiàn)的抑制作業(yè)作弊行為的策略效果不佳、對(duì)其有效性打分普遍偏低有關(guān)。

本研究具有一定的理論創(chuàng)新性:作為國(guó)內(nèi)首個(gè)聚焦于小學(xué)生作業(yè)作弊行為及其影響因素的研究,初步建立了關(guān)于小學(xué)生作業(yè)作弊影響因素的綜合模型,并將這些影響因素根據(jù)量化后的重要性指標(biāo)進(jìn)行了排序。特別需要指出的是,本研究發(fā)現(xiàn)小學(xué)生作業(yè)作弊的影響因素與大中學(xué)生學(xué)業(yè)作弊行為的影響因素構(gòu)成并不完全相同,存在其特殊性。如在Murdock 和Anderman (2006)的模型中,后果嚴(yán)重性是能夠預(yù)測(cè)大中學(xué)生考試作弊的至關(guān)重要的作弊動(dòng)機(jī),但該指標(biāo)對(duì)小學(xué)生作業(yè)作弊的影響卻遠(yuǎn)不如預(yù)期之大。可見(jiàn)小學(xué)生群體具有其發(fā)展的特殊性。此外,本研究還發(fā)現(xiàn),除了后果嚴(yán)重性,還有一些被以往研究證明能夠影響大學(xué)生和中學(xué)生學(xué)業(yè)作弊行為的因素,在預(yù)測(cè)小學(xué)生作業(yè)作弊時(shí)貢獻(xiàn)也非常微弱,如是否是獨(dú)生子女(Tsui &Ngo,2016,兄弟姐妹數(shù)量越多的大學(xué)生越有可能作弊)、性別(Galloway,2012,男高中生作弊率高于女生)等;但部分對(duì)小學(xué)生作業(yè)作弊具有較強(qiáng)預(yù)測(cè)作用的變量在大中學(xué)生學(xué)業(yè)作弊行為中卻不存在顯著效應(yīng),如年級(jí)(Ives et al.,2017)等。

但是,研究結(jié)果也表明,Murdock 和Anderman(2006)提出的一些影響大中學(xué)生作弊行為的關(guān)鍵要素也能夠預(yù)測(cè)小學(xué)生的作業(yè)作弊,即也存在一定的相似性。如個(gè)體自身對(duì)作業(yè)作弊行為的可接受性,同伴作業(yè)作弊的普遍性和發(fā)生頻率,及其自身的成績(jī)水平是預(yù)測(cè)小學(xué)生作業(yè)作弊的關(guān)鍵變量。可見(jiàn),多個(gè)影響著大學(xué)生和中學(xué)生學(xué)業(yè)作弊行為的因素,也同樣會(huì)對(duì)小學(xué)生的作業(yè)作弊行為存在顯著影響(Abaraogu et al.,2016;Ghanem &Mozahem,2019)。

此外,本研究還發(fā)現(xiàn),個(gè)體對(duì)情境的認(rèn)知(如“個(gè)體自身對(duì)作業(yè)作弊行為的可接受性”等)在影響作業(yè)作弊行為中也發(fā)揮著重要的作用。這一結(jié)果為一個(gè)長(zhǎng)久以來(lái)的有關(guān)作弊是情境驅(qū)動(dòng)還是個(gè)體特質(zhì)驅(qū)動(dòng)這一爭(zhēng)議提供了新的思路和理論依據(jù)。過(guò)去關(guān)于作弊的研究似乎更加認(rèn)可個(gè)體的作弊行為是受情境而非個(gè)人特質(zhì)驅(qū)動(dòng)的(Hartshorne &May,1928)。而本研究的結(jié)果則表明,情境和個(gè)人特質(zhì)的交互作用可能也在其中發(fā)揮著重要的作用。

本研究在方法上也具有一定的創(chuàng)新性。近年來(lái),隨著人工智能在醫(yī)學(xué)、化學(xué)及生物學(xué)等領(lǐng)域的廣泛應(yīng)用,機(jī)器學(xué)習(xí)技術(shù)已在成人(Bartlett et al.,2014;Just et al.,2017;Livieris et al.,2018)乃至兒童(Bruer et al.,2019;Zanette et al.,2016)研究中得到越來(lái)越廣泛的應(yīng)用。本研究首次將機(jī)器學(xué)習(xí)運(yùn)用于兒童道德研究領(lǐng)域,對(duì)小學(xué)生作業(yè)作弊行為的影響因素進(jìn)行深入分析。結(jié)果表明,機(jī)器學(xué)習(xí)法在分析兒童行為發(fā)展數(shù)據(jù)上是可行的,在數(shù)智時(shí)代背景下,為后續(xù)更多的兒童心理學(xué)領(lǐng)域同行提供了一種新的研究和數(shù)據(jù)分析思路。

本研究還具有較強(qiáng)的實(shí)踐創(chuàng)新性。本研究采用機(jī)器學(xué)習(xí)方法創(chuàng)建了能夠預(yù)測(cè)小學(xué)生有多大的概率會(huì)做出作業(yè)作弊行為的模型(預(yù)測(cè)準(zhǔn)確率達(dá)80%以上),未來(lái)可基于該模型創(chuàng)建相關(guān)app 或網(wǎng)頁(yè)版測(cè)試,在小學(xué)中投入應(yīng)用。具體來(lái)說(shuō),首先由小學(xué)生在app或網(wǎng)頁(yè)上填寫本研究的問(wèn)卷并提交,后臺(tái)基于已有模型對(duì)提交的數(shù)據(jù)進(jìn)行計(jì)算并輸出結(jié)果(即每位小學(xué)生作業(yè)作弊的可能性或概率,0%至100%)。根據(jù)輸出的結(jié)果,教師或家長(zhǎng)能夠初步了解小學(xué)生當(dāng)下有多大的可能性會(huì)在作業(yè)中作弊,以便于教師或家長(zhǎng)進(jìn)行必要的關(guān)注。但值得注意的是,我們并不能依據(jù)一次測(cè)試的結(jié)果就給學(xué)生“貼標(biāo)簽”,關(guān)于如何使用預(yù)測(cè)模型的結(jié)果,還需結(jié)合研究倫理和學(xué)校教育方式加以綜合考慮。此外,由于目前問(wèn)卷涉及的部分預(yù)測(cè)變量對(duì)預(yù)測(cè)作業(yè)作弊的貢獻(xiàn)性非常小,如對(duì)預(yù)防作弊的方法的有效性評(píng)價(jià)等。后續(xù)研究可繼續(xù)刪除問(wèn)卷中的相關(guān)條目并重新建模,開(kāi)發(fā)出更簡(jiǎn)短的問(wèn)卷。此舉將進(jìn)一步推進(jìn)研究成果在學(xué)校和家庭教育中的推廣應(yīng)用。

此外,本研究還為誠(chéng)信教育的方式方法提供了具體、可操作的實(shí)踐方案。首先,個(gè)體對(duì)作弊的可接受性(或者說(shuō)“道德意識(shí)”),而非作業(yè)作弊后果的嚴(yán)重性,能夠較好地預(yù)測(cè)小學(xué)生的作業(yè)作弊行為。這就給予家長(zhǎng)、老師及廣大教育工作者以啟示:不應(yīng)一味強(qiáng)調(diào)作弊的后果,相反,更有效的做法是從積極的角度幫助學(xué)生建立正確的學(xué)業(yè)誠(chéng)信認(rèn)知,引導(dǎo)其認(rèn)識(shí)到作弊是“零容忍”的不道德行為。其次,由于同伴作弊對(duì)個(gè)體作業(yè)作弊影響很大,因此教師和家長(zhǎng)應(yīng)注意減少同伴行為所產(chǎn)生的負(fù)面影響,并嘗試通過(guò)各種方法樹(shù)立同伴的正面影響。例如,給予那些即使作業(yè)做得不好,但仍然選擇獨(dú)立完成的學(xué)生以充分肯定,讓學(xué)生認(rèn)識(shí)到,獨(dú)立完成作業(yè)比正確率更重要(Misselbrook,2014;Siev &Kliger,2019)。再次,學(xué)校還應(yīng)積極響應(yīng)教育部倡導(dǎo)的“雙減”政策,重“質(zhì)”不重“量”,并著力建立起一種良性的學(xué)習(xí)氛圍,杜絕“唯成績(jī)論”:讓學(xué)生認(rèn)識(shí)到,做作業(yè)僅僅是對(duì)課上知識(shí)的查漏補(bǔ)缺和及時(shí)鞏固,并不是為了讓同班同學(xué)“一較高下”(Misselbrook,2014;Siev &Kliger,2019)。最后,作弊是一種習(xí)慣性行為(Davy et al.,2007),鑒于小學(xué)生的學(xué)業(yè)作弊率在所有年齡段中相對(duì)較低(Cochran,2015),尚處于萌發(fā)階段,我們更應(yīng)該“從娃娃抓起”,適時(shí)在小學(xué)乃至幼兒園階段推廣誠(chéng)信教育,將作弊行為“扼殺在搖籃里”。

本研究存在一定的局限性。首先,本研究所創(chuàng)建的小學(xué)生作業(yè)作弊行為的預(yù)測(cè)模型達(dá)到了80.46%,但仍存在近20%的預(yù)測(cè)錯(cuò)誤的可能性,因此仍需在未來(lái)的研究中進(jìn)一步優(yōu)化模型。一方面,可以通過(guò)理論探索,尋找更多新的可能影響作業(yè)作弊的預(yù)測(cè)變量來(lái)完善模型。本研究主要參考了影響大學(xué)生和中學(xué)生學(xué)業(yè)作弊行為的因素,且側(cè)重于考察與學(xué)校有關(guān)的情境因素對(duì)小學(xué)生作業(yè)作弊行為的影響,因此不能排除還有其他預(yù)測(cè)因素的存在。且研究結(jié)果表明,相較于大中學(xué)生,影響小學(xué)生作業(yè)作弊的因素也具有一定的特殊性,未來(lái)的研究可依據(jù)上述領(lǐng)域進(jìn)行拓展,更充分地挖掘影響小學(xué)生作弊的因素,進(jìn)而創(chuàng)建一個(gè)科學(xué)而完備的、專門適用于小學(xué)生作業(yè)作弊的理論模型。另一方面,機(jī)器學(xué)習(xí)是服務(wù)于大數(shù)據(jù)的方法,未來(lái)可將本研究問(wèn)卷轉(zhuǎn)變?yōu)閍pp 或網(wǎng)頁(yè),可以通過(guò)進(jìn)一步擴(kuò)大樣本量,再增加一個(gè)外部驗(yàn)證的數(shù)據(jù)集,對(duì)參數(shù)進(jìn)行調(diào)優(yōu),進(jìn)一步完善模型,提高模型的預(yù)測(cè)準(zhǔn)確性。其次,本研究對(duì)于小學(xué)生作業(yè)作弊行為的測(cè)量采用的是自我報(bào)告法,雖然問(wèn)卷是匿名性質(zhì)的,但受社會(huì)稱許性影響仍存在個(gè)體自我報(bào)告的作弊率低于真實(shí)作弊率這一可能性。未來(lái)研究可嘗試通過(guò)自我報(bào)告法和行為實(shí)驗(yàn)法相結(jié)合的方式來(lái)解決該問(wèn)題。事實(shí)上,最近已有越來(lái)越多的研究者開(kāi)始采用實(shí)驗(yàn)法來(lái)研究作弊問(wèn)題,但這些實(shí)驗(yàn)范式比較適合年齡相對(duì)較大的學(xué)生群體或成人(Cizek,1999;Zhao et al.,2021;Zhao,Peng et al.,2022),實(shí)驗(yàn)法在兒童群體中的適用性還有待于更多研究加以檢驗(yàn)。最后,本研究考察了不同作業(yè)作弊方式的普遍性,但這些方式以“抄作業(yè)”、“抄答案”等傳統(tǒng)方式為主,并未涉及數(shù)智時(shí)代下一些新型的作弊方式(如,采用“愛(ài)作業(yè)”等批改作業(yè)的app 進(jìn)行作弊,或其他“線上”方式作弊)。未來(lái)研究可對(duì)上述新型作弊方式加以探討。

5 結(jié)論

本研究首次聚焦小學(xué)生作業(yè)作弊行為,采用機(jī)器學(xué)習(xí)集成算法,系統(tǒng)考察了影響小學(xué)生作業(yè)作弊行為的關(guān)鍵因素及其相對(duì)重要性。結(jié)果表明,33%的小學(xué)生自我報(bào)告曾經(jīng)做過(guò)作業(yè)作弊行為,且作弊行為的發(fā)生率隨年級(jí)的增長(zhǎng)呈上升趨勢(shì);機(jī)器學(xué)習(xí)集成算法得到的預(yù)測(cè)模型AUC 值達(dá)80.46%,能夠較準(zhǔn)確地預(yù)測(cè)小學(xué)生的作業(yè)作弊行為。總的來(lái)說(shuō),小學(xué)生的作業(yè)作弊行為很大程度上取決于他們對(duì)于作業(yè)作弊的接受性,同伴的作業(yè)作弊行為,及其自身的成績(jī)水平。上述結(jié)果為兒童誠(chéng)信行為發(fā)展的理論構(gòu)建以及學(xué)業(yè)作弊的早期干預(yù)提供了科學(xué)依據(jù)。此外,本研究也表明,機(jī)器學(xué)習(xí)作為人工智能的核心方法,是一種可用于分析發(fā)展性數(shù)據(jù)的有效方法。

猜你喜歡
小學(xué)生作業(yè)模型
一半模型
重要模型『一線三等角』
快來(lái)寫作業(yè)
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
怎樣培養(yǎng)小學(xué)生的自學(xué)能力
甘肅教育(2020年22期)2020-04-13 08:10:56
3D打印中的模型分割與打包
作業(yè)
故事大王(2016年7期)2016-09-22 17:30:08
我是小學(xué)生
我想要自由
三十六計(jì)第七計(jì):無(wú)中生有
主站蜘蛛池模板: 亚洲乱亚洲乱妇24p| 国产亚洲视频中文字幕视频| 婷婷六月综合| 亚洲欧美自拍中文| 亚洲第一色视频| 亚洲伊人天堂| 亚洲成人黄色网址| 日本一区中文字幕最新在线| 99ri精品视频在线观看播放| 蜜桃视频一区二区| 日韩第九页| 在线中文字幕网| 久久这里只有精品国产99| 91亚洲影院| 国产综合另类小说色区色噜噜| 国产一区成人| 麻豆国产原创视频在线播放| AⅤ色综合久久天堂AV色综合| 在线亚洲精品自拍| 国产91透明丝袜美腿在线| 在线网站18禁| 亚洲欧美精品一中文字幕| 亚洲最新网址| 免费高清a毛片| 中文字幕亚洲另类天堂| 久久精品视频一| 九九九久久国产精品| 国产美女免费| 自拍中文字幕| 中文字幕人妻av一区二区| 免费无码网站| 国产午夜一级淫片| 波多野结衣第一页| 亚洲色图在线观看| 在线观看免费国产| 久久黄色视频影| 免费在线国产一区二区三区精品| 韩国福利一区| 国产真实乱人视频| 欧美va亚洲va香蕉在线| 亚洲自拍另类| 99精品免费在线| 国产成人h在线观看网站站| 久久精品欧美一区二区| 亚洲国产日韩在线成人蜜芽| 国产福利一区视频| 亚洲男人天堂网址| 六月婷婷综合| 日韩精品欧美国产在线| 精品成人一区二区三区电影 | 99r在线精品视频在线播放 | 国产内射一区亚洲| 亚洲综合专区| 国产真实乱子伦精品视手机观看| 国产成人精品一区二区不卡| 91成人在线免费观看| 乱系列中文字幕在线视频| 国产精品大白天新婚身材| 日韩一二三区视频精品| 国产素人在线| 欧美国产日韩在线观看| 亚洲男人在线天堂| 69国产精品视频免费| 欧美精品亚洲精品日韩专区| 香蕉视频国产精品人| 婷婷综合缴情亚洲五月伊| 国产成人综合在线观看| 97se亚洲综合在线韩国专区福利| 国产成人久久777777| 人妻一区二区三区无码精品一区| 成人精品在线观看| 国产一区二区精品福利| 国内精品久久久久久久久久影视| 老司机久久99久久精品播放| 青青草91视频| 久草热视频在线| 久久这里只有精品66| 亚洲高清在线天堂精品| 日韩第九页| 国产欧美又粗又猛又爽老| 国产精品免费久久久久影院无码| 亚洲va在线观看|