徐杜紅 賴嘉釩 沐守寬
(閩南師范大學教育科學學院,漳州 363000)
學習判斷是個體對自身記憶的預見性判斷,它反映了個體對于新近學習的內容在未來測驗中正確提取的信心(Fiacconi et al., 2020; Koriat, 1997),學習判斷是元記憶監測的主要指標之一,這種監測自己學習情況的能力對學習者至關重要,因為監測的結果決定個體如何調控學習行為,比如對學習時間以及努力程度的分配(Bjork et al., 2013; Nelson, 1990)。過往針對學習判斷的研究主要聚焦在學習判斷的影響因素(Dunlosky & Matvey, 2001; Mueller, 2016; Yeager, 2019)、學習判斷的潛在機制(Koriat, 1997; Koriat et al., 2004; Wang et al., 2020)以及學習判斷準確性(Hu et al., 2016; Koriat & Bjork, 2005)。但近年,有部分研究者將研究興趣轉向學習判斷反應性,并就該主題展開深入研究(Tekin & Roediger, 2020)。
學習判斷反應性是指讓學習者進行學習判斷活動,監測學習過程可能對學習結果產生的影響,學習者在有無學習判斷任務下記憶結果差異顯著(Witherby & Tauber, 2017)。學習判斷反應性研究最常使用的實驗范式為“學習—學習判斷—測驗”,對學習判斷的測量是基于被試的自我報告,讓被試進行學習判斷會促使被試更多關注自己的記憶情況,以達到實驗者的預期,這個判斷可能會改變被試真實的記憶表現情況,這便是產生了反應性(Lahey & Harris, 1982)。以往的研究結果發現延遲學習判斷能夠讓被試在呈現線索的記憶條件下表現更優(Kimball & Metcalfe, 2003),產生這一現象可能的原因便是發生了學習判斷的反應性,但研究者并沒有因此對學習判斷反應性產生興趣,仍舊堅持假定學習判斷對記憶不存在任何作用。另外,先前研究較少設置無判斷的對照組檢驗學習判斷的反應性。直至近年,學習判斷的反應性才作為一個研究問題得到研究者的關注(Ariel et al., 2020; Tauber et al., 2015; Witherby & Tauber, 2017),然而不同研究間設計的異質性導致最終得到的結論并不一致,即學習判斷反應性表現出現跨研究的不一致(Dougherty et al., 2018; Mitchum et al., 2016)。
在學習判斷反應性的實驗中,雖然不同研究對于學習材料的選擇不盡相同,但使用的學習材料大致可以分為兩類。一類是以成對詞組作為學習材料,一類以文本材料為學習材料,其中詞對學習材料又可以根據關聯性分為三種,一種是具有高度相關性的詞對,一種是不具有相關性的詞對,還有一種是兩種相關度都包含的混合詞對。
以往有關探究材料類型對學習判斷反應性影響的研究結果并不一致,其中結果最為混淆的是以低相關詞對為學習材料的相關研究。Dougherty等人(2005)使用低相關詞對探討學習判斷的反應性,結果發現讓學習者進行學習判斷會提高個體未來記憶表現。但其在2018年的研究中同樣以低相關詞對作為實驗材料,結果卻發現讓學習者進行學習判斷并不會對其記憶表現產生反應性(Dougherty et al., 2018)。其他探究低相關詞對學習判斷反應性的研究結果也各有不同。Mitchum等人(2016)使用低相關詞對為學習材料發現學習判斷對于記憶表現存在負向抑制作用;但Tauber等人(2019)使用低相關詞對為學習材料卻發現了學習判斷對記憶表現的正反應。以上研究同樣使用低相關詞對作為學習材料,為什么得到的結果卻不一致?其中有什么變量在起調節作用?低相關詞對學習材料的學習判斷反應性究竟是如何?這些問題都需要進一步的解答。
對于學習時間的操縱可以分為兩類,一類是實驗者規定學習時間,即固定學習步調,另一類是學習者自定學習時間,即自定學習步調。
以往研究結果發現兩種不同的學習時間可能對學習判斷的反應性存在調節作用。Mitchum等人(2016)的研究1與研究2均使用“高相關詞對”為學習材料,并采用學習者自定學習時間的方式來探究學習判斷的反應性,結果發現學習判斷并不會影響個體的學習成績表現。然而,在另一項研究中,研究者同樣使用“高相關詞對”作為學習材料,但使用學習者自定學習時間的方式來探究學習判斷的反應性,結果卻發現存在學習判斷反應性(Witherby & Tauber, 2017)。兩個研究同樣使用“高相關詞對”作為學習材料的研究,得到的學習判斷反應性卻各不相同,這可能是因為這兩個研究設計中對于學習時間控制的差異。
綜上所述,學習判斷的反應性是否存在?學習判斷的反應性是否會受到各種實驗操縱變量的影響?現存研究的回答還存有一定的爭議,需要整合已有研究討論。
針對學習判斷反應性的結果混淆,Double等人(2018)使用元分析方法探究了材料類型、學習時間以及是否進行二次學習等變量是否影響學習判斷對于記憶的反應性,結果發現學習判斷對于記憶并不存在反應性(Hedges’g=0.05, 95%CI=[0.03, 0.14])(Double et al., 2018),但調節效應檢驗發現,學習判斷反應性在不同學習材料上表現不同:使用高相關詞對作為學習材料時表現為學習判斷的正反應性,即進行學習判斷讓個體記憶表現更佳(Hedges’g=0.32, 95%CI=[0.08, 0.56],p<0.01);使用低相關詞對(Hedges’g=-0.01, 95%CI=[-0.16, 0.13],p=0.128)或者混合詞表(高相關詞對+低相關詞對)作為學習材料時(Hedges’g=-0.05,95%CI =[-0.17, 0.07],p=0.424)不存在學習判斷的反應性。Double等人(2018)的元分析為澄清學習判斷反應性的存在與反應方向做出了巨大貢獻,幫助研究者綜合并梳理了學習判斷反應性的效應值及對學習判斷反應性產生影響的相關變量,為后續研究者深入研究提供了支撐證據。但該元分析所得到最終結果的原始效應量僅為19個,且其中一部分原始效應量的來源并不是探究學習判斷的反應性這一主題的。有關學習判斷反應性主題的研究在國內還比較少,王景玉對相關問題進行了文獻綜述(王景玉等,2019),但關于該主題的研究很少。
在Double等人(2018)文章發表后又有很多研究者就這一主題進行了一系列研究,近兩年關于這一主題的研究數量有所增長且獨立效應量相比2018年也有增長,因此,本研究再次針對學習判斷反應性這一主題進行元分析,在探索學習判斷反應性是否存在的前提下進一步探究學習材料類型、學習時間、測驗類型如何調節學習判斷的反應性。進一步梳理學習判斷反應性的存在及其表現形式,有利于研究者清晰地認識學習判斷這一廣泛使用的元記憶測量方式對于記憶存在的潛在影響,以便在未來使用更合適的元記憶測量方式探究記憶和元記憶的關系。
通過關鍵詞: judgement(s)/judgment(s) of learning、 reactivity of judgement(s)/judgment(s) of learning、confidence judgement/judgment、metacognition judgement/judgment在Web of science、 Proquest、 谷歌學術等數據庫篩選文獻, 另將Double等人(2018)的元分析所使用的參考文獻納入查閱范圍。 文獻檢索的起始時間為1997年1月, 文獻檢索的截止日期為2022年1月1日。
文獻納入標準包括:(1)所納入研究為實驗研究,對于沒有數據的報告或綜述文章予以篩除;(2)所納入的研究目的均為探索學習判斷對于記憶表現的影響,且每個納入實驗中包含學習判斷組vs. 無學習判斷組(空白對照組);(3)所有研究中被試的學習材料為詞對、句子或者文本,學習任務為“請被試記憶所學內容”并且在后續實驗中對于被試的學習情況進行測試;(4)所納入的研究所測量的記憶范疇均為短時記憶范疇,即本研究所納入的原始研究均在材料學習結束后即刻進行回憶,對于部分間隔24h或者48h再進行回憶的測驗本研究予以篩除;(5)所納入的研究必須明確報告了學習判斷組與無學習判斷組的測驗成績表現(回憶成績均數、標準差或者是學習判斷組與非學習判斷組的t檢驗數值);(6)相同作者使用同一數據所做的研究只選擇最早發表的一篇。納入研究的每篇論文必須滿足所有標準,否則予以篩除。
文獻搜索、 納入及排除流程如圖1所示, 按照上述標準進行徹底的文獻檢索與篩查后,最終納入研究的論文有11篇,均為同行評審論文,最終納入元分析的獨立效應量為55個,文獻具體情況見表1。

圖1 文獻篩選流程

表1 納入元分析的原始研究

(續表)
對納入元分析的文獻進行如下編碼:文獻信息(作者名、 文獻發表時間、 實驗編號), 樣本量大小, 學習材料類型(高相關詞對、 低相關詞對、 混合詞對材料、 文本材料), 學習時間(固定步調、 自定步調),測試類型(自由回憶、 再認測驗或者線索呈現的目標詞回憶),每個獨立樣本編碼一個效應值,如果一篇文獻中存在多個獨立樣本則分別編碼,但在本研究中有個別獨立樣本分別編碼了幾個效應量,這是因為該獨立樣本在不同實驗條件下所得到的效應量不同,文獻編碼具體情況見表1。編碼者在不同時段依據文獻的納入標準和排除標準分別進行三次編碼,編碼的一致性為92.4%,說明文獻編碼有效。
2.4.1 效應量計算
使用Hedges’g作為效應量指標,以避免Cohen’sd對小樣本研究效應量估計偏高的問題。在分析中,我們最初編碼的效應量為每個獨立樣本所得到的Cohens’d值,由于部分研究未直接報告Cohen’sd值,只報告了學習判斷組與無學習判斷組記憶成績的均數、標準差或只報告了兩組t檢驗的結果及其顯著性。對于只報告了均數、標準差的研究采用Cohen’sd的計算公式,利用研究中所報告的均數、標準差計算其對應的Cohen’sd值(Cohen, 1988),對于只報告了t檢驗結果的研究,采用Steiger的相關轉換公式將t值轉化為Cohen’sd值(Steiger & Fouladi, 1997)。最后,利用R語言(4.0.5)的“esc”程序包將所有編碼的Cohen’sd值轉化為Hedges’g并使用Hedges’g值進行元分析。
2.4.2 模型的選定與異質性檢驗
元分析主要采用固定效應模型或隨機效應模型,固定效應模型假定研究背后只存在一個真實效應量,而每個研究效應量的不同是由抽樣誤差引起的,因此固定效應模型的結果推論只適用于當下的研究原始樣本范圍。隨機效應模型則認為每個研究的真實效應量是不同的,這種不同來源于抽樣誤差外的其他變異來源,如被試群體差異、研究方法差異等,因此隨機效應模型得到的效應值只是對真實效應量均值的估計,它所涵蓋的置信區間范圍更加廣泛(Borenstein et al., 2009)。在模型選定上,本研究不符合固定效應模型的選擇標準,除抽樣誤差外還有測量手法等變量會影響學習判斷和記憶表現間的真實關系,因此選用隨機效應模型。下文中,我們將結合異質性檢驗的方法進一步評估隨機效應模型選擇的正確性。
2.4.3 發表偏差
當發表的研究文獻不能系統性地代表該領域已經完成的研究總體時,就認為產生了發表偏差(Rothstein et al., 2005)。發表偏差意味著該領域的研究文獻不完整,這會嚴重影響元分析的結果,因為它可能會導致最終得到的效應量高于真實值(Kuppens et al., 2013)。針對發表偏差的問題,最好的辦法就是全面檢索文獻,以減少發表偏倚。此外,在元分析過程中,還采用漏斗圖、Egger’s檢驗以及剪補法來評估發表偏差。
2.4.4 數據分析及處理程序
使用excel進行前期的文獻整理與編碼,通過R語言(4.0.5)的metafor程序包進行綜合效應量計算、發表偏倚檢驗以及調節效應檢驗(Balduzzi et al., 2019)。
對于納入元分析的數據進行異質性檢驗,Q檢驗表明,納入元分析的各獨立效應量之間是異質的,Q(52)=164.28,p<0.001,I2=67.10%,這一結果對選擇隨機效應模型的正確性予以佐證。根據Borenstein等人(2009)對I2的解釋,說明在學習判斷與記憶表現關系的研究中有67.10%的觀察變異是由學習判斷對記憶表現的真實改變效應引起的。
首先,通過漏斗圖檢查發表偏差,如圖2所示,納入元分析的55個獨立效應量基本均勻分布在總效應量兩側,這表明,針對學習判斷對于學習表現影響的研究并不存在嚴重發表偏差。因為漏斗圖只能從視覺對稱判斷的角度初步檢查發表偏差,本研究還使用了Egger’s檢驗,結果顯示本研究存在一定的發表偏差(p=0.009)。

圖2 學習判斷反應性效應量分布的漏斗圖
因此采用剪補法檢驗發表偏差對元分析結果的影響,對獨立效應量進行剪貼之后,使用隨機效應模型的總效應值依然顯著(Hedges’g=0.33, 95%CI=[0.25, 0.41],p<0.001)。由此可見,本研究元分析納入的所有獨立效應量雖然存在部分發表偏差的因素,但主要結果還是有效的。
使用隨機效應模型進行總體效應檢驗,使用55個獨立效應量,被試總數為3690人,得到學習判斷對于記憶表現的影響為正反應(Hedges’g=0.22, 95%CI=[0.14, 0.29],p<0.001)。
從圖2來看,各個研究的效應量分布于總效應量兩側,而且各研究的效應量之間存在很大的變異,為分析這一變異的可能來源,本研究檢驗了學習時間、學習材料以及測試類型對于學習判斷反應性的調節作用,結果見表2。

表2 調節效應檢驗
從調節效應分析的結果來看,學習時間的調節效應顯著(Qb=7.78,p<0.01),相比于自定步調的學習時間(Hedges’g=0.08),實驗者規定被試學習時間影響學習判斷反應性的效應量更大(Hedges’g=0.27);學習材料類型的調節效應顯著(Qb=17.08,p<0.001),相比于學習無關詞對、混合詞對和文本材料,學習具有一定關聯度的詞對影響學習判斷反應性的效應量更大(Hedges’g=0.39);測試類型的調節效應不顯著(Qb=1.59,p=0.452)。
本研究就個體在學習結束之后進行學習判斷是否會改變其在未來測驗中的記憶表現進行了元分析,其主效應結果表明學習判斷存在反應性,其效應量為0.22,這說明學習判斷對于記憶有一定影響,且這個影響方向表現為正向的促進作用,即進行學習判斷能夠讓個體的記憶測驗表現更佳。這與以往的一些研究結果相似(Ariel et al., 2020; Dougherty et al., 2005; Kelemen & Weaver 1997; Soderstrom et al., 2015; Witherby & Tauber, 2017; Yang et al., 2015),出現這一結果的可能原因是學習判斷的測量方式為被試自我報告,通過讓被試自我估計在未來測驗中的記憶表現情況來測量學習判斷的基本情況,這在一定程度上向個體提供了測驗信息,可能在無形中強化了個體記憶,從而使得個體在有學習判斷項目上記憶表現更好(Soderstrom et al., 2015)。另外,讓被試進行學習判斷會促使他們利用一些材料線索進行估計,這種估計強化了可用的線索,使被試在隨后的記憶測試中再運用這種線索時出現了學習判斷的正反應性(Koriat, 1997),這與Double等人(2018)的元分析結果不一致,可能是本研究納入的原始效應量、被試數量更多,因此能夠更有效地避免樣本抽樣誤差混淆結果,且本研究中納入的原始效應量大多來自2017年至2020年,相比于Double等人(2018)納入的早先研究,這些新近研究對無關變量的控制更加準確,因此能夠更多地排除無關變量對于學習判斷反應性的影響,從而穩定地解釋學習判斷反應性的真實表現情況。
綜上所述,學習判斷的正反應性提示研究者探究元記憶監測相關機制時,要考慮進行學習判斷這一行為是否會改變個體的學習行為及其學習結果,一個簡單的學習判斷行為便可促進個體的記憶結果,這對學生來說或許是一種不錯的學習方法,值得廣大學習者利用。
4.2.1 學習材料對學習判斷反應性的調節效應
調節效應檢驗表明,不同學習材料類型對學習判斷反應性的影響不同,相比于學習無關詞對、混合詞對和文本材料,學習具有一定關聯度的詞對影響學習判斷反應性的效應量更大(Hedges’g=0.39)。以往研究結果也表明,使用相關詞對作為學習材料進行學習判斷的記憶表現更佳,使用無關詞對作為學習材料進行學習判斷對于記憶的作用可能表現為促進,也可能是抑制或者沒有作用(Mitchum et al., 2016; Myers et al., 2020; Witherby & Tauber, 2017)。造成學習材料對學習判斷反應性調節效應顯著的原因可能是進行學習判斷會讓學習者更多地關注“材料關聯度”這一線索,并根據材料的關聯度進行判斷,這種判斷可能會激活其內在的一些學習信念,即具有關聯度的詞對更容易學習,無關詞對記憶更困難,而這種信念會產生自我驗證效應(對于高相關詞對抱有更高提取信心),從而導致對于兩種材料的回憶結果產生分離。已有研究者發現,高提取信心的個體大多表現為學習判斷的正反應性,而低提取信心的個體大多表現為學習判斷的負反應性或者無反應性,這一結果印證了我們的猜測,即對于關聯度(高vs. 低)不同的材料進行學習判斷會改變個體的提取信心,而提取信心的不同又會進一步影響個體的記憶表現(Double & Birney, 2017)。
4.2.2 學習時間對學習判斷反應性的調節效應
調節效應檢驗表明,不同學習時間對學習判斷反應性的影響不同(Qb=7.78,p=0.005),表現為相比于自定步調的學習時間(Hedges’g=0.08),實驗者規定被試學習時間影響學習判斷反應性的效應量更大(Hedges’g=0.27)。以往研究也表明,使用固定學習步調能夠揭示學習判斷的正反應性(Soderstrom et al., 2015),而使用自定學習步調可能并不會產生學習判斷的反應性(Janes et al., 2018),甚至可能產生負反應性(Mitchum et al., 2016)。學習時間對學習判斷反應性調節作用顯著的原因可能是要求個體做出學習判斷行為會促使被試注意到一些更容易記憶的材料(簡單),而忽視一些不容易記憶的材料(困難或有挑戰的項目)。每個學習者在學習材料時所持有的態度都是要掌握材料,但當學習時間有限時(實驗者固定步調),被試更有可能犧牲困難詞對,將更多的注意力集中在記憶簡單材料上,從而形成一種有效的學習策略;當有足夠時間學習材料時(學習者自定步調),被試會以掌握所有材料為目標,可能并不會根據材料難度分配自己的認知資源,最終因為記憶容量有限而在最終測驗中表現一般。
首先,在搜集文獻時由于部分研究實驗數據缺失損失了部分研究樣本,一定程度上影響了元分析結果的準確性,未來應該更加采用多渠道更全面的方法搜集元分析所需要的數據。其次,納入的所有原始研究均為考察學習判斷對于短時記憶的反應性,所以目前的結果僅能說明學習判斷對于短時記憶的表現有所促進,并不能推廣至長時記憶,所以學習判斷對于長時記憶表現的影響還需深入探討。最后,學習判斷反應性的影響因素較多,本研究中只選取了三個影響因素進行探究,還有一些影響因素沒有涉及,如學習判斷范式、實驗設計類型、學習材料數量等,未來研究應該更全面地探究學習判斷反應性的影響因素,以全面揭示學習判斷反應性的產生機制。
學習判斷會促進學習者的記憶表現,學習判斷的反應性受到學習材料、學習時間的調節,不受測驗類型的調節。