仝 文 余 雪 劉志方 朱星宇 齊 琦
(1 山西師范大學教育科學學院,太原 030031) (2 杭州師范大學教育學院,杭州 311121)(3 海南師范大學心理學院,海口 571158)
語境預測性是指在句子閱讀中,根據前文語境推測出目標詞的概率。以往研究發現,語境預測性是影響詞匯加工的“三大因素”之一(DeLong et al., 2014)。讀者在閱讀高預測性詞和低預測性詞時會有不同的眼動模式,相對于低預測性詞來說,高預測性詞的注視時間更短,眼跳距離更長,回視次數更少(Balota et al., 1985; Rayner &Well, 1996; Schustack et al., 1987),即表現出預測性效應。以漢語句子為材料的研究也得到了同樣的結果(劉志方 等, 2020; Chang et al., 2020)。可見,預測性對于詞匯加工的促進作用具有跨語言的一致性(Rayner et al., 2005)。
以不同群體為研究對象的語境預測性相關研究發現,各群體均能利用語境預測性信息來促進詞匯加工。眼動研究發現,兒童已經能夠利用語境預測性信息促進詞匯加工(Perfetti et al., 1979);青年和老年讀者的眼動數據也證實他們可以有效利用語境預測性信息(王麗紅 等, 2012)。可見,預測性對詞匯加工的促進作用具有普遍性。
而在普遍性之外,差異性也是研究者關注的重要內容。以往研究發現高低技能讀者均可以利用預測性信息(Hawelka et al., 2015),但不同閱讀技能的讀者在對語境預測性信息的利用上是存在差異的,主要表現在預測性效應的大小和時間早晚上。
關于高低技能讀者利用預測性信息的差異,目前有兩種相關的假說:一種是詞匯質量假說,認為對于高閱讀技能者而言,高質量的詞匯表征支持模塊化閱讀,他們可以利用有效的自下而上的加工來獲取詞匯信息而無需依賴語境信息,低閱讀技能者則需要語境信息來幫助其進行詞匯識別(Hersch & Andrews, 2012);另一種是預測編碼框架假設,認為在自下而上的信息到達大腦各區域前,低空間頻率信息在大腦中的投射就已預先激活了可能的對象,即讀者在閱讀過程中會不斷產生前向推斷,而相比于低技能讀者,高技能讀者自動化產生前向推斷的能力較強(Hawelka et al.,2015)。綜上所述,詞匯質量假說與預測編碼框架假設在預測性信息利用的時間進程和大小上有不同預測。具體來看,在對預測性信息利用的時間進程上,詞匯質量假說所推斷的預測性效應表現時間的早晚是以詞匯加工階段為界。慢速讀者由于詞匯表征質量較差,需依賴語境信息幫助其進行詞匯加工,因此其在詞匯加工階段就會表現出預測性效應,而快速讀者在詞匯加工階段不依賴預測性信息,其對預測性信息的利用可能更多地體現在更高層次的加工中;而預測編碼框架假設推斷快速讀者比慢速讀者能更早利用預測性信息來促進詞匯加工。在預測性效應的大小上,詞匯質量假說推斷慢速讀者的預測性效應較大,而預測編碼框架假說推斷快速讀者利用預測性信息的能力更強。
盡管兩種假說在快慢讀者預測性信息利用的時間進程和大小上有不同預測,但從以往研究結果來看,兩種假說均有證據支持。一些研究者發現英文高技能讀者能夠產生更大的預測性效應(Klein et al., 1974; Steiner et al., 1971),支持了預測編碼框架假設。劉妮娜等(2019)分析中文高低技能讀者在預視階段的預測性效應發現,高技能讀者在預視階段就可以產生預測性效應,而低技能讀者在加工晚期(總閱讀時間)才能利用預測性信息,同樣支持了預測編碼框架假設。盡管如此,也有研究顯示,相比于低技能讀者,高技能讀者在詞匯加工中對語境信息的依賴性較小(West &Stanovich, 1978; West et al., 1983),支持詞匯質量假說。但通過文獻梳理發現,其設置的實驗任務并非自然的閱讀情境。例如,Schvaneveldt 等(1977)比較高低技能兒童在前置關聯詞和非關聯詞條件下的詞匯判斷表現發現,低閱讀技能兒童產生了更大的預測性效應。而在West 和Stanovich的研究中,雖然設置了前文語境,但其設置的單詞閱讀任務需要讀者出聲閱讀,且在前文語境與目標詞呈現之間插入了時間間隔,同樣不是自然閱讀情境。因此,不同研究得出的高低技能讀者預測性效應表現的結果差異可能只是不同的任務要求導致的。也就是說,詞匯質量假說與預測編碼框架假設不是矛盾對立的,而是各有其適用情境。在預視信息可用的自然的閱讀情境中,高低技能讀者的預測性效應表現可能更符合預測編碼框架假設。
此外,即使設置了較為自然的閱讀情境,不同閱讀任務本身所需的加工深度差異也可能會對預測性效應產生影響。主題掃描是一種比閱讀理解加工深度更淺的閱讀任務,研究者通過指導語引導被試在頭腦中預先形成一個目標,稱之為“主題”,被試在主題掃描任務中通過快速移動眼睛,提取關鍵點并以此來判斷該文本與主題的相關性,一旦判斷為無關,被試就會放棄進行更高層次的整合(Duggan & Payne, 2009),反之判斷為相關后將轉為閱讀理解過程。White 等(2015)的一項研究對比了主題掃描和閱讀理解任務上的詞頻效應,結果發現,在主題掃描任務中,在第一遍閱讀時間指標上表現出了與閱讀理解任務相當的詞頻效應。因此,可以認為,雖然在主題掃描任務中的加工深度較淺,但對單詞的加工確實到達了詞匯的層面。而閱讀理解以獲取句義為目的,不僅需要對詞匯進行加工,還需要將詞匯的意義與上下文進行整合來理解句義,這個過程中詞匯的加工程度更深。
Reichle 等(2009)在使用E-Z 讀者模型探討高級語言加工過程對眼動的影響時提出,預測性信息的可用性是基于前一個詞的后詞匯整合階段的完成。也就是說,預測性效應的產生是基于一定加工深度的。當加工深度較淺時預測性效應較小,甚至不出現預測性效應;但是對于需要更深入加工的閱讀理解來說,預測性效應較大(張麗華 等, 2019)。以往關于高低技能讀者預測性效應的研究是在單一的任務中進行的,忽略了加工深度的影響。因此本研究設置主題掃描任務(不需要對句中詞匯進行后詞匯整合)與閱讀理解任務(通過詞匯意義的整合來理解句義)來形成兩種不同的加工深度,以探討加工深度對高低技能讀者預測性效應大小的調節作用。
根據對以往文獻的梳理,本研究提出以下假設:(1)若在自然的閱讀情境中,閱讀理解任務中快速讀者相比于慢速讀者更早表現出預測性效應,則快慢讀者預測性效應支持預測編碼框架假設。(2)加工深度調節快慢讀者預測性效應的大小。
選取某大學本科生90名,平均年齡為19.72 歲(年齡范圍17~26 歲),其中男性18人,女性72人。所有被試的母語均為漢語,無色盲色弱問題,裸眼視力或者矯正視力正常,未參加過類似實驗,未參與本實驗的材料評定工作。
以往研究對閱讀能力進行高低分類主要有兩種方法:一種是以任務得分作為劃分指標;另一種是在保證一定閱讀理解程度下,以閱讀速度作為劃分指標(Risse, 2014)。Rayner 等(2016)認為,語言技能對閱讀速度具有重要影響,閱讀速度是代表閱讀能力的綜合指標。故本研究采用閱讀速度作為指標對快慢讀者進行分組。記錄并整理被試閱讀理解練習部分的眼動數據,剔除正確率過低(低于85%)的被試2名,剔除閱讀過程中眨眼次數過多的被試8名,共80名被試參與分組(使用G*power3.1.9.2 計算,當統計檢驗力為0.85 時,被試樣本量為75)。本研究以練習句的總閱讀時間為指標,采用中位數法對快慢讀者進行劃分(Rayner et al., 2010),即總閱讀時間較短的一半為快速閱讀組,較長的一半為慢速閱讀組。快速讀者(M=2074 ms,SD=391 ms)與慢速讀者(M=3395 ms,SD=964 ms)之間差異顯著(t=-8.03,p<0.001,d=1.80)。
使用加拿大SR Research 公司生產的EyeLink II 眼動記錄儀,采樣頻率為500 Hz,被試機屏幕刷新率為75 Hz,分辨率為1024×768 像素。實驗時句子以宋體21 號字呈現在灰色背景上,被試眼睛距屏幕約50 cm,每個漢字約為0.8 度視角。
使用96個句子框架,每個句子框架都有高低預測性兩種目標詞。目標詞共192個,均為雙字詞,材料如表1 所示。選取不參與正式實驗的30名大學生對材料通順性和合理性進行5 點評定(1 表示“非常不通順/非常不合理”,5 表示“非常通順/非常合理”),評定結果為:高預測句子的通順性為4.05,合理性為4.23,低預測句子的通順性為4.04,合理性為4.22,高低預測性句子在通順性和合理性上均沒有顯著差異[通順性:t(190)=0.29,p=0.776; 合理性:t(190)=0.49,p=0.624]。另外選擇30名不參與正式實驗的大學生采用句子補全的方法對目標詞預測性進行評定(Taylor, 1953),評定結果為:高預測性句子中的目標詞預測性為0.51~0.95(M=0.71,SD=0.12);低預測性句子中的目標詞預測性為0.00~0.27(M=0.05,SD=0.07),兩者之間差異顯著[t(190)=44.98,p<0.001,d=6.54]。高預測性句子中的目標詞詞頻平均值為76.17 次/百萬,低預測性句子中為49.73 次/百萬,高低預測性句子中目標詞詞頻差異不顯著[t(190)=1.21,p=0.227]。

表1 實驗材料舉例
采用2(任務:閱讀理解、主題掃描)×2(預測性:高、低)×2(閱讀速度:快速讀者、慢速讀者)的混合實驗設計,其中任務和預測性為被試內變量,閱讀速度為被試間變量。采用拉丁方分配實驗材料和實驗條件。
閱讀理解任務:閱讀64個漢語句子,包括48個實驗句和16個填充句(填充句為服裝主題相關句,服裝有關的詞語可在句子任何位置)。為保證被試認真閱讀,每個句子后均設有問題句,共64個問題句,形式為是否判斷句。
主題掃描任務:閱讀64個漢語句子,包括48個實驗句和16個填充句(主題相關句),只在主題相關句后設置問題句,整個任務有16個問題句,形式為是否判斷句。
采用個別施測。被試調整下頜托高度,佩戴眼動儀,主試進行校準并提醒被試在閱讀過程中盡量不要移動頭部和眨眼。校準完成后在屏幕上出現閱讀理解任務的指導語(“請認真閱讀句子,每個句子后均有一個問題需進行是否判斷”),請被試認真閱讀后開始實驗。主題掃描任務指導語如下:“請快速瀏覽句子并判定句子類型,當句子與服裝主題相關時請認真閱讀,無關時請快速按手柄上的‘確定’鍵跳過,主題相關句后設有問題句需進行是否判斷”。主題掃描任務的程序與閱讀理解任務相同,兩種任務間進行休息以免不同任務之間產生干擾。當被試在實驗過程中眼睛追蹤誤差過大時重新進行校準。整個實驗過程大約50 分鐘(包含休息時間)。
在主題相關句閱讀上包括主題掃描和主題理解過程,因此在主題掃描任務的結果中只分析主題無關句。在數據的預處理中,刪除單個注視點注視時間小于80 ms 以及大于1200 ms 的數據(Rayner, 2009),刪除注視點個數少于5個以及多于40個的數據,刪除三個標準差以外的數據,數據最大刪除比例為4.14%。
選擇首次注視時間、凝視時間、總閱讀時間、回視路徑時間進行分析。其中,首次注視時間、凝視時間是早期指標,回視路徑時間和總閱讀時間是晚期指標。數據分析均使用R 數據分析軟件進行,具體使用線性混合效應模型(linear mixed model)進行(眼動指標均做對數轉換,同時,為了分離目標詞詞頻對眼動指標的影響將詞頻進行對數轉換后作為協變量加入模型),以復雜模型為基礎,如有未擬合情況則進行逐步簡化:首先從項目隨機效應入手進行模型簡化,如仍無法擬合,則進一步簡化被試隨機效應。結果如表2 所示。

表2 快慢讀者在不同任務中目標詞上眼動指標的平均數和標準誤(ms)
數據分析結果顯示:快速讀者回答問題正確率為93.27%,慢速讀者為94.20%,二者之間差異不顯著[t(78)=-1.10,p=0.274]。任務主效應和閱讀速度主效應在各個指標上均顯著,任務主效應:首次注視時間:b=-0.09,SE=0.01,t=-9.75;凝視時間:b=-0.12,SE=0.01,t=-10.33;總閱讀時間:b=-0.30,SE=0.01,t=-22.60;回視路徑時間:b=-0.13,SE=0.01,t=-9.19。閱讀速度主效應:首次注視時間:b=0.07,SE=0.02,t=3.02;凝視時間:b=0.07,SE=0.02,t=2.98;總閱讀時間:b=0.18,SE=0.03,t=5.74;回視路徑時間:b=0.10,SE=0.03,t=3.21。數據表現為:閱讀理解任務中的首次注視時間、凝視時間、總閱讀時間以及回視路徑時間均顯著長于主題掃描任務中;快速讀者在所有指標上均顯著短于慢速讀者。
預測性主效應在除凝視時間外的指標上均顯著,首次注視時間:b=0.02,SE=0.01,t=2.29;總閱讀時間:b=0.06,SE=0.02,t=3.09;回視路徑時間:b=0.06,SE=0.03,t=2.21。閱讀高預測性詞時的首次注視時間、總閱讀時間以及回視路徑時間均顯著短于低預測性詞。
三階交互作用在凝視時間和回視路徑時間指標上顯著,凝視時間:b=0.07,SE=0.04,t=1.97;回視路徑時間:b=0.14,SE=0.06,t=2.51,簡單簡單效應檢驗結果顯示,只有快速讀者在閱讀理解任務中表現出了預測性效應,凝視時間:b=-0.05,SE=0.02,t=-2.48;回視路徑時間:b=-0.12,SE=0.04,t=-3.39。三階交互作用在首次注視時間和總閱讀時間指標上不顯著。
本研究探討快慢讀者在較為自然的閱讀情境中對語境預測性信息的利用以及加工深度在其中發揮的作用。結果顯示,在除凝視時間外的眼動指標上均表現出了預測性主效應顯著,在各個眼動指標上均表現出了閱讀速度主效應顯著,說明本實驗對預測性和閱讀速度的操縱是有效的。同時,數據分析結果顯示,在閱讀理解任務中快慢讀者均能利用預測性信息促進詞匯加工,這與以往研究的結論一致(Ashby et al., 2005),但本研究發現快慢讀者在預測性信息利用的時間進程上有所不同:快速讀者在注視的早期階段就可以利用預測性信息,而慢速讀者在詞匯加工的晚期(總閱讀時間)才能利用預測性信息。相比于慢速讀者,快速讀者自動化產生前向推理能力較強,結果支持預測編碼框架假設。
實驗結果支持了研究推論,即預測編碼框架假設與詞匯質量假說的適用情境不同,在較為自然的閱讀情境下,快慢讀者對語境信息的利用情況符合預測編碼框架假設。本研究認為,當閱讀情境較為自然時,信息獲取和整合的連續性為讀者提供了自動化產生前向推理的條件。王穗蘋等(2009)的研究發現,在語義違背條件下,目標詞上的首次注視時間顯著長于語義一致條件,支持了中文閱讀中語義加工的即時性。同時,以往研究發現,相比于慢速讀者,快速讀者有更強的中央凹加工能力(Ashby et al., 2005)和預視能力(Chace et al., 2005; Wang et al., 2014)。得益于此,相比于低技能讀者,高技能讀者能夠更多地將注意資源用于信息的整合和理解(Kim & Goetz,1994)。在此基礎上,快速讀者能夠更加迅速地利用預測性信息促進詞匯加工,因此在詞匯加工的早期階段就表現出了預測性效應。而慢速讀者由于信息加工和整合能力較差,速度較慢,其向前產生推斷的速度較慢,因此其在較晚階段才表現出了預測性效應。
綜上所述,快速讀者得益于較強的信息加工和整合能力而能夠自動化地持續產生前向推理,其對預測性信息的利用在詞匯加工的早期階段就已經開始。而對于慢速讀者來說,由于其信息加工和整合能力較差,在詞匯加工的較晚階段才能夠利用預測性信息。實驗結果支持預測編碼框架假設,同時也驗證了本研究的推論,即閱讀情境的自然性是預測編碼框架假設成立的重要條件。
以往研究發現,任務要求會影響加工深度(Dampuré et al., 2012; Forster & Chambers, 1973;Reichle et al., 2010; Schad et al., 2012)。在主題掃描任務中,對于主題無關句,被試僅需瀏覽文本內容且沒有回答問題的壓力,這種情況下被試對文本內容的加工程度較淺(Duggan et al., 2009),而在閱讀理解任務中,被試在每個句子后都需回答相關問題,在這種任務要求下,被試需對詞匯進行更深層次的加工及語義整合(王穗蘋 等, 2009)。本研究發現,被試在完成主題掃描和閱讀理解任務時有不同的眼動表現,在主題掃描任務中注視時間更短,這與以往研究結果一致(White et al.,2015),支持了兩種任務所要求的加工深度不同的觀點。
盡管本研究在首次注視時間、總閱讀時間、回視路徑時間指標上都發現了閱讀高低預測性詞的差異,但進一步分析發現,只有快速讀者在閱讀理解任務中表現出了預測性效應,這種數據模式說明加工深度調節快慢讀者對預測性信息的利用程度。具體來說,在閱讀主題掃描任務中的主題無關句時,讀者只需判斷提取的內容要點是否與主題相關而不需要形成句子層面的表征。在這種情況下,不管讀者的閱讀能力如何,在前文加工較淺的條件下都無法有效利用預測性信息,而更加側重于依托對自下而上的信息進行加工來完成任務。而閱讀理解任務要求讀者理解句義并進行問題回答,這種情況下讀者需要對文本進行較深層次的加工,也就是說讀者需要在詞匯加工的基礎上不斷進行語義整合來完成閱讀理解。如前所述,預測性信息的可用性是基于前一個詞的后詞匯整合階段的完成,因此,閱讀理解任務所要求的加工深度為讀者利用預測性信息提供了條件。總體而言,實驗結果顯示閱讀任務類型會對快慢讀者預測性信息的利用產生影響,支持了本研究的假設,即加工深度調節快慢讀者預測性效應的大小。
本研究探討了加工深度對語境信息利用的影響,結果發現加工深度是調節快慢讀者對語境預測性利用的重要因素,而加工深度與任務類型密切相關。讀者可以根據任務需要靈活調整閱讀策略,以此來達到一種速度和深度的權衡,進而影響詞匯加工過程。這種權衡作為一種閱讀策略,其機制及運行時的調整方式還有待繼續探索,目前可以確定的是快速讀者和慢速讀者在閱讀策略的轉換上均具有靈活性。
(1)在自然閱讀情境中快速讀者能夠更早地利用預測性信息,支持預測編碼框架假設。(2)快慢讀者對預測性信息的利用受加工深度的調節。加工深度較淺時,快慢讀者均無法有效利用預測性信息。