張慢慢 張志超 臧傳麗
(1 教育部人文社會科學重點研究基地天津師范大學心理與行為研究院,天津 300387) (2 天津師范大學心理學部,天津300387) (3 學生心理發展與學習天津市高校社會科學實驗室,天津 300387)
在閱讀過程中,讀者不會從頭到尾注視每一個字或詞,有些字或詞直接被跳過,并沒有被注視,即詞跳讀(word skipping)(白學軍, 劉麗萍,閆國利, 2008)。在拼音類文字閱讀(如英文)中,約三分之一的詞會被跳讀(Rayner, 1998),研究顯示,對目標詞的跳讀會隨著詞長變短(Rayner, Slattery, Drieghe, & Liversedge, 2011)或詞頻增加(Rayner & Fischer, 1996)或語境預測性增大(Balota, Pollatsek, & Rayner, 1985)而增多。跳讀受起跳位置(launch site, 即跳向一個詞前的最后一次注視位置與該詞的距離)的影響也很大,起跳位置越近,跳讀率越高(Brysbaert & Vitu, 1998;Drieghe, Rayner, & Pollatsek, 2005)。中文閱讀過程中詞跳讀現象也非常普遍,例如單字詞的跳讀率在40%~50%之間,雙字詞的跳讀率為14%左右,三字詞的跳讀率只有4%左右(白學軍, 曹玉肖, 顧俊娟, 郭志英, 閆國利, 2011; Zang, Fu, Bai, Yan,& Liversedge, 2018),主要影響因素有筆畫數、詞長、詞頻和預測性等(Liversedge et al., 2014;Rayner, Li, Juhasz, & Yan, 2005; Zang, Fu et al.,2018)。研究表明,絕大多數被跳讀的詞都是通過副中央凹預視或者語境信息提前獲得了某種程度的加工(Zang, Zhang et al., 2018)。
那么,副中央凹詞加工到何種程度會引起跳讀?對該問題的解釋主要源于兩種理論。一種是序列注意模型(sequential attention shift, SAS)中的代表—E-Z讀者模型(Drieghe, 2008; Rayner,Ashby, Pollatsek, & Reichle, 2004; Reichle, 2011;Reichle & Drieghe, 2013; Schotter, Reichle, & Rayner,2014)。該模型認為,詞匯加工是嚴格按照序列方式進行的,每次只加工一個詞。該模型對跳讀的解釋為:對當前注視詞n完成熟悉度檢驗(L1)后,會觸發對詞n+1的第一次可變眼跳計劃(M1),同時詞n進入詞匯通達(L2)。當詞n的L2階段完成后,注意會從詞n轉移到詞n+1上,開始對詞n+1進行熟悉度檢驗(眼睛仍在詞n上),如果對詞n+1的熟悉度檢驗足夠快,而且眼跳程序仍然處于對詞n+1的第一次可變眼跳計劃中,此時就會撤銷對詞n+1的眼跳計劃,重新制定對詞n+2的眼跳計劃,詞n+1將被跳讀。該模型認為只有副中央凹詞n+1被完全識別或即將發生完全識別才會被跳讀。
另一種是注意梯度指引模型(guidance by attentional gradient, GAG)中的代表—SWIFT模型(Drieghe, Desmet, & Brysbaert, 2007; Drieghe et al.,2005; Engbert & Kliegl, 2011),該模型認為注意是按空間梯度分布在若干詞上的,詞匯加工是平行的,讀者可以同時加工若干個詞。同時眼跳是自發產生的,激活程度最大的詞會成為下一次眼跳的目標(詞的激活程度與加工難度有關)。該模型對跳讀的解釋為:在激活區域內,多個詞同時競爭加工資源,加工困難的詞會占用更多的注意資源,分配到其他詞的注意資源就會變少。加工相對容易的詞,激活程度就小,成為下一個眼跳目標的可能性越低,被跳讀的可能性就越大。該模型認為即使副中央凹詞n+1沒有被完全識別,也會被跳讀。
以上兩種模型對跳讀的爭論主要集中在被跳讀詞的加工程度上,SWIFT模型認為詞n+1即使沒有達到E-Z讀者模型假設的加工程度也會被跳讀,比如詞n+2的激活程度大時會增加詞n+1被跳讀的機會。對被跳讀詞的加工程度的考察也得到不同結論。Balota等(1985)使用邊界范式(該范式由Rayner在1975年提出,即在目標詞左邊設置一個隱形邊界,當注視點在該隱形邊界之前時,目標位置呈現可操縱的預視內容;當注視點越過該隱形邊界時,預視內容被目標詞取代)考察了預測性與副中央凹視覺信息對跳讀的影響。實驗中設置高預測詞(cake)和低預測詞(pies)兩種類型的目標詞,根據目標詞設置五種預視類型:一致預視(cake-cake, pies-pies)、詞形相似的非詞預視(cake-cahc, pies-picz)、語義相關真詞預視(cake-pies, pies-cake)、詞形不相似的非詞預視(cake-picz, pies-cahc)、違背語境的無關真詞預視(cake-bomb, pies-bomb)。其中高預測詞(即可以通過前文語境直接推測出該詞)對該詞的加工是完全的,詞形相似的非詞只提供詞的部分信息。結果顯示,詞形相似的非詞預視和一致預視的跳讀率沒有差異,表明跳讀是基于副中央凹詞的部分加工。但是Drieghe等(2005)認為該實驗材料中預視詞的平均長度較長,而英文中長詞相對于短詞更不容易被跳讀,導致整體跳讀率偏低,會產生地板效應。基于此,該研究把實驗中長度多于六個字母的詞剔除,對高預測目標詞設置了一致預視(liver)、低預測預視(heart)、語義違反的真詞預視(files)、與高預測詞形相似的非詞預視(livor)、與高預測詞形不相似的非詞預視(heant)、正字法違背的非詞預視(frhos)共六種預視條件。結果顯示一致預視下對目標詞的跳讀比詞形相似的非詞預視更高,這表明詞跳讀是基于副中央凹詞的完全加工。從以上兩個研究可以看出,詞長可能是拼音文字閱讀中關于詞跳讀加工程度研究結果不一致的原因。
拼音文字中的單詞長度分布不均勻,從1個字母長度到20多個字母長度不等(臧傳麗, 鹿子佳, 白玉, 張慢慢, 2018),在視覺空間分布上有很大變異性,由于視敏度限制,副中央凹詞的加工程度在很大程度上受單詞空間分布的制約。與之相比,中文在考察詞跳讀時可以有效避免該問題。一方面,中文文本中字與字之間沒有空格,所占的空間相同,而且在固定的單位空間內,每個漢字的字形和復雜性不同;另一方面,中文詞長相對集中,常用雙字詞占72%,單字詞占6%(臧傳麗等, 2018; Li, Zang, Liversedge, &Pollatsek, 2015)。這些特征使得中文文本單位空間內的信息密度更大,讀者在有限的空間內可能會獲得更多信息,對副中央凹詞可能有更多的預加工(王穗蘋, 佟秀紅, 楊錦綿, 冷英, 2009)。那么,在視覺空間分布相對集中、信息較密集的中文文本中,詞跳讀到底是基于副中央凹詞的部分加工還是完全加工?本研究將以中文文本為考察對象,在良好控制詞空間分布的前提下,以單字詞作為預視目標,通過使用邊界范式來操縱預視程度:高預測預視、低預測預視、與高預測詞正字法相似預視、與高預測詞正字法不相似預視。其中,正字法不相似預視條件為控制條件,沒有提供任何有效預視信息;正字法相似預視條件只提供目標詞的正字法信息(部分加工);高預測預視則提供了目標詞的全部信息(完全加工)。研究假設,根據SWIFT模型觀點,如果詞跳讀基于部分加工,那么正字法相似預視與高預測預視在跳讀率上沒有顯著差異,且正字法相似預視的跳讀率顯著高于正字法不相似預視;根據E-Z讀者模型觀點,如果詞跳讀是基于副中央凹詞的完全加工,那么高預測預視的跳讀率顯著高于正字法相似預視,且正字法相似預視的跳讀率與正字法不相似預視沒有顯著差異。
天津師范大學82名在校學生(13名男生)參加了實驗,平均年齡22±2歲。所有被試的母語為漢語,且沒有閱讀障礙。被試的視力或者矯正后的視力正常,參加實驗前均不知道本次實驗的目的。實驗后每人獲得一定報酬。
通過操縱目標詞的預視類型,形成單因素四水平(高預測性預視、低預測性預視、與目標詞正字法相似假字預視、與目標詞正字法不相似假字預視)的被試內實驗設計。
從基于電影對白編制的漢語字詞語料庫(Cai &Byrsbert, 2010)中選取36對詞(均為單字詞,且詞性為名詞)分別編入相同的句子框架中形成高預測-低預測詞對。句子的平均長度為19字,高預測性詞的詞頻為25.88±21.10次/百萬,低預測性詞的詞頻為25.34±20.05次/百萬,二者沒有顯著差異,t(35)=0.32,p>0.05。使用Windows 10系統中專用字符編輯程序分別創造出36個與目標詞正字法相似的假字以及不相似的假字。本研究參考了Drieghe等(2005)的做法(變換目標詞的倒數第二個字母來實現對正字法相似預視的操縱,正字法相似程度約為79%),通過變化1~2筆畫來實現對正字法相似預視(相似程度為88%)的操縱,其中有15個字通過增筆畫、13個字通過減筆畫、8個字保持筆畫數不變來實現。四種預視條件的筆畫數沒有顯著差異,F(3, 140)=0.06,p>0.05。實驗中使用邊界范式呈現四種預視,當注視點越過邊界時,預視詞被目標詞替代,具體示例如圖1。
請50名天津師范大學在校學生對含有高、低預測性詞的句子進行通順性評定。選用5點等級評定量表,“1”代表“非常不通順”,“5”代表“非常通順”。高預測預視的通順性(M=3.76,SD=0.43)與低預測預視的通順性(M=3.69,SD=0.39)沒有顯著差異,t(35)=1.14,p>0.05。
另請20名天津師范大學在校學生對目標詞的預測性進行評定,讓被試根據句子前半部分信息來填補后面的內容,結果顯示高預測詞被猜中的概率大于或等于50%(M=69.66%,SD=14.52%),低預測詞被猜中的概率小于6%(M=0.29%,SD=1.22%),高預測預視的預測性顯著比低預測預視高,t(35)=28.14,p<0.001。
采用加拿大SR公司生產的EyeLink1000塔式眼動儀記錄被試的眼動軌跡,該儀器的采樣率為1000 Hz,實驗材料以25號宋體呈現在電腦顯示器上,顯示器的刷新率為150 HZ,分辨率為1024×768像素,被試距離屏幕約為65 cm,每個字的視角約為 1.1°。
每個被試都是單獨施測,首先在被試機前調整到最舒服的坐姿,把下巴放在眼動儀的下巴托上。實驗開始前讓被試理解顯示屏上的指導語,然后對眼睛進行三點校準。為保證被試理解實驗過程,正式實驗之前有8個練習句,其中有4句設置“是”或“否”判斷題。正式實驗中除實驗句,還有24句填充句,同時設置20個判斷題來確定被試是否認真閱讀句子,所有句子均隨機呈現。整個實驗大約持續20分鐘。
被試閱讀理解的平均正確率為96%(SD=4%),表明被試整體上很好地理解句子的意思(其中3名被試的數據因正確率較低被剔除)。首先刪除短于80 ms或長于1200 ms的注視點。再根據以下標準(王永勝等, 2018; Zhang, Liversedge, Bai, Yan, &Zang, 2019)篩選句子:(1)刪除總注視點少于3個的句子;(2)刪除由于一些偶然因素(被試眨眼、頭動等因素)導致追蹤記錄有問題的句子;(3)刪除注視時間超過3個標準差之外的數據;(4)刪除邊界變化或注視目標詞時眨眼的數據,以及邊界變化延遲的數據。最終刪除的數據占總數據的9.51%。
分析指標包括首次注視時間、單次注視時間、凝視時間、總注視時間以及跳讀率(閆國利等, 2013)。在R語言環境下,使用R Studio(R Core Team, 2018)中的線性混合模型(Bates,M?chler, Bolke, & Walker, 2015)對眼動數據進行分析。其中,預視類型為固定因素,被試和項目為交叉隨機因素。根據馬爾可夫鏈蒙特卡羅算法(Markov-Chain Monte Carlo)得出事后分布的模型參數作為顯著性的估計值(b),能同時反映來自被試和項目中的變異(Baayen, Davidson, & Bates,2008)。在運行模型時,對注視時間指標進行log轉換,對跳讀數據直接進行logistic LMM分析。
以目標詞為興趣區,對目標詞的眼動指標進行分析(見表1)。在跳讀率上,高預測與低預測預視條件之間沒有顯著差異(b=0.14,SE=0.14,z=1.00,p=0.319);正字法相似預視條件下的跳讀率顯著高于高預測預視條件(b=0.47,SE=0.15,z=3.21,p=0.001);正字相似預視條件下的跳讀率顯著高于正字法不相似預視條件(b=0.63,SE=0.14,z=4.53,p<0.001),說明副中央凹正字法信息影響讀者對詞跳讀的決定。

表1 不同預視條件下目標詞的平均跳讀率和注視時間
盡管本實驗主要關注跳讀率上的效應,但對目標詞上的注視時間分析可以了解不同預視類型對副中央凹信息加工的影響。結果顯示,在首次注視時間、單次注視時間和凝視時間上,高預測與低預測預視之間沒有差異(|t|s<0.87,ps>0.05),但是低預測預視下的總注視時間顯著長于高預測預視(b=0.09,SE=0.04,t=2.22,p=0.027)。在所有時間指標上,正字法相似預視與高預測預視以及正字法不相似預視與高預測預視均沒有顯著差異(|t|s<0.89,ps>0.05),正字法相似與正字法不相似條件也沒有顯著差異(|t|s<1.29,ps>0.05)。
Brysbaert和Vitu(1998)研究發現跳讀與起跳位置有密切的關系。為更明確起跳位置對跳讀的影響,按照中位數(1.28字)把起跳位置分成遠(M=2.49,SD=1.21)和近(M=0.67,SD=0.36)兩個類別再進行分析(結果見表2)。結果顯示起跳位置近時對目標詞的跳讀率顯著高于起跳位置遠的情況(b=1.46,SE=0.11,z=13.71,p<0.001)。起跳位置與預視類型(高預測vs.正字法相似)之間有邊緣顯著交互作用(b=0.48,SE=0.27,z=1.84,p=0.066),然而貝葉斯分析結果并不支持該交互作用。也沒有發現其他預視類型與起跳位置的交互作用(|z|s<1.47,ps>0.05)。

表2 不同預視條件下起跳位置遠和近時的跳讀率
本研究考察中文閱讀中詞跳讀是基于副中央凹信息的完全加工還是部分加工。結果顯示正字法相似預視下對目標詞的跳讀率顯著高于正字法不相似預視,且不受起跳位置的影響。以往研究采用邊界范式在時間指標上穩定地發現了預視效應(白學軍, 劉娟等, 2011; Schotter, Angele, &Rayner, 2012),而本研究卻沒有在時間指標上發現該效應。由于本研究關注詞跳讀問題,選用單字詞以期獲得充足的跳讀數據,然而注視和跳讀是一種權衡關系(trade-off),對目標詞跳讀越多則意味著獲得注視越少。結果確實發現單字詞的跳讀率非常高,平均為0.54,導致時間指標上的數據相對較少,這可能是沒有發現典型預視效應的原因。事后分析發現,在首次注視時間上的統計檢驗力為0.13,單次注視時間上的統計檢驗力為0.28,凝視時間上的統計檢驗力為0.20,總注視時間上的統計檢驗力為0.65。在跳讀率上典型預視效應的統計檢驗力接近1.00。這表明,在跳讀率上的統計檢驗力足夠強(統計檢驗力不低于0.8表示足夠,小于0.8表示不足),結果非常可靠;但同時也意味著在注視時間指標上沒有發現典型的預視效應極可能是由統計檢驗力不夠所造成的。
本研究發現正字法相似預視下對目標詞的跳讀率顯著大于正字法不相似預視,而Drieghe等(2005)發現正字法相似預視與正字法不相似預視在跳讀率上沒有差異。這種差異可能由中文文本與拼音文字的書寫特性不同所致。與拼音文字相比,中文文本之間沒有空格,視覺信息空間分布相對集中和密集,中文讀者可以提取更多的副中央凹信息(王穗蘋等, 2009)。本研究中正字法相似預視與目標詞的相似程度很高,意味著中文讀者可以提取到更多正字法信息,進而造成讀者對相似預視的跳讀高于不相似預視。結合假設,如果詞跳讀是基于副中央凹信息的完全加工,那么高預測預視的跳讀率顯著高于正字法相似預視;如果詞跳讀基于部分加工,則二者沒有差異。但出乎意料的是,本研究發現正字法相似預視下的跳讀率顯著高于高預測預視,這表明被試并沒有根據完全的詞匯識別進行跳讀。本研究試圖尋找可能的影響因素,比如起跳位置,盡管正字法相似與高預測以及正字法相似與正字法不相似下的跳讀率差異在起跳位置近時有大于起跳位置遠的趨勢,但是并沒有達到統計學上的顯著,即起跳位置沒有顯著調節副中央凹預視對跳讀的影響。造成該結果的原因目前還不清楚,但至少該結果說明相似的正字法信息足夠引起讀者跳讀,否則相似預視下對目標詞的跳讀不會高于不相似預視。以后還需要更進一步的研究來驗證。
另外,實驗還假設,如果高預測預視下的跳讀率顯著高于低預測預視,則說明預測性在副中央凹信息加工中發揮了作用,讀者可以利用語境信息在副中央凹中完全識別該詞。然而結果沒有發現高預測與低預測在跳讀率上有顯著差異,這與Rayner等(2005)的研究結果不同。原因可能是,該研究的材料是中文雙字詞,而本研究中使用的是中文單字詞,單字詞的跳讀率很高(Liversedge et al., 2014),在本研究中,高、低預測預視條件下的跳讀率達到50%以上,且當起跳位置近時,高預測和低預測的跳讀率達到60%左右。如此高的跳讀率,可能造成了天花板效應,導致高、低預測預視條件下的跳讀率差異不明顯。但高預測條件下的總注視時間顯著低于低預測條件,這說明預測性在詞匯加工晚期階段比較明顯。
拼音文字閱讀研究顯示,詞長可能是導致詞跳讀問題研究結論不同的原因,本研究對副中央凹預視的操縱限制在單字詞空間內,避免了詞長可能帶來的影響,結果顯示正字法相似的跳讀率顯著高于正字法不相似,這在一定程度上符合SWIFT模型對詞跳讀的解釋(Engbert & Kliegl, 2011)。根據SWIFT模型,在知覺廣度里的詞可以同時被加工,詞的激活程度是一個動態過程:先上升,達到峰值,再下降;激活程度與詞的加工難度有關:容易加工的詞,其激活程度較低;難度最大的詞,其激活程度最大,更容易成為下一個眼跳目標(Drieghe et al., 2005)。相對于正字法不相似預視,正字法相似預視加工更容易,其激活程度相對較低,被跳讀的概率更高。根據E-Z讀者模型,只有對詞n+1完成了詞匯通達,達到完全加工,才會取消對詞n+1的眼跳計劃,即對詞n+1產生了跳讀(Reichle & Drieghe, 2013)。按此推測,相似預視下對目標詞的跳讀率應低于高預測預視,且相似預視與不相似預視下的跳讀率沒有差異。然而,本研究發現相似預視下對目標詞的跳讀率并沒有低于高預測預視,且相似預視下的跳讀率高于不相似預視,該結果不支持E-Z讀者模型的觀點。
Drieghe等(2005)在操縱正字法相似預視時,只改變了高預測詞中的一個字母卻導致了比高預測條件更低的跳讀率。而本研究通過類似的操縱,即在漢字筆畫數整體上增加或減少1~2畫或只對筆畫進行變化(不增加也不減少筆畫數),卻沒有發現相似的結果。本研究認為,正字法相似預視提供的正字法信息導致了部分加工,實驗結果也發現正字法相似預視的跳讀率顯著高于正字法不相似預視,從理論上而言,該結果支持部分加工的觀點。然而,目前還不能直接做出定論。根據Yan等(2012)關于省筆畫對中文句子閱讀的研究,省略15%筆畫數的漢字與正常漢字有著一樣的平均閱讀時間,這意味著刪除一定量的筆畫數不影響整體閱讀。而且,中文的表意特性使得中文讀者對漢字的識別可以從形直接激活義(陳寶國, 王立新, 彭聃齡, 2003)。而本研究中對正字法相似預視的操縱使筆畫數的增加量、減少量或變化量約占目標詞筆畫數的11.83%。從這一角度來看,本研究中的正字法相似預視被讀者加工的程度可能會接近或等同于目標字,即接近完全加工的程度,從而導致正字法相似預視的跳讀率顯著高于正字法不相似預視。未來研究需要更細致地操縱副中央凹信息類型以區別不同類型信息的加工程度,進一步探討中文跳讀是基于副中央凹詞的部分還是完全識別。
在本實驗條件下得出以下結論:在中文閱讀中,從副中央凹提取的正字法信息足夠引起讀者作出跳讀的決定,在一定程度上支持詞跳讀是基于部分加工的觀點。