特征和位置信息在價值驅動注意捕獲中的作用*

2016-02-01 17:43:56白學軍郭志英

心理學報 2016年11期

白學軍劉麗,2 宋娟郭志英

(1天津師范大學心理與行為研究院, 天津 300074) (2天津商業大學心理系, 天津 300134)

1 引言

視覺場景中通常包含大量的信息, 而大腦加工這些信息的能力有限, 所以需要選擇一些信息進行加工(Reynolds, Chelazzi, & Desimone, 1999)。注意選擇決定了哪些信息能夠獲得加工并進入到更高級的認知過程, 如推理、決策和記憶存儲。人類的注意系統選擇和抑制信息, 偏向任務相關或高度突顯的客體和特征(Corbetta & Shulman, 2002;Serences & Yantis, 2007)。目標驅動和突顯驅動的注意選擇都具有適應價值(Chelazzi, Perlato, Santandrea,& Della Libera, 2013), 能夠使總體利益最大化(Laurent, 2008)。

但是, 在某種情境中, 最具價值的刺激既不是當前任務目標, 在物理上也不具有突顯性。這種情況下, 如果注意選擇只考慮目標和突顯因素將會使個體失去獲得價值的機會。所以, 為了更好地生存,注意系統選擇和價值相聯結的刺激具有重要意義(Anderson, 2013)。價值的形成主要是通過將刺激與金錢獎勵建立聯結來實現, 與獎勵相聯結的刺激特征對注意選擇的影響體現在以下三個方面：

第一, 與獎勵相聯結的刺激特征能夠啟動注意選擇。表現為在啟動范式的搜索任務中, 和高獎勵相聯結的刺激特征能夠增加試次間啟動(Hickey,Chelazzi, & Theeuwes, 2010; Kristjánsson, Sigurjónsdóttir,& Driver, 2010)。例如, Hickey等(2010)讓被試搜索形狀奇異項目標, 其中一個非目標形狀為物理突顯的顏色奇異項分心物。被試在n-1試次中正確識別形狀奇異項目標會隨機獲得高或低的金錢獎勵。在n試次中, 目標與分心物的顏色與n-1試次中目標和分心物的顏色是重復的或互換的, 且反應不再伴隨金錢獎勵。結果表明在高獎勵后出現大的啟動效應, 而在低獎勵后啟動效應消失或反轉。

第二, 獎勵能夠調節目標選擇的有效性。與獎勵相聯結的刺激特征在快速系列視覺呈現任務(Raymond & O’Brien, 2009; Yokoyama, Padmala, &Pessoa, 2015)和視覺搜索任務中(St?rmer, Eppinger,& Li, 2014)能夠促進目標的選擇, 并減少任務無關信息的抑制(Krebs, Boehler, & Woldorff, 2010)。例如, Raymond和O’Brien (2009)的研究中, 在訓練階段, 被試學習把不同的面孔和不同的金錢獎勵結果建立聯結。這些面孔在接下來的注意瞬脫任務中作為目標出現。以前和高金錢獎勵或高金錢損失相聯結的面孔當作為第二個目標出現時, 相對其它面孔能夠更加正確的被報告, 表明它們獲得了高的注意優先性。

第三, 以往獎勵學習中和獎勵建立聯結的刺激特征, 當不再能夠預測獎勵結果時仍然能夠無意識的捕獲注意(Anderson, Laurent, & Yantis, 2011a,2011b)。Anderson等(2011b)采用訓練?測試兩階段范式, 在訓練階段要求被試在6個不同顏色的圓環中搜索紅色或綠色的目標圓環, 并對目標圓環里的線段方向(水平或垂直)進行判斷, 被試在規定的時間內正確反應將會獲得高(10￠)或低(1￠)的金錢獎勵反饋。重要的是, 在訓練階段將不同的顏色分別和高、低兩種金錢獎勵建立聯結。如：對于一半被試來說, 對紅色目標進行反應在80%的試次中會獲得高獎勵, 在20%的試次中會獲得低獎勵; 對綠色目標進行反應在80%的試次中會獲得低獎勵, 在20%的試次中會獲得高獎勵。另一半被試恰恰相反。Anderson等(2011b), Anderson (2013)認為, 被試在訓練階段學習將每個目標顏色和一種獎勵結果建立聯結, 其中一種顏色相對于另一種顏色能夠獲得更高的金錢獎勵。在訓練階段之后, 被試完成測試階段, 測試任務中被試搜索一個物理突顯的形狀奇異項(如, 很多個方形中的唯一一個圓形), 并對目標形狀里的線段方向進行判斷。搜索任務包括6個不同顏色的形狀刺激。在50%的試次中, 其中一個非目標形狀的顏色為訓練階段和獎勵建立聯結的顏色(紅色或綠色), 要求被試忽視顏色特征,并且反應后不再給予獎勵反饋。結果發現訓練階段和高獎勵相聯結的刺激特征當在測試階段作為分心刺激出現時, 即使不具有突顯性, 并且是任務無關的, 仍然能夠捕獲注意。這種效應只能歸結為訓練階段的顏色?獎勵聯結, 和高獎勵聯結的刺激特征獲得了注意優先性。ERP的N2pc指標也表明這種捕獲是無意識的、基于空間的(Qi, Zeng, Ding, &Li, 2013)。這種現象叫作價值驅動的注意捕獲, 是一種獨立于突顯驅動和目標驅動的注意選擇機制(Anderson et al., 2011b)。訓練任務中和獎勵相聯結的刺激所產生的捕獲效應可泛化到其它任務中(Anderson, Laurent, & Yantis, 2012; Lee & Shomstein,2014); 并且, 訓練階段學習到的刺激?獎勵聯結效應可以保持很長時間(Anderson & Yantis, 2013;Della Libera & Chelazzi, 2009)。個體不僅能夠將任務相關特征和獎勵建立聯結, 也能夠將任務無關特征和獎勵建立聯結(Mine & Saiki, 2015)。

以上關于獎勵影響注意選擇的研究都是將獎勵和低水平的視覺特征建立聯結。被試所獲得的獎勵依賴于顏色搜索任務(Anderson et al., 2011a,2011b; Sali, Anderson, & Yantis, 2014)和stroop任務中(Krebs et al., 2010)的顏色、負啟動任務或形狀搜索任務中的形狀(Della Libera & Chelazzi, 2009;Wang, Yu, & Zhou, 2013)、方向搜索任務中的方向(Laurent, Hall, Anderson, & Yantis, 2015; Lee &Shomstein, 2014), 而不考慮它們呈現的位置。Camara, Manohar和Husain (2013) 使用眼動技術考察了獎勵對位置選擇的影響。眼動研究采用雙任務范式, 每個試次開始時, 被試將眼睛定位到兩個位置(同樣顏色的兩個圓)中的一個。定位到其中一個位置會獲得獎勵, 定位到另外一個位置會獲得懲罰,被試在進行眼動前不能預測獎勵結果。獎勵反饋后,被試需要完成第二個視覺搜索試次, 將眼睛移動到綠色目標上, 同時忽略粉色的分心物。結果表明當分心物出現在前一個試次被獎勵的位置時, 被試的眼動指向分心物位置的可能性增加, 這表明獎勵能夠獨立于特征而啟動位置。Hickey, Chelazzi和Theeuwes (2014)采用了相同的啟動范式, 反應時結果表明當目標選擇獲得了獎勵結果時, 注意在接下來會返回到目標位置, 并從以前突顯的、任務無關的分心物所在的位置轉移。這些結果表明獎勵能夠通過啟動視覺刺激的空間位置來引導視覺搜索。獎勵不僅引發了眼跳行為, 而且引發了內隱的注意或知覺表征的分配。

采用訓練?測試兩階段范式, Chelazzi等(2014)發現通過聯結性的獎勵學習能夠引發注意偏向更加具體的空間位置。他們將空間劃分為8個具體的位置(以方框標志), 在訓練階段, 將出現在不相鄰的兩個特定位置的目標與相對高的金錢獎勵建立聯結時, 發現測試階段在兩個高獎勵位置出現的目標能夠更快的, 更正確的被報告。他們認為基于獎勵的學習會導致空間優先性地圖發生變化, 這種變化是長期的、無意識的。但是, Chelazzi等(2014)的研究中測試階段采用的是快速搜索任務, 并且需要被試在兩個目標同時出現的境況下的進行競爭反應, 并沒有考察當分心物出現在高獎勵位置時是否會捕獲注意。

所以, 本研究的第一個目的是采用訓練?測試范式, 考察是否存在基于具體位置的價值驅動的注意捕獲效應。在實驗1中, 訓練階段將不同的具體位置分別和高、低金錢獎勵建立聯結, 而其余的位置不和獎勵建立聯結。在測試階段考察當分心物出現在高獎勵位置時, 和出現在其它位置時相比能否產生捕獲效應。

雖然已有研究表明聯結性的獎勵學習能夠分別影響刺激特征和空間位置的注意優先性, 但是兩者結合在一起時將怎樣影響注意偏向？Anderson(2015b)探討了這個問題：在訓練階段, 將顏色和空間位置信息聯合起來進行學習, 例如, 對左半部出現的紅色目標進行正確反應伴隨著高獎勵反饋, 而對右半部出現的綠色目標進行正確反應伴隨著低獎勵反饋, 在隨后的測試階段發現, 只有高獎勵顏色出現在高獎勵位置時才能捕獲注意, 而高獎勵顏色出現在低獎勵位置時不能捕獲注意。他采用相同的實驗范式, 將空間位置信息換成空間情境信息也得到了相似的結果(Anderson, 2015a)。例如, 被試在測試階段對森林情境中的紅色目標進行反應伴隨著高獎勵反饋, 而對城市情境中紅色目標反應伴隨著0獎勵反饋, 對于綠色目標來說恰恰相反, 在測試階段發現只有高獎勵顏色出現在高獎勵情境下才能產生注意捕獲效應。因此, 他認為, 顏色特征產生的注意捕獲效應受到空間信息的調節。但是,我們認為, Anderson (2015a, 2015b)的研究雖然將刺激特征和空間信息結合起來考察兩者在價值驅動的注意捕獲中的交互作用, 但是存在缺陷。在測試階段, 顏色分心物不是出現在高獎勵位置(或情境),就是出現在低獎勵位置(或情境), 而沒有設置顏色分心物出現在中性獎勵位置(或情境)的條件。

所以, 本研究的第二個目的是改進Anderson(2015b)的實驗設計, 在訓練階段將顏色和具體的空間位置聯合起來與獎勵建立聯結, 但是在測試階段將顏色和位置獨立開來, 考察當與高獎勵相聯結的顏色出現在中性位置時能否捕獲注意。已有研究表明聯結性的獎勵學習對注意的影響具有泛化性,能夠轉移到不同的刺激和情境下, 當訓練階段和測試階段的刺激、任務要求、反應方式不同時, 仍然能夠發現注意捕獲效應(Anderson et al., 2012)。這種基于價值的注意選擇的泛化具有適應性, 使有機體能夠在新情境中最大化的利用之前的學習。在此基礎上, 我們預測實驗2中, 顏色將能夠獨立于空間位置而產生價值驅動的注意捕獲效應。

2 實驗1

實驗1的范式是將Chelazzi等(2014)與Anderson(2015b)的范式相結合。將空間位置劃分為8個區域。在訓練階段, 8個區域的每個區域內分別出現一個有顏色的圓環, 被試在不同顏色的非目標圓環中搜索一個紅色的圓環, 并對圓環里的線段方向進行判斷。每個試次正確反應后會獲得金錢獎勵反饋,其中兩個不相鄰位置和高獎勵建立聯結, 而另外兩個不相鄰位置和低獎勵建立聯結, 其余的4個位置不出現目標, 也就是不與獎勵建立聯結(例子見圖1)。告知被試目標出現的位置, 但是不告知被試目標位置與獎勵的聯結規律。測試階段采用形狀奇異項搜索任務, 被試在8個不同顏色的圖形中搜索一個唯一的圖形, 圖形分布的位置與訓練階段相同。告知被試目標出現在和測試階段不同的另外4個位置上,這樣就保證在測試階段, 顏色和位置信息都是任務無關的。在一半試次中, 其中一個非目標的形狀顏色為紅色。告訴被試顏色是任務無關的需要忽略,而且目標永遠不是紅色的。在測試階段沒有獎勵反饋。

圖1 實驗1位置?獎勵聯結示意圖

在實驗1中我們想考察紅色分心物的出現是否會捕獲注意, 使搜索目標的反應時變慢。如果學習到的價值增加了處于高獎勵位置的目標的物理突顯性, 那么在測試階段, 分心物出現在高獎勵聯結位置相對于分心物出現在其它位置來說能夠產生注意捕獲效應。

2.1 研究方法

2.1.1 被試

20名本科生參加實驗(男生7名, 女生13名,平均年齡為19.60 ± 0.82歲, 年齡跨度為19～22歲)。所有被試的視力或矯正視力正常, 無色盲或色弱。訓練階段所獲得的獎勵反饋作為被試的報酬, 平均為51.95元。所有被試先完成訓練任務, 休息10 min后完成測試任務。

2.1.2 實驗儀器

實驗刺激呈現在17寸聯想臺式計算機上, 屏幕分辨率為1024×768, 背景為黑色。采用E-prime 2.0編程。被試在微亮的實驗室里單獨參加測試, 眼睛距離屏幕約55 cm。

2.1.3 訓練階段

刺激

每個試次由注視屏、搜索屏和反饋屏組成(見圖2A)。注視屏為呈現在屏幕中心的白色注視點“+” (0.63°× 0.63°), 搜索屏為中心注視點和周圍8個不同顏色的圓環(直徑2.14°), 圓環粗4磅(0.13°)。8個圓環組成一個虛擬的大圓(直徑為11.42°), 每個圓環中心距離中心注視點為4.73°。每相鄰兩個圓環間距離相等, 圓環分別處于中心注視點的垂直線順時針和逆時針旋轉22.5°、67.5°、112.5°和157.5°。目標是紅色圓環(RGB, 255, 0, 0),在每個試次中都出現, 非目標圓環的顏色分別為綠色、藍色、粉色、橘色、黃色、白色和紫色。每個圓環里包含一個白色線段(1.30°×0.11°), 目標圓環里的線段為垂直或水平, 非目標圓環里線段的方向可能是向左或右傾斜45°, 也可能是水平或垂直,隨機選擇。反饋屏呈現本試次所獲得的金錢獎勵的數量和累積的總獎勵數量。

設計

目標出現在8個位置中的4個位置, 被試在規定的時間內對目標圓環中的線段進行正確判斷將會獲得金錢獎勵(獎勵與位置的聯結見圖1)。為了消除位置對搜索目標的影響, 同時保證在測試階段高、低獎勵位置在不同被試間是不固定的, 獎勵和位置的聯結有4種方式：分別為左上、左下?高獎勵, 右上、右下?低獎勵; 右上、右下?高獎勵,左上、左下?低獎勵; 左上、右上?高獎勵, 左下、右下?低獎勵; 左下、右下?高獎勵, 左上、右上?低獎勵。將20名被試平均分配到4種條件下, 每種條件下5名被試。在高獎勵條件下, 80%的試次得到0.15元反饋, 20%的試次得到0.01元反饋, 低獎勵條件則相反。但是告知被試獎勵是依據反應時分配的, 正確反應越快, 越有可能得到高獎勵。目標永遠不會出現在其它4個位置, 我們把這些位置叫做中性位置, 被試不能預測目標出現在這些位置將會獲得什么樣的獎勵。中性位置和目標位置交替分布。

圖2 實驗流程示意圖

程序

訓練階段包含12個block共672個正式試次和1個block的56次練習。實驗流程如圖2A所示, 每個試次開始是呈現注視點, 呈現時間在400～600 ms之間隨機變化。然后呈現搜索屏, 時間為1500 ms或直到被試反應, 如果被試沒有及時反應則認為是超時, 計算機自動進入下一個步驟。搜索屏后是1000 ms的空屏, 然后是1500 ms的獎勵反饋, 隨后是1000 ms的空屏, 然后呈現下一個試次。要求被試將左右手的食指分別放在“c”和“m”鍵上, 垂直按“c”鍵, 水平按“m”鍵。正確的反應伴隨著0.15元或0.01元的獎勵, 獲得哪種獎勵依賴目標所在的位置。反應錯誤會得到“錯誤”的反饋提示,反應太慢(沒有在1500 ms之內進行反應)會得到“反應太慢”的反饋提示, 呈現時間也為1500 ms。被試在每個block之間可以進行短暫休息。訓練階段約60 min。練習試次不提供金錢獎勵的反饋, 只提供正確與否的反饋, 目的是為了讓被試熟悉反應規則。

2.1.4 測試階段

刺激

每個試次包含注視屏、搜索屏和反饋屏(如圖2B所示)。注視屏與訓練階段相同。搜索屏為8個不同顏色的圖形, 呈現位置與訓練階段相同,可能是7個方形(對角線為2.62°)和1個圓形(直徑為2.14°), 或者是7個圓形和1個方形, 目標是唯一的形狀奇異項(方形或圓形), 測試階段中非目標圖形的顏色在訓練階段的基礎上增加了藍綠色。在一半試次中, 其中一個非目標形狀的顏色被訓練階段和獎勵建立聯結的目標顏色(紅色)所取代, 叫做有價值的分心物。如果被試反應正確, 不給予反饋,如果被試反應錯誤或者反應超時, 會有“錯誤”或“反應太慢”的提示。

設計

在測試階段, 目標隨機呈現在4個中性位置上。當目標呈現在其中一個位置時, 分心物隨機出現在其它7個位置。目標為方形或圓形的次數相等且在試次間隨機變化。在一半試次中會出現紅色(有價值的)分心物, 一半試次中不出現紅色分心物。

程序

測試階段包含6個block共336次正式試次和1個block的56次練習。練習時紅色分心物不出現, 對被試的反應是否正確給予反饋, 正式實驗不再給予反饋。實驗流程圖如圖2B所示, 每個試次開始呈現注視點, 在400～600 ms之間隨機變化。然后呈現搜索屏, 呈現時間為1500 ms或者直到被試反應, 如果被試沒有及時反應則認為是超時,計算機自動進入下一屏。然后是1000 ms的空屏,然后呈現下一個試次。在指導語中告知被試測試階段的任務和訓練階段無關, 告知被試目標出現在中性位置, 要求被試忽略顏色。反應和按鍵規則與訓練階段相同。被試在每個block之間可以進行短暫休息。測試階段約30 min。

2.1.5 實驗結束后的問題

在實驗結束后, 給被試呈現空間位置示意圖,要求被試對訓練階段的獎勵?位置聯結進行自由選擇。

2.1.6 數據分析

刪除每個被試正負3個標準差以外的數據, 刪除的數據占總數據的1.08%。對正確反應時和錯誤率進行分析。

2.2 結果

表1 實驗1和2訓練階段目標位置的平均反應時(ms)和錯誤率(%)

圖3 實驗1測試階段各種位置上的反應時(A)和錯誤率(B)

對附加問題進行統計, 表明在20個被試中有6人能夠完全正確的回答獎勵與位置的聯結; 有7人能夠進行部分正確的聯結; 有5人放棄填寫; 另外2人進行錯誤的聯結。

2.3 討論

實驗1結果表明當分心物出現在高獎勵聯結位置時能夠捕獲注意, 而分心物出現在低獎勵聯結位置時和無分心物條件下的反應時沒有差異, 不能捕獲注意。另外, 我們也發現, 當分心物出現在兩個高獎勵位置之間的中性位置時也能夠捕獲注意, 這表明高獎勵位置所獲得的注意捕獲效應能夠泛化到特定的鄰近位置。這與Chelazzi等(2014)的研究結果不一致, 他們的結果表明兩個高獎勵位置之間的位置不能獲得注意優先性。對于本研究中出現的位置泛化可有兩種解釋。第一, 在訓練階段, 我們將兩個不相鄰位置和高獎勵建立聯結, 雖然在指導語中明確告知被試目標不會出現在中性位置, 但是被試在進行學習時采用了簡單化原則, 將兩個位置之間的區域作為一個整體, 與高獎勵反饋建立了聯結, 因而提高了整個區域的注意優先性。第二, 這種注意捕獲效應是在測試階段出現的。高獎勵聯結的位置獲得了注意優先性, 增加了處在這個位置的特征的突顯性。被試在測試階段將注意轉移到了高獎勵位置的刺激, 而在高獎勵位置附近的位置呈現的刺激也連帶捕獲了注意, 而處在中間的位置能夠同時獲得相鄰兩個高獎勵位置的擴散效應, 因而產生了顯著的注意捕獲效應。以往研究也表明, 價值驅動的注意捕獲效應能夠擴散到鄰近的空間位置(Wang, Duan, Theeuwes, & Zhou, 2014)。而Chelazzi等(2014)的研究中, 訓練階段, 目標出現在所有位置, 當出現在我們研究范式中的中性位置時, 獲得高、低獎勵的幾率各有50%。也就是說, 被試在訓練階段已經將這些位置和中等程度的獎勵建立了聯結, 這些位置并不是中性的, 所以被試在訓練階段無法再將兩個位置之間的區域作為一個整體, 在測試階段高獎勵聯結位置所獲得的注意優先性也無法擴散到這些位置。所以, 實驗1所設置的中性位置并不都是中性的, 根據第一種解釋, 只有高低獎勵位置之間的位置才是中性位置(被試也將低獎勵位置之間的區域作為一個整體, 與低獎勵建立了聯結); 根據第二種解釋, 高低獎勵之間的位置和低獎勵之間的位置都是中性位置。總的來說, 實驗1結果表明, 將獎勵反饋與更加具體的位置建立聯結,不僅能夠使注意偏向這些具體位置, 還能偏向特定的鄰近位置, 價值驅動的注意捕獲效應在位置上表現出一定程度的泛化。

3 實驗2

在實驗1范式的基礎上, 我們設計了實驗2。在訓練階段被試將顏色?位置聯合起來與獎勵建立聯結。例如, 其中兩個不相鄰位置出現的紅色目標和高獎勵反饋建立聯結, 而另外兩個不相鄰位置出現的綠色目標和低獎勵反饋建立聯結。測試階段的任務與實驗1基本相同, 區別是在1/3試次中, 訓練階段的目標顏色不出現; 在1/3試次中, 其中一個非目標形狀的顏色被訓練階段的高獎勵顏色替代; 在剩下1/3試次中, 其中一個非目標形狀的顏色被訓練階段的低獎勵顏色替代。有價值的顏色分心物可能出現在高獎勵聯結位置、低獎勵聯結位置或中性位置。

在實驗2中我們想考察顏色和位置在價值驅動注意捕獲中的交互作用。如果顏色能夠獨立于位置而產生價值驅動的注意捕獲效應, 那么高獎勵顏色不僅出現在高獎勵位置時能夠捕獲注意, 出現在高低獎勵之間的中性位置時也能夠捕獲注意。

3.1 方法

3.1.1 被試

沒有參加過實驗1的24名大學生參加了實驗2(男生9名, 女生15名, 平均年齡為19.83 ± 0.96歲, 年齡跨度為19～22歲)。所有被試的視力或矯正視力正常, 無色盲或色弱。訓練任務所獲得的獎勵反饋作為被試的報酬, 平均為33.74元。所有的被試先完成訓練任務, 休息10 min后完成測試任務。

3.1.2 儀器

儀器同實驗1。

3.1.3 訓練階段

刺激

與實驗1相同, 每個試次包含注視屏、搜索屏和反饋屏。與實驗1的區別僅在于目標為紅色或綠色的圓(實驗1目標只有紅色的圓), 在每個試次中隨機出現。

設計

顏色和位置不能單獨預測獎勵, 獎勵的高低由目標顏色和目標位置的聯合特征所預測。位置與獎勵的聯結規律與實驗1相同, 但是增加了顏色。如, 對于一些被試來說, 對出現在左上和左下位置的紅色目標反應伴隨高獎勵反饋, 對出現在右上和右下位置的綠色目標反應伴隨著低獎勵反饋(如圖4所示)。與實驗1相似, 為了平衡目標位置和顏色對搜索反應時的影響, 我們將顏色和位置與獎勵的聯結分為8種條件, 每種條件下分配3名被試。

圖4 實驗2顏色、位置?獎勵聯結示意圖

程序

與實驗1相同。區別是訓練階段包含8個block共448個正式試次和1個block的56次練習。訓練階段約40 min。

3.1.4 測試階段

刺激

每個試次包含注視屏、搜索屏和反饋屏,與實驗1相同。不同之處在于有價值的分心物為紅色或綠色(實驗1只有紅色), 隨機出現, 位置隨機分配。

設計

與實驗1相同。區別在于在1/3試次中出現高獎勵聯結顏色分心物, 1/3試次中出現低獎勵聯結顏色分心物, 1/3試次中不出現有價值的分心物。

程序

與實驗1相同。區別在于實驗2測試階段由9個block共504次正式試次和1個block的56次練習組成。測試階段約45 min。

3.1.5 實驗結束后的問題

在實驗結束后, 給被試呈現空間位置示意圖,要求被試對訓練階段的顏色、位置?獎勵聯結進行自由選擇。

3.1.6 數據分析

刪除每個被試正負3個標準差以外的數據, 刪除的數據為總數據的1.12%。對正確反應時和錯誤率進行分析。

3.2 結果

圖5 實驗2各種位置上的反應時(A)和錯誤率(B)

對錯誤率進行了同樣的分析, 2(顏色：高獎勵和低獎勵)×5(位置：高獎勵、高之間、高低之間、低獎勵、低之間)重復測量方差分析結果表明主效應和交互作用均不顯著; 將測試階段呈現在每個位置上的3種分心物條件(高獎勵顏色分心物、低獎勵顏色分心物、無分心物)下的錯誤率分別進行單因素重復測量方差分析, 結果表明主效應均不顯著(結果見圖5B)。

對附加問題進行統計, 表明在24個被試中有10人能夠完全正確的預測獎勵與顏色和位置之間的聯結; 有6人能夠進行部分正確的聯結; 有8人放棄選擇, 表示沒有印象。

3.3 討論

實驗2中, 訓練階段將顏色和位置信息聯合起來分別和高、低獎勵建立聯結, 結果表明只有高獎勵聯結顏色出現在高獎勵位置和高獎勵位置之間的中性位置時能夠捕獲注意, 而低獎勵顏色出現在高獎勵位置或高獎勵位置之間的中性位置或者高獎勵顏色出現在低獎勵位置都不能捕獲注意。對于高獎勵顏色出現在高獎勵之間的中性位置能夠捕獲注意, 這個結果與實驗1結果一致, 說明高獎勵之間的中性位置獲得的捕獲效應并不是由于高獎勵顏色所引起的, 而是由于位置本身引起的泛化。重要的是, 我們發現, 高獎勵聯結顏色分心物出現在高、低獎勵位置之間的中性位置時不能捕獲注意,這說明個體在學習階段所獲得的聯合特征不能泛化到獨立特征上。總的來說, 實驗2表明高獎勵顏色不能獨立于高獎勵位置而捕獲注意, 不支持價值驅動在不同特征之間的泛化。

4 總討論

本研究表明當出現在某個空間位置的刺激特征(顏色)和高的金錢獎勵反饋建立聯結時, 在隨后的任務中, 刺激特征只有呈現在高獎勵位置或者高獎勵位置之間的中性位置時才能捕獲注意。而且當將顏色特征和空間位置聯合起來進行學習時, 在測試階段發現只有高獎勵顏色特征出現在高獎勵位置和高獎勵位置之間的中性位置時才能捕獲注意,而當高獎勵聯結顏色特征出現在高低獎勵之間的中性位置時則不能捕獲注意。

在實驗1中, 訓練階段, 同一個紅色特征目標出現在某兩個位置時選擇性的伴隨高獎勵反饋, 而出現在另兩個位置時伴隨低獎勵反饋。在測試階段,發現擁有這個特征(紅色)的分心物出現在高獎勵位置時能夠捕獲注意。這與Anderson (2015b)采用左右兩半部位置的研究結果一致。他們的研究結果表明, 只有獎勵聯結分心物出現在高獎勵部分時能夠捕獲注意, 而出現在低獎勵部分時不能捕獲注意,確實存在基于位置的價值驅動的注意捕獲。在實驗1中, 我們通過實驗設計將空間位置進行了更加具體的劃分, 結果表明價值驅動的注意捕獲不僅出現在具體的空間位置, 而且也出現在特定的鄰近空間位置。這個結果拓展了Chelazzi等(2014)的研究, 不僅在快速識別的競爭性任務中和高獎勵聯結位置作為目標時能夠促進反應, 當作為分心物時也能夠干擾對目標的搜索, 產生注意捕獲效應。并且, 這種效應存在一定程度上的泛化。Della Libera和Chelazzi (2009)采用啟動范式, 將n-1試次中和高或低獎勵聯結的刺激在n試次中既作為目標又作為非目標出現, 結果也表明以前和高獎勵聯結的刺激在作為目標時能夠被更快的識別, 在作為分心物時能夠被更慢的識別, 而和低獎勵聯結的刺激恰恰相反。

在實驗1中, 紅色不能預測獎勵的高低, 但是紅色對于價值驅動的注意捕獲的產生仍然是至關重要的, 因為它是目標定義的特征, 所以, 在學習階段進行獎勵聯結時, 被試也將紅色這個特征納入到了獎勵聯結體系中。也就是說, 基于位置的注意捕獲效應的產生是以顏色的出現為前提的。早在Treisman (1992)的特征搜索研究中就表明當目標定義的特征和位置都重復時, 被試對具有單一視覺特征的目標的反應變快, 說明位置啟動可能依賴于目標定義特征的重復。在實驗1中, 我們也發現基于位置的價值驅動的注意偏向只局限于以前和目標相聯結的特征。這個結果看似和以前報告的注意偏向能夠預測獎勵位置的結果矛盾(Chelazzi et al.,2014), 他們的結果表明即使沒有顏色特征, 被試也會產生基于位置的價值驅動的注意選擇效應, 被試在測試階段對高獎勵位置呈現的目標的搜索反應時變快。但是他們的研究采用的是同質的顏色,顏色不是目標定義的特征; 而在我們的實驗1中,顏色為目標定義的特征, 雖然在整個實驗不變(都是紅色的), 但會使相同的顏色和不同的位置綁定起來去預測獎勵, 這和Chelazzi等(2014)只將位置和獎勵聯結起到的效果是相同的。第二, 在我們的實驗1中, 測試階段的目標被定義為形狀奇異項,是相對突顯的特征, 這鼓勵被試在整個刺激系列廣泛的分布注意; 而在Chelazzi等(2014)的研究中,測試階段被試的任務是尋找數字或字母, 目標的突顯性不是很強。

在實驗1中, 訓練階段的目標特征作為分心物出現在高獎勵聯結的位置時能夠捕獲注意, 表明存在基于位置的價值驅動的注意捕獲效應, 并且在位置上表現出一定程度的泛化。在實驗2中, 我們考察當顏色特征和空間位置聯合起來預測獎勵時會獲得什么樣的結果。在訓練階段, 目標特征和位置不能獨立預測獎勵, 只有兩者聯合起來才能預測獎勵：某個特征出現在某個位置時才能獲得獎勵。結果發現只有高獎勵顏色出現在高獎勵位置和高獎勵位置之間的中性位置時能夠捕獲注意, 而高獎勵顏色出現在其它中性位置和低獎勵位置時都不能捕獲注意, 表明被試在訓練階段不是形成兩個獨立的偏向：一個是和獎勵相聯結的特征, 一個是和獎勵相聯結的位置。而是將顏色和位置結合起來與不同的獎勵建立聯結, 顏色和位置共同引導注意。

本研究采用了修改的實驗設計, 實驗結果與Anderson (2015a,2015b)的結果基本一致, 表明空間位置和顏色特征對價值驅動的注意捕獲的產生都很重要。如果在訓練階段不考慮位置, 只將顏色與獎勵聯系起來, 那么它們能夠在所有的空間位置產生相等的注意捕獲(Anderson et al., 2011a, 2011b;Lee & Shomstein, 2014; Qi et al., 2013)。同時, 如果將顏色特征和空間位置聯合起來進行學習, 那么顏色與位置共同決定了的注意優先性。

關于顏色特征和位置信息在價值驅動的注意捕獲中的作用機制, Anderson (2015b)進行了兩種推論性解釋：第一, 顏色特征和空間位置的聯合才能產生引導注意選擇的偏向信號。第二, 獎勵?聯結的顏色特征總是能夠產生偏向信號而不管它呈現在什么位置, 但是當特征所處的情境(位置)預測價值低時, 這種偏向信號會被抑制。如果第二種解釋成立, 那么當高獎勵聯結的顏色出現在高、低獎勵位置之間的中性位置時, 位置的偏向信號不會被抑制, 而顏色的偏向信號仍然存在, 那么可以推測當高獎勵顏色出現在這些中性位置時仍然能夠捕獲注意, 但是實驗2的結果不支持這點。而且, 如果顏色特征和位置信息所產生的注意捕獲效應是獨立的, 那么我們可以推測, 實驗2所產生的捕獲效應是顏色特征和位置信息兩者捕獲效應的疊加, 所以相對于實驗1會有顯著增加。在本研究實驗1中,分心物出現在高獎勵位置的捕獲效應(與無分心物出現條件相比)為37 ms, 在實驗2中, 將顏色與位置聯合起來學習, 測試階段高獎勵顏色出現在高獎勵位置所獲得的捕獲效應為33 ms, 獨立樣本

檢驗表明兩種情況下的捕獲效應差異不顯著,

(43) < 1。

本研究結果表明：將單一位置與獎勵建立聯結時, 價值驅動的注意捕獲效應在位置上表現出一定程度的泛化(實驗1), 而將聯合特征與獎勵建立聯結時, 價值驅動的捕獲效應不能泛化到個別特征上(實驗2)。這說明價值驅動注意捕獲的泛化具有選擇性。實驗1與實驗2的不同之處在于：在實驗1中, 訓練階段泛化的位置為中性位置, 不能預測獎勵, 因而能夠泛化到這個中性位置。這也與以往表明基于價值的注意優先性可以泛化到不同刺激、位置和任務的研究結果相一致(Anderson et al., 2012;Lee & Shomstein, 2014)。在這些研究中, 只有顏色特征能夠預測獎勵結果, 而位置、任務、刺激都作為背景信息。在這種情況下, 注意系統會忽略那些不能預測獎勵的信息, 只進行關鍵的表征, 所以產生泛化現象。但是在實驗2中, 當位置信息也能夠預測獎勵時, 個體就會將位置信息整合到注意系統中, 因而不會產生泛化現象。從這個角度說, 有機體在新的情境中能夠較精確的利用以前所獲得的學習結果, 能夠產生一定程度的泛化, 但又避免了學習的過度泛化, 泛化具有選擇性。這種選擇性可能有助于收益最大化。以往研究也表明甚至使用復雜的獎勵結構, 為了最大化總體的獎勵獲得, 個體也能夠精確的分配注意優先性到不同的目標上(Navalpakkam, Koch, & Perona, 2009; Navalpakkam,Koch, Rangel, & Perona, 2010)。

本研究所采用的范式是對Anderson (2015b )范式的修改, 他的研究中也是用圓或方形(6個而不是8個)來定位抽象的空間位置。而本研究中性位置的設置則是借鑒了Chelazzi等(2014)的實驗范式, 將中性位置和高、低獎勵位置進行交叉分布。這樣的交叉分布導致了這些中性位置其實并不都是中性的。而對于實驗1位置泛化的原因, 本研究也并不能作出明確解釋。同時, 我們的實驗材料也缺乏生態學意義。未來的研究應該通過設置具體的背景來增加位置感, 同時取消高、低獎勵之間的中性位置的設定, 然后考察顏色和位置在價值驅動注意捕獲中的交互作用。

在本研究中, 采用自由選擇法在實驗結束后讓被試對獎勵與顏色、位置之間的聯結進行選擇, 結果與Anderson (2105b)不同：他的結果表明有80%的被試不能正確報告出訓練階段的正確聯結。而我們的研究結果表明, 有65%的被試能夠正確或部分正確的報告訓練階段的正確聯結。這可能是由于兩個研究所采用的方法不同所導致。在Anderson(2105b)的研究中, 訓練階段在所有的6個位置都呈現目標; 而在我們的研究范式中, 訓練階段只在8個位置中的4個位置呈現目標, 所以本研究的目標更加突出, 被試對目標的位置印象更加深刻, 所以容易建立正確的聯結。在這點上, 我們的研究支持被試能夠意識到刺激與獎勵的聯結, 注意優先性的建立可能是策略性的, 這與支持獎勵學習所建立的聯結能夠自動引導注意, 在很大程度上是內隱的結果不同(Anderson & Yantis, 2013; Le Pelley, Pearson,Griffiths, & Beesley, 2015; Hickey & van Zoest,2013)。為了進一步確定訓練階段建立的不同程度的聯結是否會影響測試階段的結果, 我們將不同聯結程度組被試作為組間變量, 對測試階段結果重新進行分析。將實驗1測試階段的反應時進行3(全部正確聯結組、部分正確聯結組、放棄和錯誤聯結組)× 6(位置：高獎勵、高之間、高低之間、低獎勵、低之間、無分心物)方差分析, 結果表明, 不同聯結程度組的主效應以及其與不同獎勵位置的交互作用均不顯著,

s < 1。將實驗2測試階段的反應時先進行3(全部正確聯結組、部分正確聯結組、放棄組)× 2(顏色：高獎勵和低獎勵)×5(位置：高獎勵、高之間、高低之間、低獎勵、低之間)方差分析, 結果表明, 不同聯結程度組與顏色和位置的交互作用均不顯著, 三者之間的交互作用不顯著,

s < 1。然后將每組被試在每個位置上的3種分心物條件(高獎勵顏色分心物、低獎勵顏色分心物、無分心物)下的反應時分別進行3×3方差分析, 結果表明在每個位置上, 不同聯結程度組與不同分心物條件均不存在交互作用, 且不同聯結程度組的主效應均不顯著,

< 1。這說明在實驗1和2中, 將被試按聯結程度的不同進行分組后, 并沒有改變原來的實驗結果模式, 不同組被試的結果沒有差異。也就是說,雖然在我們的研究中, 大多數被試在學習階段都能夠外顯的意識到獎勵?聯結的規則, 但是不管在訓練階段獎勵?聯結是外顯的還是內隱的, 都能夠引起價值驅動的注意捕獲。但是需要強調, 我們將自由選擇階段放到實驗結束后進行, 不能排除有一部分被試在訓練階段能夠外顯意識到獎勵?聯結規則,但是在測試階段后就忘記了。但是, 即使存在這種可能, 也不影響本研究結果。而且, Miranda和Palmer (2014)的研究表明獎勵系統可以分為獨立的兩個：外顯的認知系統和內隱的知覺系統, 而且兩個系統在注意捕獲量上是沒有差異的。Della Libera,Perlato和Chelazzi (2011)也認為和價值相關的視覺選擇性注意通過兩個獨立的學習機制形成：一個是對成績和伴隨的獎勵進行積極監控; 一個只是消極的檢測環境中的客體和所伴隨獎勵之間的聯結。價值驅動的注意捕獲可能反應了內隱的和外顯定向的共同作用(范玲霞, 齊森青, 郭仁露, 黃博, 楊東,2014)。

不依賴于競爭性的當前目標, 而注意到和價值相聯結的刺激或位置雖然具有適應性, 但不足是當學習到的刺激?獎勵聯結不能反應當前環境的獎勵結構時, 價值驅動注意捕獲的出現可能會誤導注意,使個體注意到既不是目標又不具價值的刺激或位置。本研究結果表明注意的泛化具有選擇性, 在單一特征(位置)上表現出一定程度的泛化; 同時, 個體能夠在訓練階段將所有預測價值的信息(位置和顏色特征)進行整合, 并與獎勵建立聯結, 從而能夠較高效的利用訓練階段所獲得的信息, 避免了學習的過度泛化。

5 結論

(1)和高獎勵相聯結的具體位置所引發的注意捕獲效應能夠泛化到特定的鄰近位置。

(2)個體在訓練階段能夠將顏色和位置的聯合特征與獎勵建立聯結; 訓練階段建立的聯結不能泛化到部分特征上。

(3)價值驅動注意捕獲的泛化具有選擇性。

Anderson, B. A. (2013). A value-driven mechanism of attentional selection.

Journal of Vision, 13

, 7.Anderson, B. A. (2015a). Value-driven attentional priority is context specific.

Psychonomic Bulletin and Review, 22

,750–756.Anderson, B. A. (2015b). Value-driven attentional capture is modulated by spatial context.

Visual Cognition, 23

, 67–81.Anderson, B. A., Laurent, P. A., & Yantis, S. (2011a). Learned value magnifies salience-based attentional capture.

PLoS One, 6

, e27926.Anderson, B. A., Laurent, P. A., & Yantis, S. (2011b).Value-driven attentional capture.

Proceedings of the National Academy of Sciences of the United States of America, 108

, 10367–10371.Anderson, B. A., Laurent, P. A., & Yantis, S. (2012).Generalization of value-based attentional priority.

Visual Cognition, 20

, 647–658.Anderson, B. A., & Yantis, S. (2013). Persistence of value-driven attentional capture.

Journal of Experimental Psychology: Human Perception and Performance, 39

, 6–9.Camara, E., Manohar, S., & Husain, M. (2013). Past rewards capture spatial attention and action choices.

Experimental

Brain Research, 230

, 291–300.Chelazzi, L., E?to?inová, J., Calletti, R., Lo Gerfo, E., Sani, I.,Della Libera, C., & Santandrea, E. (2014). Altering spatial priority maps via reward-based learning.

The Journal of Neuroscience, 34

, 8594–8604.Chelazzi, L., Perlato, A., Santandrea, E., & Della Libera, C.(2013). Rewards teach visual selective attention.

Vision Research, 85

, 58–72.Corbetta, M., & Shulman, G. L. (2002). Control of goal-directed and stimulus-driven attention in the brain.

Nature Reviews Neuroscience, 3

, 201–215.Della Libera, C., & Chelazzi, L. (2009). Learning to attend and to ignore is a matter of gains and losses.

Psychological Science, 20

, 778–784.Della Libera, C., Perlato, A., & Chelazzi, L. (2011). Dissociable effects of reward on attentional learning: From passive associations to active monitoring.

PLoS One, 6

, e19460.Fan, L. X., Qi, S. Q., Guo, R. L., Huang, B., & Yang, D.(2014). Toward understanding the role of reward in attentional selection.

Advances in Psychological Science,22

, 1573–1584.[范玲霞, 齊森青, 郭仁露, 黃博, 楊東. (2014). 獎勵影響注意選擇的認知加工機制.

心理科學進展, 22

, 1573–1584.]Hickey, C., Chelazzi, L., & Theeuwes, J. (2010) Reward changes salience in human vision via the anterior cingulate.

The

Journal of Neuroscience

, 30

, 11096–11103.Hickey, C., Chelazzi, L., & Theeuwes, J. (2014). Reward-priming of location in visual search.

PLoS One, 9

, e103372.Hickey, C., & van Zoest, W. (2013). Reward-associated stimuli capture the eyes in spite of strategic attentional set.

Vision Research, 92

, 67–74.Krebs, R. M., Boehler, C. N., & Woldorff, M. G. (2010). The influence of reward associations on conflict processing in the Stroop task.

Cognition, 117

, 341–347.Kristjánsson, á., Sigurjónsdóttir, ó., & Driver, J. (2010).Fortune and reversals of fortune in visual search: Reward contingencies for pop-out targets affect search efficiency and target repetition effects.

Attention, Perception and Psychophysics, 72

, 1229–1236.Laurent, P. A. (2008). The emergence of saliency and novelty responses from reinforcement learning principles.

Neural Networks, 21

, 1493–1499.Laurent, P. A., Hall, M. G., Anderson, B. A., & Yantis, S.(2015). Valuable orientations capture attention.

Visual Cognition,

23, 133–146.Le Pelley, M. E., Pearson, D., Griffiths, O., & Beesley, T.(2015). When goals conflict with values: Counterproductive attentional and oculomotor capture by reward-related stimuli.

Journal of Experimental Psychology: General, 144

,158–171.Lee, J., & Shomstein, S. (2014). Reward-based transfer from bottom-up to top-down search tasks.

Psychological Science,25

, 466–475.Mine, C., & Saiki, J. (2015). Task-irrelevant stimulus-reward association induces value-driven attentional capture.

Attention,Perception, and Psychophysics, 77

, 1896–1907.Miranda, A. T., & Palmer, E. M. (2014). Intrinsic motivation and attentional capture from gamelike features in a visual search task.

Behavior Research, 46

, 159–172.Navalpakkam, V., Koch, C., & Perona, P. (2009). Homo economicus in visual search.

Journal of Vision, 9

, 31.Navalpakkam, V., Koch, C., Rangel, A., & Perona, P. (2010).Optimal reward harvesting in complex perceptual environments.

Proceedings of the National Academy of Sciences of the United States of America, 107

, 5232–5237.Qi, S. Q., Zeng, Q. L., Ding, C., & Li, H. (2013). Neural correlates of reward-driven attentional capture in visual search.

Brain Research, 1532

, 32–43.Raymond, J. E., & O’Brien, J. L. (2009). Selective visual attention and motivation: The consequences of value learning in an attentional blink task.

Psychological Science,20

, 981–988.Reynolds, J. H., Chelazzi, L., & Desimone, R. (1999).Competitive mechanisms subserve attention in macaque areas V2 and V4.

Journal of Neuroscience, 19

, 1736–1753.Sali, A. W., Anderson, B. A., & Yantis, S. (2014). The role of reward prediction in the control of Attention.

Journal of Experimental Psychology: Human Perception and Performance,40

, 1654–1664.Serences, J. T., & Yantis, S. (2007). Spatially selective representations of voluntary and stimulus-driven attentional priority in human occipital, parietal, and frontal cortex.

Cerebral Cortex, 17

, 284–293.St?rmer, V., Eppinger, B., & Li, S.-C. (2014). Reward speeds up and increases consistency of visual selective attention: A lifespan comparison.

Cognitive, Affective, & Behavioral Neuroscience, 14

, 659–671.Treisman, A. (1992). Perceiving and re-perceiving objects.

American Psychologist, 47

, 862–875.Wang, L. H., Duan, Y. Y., Theeuwes, J., & Zhou, X. L. (2014).Reward breaks through the inhibitory region around attentional focus.

Journal of Vision, 14

, 2.Wang, L. H., Yu, H. B., & Zhou, X. L. (2013). Interaction between value and perceptual salience in value-driven attentional capture.

Journal of Vision, 13

, 5.Yokoyama, T., Padmala, S., & Pessoa, L. (2015). Reward learning and negative emotion during rapid attentional competition.

Frontiers in Psychology, 6

, 629.