朱樹青 翟 昱 賈世偉
反饋評估的局部背景依賴效應:ERP研究
朱樹青 翟 昱 賈世偉
(山東師范大學心理學院, 濟南 250014)
人腦對反饋的評估依賴于其所處背景。但是只能依賴整體背景(整個組塊的結果范圍), 還是可以依賴局部背景(單個試次的結果范圍)進行評估, 目前并不清楚。本研究通過獲益/損失線索操縱所在試次的反饋背景, 探討反饋評估僅依賴整體背景, 還是可延伸到局部水平。25名被試參與實驗。結果發現, 背景試次間變化時, 在獲益背景下, ¥0 (負反饋)比+ ¥4 (正反饋)引發更負的FRN (feedback-related negativity); 在損失背景下, ? ¥4 (負反饋)比¥0 (正反饋)引發更負的FRN。這一結果說明反饋評估以某線索背景中可能的結果為參考對象, FRN的背景依賴可以延伸到局部水平。結合前人研究, 推測任務類型和反饋真實性會調節背景依賴水平。在含真實反饋的主動性任務中, FRN的背景依賴效應可延伸至局部水平。
反饋評估; 反饋相關負波(FRN); 整體背景依賴效應; 局部背景依賴效應
人們常常根據外部反饋信息來矯正自己的錯誤行為。外部反饋既可以在短時間內幫助人們覺察錯誤, 及時補救, 又可以在較長時間內幫助人們區分獎懲, 強化適應性行為。因此, 研究者們一直關注人腦是如何評估外部反饋的。反饋評估(feedback evaluation), 或稱為結果評價, 是行為監控(performance monitoring)過程的一部分, 主要通過比較預期與實際結果來判斷結果的好壞、得失等(Ullsperger, Danielmeier, & Jocham, 2014)。反饋評估有助于人們優化自己的行為方式和策略, 以便更快適應環境(Holroyd & Coles, 2002)。反饋評估在行為上通常表現為簡單選擇反應任務中的錯誤后減慢(Wang et al., 2015), 或時間估計任務中, 錯誤后時間估計調整量的增大(向玲, 王寶璽, 張慶林, 2012)。反饋評估的腦電(ERP)研究發現, 反饋相關負波(feedback-related negativity, FRN)可以作為神經生理指標, 用以考察反饋評估的神經機制(李丹陽, 李鵬, 李紅, 2018; Sambrook & Goslin, 2015; Walsh & Anderson, 2012)。
FRN是一個分布于前額中部的負向偏轉腦電成分, 最初發現于正確反饋和錯誤反饋所引發腦電波的差異(Miltner, Braun, & Coles, 1997)。這一差異出現于反饋后200~400 ms, 而波峰出現于250 ms左右(Gehring & Willoughby, 2002)。相對于有利結果, 不利結果, 如錯誤反饋、金錢損失會誘發更負的FRN (效價效應), 這一現象被稱為好/壞二元分類評估(good/bad binary evaluation) (Gehring & Willoughby, 2002; Hajcak, Moser, Holroyd, & Simons, 2006; Holroyd, Hajcak, & Larsen, 2006; Yeung & Sanfey, 2004)。FRN的效價效應符合強化學習理論(reinforcement learning theory) (Holroyd & Coles, 2002)。最近有研究者認為, 正、負反饋誘發的腦電波的差異是正反饋誘發的獎賞正波(reward positivity, RewP) (Proudfit, 2015)導致的, 而不是因為負反饋誘發的負腦電成分。獎賞正波通常是FRN差異波(即負反饋引發的腦電成分減去正反饋引發的腦電成分)或采用主成分分析技術得到的, 而由于正、負反饋之后, 通常都會出現負偏向成分, 根據直觀結果以及前人研究(Sambrook & Goslin, 2015; Walsh & Anderson, 2012), 本研究也把正負反饋誘發的腦電成分稱作FRN。
反饋評估相關ERP研究中, 一個研究者們感興趣的問題是人腦是如何判斷好壞的呢?在不同實驗背景下, 人腦對同一事件的價值評估是否相同呢?針對這些問題, 研究者們進行了相關研究。結果發現, 人在進行反饋評估時, 對同一事件的好壞界定是以該結果與同處一個背景下的其他結果相比較得出的相對價值(relative value)為判斷標準, 因此FRN的好/壞二元評估是以背景依賴為基礎實現的(Holroyd, Larsen, & Cohen, 2004; Kujawa, Smith, Luhmann, & Hajcak, 2013; Osinsky, Walter, & Hewig, 2014)。
Holroyd等人于2004年考察背景(context)對FRN波幅的影響, 首次探究反饋評估是遵循背景依賴還是背景獨立這一問題。如果人在不同實驗背景對某個反饋刺激的價值判斷相同, 則其評估不受背景影響, 即背景獨立; 如果人在不同實驗背景, 對某個反饋刺激的價值評估是根據其在具體背景的相對價值來判斷, 則其評估受到背景影響, 即背景依賴(Holroyd et al., 2004)。
Holroyd等人(2004)向被試呈現兩個背景:“Win”背景, 被試可能獲得一個大數額(+ +)、小數額(+)或者零金額(0)的金錢; “Lose”背景, 被試可能損失一個大數額(? ?)、小數額(?)或者零金額(0)的金錢。“Win”背景和“Lose”背景采用組塊間變化(block by block)的呈現方式。結果發現, 兩種背景中相對更壞的結果引發的FRN都顯著負于相對更好的結果。另外, 分析了被試對零金額的評估結果。零金額是“Win”背景中的最差結果, 也是“Lose”背景中的最好結果, 這是“0”的相對價值; 而其絕對價值都是“0”。結果發現“Win” 0比“Lose” 0引發更負的FRN。以上結果說明反饋評估是背景依賴的。Holroyd等人(2004)認為人判斷行為表現好壞是根據期望水平, 而不是結果本身的客觀價值(objective value)。Nieuwenhuis, Yeung, Holroyd, Schurger和Cohen (2004)也提出背景是通過影響人對結果的主觀價值(subjective value)形成來影響FRN波幅的; Nieuwenhuis等人(2005)發現獎賞相關腦區, 如伏隔核、杏仁核也存在背景依賴效應。向玲、王寶璽、張慶林和袁弘(2008)發現FRN反映的是以賭注為基點的相對價值, 且比投注稍大或稍小的反饋無顯著差異, 故研究者提出參照是以賭注為基點的區間而非一個點。
背景因素是如何影響結果評估過程的?Osinsky等人(2014)發現未選擇選項結果是人們評估所選選項結果的重要背景因素。人們在評估所選選項結果時, 以未選選項結果為參照, 確定所選選項結果的相對價值, 相對更壞的結果引發了更負的FRN。而關于背景是如何發揮作用的, Osinsky等人認為人腦中存在一個內部參照系統, 通過不斷結合分析反饋和環境信息, 對結果形成預期, 而早期評估通過期望來判斷好壞。這一系統與Holroyd和Coles (2002)所提出的強化學習系統在概念上、功能上和結構上高度重疊, 都與對結果的預期高度相關。
Kujawa等人于2013年對背景依賴進行進一步探究, 提出FRN的背景依賴效應只能是整體(global)背景依賴, 還是可以發生在局部(local)背景水平這一問題。整體背景依賴指以同一組塊(block)內所有可能結果為參照的背景依賴模式; 局部背景依賴是指以單個試次的所有可能結果為參照的背景依賴模式。以整體背景為參照, 參照標準不用時時變化, 相對固定和容易。而以單個試次的背景為參照, 需要在每個試次評估時提取本試次的背景, 參照標準時時變化, 更靈活但是難度也較大。
Holroyd等人(2004)研究中的“Win”和“Lose”背景為組塊間變化, 因此該背景依賴效應可以認為是整體水平的。Kujawa等人(2013)采用添加線索的簡單賭博任務, 線索為試次間變化(trial by trial)呈現。其中, 半綠半白色圓環線索表示被試處于獲益試次, 50%可能獲益(綠色上箭頭), 50%可能不獲益(“0”); 半紅半白色圓環線索表示被試處于損失試次, 50%可能損失(紅色下箭頭), 50%可能不損失(“0”)。結果發現, 獲益背景下, 零獲益比獲益反饋引發更負的FRN; 損失背景下, 零損失與損失反饋所引發的FRN無顯著差異。跨線索比較發現, 零獲益、零損失和損失反饋無顯著差異, 零損失和損失反饋顯著負于獲益反饋。這一結果表明線索并未起作用, 人在進行結果評估時以整個組塊所有可能結果為參照, 而非以現有線索背景下的本試次可能的結果為參照。因此該結果也支持背景依賴為整體水平, 而不是局部水平。然而, Angus等人(2017)同樣采用添加線索和試次間變化的任務, 卻發現無論獲益背景或損失背景下, 該背景下相對壞比相對好的反饋引發更負的FRN。這表明線索是起作用的, 每種線索在本試次中形成相應背景, 人在評估結果時, 僅以所在試次的可能結果為參照, 該結果支持背景依賴為局部水平。因此, 局部水平的背景是否能影響結果評估, 結論還不統一。當人在進行結果評估時, 背景依賴效應是只能在整體水平上發揮作用, 還是可以延伸到局部水平即本研究所關注的問題。
為了探究該問題, 本研究改進了Kujawa等人(2013)的研究, 采用添加獎勵線索的時間估計任務(估計1秒時間) (Mars, De Bruijn, Hulstijn, Miltner, & Coles, 2004; Miltner et al., 1997; 向玲等, 2012)。首先由每個試次開始時的線索決定所在試次為獲益或損失背景, 然后根據被試時間估計的準確與否給予正確反饋或錯誤反饋, 最后通過分析反饋呈現后FRN來檢驗FRN背景依賴效應出現于整體水平還是出現于局部水平。數據處理參照Kujawa等人(2013)的研究。相對于Kujawa等人(2013)的研究, 本研究有兩個改進:第一個是采用主動任務且反饋為真實反饋。Kujawa等人(2013)的研究中采用的簡單賭博任務, 反饋為偽隨機反饋。主動任務和真實反饋, 有利于提高被試的動機, 可以促進針對每個試次的精細加工; 第二個是增加試次數, 每個實驗條件設置80試次。Kujawa等人(2013)的研究中每個條件20個試次。試次太少可能造成被試沒有完全掌握線索的意義。通過增加試次, 可以促進被試對線索的加工, 改善對局部背景的使用。
如圖1所示, 如果為局部背景依賴, 則每個試次中相對壞的結果比相對好的結果會引發更負的FRN, 也就是說, 獲益背景中零反饋比獲益反饋引發更負的FRN, 而損失背景中損失反饋比零反饋引發更負的FRN, 并且獲益?零反饋比損失?零反饋引發更負的FRN (Angus et al., 2017)。如果為整體背景依賴, 則結果與Kujawa等人(2013)的結果類似, 以所有可能的結果為參照, 相對壞的結果(損失反饋和零反饋)比相對好的結果(獲益反饋)引發更負的FRN, 無論所在試次線索如何(Kujawa et al., 2013)。

圖1 背景依賴情況示意圖。如果結果評估采取整體依賴模式, 結果如左圖所示, 被試以所有可能的結果為參照, 相對壞的結果比相對好的結果