關 元何嘉梅,2尚俊辰
(1 遼寧師范大學心理學院,大連 116029;2 遼寧省兒童青少年健康人格評定與培養協同創新中心,大連 116029)
跨期決策(intertemporal decision)是人們對發生在不同時間點的事件或者結果的價值進行的權衡和決策 (Frederick,Loewenstein,&O’donoghue,2002;梁竹苑,劉歡,2011;任天虹,胡志善,孫紅月,劉揚,李紓,2015)。比如,在當下能夠獲得的、利潤微薄的即時獎勵和等待一段時間才能夠獲得的、利潤相對豐厚的延遲獎勵之間進行二擇一的決策。在日常生活中,小至個體的信貸行為(Surachita,2017),大到國家的宏觀經濟政策制定都涉及到跨期決策。比如,黨中央提出的“綠水青山就是金山銀山”,以及《環境保護法》的施行都蘊含著“不能吃祖宗飯、斷子孫路,用破壞性方式搞發展”這種在近期的經濟收益和未來長遠的、造福子孫后代的環境保護之間的跨期決策。因此,能夠做出恰當的跨期決策對人類社會具有十分重要的意義 (劉洪志,江程銘,饒儷琳,李紓,2015)。
自我控制(self-control)具有復雜的結構,研究者從不同的角度來研究它。從行為層面來說,自我控制是個體為了實現預定的目標,對自己的心理和行為活動進行自主調節的過程和結果(Vohs&Baumeister,2004;Inzlicht,Schmeichel,&Macrae,2014)。從行為經濟學的角度來說,自我控制包含了一系列的決策過程,個體對自我控制的成本與收益進行權衡,并且以此來決定是否值得進行自我控制 (Botvinick&Braver,2015;Kotabe&Hofmann,2015;竇澤南,方圓,周偉,喬志宏,2017)。從人格特點來說,自我控制是一種穩定的特質(Casey et al.,2011)。在實現預定目標的過程中,高、低特質自我控制的個體表現出不同的自我控制能力,相對于低特質自我控制的個體來說,高特質自我控制的個體能夠更加熟練地運用自我控制,能夠更好地控制沖動行為 (Tangney,Baumeister,&Boone,2004;Cherniawsky&Holroyd,2013)。
跨期決策的完成需要執行自我控制(Luo,Ainslie,Giragosian,&Monterosso,2009;Scherbaum,Dshemuchadse,&Goschke,2012;Banich et al.,2013)。是否能夠順利地執行自我控制影響著人們是為了近期的仨瓜倆棗而舍棄意義重大的長遠收益,還是能夠為了長遠的重大價值而克制住對即時滿足的沖動性 (索濤,2012;劉雷,蘇緹,彭娟,郭逸群,馮廷勇,2014;Figner et al.,2010;Liu,Feng,Wang,&Li,2012;Cherniawsky&Holroyd,2013;Schmidt,Holroyd,Debener,&Hewig,2017)。因此,了解跨期決策中自我控制的加工機制,有助于個體做出恰當的跨期決策。
針對跨期決策中自我控制的作用機制,已有研究分別從三個方面進行了初步解釋。在認知加工過程方面,研究者認為跨期決策包含價值估計和價值選擇兩個認知加工過程,個體在跨期決策任務中偏好即時收益是因為個體在跨期決策的價值選擇階段沒有能夠成功地進行自我控制 (Luo et al.,2009;Figner et al.,2010;Liu&Feng,2012;Liu et al.,2012)。在大腦加工區域方面,研究者認為扣帶回和前額是跨期決策中負責自我控制的主要腦區(van den Bos&McClure,2013;Koffarnus,Jarmolowicz,Mueller,&Bickel,2013;Shenhav,Botvinick,&Cohen,2013;Hare,Hakimi,&Rangel,2014)。在能量來源方面,研究者認為自我控制資源的充足程度影響了個體能否在跨期決策任務中成功地抑制對即時滿足的沖動(Cherniawsky&Holroyd,2013;竇凱,聶衍剛,王玉潔,黎建斌,沈汪兵,2014;何貴兵,晏祥輝,2015)。然而,這些研究還缺乏深入辨析,比如,跨期決策的價值選擇過程包含了自我控制的哪些認知加工過程,哪些大腦區域參與到這些具體的自我控制認知加工過程中,哪些大腦區域更容易受到自我控制資源的影響。由此,本文擬整合已有研究成果,從跨期決策中執行自我控制涉及到的認知加工過程、相應的大腦神經加工以及需要消耗的自我控制資源等三個方面,深入辨析跨期決策中自我控制的加工機制。
自我控制兩階段模型(two-stage model of selfcontrol)認為,自我控制的執行包括了矛盾識別和矛盾解決兩個階段(Myrseth&Fishbach,2009)。個體首先需要判斷選擇當下的放縱與預定目標的實現之間是否存在著矛盾,只有當個體察覺到了二者之間存在著矛盾,才會采取相應的自我調節策略來抵制誘惑。兩個階段中的任何一個環節出現了錯誤都會導致自我控制失敗(李瓊,黃希庭,2012)。自我控制獎勵模型(r eward-b ased m odel) (Shenhav et al.,2013)對兩階段模型進行了補充,提出自我控制的預期價值(e xpected v alue of c ontrol,EVC)是個體決定是否進行矛盾解決的標準,認為能否解決矛盾首先取決于個體預期執行自我控制的收益是否高于成本(竇澤南等,2017)。該模型強調在識別出了需要進行自我控制的信號之后,個體會對進行自我控制需要付出的成本和可能得到的收益進行評估(c ostb enefit a nalysis,CBA),計算出進行自我控制的預期價值,來判斷是否有必要進行自我控制。當進行自我控制的收益高于成本時,個體才會執行自我控制(Power&Petersen,2013;Botvinick&Braver,2015;竇澤南等,2017)。
跨期決策的完成包含兩個過程:(1)負責對獎勵的主觀價值進行估計的過程,在這個過程中個體將獎勵在各個維度上的信息,比如金額大小和等待時間,集中起來估算出獎勵的主觀價值;(2)選擇具有較大主觀價值的備選項的過程(Liu&Feng,2012;Liu et al.,2012)。價值估計過程和選擇過程之間的相互作用關系還不清楚。腦成像的研究發現在跨期決策中,對價值的表征是動態進行的。比如,腹內側前額葉皮層(ventromedial prefrontal cortex,vmPFC)和腹側紋狀體(ventral striatum,VS)在跨期決策的價值估計過程中表征了獎勵的主觀價值(McClure,Laibson,Loewenstein,&Cohen,2004;Kable&Glimcher,2007)。而且腹內側前額葉皮層還受到了來自執行認知控制的腦區背外側前額皮層 (dorsolateral prefrontal cortex,dlPFC)的調節,使得腹內側前額葉皮層在價值估計時提高了賦予長遠收益的權重(Hare et al.,2014)。 在以幾十秒為等待時間的延遲滿足的研究中,還發現腹內側前額葉皮層和腹側紋狀體在做出選擇,以及做出選擇后等待延遲獎勵的過程中都參與了對延遲獎勵的價值表征(Jimura,Chushak,&Braver,2013)。 所以,價值估計過程和選擇過程在時間進程上可能并不是以一次性的先后線性順序來協作完成跨期決策的,它們之間可能存在著即時的多次相互作用影響。
結合兩個領域的研究,在跨期決策選擇過程中自我控制至少包含了自我控制矛盾識別、自我控制預期價值計算和執行控制等三種相互影響的認知加工過程。首先,自我控制矛盾識別加工通過對長遠收益與即時收益的主觀價值,和個體預定的目標、計劃、個體需要等等因素之間是否一致進行監控。然后,當探測到跨期決策涉及到的兩個主觀價值與預定目標不一致時,個體會評估自我控制需要付出的成本和可能的收益,計算出進行自我控制的預期價值。最后,如果個體認為收益高于成本,那么個體就會執行自我控制行為。此時,在自我控制矛盾解決過程中個體采用自上而下的控制加工,來完成在長遠收益和即時收益之間的選擇。即使在跨期決策的價值估計階段中即時收益的主觀價值高于長遠收益的主觀價值,但是為了實現預定目標,個體在自我控制的作用下最終可能還是會做出等待長遠收益的選擇。
在跨期決策的自我控制矛盾識別和自我控制預期價值計算兩個認知加工過程中,前扣帶回皮層(anterior cingulate cortex,ACC)是重要的神經基礎(Botvinick,Cohen,&Carter,2004),負責對長遠收益與即時收益的主觀價值,和個體預定的目標、計劃、個體需要等等因素之間是否一致進行監控(Myrseth&Fishbach,2009;Shenhav et al.,2013),并且評估自我控制需要付出的成本和可能的收益,計算出進行自我控制的預期價值。在跨期決策的執行控制加工過程中,前額葉皮層(prefrontal cortex,PFC)起到了重要的作用,當自我控制的收益大于成本時,前額葉皮層執行自上而下的自我控制 加 工(Shenhav et al.,2013;Hare et al.,2014),來減少價值估計結果與預定目標之間的偏離(Heatherton&Wagner,2011)。
前扣帶回皮層是自我控制的監控系統的神經基礎(Botvinick et al.,2004),負責對矛盾進行識別。在完成跨期決策任務時,相比于主觀價值差異懸殊的兩筆獎勵,個體感到在主觀價值大體一致的即時獎勵和延遲獎勵之間進行的選擇更加困難,此時前扣帶回皮層和側前額葉皮層(lateral PFC)有更高程度的激活 (Pine et al.,2009;Peters&Büchel,2011)。
背側前扣帶回(dorsal anterior cingulate cortex,dACC)被認為是跨期決策中自我控制的關鍵區域(van den Bos&McClure,2013;Shenhav et al.,2013)。背側前扣帶回通過監控任務的狀態(Sheth et al.,2012)和預期結果的收益(Amemori&Graybiel,2012;Wallis&Kennerley,2011) 等等信息來監控沖突。研究認為與獎勵預測誤差有關的腦電成分反饋相關負波(feedback-related negativity,FRN)(Jessup,Busemeyer,&Brown,2010)和背側前扣帶回有關。相比于即時收益,長遠收益引起的反饋相關負波波幅更大 (Blackburn,Mason,Hoeksma,Zandstra,&El-Deredy,2012)。 而且,背側前扣帶回還參與了對控制可能帶來的期望價值和對認知控制的成本進行的估計,其活動強度與任務難度之間呈現正相關 (Kouneiher,Charron,&Koechlin,2009)。隨著即時收益和長遠收益主觀價值的接近,跨期決策任務難度增大,背側前扣帶回的活動增強(Pine et al.,2009)。
前額葉皮層在跨期決策的自我控制中起著自上而下加工的作用(Heatherton&Wagner,2011),對即時滿足沖動進行控制和調節。前額葉對負責編碼主觀價值的紋狀體(Kable&Glimcher,2007)自上而下的控制越少,個體越傾向于即時滿足(Peters&Büchel,2011)。前額葉和紋狀體之間的白質神經束有更強的聯結時,個體在跨期決策中有更少的沖動行為(Peper et al.,2013)。 前額葉皮層區域活動的受限將導致自上而下調節路徑失衡,使得個體在跨期決策中自我控制失敗(Figner et al.,2010;Koffarnus et al.,2013)。
背外側前額皮層是跨期決策中負責自我控制的重要區域(van den Bos&McClure,2013),對目標導向行為的產生非常重要(Miller&Cohen,2001)。它的活動與跨期決策中的選擇過程有關 (Peters&Büchel,2009;Liu et al.,2012),尤其是與個體對長遠收益的偏好選擇之間存在著相關 (van den Bos&McClure,2013;van den Bos,Rodriguez,Schweitzer,&McClure,2014),當被試選擇長遠收益時,背外側前額皮層的活動增強 (Hare et al.,2014)。當要求個體完成N-back工作記憶任務,使個體的認知加工能力受到限制時,個體背外側前額皮層的活動強度降低,此時個體更加偏好選擇即時獎勵(Aranovich,McClure,Fryer,&Mathalon,2016)。對背外側前額皮層進行經顱直流電刺激(transcranial direct current stimulation,tDCS)時,發現背外側前額皮層的左側部分對于認知控制尤其重要,施加的陽極刺激加強了左側部分的活動,抑制了跨期決策中的沖動性,施加的陰極刺激減弱了左側部分的活動,提高了跨期決策中選擇即時獎勵的沖動性(Shen et al.,2016)。在跨期決策中,背外側前額皮質的控制功能還表現在它與其它大腦區域的神經聯結中。背外側前額皮層和前額皮質其它區域之間的神經聯結活動的增強反映了個體對自我控制的需求。比如,當要求被試在美味的食物和健康的食物之間進行選擇時,只有當被試選擇了健康食物時,背外側前額皮層和腹內側前額葉皮層之間的神經聯結活動才會出現增強(Hare,Malmaud,&Rangel,2011),而且二者之間的神經聯結也與偏好選擇有關,研究發現背外側前額皮層和腹內側前額葉皮層之間的神經聯結活動在被試選擇長遠收益時增強了(Hare et al.,2014)。背側前額皮質和背側紋狀體 (dorsal striatum)之間的結構和功能聯結可以預測在跨期決策中的個體差異,聯結越強,被試越有耐心(van den Bos et al.,2014)。
自我控制資源模型認為,個體在調控行為的過程中需要消耗資源,這種資源具有領域一般性特征,即所有自我控制行為的執行消耗的都是同一種自我控 制 資 源(Baumeister,Vohs,&Tice,2007;Heatherton&Wagner,2011;譚樹華,許燕,王芳,宋婧,2012;于斌,樂國安,劉惠軍,2013)。但是,自我控制資源總量是有限的,如果個體當前沒有足夠的資源來完成自我控制任務,就會導致自我控制失敗(Baumeister,2002)。比如,個體在先前的任務中已經進行過的自我控制操作會在一定程度上消耗自我控制資源,那么當前可用的自我控制資源就會處于暫時性的枯竭狀態,使得個體不能很好地完成后續的自我控制任務(Wagner,Altman,Boswell,Kelley,&Heatherton,2013),即出現自我損耗現象 (ego depletion)(Baumeister,Bratslavsky,Muraven,&Tice,1998;Baumeister&Vohs,2007)。
有研究采用雙任務范式,首先要求被試完成其它的自我控制任務來消耗有限的自我控制資源,然后要求被試完成跨期決策任務,發現隨著自我控制資源的減少,個體在隨后的跨期決策任務中選擇即時獎勵的比例增加了 (竇凱等,2014;何貴兵,晏祥輝,2015)。所以,完成跨期決策任務需要消耗自我控制資源,當剩余的自我控制資源不足以抵制即時獎勵的誘惑時,個體選擇即時獎勵的比例就會增加。
在自我控制資源模型的基礎上,研究者根據跨期決策中有關大腦區域消耗自我控制資源的情況,提出了跨期決策的雙系統模型。例如,由理智的自我控制冷系統和情緒性、沖動的熱系統組成的“冷/熱雙系統模型 (hot/cold system)”(Metcalfe&Mischel,1999)認為,冷系統遵循實用原則(do it if it makes sense),以目標為導向,需要個體的意志控制,熱系統以“覺得好(do it if it feels good)”為原則,主要與低自我控制、沖動行為有關。在fMRI研究基礎上,研究者提出了由加工即時收益的β系統和加工長遠收益的δ系統組成的 “β-δ雙系統模型(β-δ systems)”(McClure et al.,2004)。 相互競爭神經行為決策系統模型(the competing neurobehavioral decision systems theory,CNDS)認為β系統和δ系統對應于兩個交互的神經生物系統:涉及邊緣系統和旁邊緣系統 (the limbic and paralimbic regions)的沖動系統(impulsive system)和涉及前額葉腦區(the prefrontal cortex)以及與沖動抑制有關的執行系統 (executive system)(Koffarnus et al.,2013)。研究發現即時獎勵的選擇與沖動系統中較大的神經活動有關(Kable&Glimcher,2007),長遠獎勵的選擇與執行系統中較強的神經活動有關(McClure et al.,2004;Shen et al.,2016)。 當個體可以調用的資源充足時,審慎的、以控制加工為主,需要消耗自我控制資源的理性分析系統占優勢(Kahneman&Frederick,2002;Morewedge&Kahneman,2010),此時,個體能夠較好地進行自我控制,選擇延遲獎勵的可能性較高;當可以調用的資源匱乏時,依賴直覺、追求即時欲望滿足的自動化加工系統更占優勢 (Kahneman&Frederick,2002;Morewedge&Kahneman,2010),自我控制失敗的可能性較高,更可能選擇即時獎勵。
研究者對自我控制資源的來源還有爭議。有研究通過為實驗組被試提供不含咖啡因的含糖飲料,給控制組提供不含咖啡因的無糖飲料來操縱被試的血糖水平,進而改變他們可調用的自我控制資源的數量,發現葡萄糖的攝入減輕了自我損耗的程度。有研究采用前后測實驗要求被試完成跨期決策任務,發現實驗組被試血糖水平的增高使得他們擁有充足的自我控制資源來執行自我控制,從而降低了他們在跨期決策中對即時獎勵的偏好;控制組被試由于沒有葡萄糖的補充,再加之在前測實驗中消耗了一部分的自我控制資源,使得剩余的自我控制資源不足以支持他們完成后測實驗,所以他們在跨期決策中更加偏好即時獎勵(Wang&Dvorak,2010)。但是,最近的研究(Dang,2016)通過對已有的文獻進行元分析,對自我控制的葡萄糖說(the glucose view of self-control)提出了質疑。已有文獻支持自我損耗效應是確實成立的,但是不支持血液中葡萄糖水平的變化和葡萄糖的攝入對自我損耗程度的影響,認為僅從葡萄糖水平的高低變化來解釋自我損耗并不恰當,葡萄糖可能并不是自我控制資源的來源。研究者提出葡萄糖的補充可以在損耗發生之后重新激活前扣帶回皮層的活動,而且葡萄糖的補充還可能被個體看成是一種獎勵刺激,所以應該從與葡萄糖水平變化有關的動機和認知沖突等心理角度來解釋自我損耗(Dang,2016)。由此,還需要進一步的研究來探討自我控制資源的來源問題,自我控制資源到底是來源于葡萄糖等客觀的能量資源,還是來源于與客觀能量變化有關的一系列動機、認知沖突等心理因素。
本研究對跨期決策中自我控制加工的心理機制進行了梳理。在跨期決策中的自我控制矛盾識別、自我控制預期價值計算過程中,扣帶回皮質對個體賦予長遠獎勵和即時獎勵的主觀價值與預定目標之間的一致性進行監控,并且對進行自我控制所需要付出的認知控制的程度以及認知控制的結果進行權衡,來形成對自我控制的價值預期;在跨期決策中的執行控制過程中負責執行認知控制的前額皮質根據扣帶回形成的對自我控制成本和收益的預期,來對價值估計和預定目標之間的不一致進行自上而下的調節。雖然還不清楚自我控制資源的來源,但是跨期決策任務的完成需要自我控制資源的參與。當個體可以調用的自我控制資源充足時,個體更依賴以控制加工為主,需要消耗資源的理性分析系統;當可以調用的資源匱乏時,個體更依賴直覺,追求即時欲望滿足的自動化加工系統,自我控制失敗的可能性較高。雖然已有研究在探索跨期決策中自我控制的影響作用方面取得了一定的進展,為我們理解自我控制對跨期決策的影響提供了基礎,然而還有許多尚待解決的問題。
除了自我控制資源外,跨期決策任務的完成還需要消耗用于支持個體成功執行認知加工的認知資源(Schmeichel,2007)。比如,N-back 工作記憶任務的完成消耗了認知資源,導致個體更加偏好即時收益(Aranovich et al,2016)。而且個體在跨期決策價值估計階段,完成對即時收益和長遠收益的概率計算也需要消耗認知資源(黎建斌,2013)。雖然自我控制資源的來源還不清楚,但是自我控制資源和認知資源之間存在著相互影響,自我控制與認知的抑制控制功能非常接近,都強調對優勢行為的控制(Inzlicht et al.,2014)。 自我控制資源和認知資源的整合模型(黎建斌,2013)指出,在自我控制和其它的高級認知加工過程中均有執行功能的參與,并且自我控制和認知加工還有共同的神經基礎——前額葉皮層。個體進行自我控制和認知加工都會消耗資源,產生心理疲勞,使得前額葉皮層的活動受限,前額葉皮層激活程度的降低進一步影響了執行功能在后續認知加工任務和自我控制任務中的發揮,進而影響了個體的自我控制和認知控制 (黎建斌,2013)。而且,自我控制任務的完成也需要認知資源的參與,比如,識別是否需要進行自我控制(Myrseth&Fishbach,2009;Shenhav et al.,2013)。 所以,跨期決策任務的完成可能需要自我控制資源和認知資源的共同參與。
目前還不清楚資源的充足程度影響個體調用理性分析系統和自動化加工系統的機制,也不清楚在自我控制參與跨期決策的心理加工過程中,資源的充足程度是如何發揮作用的。比如,在跨期決策中的自我控制矛盾識別、自我控制預期價值估算和自我控制執行三個認知加工過程中,哪個過程最容易受到資源不足的影響?另外,由于在跨期決策中對價值的表征是動態進行的,跨期決策價值估計過程可能與上述三個加工過程之間存在著聯系,自我控制資源不足是否也影響了跨期決策價值的估計?未來可以通過比較自我控制資源和認知資源在心理和神經機制上的異同,以及它們在跨期決策過程中的作用和調用方法來探討跨期決策中自我控制的作用。
人格特質在決策中起著重要的作用,具有不同特質自我控制水平的個體往往采用不同的決策信息加工方式 (Marshall,Smith,&Kirkpatrick,2014;Smith,Marshall,&Kirkpatrick,2015;Marshall,&Kirkpatrick,2016;Peterson,Hill,&Kirkpatrick,2015)。研究發現,高、低特質自我控制個體在跨期決策任務中存在著個體差異,在自我控制能力上的個體差異使得他們在跨期決策任務中有著不同的行為表現(索濤,2012),相比于對長遠收益價值貶值程度較低的個體來說,對長遠收益價值貶值程度較高的個體對即時獎勵的高估程度更大,更關注即時獎勵的信息,而且他們加工即時獎勵時還引起了波幅更大的獎勵正波(reward positivity)(Cherniawsky&Holroyd,2013)。因此,未來可以探討人格特質在自我控制影響跨期決策中的作用。比如,對注意的研究發現,把注意力從即時獎勵上脫離開來需要個體執行自我控制(van den Bos et al.,2014)。 而且 Schmidt等(2017)發現,在完成跨期決策任務時,個體加工獲得獎勵的等待時間的方式與他們具有的特質自我控制水平有關,在加工時間信息時前扣帶回皮層產生的表征個體對獎勵的敏感性的獎勵正波(Holroyd&Umemoto,2016)的波幅可以預測個體的特質自我控制水平。相比于高特質自我控制個體,低特質自我控制個體在面對時間長短的變化時,獎勵正波有更大的波幅。因此,注意加工機制的差異可能是導致高、低特質自我控制個體在跨期決策任務的完成中存在差異的原因之一。
另外,自我控制損耗進程模型 (t he process model of self-control depletion)強調個體在自我控制中的自主性,認為動機的缺乏是自我控制失敗的主要原因(Inzlicht et al.,2014)。 把人們對自我控制的放棄看成是個體在認知努力 (cognitive labor)和認知安逸 (cognitive leisure)之間進行的主動權衡,個體在了解了自己的需求和外在的客觀環境之后,將自我控制涉及到的任務區分為外界環境要求完成的“必須(have to)”任務和自主選擇完成的“自愿(want to)”任務,個體自己決定了以什么樣的動機來實現預訂的目標 (Ryan&Deci,2000;Inzlicht et al.,2014;Kotabe&Hofmann,2015)。目前還不清楚高、低自我控制個體是否在進行自我控制的動機上也具有差異。所以,未來可以深入考察高、低特質自我控制個體在跨期決策中的認知加工差異和動機差異。