基于嚙齒類動(dòng)物的決策行為研究及其腦機(jī)制

2008-01-01 00:00:00程九清李勇輝隋南

心理科學(xué)進(jìn)展 2008年5期

摘要：介紹了近年來以嚙齒類動(dòng)物為對(duì)象，關(guān)于決策的行為表現(xiàn)及其內(nèi)在腦機(jī)制的研究進(jìn)展。首先介紹了決策的概念，以及嚙齒類動(dòng)物的決策模型。在這些模型的基礎(chǔ)上，總結(jié)了不同決策模型的共同的心理過程：計(jì)算、動(dòng)機(jī)和記憶，并且介紹了業(yè)已發(fā)現(xiàn)的參與這些心理機(jī)制的腦機(jī)制。最后，還從決策的角度探討了其與藥物成癮之間的關(guān)系，包括成癮藥物對(duì)決策行為的影響以及決策個(gè)體差異與藥物成癮易感性之間的關(guān)系。

關(guān)鍵詞：決策，腦機(jī)制，藥物成癮，嚙齒動(dòng)物模型分類號(hào)：B845

1 前言及實(shí)驗(yàn)?zāi)Ｐ?/p>

決策(decision making)是人類以及許多動(dòng)物所共同具有的能力，是一種較高級(jí)的心理功能。在動(dòng)物實(shí)驗(yàn)中，決策與行為選擇(action selection)的意義相同，因?yàn)閮烧呖梢员灰暈檫@樣的行為活動(dòng)：在數(shù)個(gè)備選項(xiàng)中，經(jīng)過利與弊，或者是收益(benefit)與成本(cost)之間的權(quán)衡，根據(jù)權(quán)衡的結(jié)果輸出行為，選擇其中的某個(gè)或某幾個(gè)選項(xiàng)。

在現(xiàn)有的嚙齒類動(dòng)物研究中，較常用的決策模型包括：延遲折扣(delay-discount)、概率折扣(probability-discount)、付出努力(effort-baseddecision making)和趨避任務(wù)(approach．a(chǎn)voidance task)等。

延遲折扣是指獎(jiǎng)賞物的價(jià)值隨著時(shí)間的流逝而逐漸貶值，動(dòng)物需要在價(jià)值大小和等待時(shí)問長短之間作出權(quán)衡。動(dòng)物通常可以在兩種行為之間進(jìn)行二選一：表現(xiàn)出行為A(如在Skinner箱中壓左桿)，結(jié)果是可以立即得到少量的食物；表現(xiàn)出行為B(如在Skinner箱中壓右桿)，結(jié)果是能夠得到更多的食物，但是需要等待一段時(shí)間。通常隨著需要等待時(shí)間的延長，動(dòng)物會(huì)更傾向于去表現(xiàn)出可以立即得到食物的行為(這種行為被稱為沖動(dòng)行為，impulsivebehavior)。

概率折扣與延遲折扣相似，動(dòng)物的任務(wù)是在出現(xiàn)概率大但食物量少以及出現(xiàn)概率小但食物量的多選項(xiàng)之間作出決策。隨著食物出現(xiàn)的概率的減少，動(dòng)物會(huì)更偏好選擇雖然少但是更可能出現(xiàn)食物的行為，而反之，如果動(dòng)物表現(xiàn)出的行為是針對(duì)食物量多卻出現(xiàn)概率小的結(jié)果，則認(rèn)為這樣的行為是冒險(xiǎn)性質(zhì)的(risky behavior)。

在付出努力的實(shí)驗(yàn)里，研究人員多運(yùn)用T迷宮障礙實(shí)驗(yàn)來考查動(dòng)物是否愿意付出努力來獲得(更多)的回報(bào)。動(dòng)物T字的分岔口面臨著決策：或者去沒有障礙的一側(cè)，可以得到少量的食物；或者去有障礙的另一側(cè)，需要翻越障礙才能得到更多的食物。動(dòng)物需要權(quán)衡的是，多得到的食物，是否值得多付出能量用于翻越障礙?

最后，在趨避任務(wù)中，目前并沒有統(tǒng)一的模型，高架十字迷宮(elevated-plus maze)、社會(huì)應(yīng)激(social-stress)的實(shí)驗(yàn)方法都有被采用到。趨避模型主要被運(yùn)用于測(cè)查抗焦慮藥物的實(shí)驗(yàn)中，如以高架十字迷宮為例，首次被放入迷宮的動(dòng)物在面對(duì)開放臂(open-arm)既有進(jìn)行探索的驅(qū)動(dòng)力，而同時(shí)又有恐高的回避傾向。這種趨避共存的現(xiàn)象會(huì)導(dǎo)致焦慮。而在服用了抗焦慮藥物后，動(dòng)物會(huì)花費(fèi)更多的時(shí)間呆在開放臂，因?yàn)榻箲]程度降低了。

總體來說，比起人類的決策及其腦機(jī)制的研究，如行為神經(jīng)經(jīng)濟(jì)學(xué)(behavioral neuroeconomics)，雖然動(dòng)物實(shí)驗(yàn)對(duì)行為考察的程度不如人類實(shí)驗(yàn)來得那么真實(shí)和復(fù)雜，但是動(dòng)物研究增加了腦干預(yù)的手段，通過特定的決策行為模型，可以更為細(xì)致的考察不同腦區(qū)，不同化學(xué)物質(zhì)在決策中所發(fā)揮的作用。

2 決策的心理機(jī)制及其腦基礎(chǔ)

以上介紹的四種模型中，雖然任務(wù)不同，但是既然都屬于決策行為，因此包含著相同成分的心理機(jī)制和腦基礎(chǔ)，在這里討論三個(gè)環(huán)節(jié)：計(jì)算、動(dòng)機(jī)以及工作記憶。

2.1 計(jì)算與皮層

在文章的開頭，提到?jīng)Q策被視為是一種選擇，而選擇的依據(jù)是收益與成本之間經(jīng)過權(quán)衡了的結(jié)果。顯然，權(quán)衡是一個(gè)計(jì)算的過程，雖然很多時(shí)候并不明確需要經(jīng)過數(shù)字的運(yùn)算，但是決策者需要在各個(gè)選擇之間進(jìn)行比較，既考慮哪個(gè)選擇可以得到的獎(jiǎng)賞最多，也要考慮實(shí)現(xiàn)各個(gè)選擇所需的成本有多少。

目前關(guān)于計(jì)算的模型將目標(biāo)腦區(qū)集中在了皮層，認(rèn)為大腦皮層經(jīng)過計(jì)算，權(quán)衡了各種可能的利弊后，會(huì)對(duì)某個(gè)或某幾個(gè)備選行為形成偏好，然后用谷氨酸將這種對(duì)于各個(gè)備選行為的權(quán)衡結(jié)果投射到基底神經(jīng)節(jié)(basal ganglia)，再由基底神經(jīng)節(jié)經(jīng)過加工輸出被選擇了的行為。采用局部損毀的方法，可以比較清楚地觀察某個(gè)區(qū)域在行為中所發(fā)揮的作用。研究人員用此方法針對(duì)前額葉皮層的眶額回(orbifrontal cortex，OFC)和扣帶前回(AnteriorCingulate cortex。ACC)在延遲折扣和付出努力兩種模型中的作用分別做了研究。結(jié)果發(fā)現(xiàn)，損毀眶額回，增加動(dòng)物的沖動(dòng)行為(但也有沖動(dòng)性降低的報(bào)道)，但是并不影響動(dòng)物愿意去翻越障礙而獲得更多食物；而損毀扣帶前回的結(jié)果則剛好相反：損毀扣帶前回使動(dòng)物變得更為“懶惰”，不愿意為了獲得更多食物而翻越障礙，但是并不影響動(dòng)物為了得到更多食物而多等一會(huì)。因此，盡管獎(jiǎng)賞均是食物，但是由于在延遲折扣和付出努力的模型中成本分別是時(shí)問和能量，因此參與成本計(jì)算與控制的區(qū)域在腦結(jié)構(gòu)上發(fā)生了分離：眶額回承擔(dān)時(shí)間的計(jì)算，而扣帶前回則考慮能量的付出。

除了時(shí)間折扣，在概率折扣中，研究人員同樣發(fā)現(xiàn)需要眶額回的參與，但是機(jī)制更為復(fù)雜。損毀眶額回的結(jié)果并不一致，冒險(xiǎn)性選擇增加和減少的結(jié)果都有。但是在以人為被試的賭博性游戲中，眶額回?fù)p傷的病人往往表現(xiàn)出的是冒險(xiǎn)性行為。Vieira等人經(jīng)過研究，認(rèn)為眶額回依據(jù)不同的不確定性，會(huì)有不同的作用。具體地說，一個(gè)是杠桿不確定性，一個(gè)是背景不確定性。在經(jīng)典的概率折扣研究中，動(dòng)物首先經(jīng)過反復(fù)學(xué)習(xí)，使之明白兩根桿所帶來的不同食物獎(jiǎng)賞與獎(jiǎng)賞呈現(xiàn)的不同概率。這便是杠桿不確定性：因?yàn)槟骋淮蔚膲簵U，并不知道會(huì)造成什么樣的結(jié)果；但是，隨著壓桿次數(shù)的增多，由于之前經(jīng)過學(xué)習(xí)，已經(jīng)大致知道了概率，因此總體能得到多少獎(jiǎng)賞是比較清楚的。在這種情況下，損毀眶額回，是減少冒險(xiǎn)選擇的。

而對(duì)于總體不確定性，Vieira等人的實(shí)驗(yàn)程序是這樣設(shè)計(jì)的：壓一根桿每10次可以有8次得到1份食物；而壓另一根桿每10次可以有3次得到3份食物。并且重要的是，在他們的實(shí)驗(yàn)里，事先不讓動(dòng)物進(jìn)行密集的學(xué)習(xí)，因此即使進(jìn)行了較多次的測(cè)試，動(dòng)物只能形成高風(fēng)險(xiǎn)／高獎(jiǎng)賞與低風(fēng)險(xiǎn)／低獎(jiǎng)賞的印象，不可能像杠桿不確定情形下那樣對(duì)每根桿的概率都了解清楚。所以，每一次壓桿所帶來的結(jié)果對(duì)于動(dòng)物來說都是未知，因此叫總體不確定性。此時(shí)損毀眶額回，動(dòng)物表現(xiàn)出更多的冒險(xiǎn)選擇，與人的研究相一致。實(shí)際上總體不確定性的實(shí)驗(yàn)?zāi)Ｊ胶腿说馁€博游戲更為相似：你總是不知道下一盤會(huì)是贏還是輸。

以上的實(shí)驗(yàn)介紹了眶額回以及扣帶前回在決策實(shí)驗(yàn)中的作用，提示皮層參與決策且不同的區(qū)域所承擔(dān)的具體計(jì)算功能是不同的。但是，由于在這些實(shí)驗(yàn)中，獎(jiǎng)賞都是食物，因此，只能推斷眶額回和扣帶前回分別參與不同的成本的計(jì)算，而是否在對(duì)獎(jiǎng)賞物的計(jì)算方面有所區(qū)分，尚不能知。此外，由于采用損毀的方法，目前還不清楚腦內(nèi)的化學(xué)物質(zhì)在各個(gè)區(qū)域之間的投射關(guān)系，以及受體的作用，甚至是細(xì)胞內(nèi)分子的功能。

2.2 動(dòng)機(jī)與伏隔核

研究發(fā)現(xiàn)，損毀伏隔核能導(dǎo)致動(dòng)物的決策行為發(fā)生變化。對(duì)于概率折扣，損毀伏隔核使動(dòng)物的冒險(xiǎn)行為增多；對(duì)于付出努力，損毀伏隔核導(dǎo)致動(dòng)物更加不傾向于付出努力而得到更多的食物；而對(duì)于概率折扣的研究還不統(tǒng)一，損毀伏隔核增加和減少?zèng)_動(dòng)行為都有報(bào)道，但是亦能說明伏隔核參與決策行為。

而另一方面，研究人員通過系統(tǒng)注射多巴胺的干預(yù)藥(激動(dòng)劑或者拮抗劑)，或者系統(tǒng)耗竭腦內(nèi)多巴胺，發(fā)現(xiàn)多巴胺參與概率折扣與付出努力。在概率折扣中，系統(tǒng)注射非選擇性多巴胺拮抗劑，D1受體拮抗劑或D2受體拮抗劑，或者系統(tǒng)耗竭多巴胺都能夠?qū)е聸_動(dòng)行為的增加；而在付出努力，系統(tǒng)給以大鼠D2受體拮抗劑使大鼠更傾向于選擇少卻相對(duì)能夠輕松獲得的食物。

考慮到中腦腹側(cè)被該區(qū)域?qū)Ψ艉说亩喟桶吠渡錇榻?jīng)典的動(dòng)機(jī)通路，那么，在動(dòng)物決策實(shí)驗(yàn)中，研究人員通過損毀伏隔核或干預(yù)多巴胺，從而造成行為的變化，是否是通過調(diào)節(jié)動(dòng)機(jī)達(dá)成的呢?

Salamone等人在1994年完成了一個(gè)實(shí)驗(yàn)，運(yùn)用付出努力模型，通過局部耗竭伏隔核的多巴胺，發(fā)現(xiàn)動(dòng)物會(huì)變得懶惰，不愿意去花費(fèi)力氣得到更多食物。作者認(rèn)為這是由于動(dòng)物對(duì)食物的動(dòng)機(jī)被削弱的原因所致。

不過，對(duì)于動(dòng)機(jī)、多巴胺和伏隔核三者關(guān)系的研究仍然非常缺乏。為了探索這三者的關(guān)系，需要更多實(shí)驗(yàn)在伏隔核區(qū)域干預(yù)多巴胺，通過不同模型來考察動(dòng)物的行為。動(dòng)機(jī)在付出努力的模型中相對(duì)容易解釋，而在延遲折扣模型中，如果干預(yù)了伏隔核多巴胺從而導(dǎo)致行為更為沖動(dòng)，那么，還需要區(qū)分，沖動(dòng)的增加是由于動(dòng)物對(duì)獲得食物的動(dòng)機(jī)減弱所致，還是對(duì)等待的厭惡動(dòng)機(jī)增大所致。

2.3 工作記憶與基底外側(cè)杏仁核

無論哪一種模型，決策都發(fā)生在行為表現(xiàn)前。在實(shí)驗(yàn)的環(huán)境下，面對(duì)諸多提示結(jié)果的線索的時(shí)候，長時(shí)記憶被提取，記憶中的內(nèi)容呈現(xiàn)一種“online”的狀態(tài)。這種online的狀態(tài)的作用是保證線索(如燈光，實(shí)驗(yàn)環(huán)境)一行為(如壓桿)一結(jié)果(如食物)之間存在著聯(lián)結(jié)。實(shí)際上，在動(dòng)物實(shí)驗(yàn)里，訓(xùn)練就是建立這種聯(lián)結(jié)，而測(cè)試則是聯(lián)結(jié)的提取。在決策中(延遲折扣與付出努力)已被提到的參與聯(lián)結(jié)作用部位有基底外側(cè)杏仁核。不過，由于目前實(shí)驗(yàn)多采用的是局部核團(tuán)的損毀法或暫時(shí)失活法，這些核團(tuán)之間的聯(lián)系，即如何共同起作用還不明確。

3 決策與藥物成癮

很多時(shí)候決策并不是一個(gè)單純的行為，而是在其他行為中發(fā)揮作用。例如，上文中提到的動(dòng)物模型都利用了覓食行為，在覓食中動(dòng)物表現(xiàn)出決策。下文將探討藥物成癮與決策的關(guān)系，希望能深化對(duì)決策及其腦基礎(chǔ)的認(rèn)識(shí)。并且，在以往的研究中，成癮常被看作是異常學(xué)習(xí)和異常記憶的結(jié)果；在這里我們提出，成癮現(xiàn)象與行為決策也有著密切的聯(lián)系，成癮藥物能夠使決策行為發(fā)生變化；同時(shí)，本身決策能力不同的個(gè)體，對(duì)成癮藥物的易感性也可能存在著個(gè)體差異。

3.1 成癮藥物對(duì)決策的影響

一些以人類為對(duì)象的調(diào)查研究發(fā)現(xiàn)，成癮人群(造成成癮的藥物包括精神興奮類，阿片類，酒精，大麻以及尼古丁)會(huì)比正常人群表現(xiàn)出更高的沖動(dòng)性，或者說，他們對(duì)獎(jiǎng)賞的延遲更不能忍受。

但是另一方面，注意缺陷多動(dòng)障礙(attentiondeficit hyperactivity disorder，ADHD)的患者的一個(gè)顯著癥狀便是認(rèn)知沖動(dòng)，而在臨床上則接受精神興奮類藥物的治療，發(fā)現(xiàn)安非他明可以減輕沖動(dòng)。

在以動(dòng)物為對(duì)象的基礎(chǔ)研究中也發(fā)現(xiàn)了這樣的混合現(xiàn)象。對(duì)此目前并沒有明確的解釋，一個(gè)可能的原因是急慢性用藥可能會(huì)導(dǎo)致雙重的作用，即急性用藥(至少對(duì)于精神興奮類和尼古丁是這樣)能導(dǎo)致沖動(dòng)的減少，而慢性用藥則使沖動(dòng)水平升高。一個(gè)典型的例子是Richards等人在1999年的報(bào)告，大鼠在測(cè)試前急性注射甲基苯丙胺會(huì)使沖動(dòng)降低，而在每次訓(xùn)練后反復(fù)注射該藥，則在今后的測(cè)試中得到相反的結(jié)果。在腦機(jī)制方面，目前還不清楚藥物是如何改變決策的，不過，應(yīng)該可以推測(cè)成癮與決策具有共同的腦機(jī)制(腹內(nèi)側(cè)前額葉是目前的一個(gè)關(guān)注點(diǎn)，因此在藥物反復(fù)作用后引起了腦長時(shí)程的適應(yīng)變化，最終改變了決策行為。

3.2 決策的個(gè)體差異對(duì)成癮易感性的預(yù)測(cè)

有觀點(diǎn)認(rèn)為，個(gè)體在決策上存在著差異(例如高沖動(dòng)與低沖動(dòng))，而這種差異意味著個(gè)體對(duì)成癮藥物不同的易感性，高的沖動(dòng)性似乎可以用來預(yù)測(cè)高的成癮易感性。一個(gè)以學(xué)齡前兒童為對(duì)象的縱向研究發(fā)現(xiàn)，孩子們?cè)敢鉃榈却^大獎(jiǎng)賞而付出的時(shí)間與10年后的社會(huì)和人格障礙成反比，即沖動(dòng)的孩子在以后的日子更容易物質(zhì)濫用。另一個(gè)例子是對(duì)大學(xué)生吸煙者的研究發(fā)現(xiàn)，一些被稱為“chipper”的人雖然有規(guī)律的吸煙，但是卻并不產(chǎn)生依賴，這些人和依賴者相比沖動(dòng)性偏低。

在動(dòng)物實(shí)驗(yàn)，一個(gè)直接的例子是以雌性成年大鼠的研究。實(shí)驗(yàn)首先將動(dòng)物分成高沖動(dòng)組與低沖動(dòng)組，結(jié)果發(fā)現(xiàn)高沖動(dòng)組更容易形成可卡因自身給藥(self-administration，SA)。另一個(gè)相關(guān)的例子，SHR大鼠(模擬ADHD的高血壓大鼠)可以區(qū)分出不同的沖動(dòng)性，并且對(duì)派酸甲酯的敏感性也不一樣(派酸甲酯具有增加中樞多巴胺的功能，但成癮性安非他明低許多，可以減少?zèng)_動(dòng)，臨床上用于治療ADHD)。

因此，與新穎尋求和感覺尋求類似，沖動(dòng)性可以作為預(yù)測(cè)藥物成癮易感性的一個(gè)指標(biāo)。目前對(duì)其腦機(jī)制的研究還很少，一個(gè)可能的原因在于高級(jí)皮層對(duì)下游動(dòng)機(jī)系統(tǒng)控制力的強(qiáng)度。Mcclure在2004年以人為對(duì)象，要求被試作出以下的二選一：立即或較短時(shí)間內(nèi)得到的少量的錢或者是較長時(shí)間而得到更多的錢。結(jié)果發(fā)現(xiàn)當(dāng)被試選擇前者時(shí)，部分的邊緣系統(tǒng)，包括旁邊緣皮層(腹側(cè)紋狀體，內(nèi)側(cè)眶額回，內(nèi)側(cè)前額葉和后扣帶回)激活。而當(dāng)被試選擇后者時(shí)，一些參與高級(jí)認(rèn)知功能的區(qū)域，背外側(cè)前額葉，腹外側(cè)前額葉和外側(cè)眶額回被激活。另一個(gè)對(duì)大鼠腦內(nèi)進(jìn)行生化檢測(cè)的實(shí)驗(yàn)發(fā)現(xiàn)，低沖動(dòng)的大鼠在前額葉皮層的代謝要比高沖動(dòng)大鼠更高，顯示更高的活性。相反，在代表動(dòng)機(jī)的伏隔核核區(qū)低沖動(dòng)大鼠的活性反而低。因此，可以推測(cè)較高級(jí)皮層對(duì)較低級(jí)區(qū)域的抑制作用是有機(jī)體做出理性選擇的一個(gè)基礎(chǔ)。假如這種抑制的強(qiáng)度不夠，動(dòng)機(jī)系統(tǒng)的活性水平過高，導(dǎo)致異常動(dòng)機(jī)。而藥物成癮的一個(gè)顯著特征便是對(duì)藥物苛求的異常動(dòng)機(jī)。實(shí)際上長期用藥導(dǎo)致沖動(dòng)性的提高也很可能是藥物弱化了高級(jí)中樞的抑制功能。

4 小結(jié)

文章介紹了近年來以嚙齒動(dòng)物為實(shí)驗(yàn)對(duì)象，圍繞決策行為及其腦機(jī)制進(jìn)行的研究。文章介紹了實(shí)驗(yàn)?zāi)Ｐ汀⒉煌愋蜎Q策共同的心理及腦機(jī)制，并在最后從決策的角度探討了藥物成癮現(xiàn)象。

由于在動(dòng)物實(shí)驗(yàn)中能夠進(jìn)行腦內(nèi)給藥等腦干預(yù)手段，也可以對(duì)腦進(jìn)行生化檢測(cè)，因此通過動(dòng)物實(shí)驗(yàn)可以更好的考查腦與行為之間的關(guān)系，對(duì)以人類被試的研究是極好的補(bǔ)充。

當(dāng)然，目前以嚙齒動(dòng)物為對(duì)象的決策行為研究還有許多尚未明了的領(lǐng)域。一是目前大部分實(shí)驗(yàn)采用了局部腦區(qū)損毀的方法。這種方法可以比較清楚的考察各個(gè)腦區(qū)在行為中的作用，但是不能探究遞質(zhì)、受體在各個(gè)腦區(qū)之問的作用，腦區(qū)與腦區(qū)之間的聯(lián)系還不明了。二是在藥物成癮領(lǐng)域中，從趨避沖突出發(fā)看待覓藥行為的研究尚不豐富。考慮到覓藥行為所能帶來的潛在快感和威脅，這樣的研究是有意義的。

心理科學(xué)進(jìn)展2008年5期

心理科學(xué)進(jìn)展的其它文章: 目標(biāo)內(nèi)容效應(yīng)及其心理機(jī)制; 污名應(yīng)對(duì)研究：發(fā)展脈絡(luò)、理論取向與展望; 談判中的時(shí)間因素; 職業(yè)選拔情境下人格測(cè)驗(yàn)作假研究; 理性行為理論及其拓展研究的現(xiàn)狀與展望; 沖動(dòng)性消費(fèi)行為內(nèi)在機(jī)制研究述評(píng)