摘要:介紹了近年來以嚙齒類動(dòng)物為對(duì)象,關(guān)于決策的行為表現(xiàn)及其內(nèi)在腦機(jī)制的研究進(jìn)展。首先介紹了決策的概念,以及嚙齒類動(dòng)物的決策模型。在這些模型的基礎(chǔ)上,總結(jié)了不同決策模型的共同的心理過程:計(jì)算、動(dòng)機(jī)和記憶,并且介紹了業(yè)已發(fā)現(xiàn)的參與這些心理機(jī)制的腦機(jī)制。最后,還從決策的角度探討了其與藥物成癮之間的關(guān)系,包括成癮藥物對(duì)決策行為的影響以及決策個(gè)體差異與藥物成癮易感性之間的關(guān)系。
關(guān)鍵詞:決策,腦機(jī)制,藥物成癮,嚙齒動(dòng)物模型 分類號(hào):B845
1 前言及實(shí)驗(yàn)?zāi)P?/p>
決策(decision making)是人類以及許多動(dòng)物所共同具有的能力,是一種較高級(jí)的心理功能。在動(dòng)物實(shí)驗(yàn)中,決策與行為選擇(action selection)的意義相同,因?yàn)閮烧呖梢员灰暈檫@樣的行為活動(dòng):在數(shù)個(gè)備選項(xiàng)中,經(jīng)過利與弊,或者是收益(benefit)與成本(cost)之間的權(quán)衡,根據(jù)權(quán)衡的結(jié)果輸出行為,選擇其中的某個(gè)或某幾個(gè)選項(xiàng)。
在現(xiàn)有的嚙齒類動(dòng)物研究中,較常用的決策模型包括:延遲折扣(delay-discount)、概率折扣(probability-discount)、付出努力(effort-baseddecision making)和趨避任務(wù)(approach.a(chǎn)voidance task)等。
延遲折扣是指獎(jiǎng)賞物的價(jià)值隨著時(shí)間的流逝而逐漸貶值,動(dòng)物需要在價(jià)值大小和等待時(shí)問長短之間作出權(quán)衡。動(dòng)物通常可以在兩種行為之間進(jìn)行二選一:表現(xiàn)出行為A(如在Skinner箱中壓左桿),結(jié)果是可以立即得到少量的食物;表現(xiàn)出行為B(如在Skinner箱中壓右桿),結(jié)果是能夠得到更多的食物,但是需要等待一段時(shí)間。通常隨著需要等待時(shí)間的延長,動(dòng)物會(huì)更傾向于去表現(xiàn)出可以立即得到食物的行為(這種行為被稱為沖動(dòng)行為,impulsivebehavior)。
概率折扣與延遲折扣相似,動(dòng)物的任務(wù)是在出現(xiàn)概率大但食物量少以及出現(xiàn)概率小但食物量的多選項(xiàng)之間作出決策。隨著食物出現(xiàn)的概率的減少,動(dòng)物會(huì)更偏好選擇雖然少但是更可能出現(xiàn)食物的行為,而反之,如果動(dòng)物表現(xiàn)出的行為是針對(duì)食物量多卻出現(xiàn)概率小的結(jié)果,則認(rèn)為這樣的行為是冒險(xiǎn)性質(zhì)的(risky behavior)。
在付出努力的實(shí)驗(yàn)里,研究人員多運(yùn)用T迷宮障礙實(shí)驗(yàn)來考查動(dòng)物是否愿意付出努力來獲得(更多)的回報(bào)。動(dòng)物T字的分岔口面臨著決策:或者去沒有障礙的一側(cè),可以得到少量的食物;或者去有障礙的另一側(cè),需要翻越障礙才能得到更多的食物。動(dòng)物需要權(quán)衡的是,多得到的食物,是否值得多付出能量用于翻越障礙?
最后,在趨避任務(wù)中,目前并沒有統(tǒng)一的模型,高架十字迷宮(elevated-plus maze)、社會(huì)應(yīng)激(social-stress)的實(shí)驗(yàn)方法都有被采用到。趨避模型主要被運(yùn)用于測(cè)查抗焦慮藥物的實(shí)驗(yàn)中,如以高架十字迷宮為例,首次被放入迷宮的動(dòng)物在面對(duì)開放臂(open-arm)既有進(jìn)行探索的驅(qū)動(dòng)力,而同時(shí)又有恐高的回避傾向。這種趨避共存的現(xiàn)象會(huì)導(dǎo)致焦慮。而在服用了抗焦慮藥物后,動(dòng)物會(huì)花費(fèi)更多的時(shí)間呆在開放臂,因?yàn)榻箲]程度降低了。
總體來說,比起人類的決策及其腦機(jī)制的研究,如行為神經(jīng)經(jīng)濟(jì)學(xué)(behavioral neuroeconomics),雖然動(dòng)物實(shí)驗(yàn)對(duì)行為考察的程度不如人類實(shí)驗(yàn)來得那么真實(shí)和復(fù)雜,但是動(dòng)物研究增加了腦干預(yù)的手段,通過特定的決策行為模型,可以更為細(xì)致的考察不同腦區(qū),不同化學(xué)物質(zhì)在決策中所發(fā)揮的作用。
2 決策的心理機(jī)制及其腦基礎(chǔ)
以上介紹的四種模型中,雖然任務(wù)不同,但是既然都屬于決策行為,因此包含著相同成分的心理機(jī)制和腦基礎(chǔ),在這里討論三個(gè)環(huán)節(jié):計(jì)算、動(dòng)機(jī)以及工作記憶。
2.1 計(jì)算與皮層
在文章的開頭,提到?jīng)Q策被視為是一種選擇,而選擇的依據(jù)是收益與成本之間經(jīng)過權(quán)衡了的結(jié)果。顯然,權(quán)衡是一個(gè)計(jì)算的過程,雖然很多時(shí)候并不明確需要經(jīng)過數(shù)字的運(yùn)算,但是決策者需要在各個(gè)選擇之間進(jìn)行比較,既考慮哪個(gè)選擇可以得到的獎(jiǎng)賞最多,也要考慮實(shí)現(xiàn)各個(gè)選擇所需的成本有多少。
目前關(guān)于計(jì)算的模型將目標(biāo)腦區(qū)集中在了皮層,認(rèn)為大腦皮層經(jīng)過計(jì)算,權(quán)衡了各種可能的利弊后,會(huì)對(duì)某個(gè)或某幾個(gè)備選行為形成偏好,然后用谷氨酸將這種對(duì)于各個(gè)備選行為的權(quán)衡結(jié)果投射到基底神經(jīng)節(jié)(basal ganglia),再由基底神經(jīng)節(jié)經(jīng)過加工輸出被選擇了的行為。采用局部損毀的方法,可以比較清楚地觀察某個(gè)區(qū)域在行為中所發(fā)揮的作用。研究人員用此方法針對(duì)前額葉皮層的眶額回(orbifrontal cortex,OFC)和扣帶前回(AnteriorCingulate cortex。ACC)在延遲折扣和付出努力兩種模型中的作用分別做了研究。結(jié)果發(fā)現(xiàn),損毀眶額回,增加動(dòng)物的沖動(dòng)行為(但也有沖動(dòng)性降低的報(bào)道),但是并不影響動(dòng)物愿意去翻越障礙而獲得更多食物;而損毀扣帶前回的結(jié)果則剛好相反:損毀扣帶前回使動(dòng)物變得更為“懶惰”,不愿意為了獲得更多食物而翻越障礙,但是并不影響動(dòng)物為了得到更多食物而多等一會(huì)。因此,盡管獎(jiǎng)賞均是食物,但是由于在延遲折扣和付出努力的模型中成本分別是時(shí)問和能量,因此參與成本計(jì)算與控制的區(qū)域在腦結(jié)構(gòu)上發(fā)生了分離:眶額回承擔(dān)時(shí)間的計(jì)算,而扣帶前回則考慮能量的付出。
除了時(shí)間折扣,在概率折扣中,研究人員同樣發(fā)現(xiàn)需要眶額回的參與,但是機(jī)制更為復(fù)雜。損毀眶額回的結(jié)果并不一致,冒險(xiǎn)性選擇增加和減少的結(jié)果都有。但是在以人為被試的賭博性游戲中,眶額回?fù)p傷的病人往往表現(xiàn)出的是冒險(xiǎn)性行為。Vieira等人經(jīng)過研究,認(rèn)為眶額回依據(jù)不同的不確定性,會(huì)有不同的作用。具體地說,一個(gè)是杠桿不確定性,一個(gè)是背景不確定性。在經(jīng)典的概率折扣研究中,動(dòng)物首先經(jīng)過反復(fù)學(xué)習(xí),使之明白兩根桿所帶來的不同食物獎(jiǎng)賞與獎(jiǎng)賞呈現(xiàn)的不同概率。這便是杠桿不確定性:因?yàn)槟骋淮蔚膲簵U,并不知道會(huì)造成什么樣的結(jié)果;但是,隨著壓桿次數(shù)的增多,由于之前經(jīng)過學(xué)習(xí),已經(jīng)大致知道了概率,因此總體能得到多少獎(jiǎng)賞是比較清楚的。在這種情況下,損毀眶額回,是減少冒險(xiǎn)選擇的。
而對(duì)于總體不確定性,Vieira等人的實(shí)驗(yàn)程序是這樣設(shè)計(jì)的:壓一根桿每10次可以有8次得到1份食物;而壓另一根桿每10次可以有3次得到3份食物。并且重要的是,在他們的實(shí)驗(yàn)里,事先不讓動(dòng)物進(jìn)行密集的學(xué)習(xí),因此即使進(jìn)行了較多次的測(cè)試,動(dòng)物只能形成高風(fēng)險(xiǎn)/高獎(jiǎng)賞與低風(fēng)險(xiǎn)/低獎(jiǎng)賞的印象,不可能像杠桿不確定情形下那樣對(duì)每根桿的概率都了解清楚。所以,每一次壓桿所帶來的結(jié)果對(duì)于動(dòng)物來說都是未知,因此叫總體不確定性。此時(shí)損毀眶額回,動(dòng)物表現(xiàn)出更多的冒險(xiǎn)選擇,與人的研究相一致。實(shí)際上總體不確定性的實(shí)驗(yàn)?zāi)J胶腿说馁€博游戲更為相似:你總是不知道下一盤會(huì)是贏還是輸。
以上的實(shí)驗(yàn)介紹了眶額回以及扣帶前回在決策實(shí)驗(yàn)中的作用,提示皮層參與決策且不同的區(qū)域所承擔(dān)的具體計(jì)算功能是不同的。但是,由于在這些實(shí)驗(yàn)中,獎(jiǎng)賞都是食物,因此,只能推斷眶額回和扣帶前回分別參與不同的成本的計(jì)算,而是否在對(duì)獎(jiǎng)賞物的計(jì)算方面有所區(qū)分,尚不能知。此外,由于采用損毀的方法,目前還不清楚腦內(nèi)的化學(xué)物質(zhì)在各個(gè)區(qū)域之間的投射關(guān)系,以及受體的作用,甚至是細(xì)胞內(nèi)分子的功能。
2.2 動(dòng)機(jī)與伏隔核
研究發(fā)現(xiàn),損毀伏隔核能導(dǎo)致動(dòng)物的決策行為發(fā)生變化。對(duì)于概率折扣,損毀伏隔核使動(dòng)物的冒險(xiǎn)行為增多;對(duì)于付出努力,損毀伏隔核導(dǎo)致動(dòng)物更加不傾向于付出努力而得到更多的食物;而對(duì)于概率折扣的研究還不統(tǒng)一,損毀伏隔核增加和減少?zèng)_動(dòng)行為都有報(bào)道,但是亦能說明伏隔核參與決策行為。
而另一方面,研究人員通過系統(tǒng)注射多巴胺的干預(yù)藥(激動(dòng)劑或者拮抗劑),或者系統(tǒng)耗竭腦內(nèi)多巴胺,發(fā)現(xiàn)多巴胺參與概率折扣與付出努力。在概率折扣中,系統(tǒng)注射非選擇性多巴胺拮抗劑,D1受體拮抗劑或D2受體拮抗劑,或者系統(tǒng)耗竭多巴胺都能夠?qū)е聸_動(dòng)行為的增加;而在付出努力,系統(tǒng)給以大鼠D2受體拮抗劑使大鼠更傾向于選擇少卻相對(duì)能夠輕松獲得的食物。
考慮到中腦腹側(cè)被該區(qū)域?qū)Ψ艉说亩喟桶吠渡錇榻?jīng)典的動(dòng)機(jī)通路,那么,在動(dòng)物決策實(shí)驗(yàn)中,研究人員通過損毀伏隔核或干預(yù)多巴胺,從而造成行為的變化,是否是通過調(diào)節(jié)動(dòng)機(jī)達(dá)成的呢?
Salamone等人在1994年完成了一個(gè)實(shí)驗(yàn),運(yùn)用付出努力模型,通過局部耗竭伏隔核的多巴胺,發(fā)現(xiàn)動(dòng)物會(huì)變得懶惰,不愿意去花費(fèi)力氣得到更多食物。作者認(rèn)為這是由于動(dòng)物對(duì)食物的動(dòng)機(jī)被削弱的原因所致。
不過,對(duì)于動(dòng)機(jī)、多巴胺和伏隔核三者關(guān)系的研究仍然非常缺乏。為了探索這三者的關(guān)系,需要更多實(shí)驗(yàn)在伏隔核區(qū)域干預(yù)多巴胺,通過不同模型來考察動(dòng)物的行為。動(dòng)機(jī)在付出努力的模型中相對(duì)容易解釋,而在延遲折扣模型中,如果干預(yù)了伏隔核多巴胺從而導(dǎo)致行為更為沖動(dòng),那么,還需要區(qū)分,沖動(dòng)的增加是由于動(dòng)物對(duì)獲得食物的動(dòng)機(jī)減弱所致,還是對(duì)等待的厭惡動(dòng)機(jī)增大所致。
2.3 工作記憶與基底外側(cè)杏仁核
無論哪一種模型,決策都發(fā)生在行為表現(xiàn)前。在實(shí)驗(yàn)的環(huán)境下,面對(duì)諸多提示結(jié)果的線索的時(shí)候,長時(shí)記憶被提取,記憶中的內(nèi)容呈現(xiàn)一種“online”的狀態(tài)。這種online的狀態(tài)的作用是保證線索(如燈光,實(shí)驗(yàn)環(huán)境)一行為(如壓桿)一結(jié)果(如食物)之間存在著聯(lián)結(jié)。實(shí)際上,在動(dòng)物實(shí)驗(yàn)里,訓(xùn)練就是建立這種聯(lián)結(jié),而測(cè)試則是聯(lián)結(jié)的提取。在決策中(延遲折扣與付出努力)已被提到的參與聯(lián)結(jié)作用部位有基底外側(cè)杏仁核。不過,由于目前實(shí)驗(yàn)多采用的是局部核團(tuán)的損毀法或暫時(shí)失活法,這些核團(tuán)之間的聯(lián)系,即如何共同起作用還不明確。
3 決策與藥物成癮
很多時(shí)候決策并不是一個(gè)單純的行為,而是在其他行為中發(fā)揮作用。例如,上文中提到的動(dòng)物模型都利用了覓食行為,在覓食中動(dòng)物表現(xiàn)出決策。下文將探討藥物成癮與決策的關(guān)系,希望能深化對(duì)決策及其腦基礎(chǔ)的認(rèn)識(shí)。并且,在以往的研究中,成癮常被看作是異常學(xué)習(xí)和異常記憶的結(jié)果;在這里我們提出,成癮現(xiàn)象與行為決策也有著密切的聯(lián)系,成癮藥物能夠使決策行為發(fā)生變化;同時(shí),本身決策能力不同的個(gè)體,對(duì)成癮藥物的易感性也可能存在著個(gè)體差異。
3.1 成癮藥物對(duì)決策的影響
一些以人類為對(duì)象的調(diào)查研究發(fā)現(xiàn),成癮人群(造成成癮的藥物包括精神興奮類,阿片類,酒精,大麻以及尼古丁)會(huì)比正常人群表現(xiàn)出更高的沖動(dòng)性,或者說,他們對(duì)獎(jiǎng)賞的延遲更不能忍受。
但是另一方面,注意缺陷多動(dòng)障礙(attentiondeficit hyperactivity disorder,ADHD)的患者的一個(gè)顯著癥狀便是認(rèn)知沖動(dòng),而在臨床上則接受精神興奮類藥物的治療,發(fā)現(xiàn)安非他明可以減輕沖動(dòng)。
在以動(dòng)物為對(duì)象的基礎(chǔ)研究中也發(fā)現(xiàn)了這樣的混合現(xiàn)象。對(duì)此目前并沒有明確的解釋,一個(gè)可能的原因是急慢性用藥可能會(huì)導(dǎo)致雙重的作用,即急性用藥(至少對(duì)于精神興奮類和尼古丁是這樣)能導(dǎo)致沖動(dòng)的減少,而慢性用藥則使沖動(dòng)水平升高。一個(gè)典型的例子是Richards等人在1999年的報(bào)告,大鼠在測(cè)試前急性注射甲基苯丙胺會(huì)使沖動(dòng)降低,而在每次訓(xùn)練后反復(fù)注射該藥,則在今后的測(cè)試中得到相反的結(jié)果。在腦機(jī)制方面,目前還不清楚藥物是如何改變決策的,不過,應(yīng)該可以推測(cè)成癮與決策具有共同的腦機(jī)制(腹內(nèi)側(cè)前額葉是目前的一個(gè)關(guān)注點(diǎn),因此在藥物反復(fù)作用后引起了腦長時(shí)程的適應(yīng)變化,最終改變了決策行為。
3.2 決策的個(gè)體差異對(duì)成癮易感性的預(yù)測(cè)
有觀點(diǎn)認(rèn)為,個(gè)體在決策上存在著差異(例如高沖動(dòng)與低沖動(dòng)),而這種差異意味著個(gè)體對(duì)成癮藥物不同的易感性,高的沖動(dòng)性似乎可以用來預(yù)測(cè)高的成癮易感性。一個(gè)以學(xué)齡前兒童為對(duì)象的縱向研究發(fā)現(xiàn),孩子們?cè)敢鉃榈却^大獎(jiǎng)賞而付出的時(shí)間與10年后的社會(huì)和人格障礙成反比,即沖動(dòng)的孩子在以后的日子更容易物質(zhì)濫用。另一個(gè)例子是對(duì)大學(xué)生吸煙者的研究發(fā)現(xiàn),一些被稱為“chipper”的人雖然有規(guī)律的吸煙,但是卻并不產(chǎn)生依賴,這些人和依賴者相比沖動(dòng)性偏低。
在動(dòng)物實(shí)驗(yàn),一個(gè)直接的例子是以雌性成年大鼠的研究。實(shí)驗(yàn)首先將動(dòng)物分成高沖動(dòng)組與低沖動(dòng)組,結(jié)果發(fā)現(xiàn)高沖動(dòng)組更容易形成可卡因自身給藥(self-administration,SA)。另一個(gè)相關(guān)的例子,SHR大鼠(模擬ADHD的高血壓大鼠)可以區(qū)分出不同的沖動(dòng)性,并且對(duì)派酸甲酯的敏感性也不一樣(派酸甲酯具有增加中樞多巴胺的功能,但成癮性安非他明低許多,可以減少?zèng)_動(dòng),臨床上用于治療ADHD)。
因此,與新穎尋求和感覺尋求類似,沖動(dòng)性可以作為預(yù)測(cè)藥物成癮易感性的一個(gè)指標(biāo)。目前對(duì)其腦機(jī)制的研究還很少,一個(gè)可能的原因在于高級(jí)皮層對(duì)下游動(dòng)機(jī)系統(tǒng)控制力的強(qiáng)度。Mcclure在2004年以人為對(duì)象,要求被試作出以下的二選一:立即或較短時(shí)間內(nèi)得到的少量的錢或者是較長時(shí)間而得到更多的錢。結(jié)果發(fā)現(xiàn)當(dāng)被試選擇前者時(shí),部分的邊緣系統(tǒng),包括旁邊緣皮層(腹側(cè)紋狀體,內(nèi)側(cè)眶額回,內(nèi)側(cè)前額葉和后扣帶回)激活。而當(dāng)被試選擇后者時(shí),一些參與高級(jí)認(rèn)知功能的區(qū)域,背外側(cè)前額葉,腹外側(cè)前額葉和外側(cè)眶額回被激活。另一個(gè)對(duì)大鼠腦內(nèi)進(jìn)行生化檢測(cè)的實(shí)驗(yàn)發(fā)現(xiàn),低沖動(dòng)的大鼠在前額葉皮層的代謝要比高沖動(dòng)大鼠更高,顯示更高的活性。相反,在代表動(dòng)機(jī)的伏隔核核區(qū)低沖動(dòng)大鼠的活性反而低。因此,可以推測(cè)較高級(jí)皮層對(duì)較低級(jí)區(qū)域的抑制作用是有機(jī)體做出理性選擇的一個(gè)基礎(chǔ)。假如這種抑制的強(qiáng)度不夠,動(dòng)機(jī)系統(tǒng)的活性水平過高,導(dǎo)致異常動(dòng)機(jī)。而藥物成癮的一個(gè)顯著特征便是對(duì)藥物苛求的異常動(dòng)機(jī)。實(shí)際上長期用藥導(dǎo)致沖動(dòng)性的提高也很可能是藥物弱化了高級(jí)中樞的抑制功能。
4 小結(jié)
文章介紹了近年來以嚙齒動(dòng)物為實(shí)驗(yàn)對(duì)象,圍繞決策行為及其腦機(jī)制進(jìn)行的研究。文章介紹了實(shí)驗(yàn)?zāi)P汀⒉煌愋蜎Q策共同的心理及腦機(jī)制,并在最后從決策的角度探討了藥物成癮現(xiàn)象。
由于在動(dòng)物實(shí)驗(yàn)中能夠進(jìn)行腦內(nèi)給藥等腦干預(yù)手段,也可以對(duì)腦進(jìn)行生化檢測(cè),因此通過動(dòng)物實(shí)驗(yàn)可以更好的考查腦與行為之間的關(guān)系,對(duì)以人類被試的研究是極好的補(bǔ)充。
當(dāng)然,目前以嚙齒動(dòng)物為對(duì)象的決策行為研究還有許多尚未明了的領(lǐng)域。一是目前大部分實(shí)驗(yàn)采用了局部腦區(qū)損毀的方法。這種方法可以比較清楚的考察各個(gè)腦區(qū)在行為中的作用,但是不能探究遞質(zhì)、受體在各個(gè)腦區(qū)之問的作用,腦區(qū)與腦區(qū)之間的聯(lián)系還不明了。二是在藥物成癮領(lǐng)域中,從趨避沖突出發(fā)看待覓藥行為的研究尚不豐富。考慮到覓藥行為所能帶來的潛在快感和威脅,這樣的研究是有意義的。