卓利楠 曾祥玉 吳 冰 牛榮榮 于 萍 王瑋文
內(nèi)側(cè)前額皮層?伏隔核環(huán)路在決策沖動中的作用:基于動物模型的研究*
卓利楠1?曾祥玉1?吳 冰1牛榮榮1于 萍1王瑋文2
(1北京市“學習與認知”重點實驗室; 首都師范大學心理學院, 北京 100048) (2中國科學院心理健康重點實驗室, 中國科學院心理研究所, 北京 100101)
注意缺陷多動障礙(attention deficit/hyperactivity disorder, ADHD)行為控制不足與決策沖動密切相關(guān), 后者受內(nèi)側(cè)前額皮層(medial prefrontal cortex, mPFC)與伏隔核(nucleus accumbens, NAc)調(diào)節(jié)。為調(diào)查ADHD決策沖動與mPFC-NAc間功能耦合的關(guān)系, 研究采用ADHD模型SHR (spontaneously hypertensive rat, SHR)大鼠, 結(jié)合延遲折扣任務和在體電生理, 研究發(fā)現(xiàn), 與對照Wistar (WIS)大鼠相比, SHR大鼠對延遲大獎賞的選擇百分比降低; WIS大鼠mPFC-NAc的Theta頻段相干值表現(xiàn)為延遲選擇時顯著大于立即選擇時、首次選擇時大于連續(xù)選擇時、轉(zhuǎn)換試次時大于連續(xù)試次時, 而SHR大鼠在上述條件均低于WIS大鼠。回歸分析發(fā)現(xiàn)mPFC-NAc的相干差值與延遲大獎賞選擇率顯著正相關(guān)。結(jié)果表明mPFC-NAc間功能聯(lián)系減弱是ADHD決策沖動缺陷的重要環(huán)路基礎(chǔ), 該缺陷與其深度信息加工以及策略轉(zhuǎn)換能力受損有關(guān), 擴展了ADHD決策沖動的認知和神經(jīng)機制的認識。
注意缺陷多動障礙, 決策沖動, 內(nèi)側(cè)前額皮層, 伏隔核, 神經(jīng)振蕩
注意缺陷多動障礙(attention deficit/hyperactivity disorder, ADHD)是兒童青少年及成人中常見的一種持續(xù)的神經(jīng)發(fā)育障礙, 以過度活躍(即多動)、難以保持持續(xù)的注意力和沖動性增加為主要癥狀(DSM-5; American Psychiatric Association, 2013; Faraone et al., 2015)。行為控制不足被認為是ADHD癥狀的重要心理病理基礎(chǔ)。決策沖動性(decision- making impulsivity)影響行為控制能力(Jackson & MacKillop, 2016; Marx et al., 2018)。其中, 人類和動物實驗研究都發(fā)現(xiàn)ADHD存在明顯的“等待”缺陷, 即行動前在權(quán)衡短期和長期的利益和成本做出決策的過程中, 不能容忍延遲滿足, 在跨期決策任務中表現(xiàn)為偏好小的即時獎勵而不能等待大的延遲獎勵, 從而導致長期獎勵損失(Aparicio et al., 2019; Marx et al., 2018; Ordu?a & Mercado, 2017; Somkuwar et al., 2016)。一項對成人、兒童和青少年ADHD患者的Meta分析結(jié)果表明, ADHD患者偏好從一個大的延遲獎勵轉(zhuǎn)變?yōu)橐粋€小的即時獎勵的決策沖動模式, 同時遺漏錯誤較多, 注意力較差(Marx et al., 2018)。
決策過程涉及獎賞價值計算、對結(jié)果的預期以及根據(jù)結(jié)果進行認知轉(zhuǎn)換等多種信息的編碼與整合加工(Robbins & Dalley, 2017)。內(nèi)側(cè)前額皮層(medial prefrontal cortex, mPFC)和伏隔核(nucleus accumbens, NAc)被認為是參與決策過程信息加工的重要結(jié)構(gòu)(Floresco et al., 2015; Jenni et al., 2017; Kim & Lee, 2011; Pérez-Díaz et al., 2017; Starkweather et al., 2018)。神經(jīng)解剖學研究表明mPFC和NAc之間具有雙向神經(jīng)纖維投射。mPFC發(fā)出的谷氨酸能神經(jīng)纖維可直接投射至NAc (Bossert et al., 2012), 其中mPFC中的緣前皮層發(fā)出的谷氨酸能神經(jīng)纖維主要投射至NAc的核部(Asher & Lodge, 2012)。NAc發(fā)出的神經(jīng)纖維可以間接投射至mPFC (Li et al., 2020)。以往的研究表明mPFC與NAc均與決策沖動的控制有關(guān)。人類功能磁共振成像顯示在DDT任務中腹側(cè)紋狀體、mPFC和后扣帶回皮層區(qū)域的激活程度隨著獎勵延遲時間的增加而減少, 因此認為這些腦區(qū)與決策沖動控制有關(guān)(Kable & Glimcher, 2007; Scheres et al., 2007)。與此一致, mPFC和NAc參與調(diào)節(jié)大鼠選擇大獎賞的延遲強化能力, 其結(jié)構(gòu)和功能受損可以誘導顯著的決策沖動(Gui et al., 2018; Sackett et al., 2019; Donnelly et al., 2014; Fox et al., 2008; Basar et al., 2010)。Sackett等人(2019)研究發(fā)現(xiàn)在DDT任務中高沖動性大鼠mPFC亞區(qū)緣前皮層中對“小/立即”線索反應的神經(jīng)元比例顯著高于低沖動性大鼠(Sackett et al., 2019), 提示高沖動性大鼠的沖動缺陷與mPFC活動有關(guān)。關(guān)于NAc及其神經(jīng)環(huán)路在決策沖動中的作用, Wang (2019)等人發(fā)現(xiàn)在DDT任務中的延遲期和獎賞預期期, 高沖動大鼠的內(nèi)側(cè)眶額皮層-NAc核部神經(jīng)通路在Beta (15~29 Hz)和低頻Gamma (30~46 Hz)頻段的gPDC (generalized partial directed coherence, gPDC)顯著弱于低沖動大鼠, 提示高沖動大鼠腦區(qū)間的信息同步交流減弱可能是導致決策沖動的原因(Wang et al., 2019)。新近的一項研究通過將靜息態(tài)功能磁共振與多模態(tài)分析相結(jié)合, 發(fā)現(xiàn)人類mPFC-紋狀體(包括NAc)功能連通性與對即時獎勵的過度敏感和較高的選擇沖動性有關(guān)(Lv et al., 2019; Wang et al., 2020)。上述實驗均提示mPFC- NAc神經(jīng)環(huán)路是參與決策沖動的重要結(jié)構(gòu)。
臨床和基礎(chǔ)研究發(fā)現(xiàn), ADHD患者及動物模型在獎勵失調(diào)的實驗中傾向于立即而不是延遲獎勵, 導致決策能力受損的行為結(jié)果與這兩個腦區(qū)結(jié)構(gòu)和功能損傷相關(guān)聯(lián)(Hauser et al., 2014; Miller et al., 2014)。例如, 與健康對照相比兒童和成人ADHD患者執(zhí)行功能相關(guān)的mPFC默認網(wǎng)絡(default mode network, DMN)失活減少(Salavert et al., 2015), 內(nèi)側(cè)、背外側(cè)和腹側(cè)前額葉腦網(wǎng)絡連接模式的改變擾亂對未來狀態(tài)的預期和未來目標的制定, 傾向于次優(yōu)決策(Sonuga-Barke & Fairchild, 2012)。ADHD青少年在獎賞預期期包括NAc在內(nèi)的腹側(cè)紋狀體激活程度降低且與病人的高活躍/沖動癥狀呈負相關(guān)(Hauser et al., 2014)。然而, 目前對于這兩個腦區(qū)的功能耦合與ADHD決策異常間的關(guān)系并不清楚。
跨期決策的雙過程理論(Carpenter et al., 2015)提出, 在決策過程中神經(jīng)網(wǎng)絡存在兩種不同的激活模式(兩個系統(tǒng)):在決策的早期階段, 需要習得不同選項與獎勵大小之間的關(guān)系, 即行為?結(jié)果的關(guān)聯(lián), 這一過程是受意識控制的、目標導向的理性分析系統(tǒng)(Khader et al., 2016), 該系統(tǒng)的活動需要調(diào)用較多的認知資源, 需要大腦進行復雜的神經(jīng)網(wǎng)絡活動(Pérez-Díaz et al., 2017)。在決策的后期階段, 在習得行為?結(jié)果聯(lián)結(jié)后, 決策過程則是不受或較少受到意識控制的、習慣化的自動加工系統(tǒng)(Zhao et al., 2019), 這個過程需要調(diào)用的認知資源以及神經(jīng)網(wǎng)絡活動的復雜程度均要低于受意識控制的理性分析系統(tǒng)。在決策過程中這兩個系統(tǒng)需要協(xié)調(diào)活動, 并隨著行為?結(jié)果聯(lián)結(jié)的變化隨時進行策略調(diào)整(Balleine & O’Doherty, 2010; Erdeniz & Done, 2020)。基于這一理論, 決策沖動的神經(jīng)環(huán)路機制可能與兩個系統(tǒng)的功能活動尤其是協(xié)同活動有關(guān)。我們假設在DDT任務的不同試次中, 首次選擇、連續(xù)選擇和試次轉(zhuǎn)換時大腦對信息加工的深度不同:大鼠在進行首次選擇時, 因為需要習得決策任務因此需要調(diào)動更多的認知資源, 以理性分析系統(tǒng)的活動為主; 而連續(xù)選擇只需要與前一個試次保持一致, 因此更多地以自動加工系統(tǒng)的活動為主; 試次轉(zhuǎn)換是對前一個試次進行糾錯并做出優(yōu)勢選項的過程, 則反映了策略調(diào)整的靈活性, 因此需要理性分析系統(tǒng)更多地參與。因此, 通過分析不同試次首次選擇、連續(xù)選擇和試次轉(zhuǎn)換時神經(jīng)環(huán)路的激活程度, 可以考察理性分析系統(tǒng)和自動加工系統(tǒng)功能活動的動態(tài)改變。目前認為, 雙過程理論的神經(jīng)基礎(chǔ)主要與皮質(zhì)?紋狀體神經(jīng)網(wǎng)絡環(huán)路的活動有關(guān), 受意識控制的目標導向行為主要依賴于皮質(zhì)?紋狀體神經(jīng)網(wǎng)絡的協(xié)同活動, 而不受意識控制的習慣性行為則主要與皮質(zhì)下的紋狀體活動有關(guān)(Khader et al., 2016)。我們假設如果ADHD的mPFC-NAc間的環(huán)路功能耦合異常, 則兩個系統(tǒng)的活動尤其是協(xié)調(diào)性有可能受損, 進而導致決策沖動異常。
SHR (spontaneously hypertensive rat, SHR)大鼠是目前最廣泛使用的一種高效度的ADHD模型動物。大量研究證實, 與Wistar (WIS)對照大鼠相比SHR大鼠表現(xiàn)出過度活躍、行為沖動, 持續(xù)注意力受損以及對延遲獎勵的敏感性異常等ADHD核心癥狀(Aparicio et al., 2019; Fox et al., 2008; Ordu?a & Mercado, 2017), 以及腦內(nèi)DA、去甲腎上腺素和谷氨酸系統(tǒng)功能紊亂等ADHD樣病理生理改變, 并且臨床治療藥物(如哌甲酯等)可以改善SHR大鼠的ADHD樣行為改變(Gauthier et al., 2014; Miller et al., 2014; Somkuwar et al., 2016)。延遲折扣任務(delay discounting task, DDT)是一個跨物種的決策沖動檢測范式, 廣泛用于測量人類、靈長目類和嚙齒類對延遲的容忍度(Aparicio et al., 2019; Ordu?a & Mercado, 2017; Sackett et al., 2019; Vanderveldt et al., 2016)。DDT是指獎勵的主觀價值會隨著等待時間的延長而降低, 即由于獎勵的延遲而使獎勵的價值貶值, 當延遲變得太長時, 個體會將他們的偏好從一個大的延遲獎勵轉(zhuǎn)變?yōu)橐粋€較小的、即時的獎勵, 個體對延遲大獎賞的選擇百分比通常被認為是一種決策沖動指數(shù), 可以用來衡量個體在不同延遲時間下的決策沖動水平(Steele et al., 2018; Vanderveldt et al., 2016)。
結(jié)合行為學和電生理方法, 本研究采用ADHD動物模型SHR大鼠并特異性地在mPFC和NAc植入微電極, 利用多通道在體電生理技術(shù)記錄清醒大鼠mPFC和NAc在DDT首次選擇、連續(xù)選擇以及試次轉(zhuǎn)換過程中的局部場電位(local field potential, LFP)活動及其在Theta (4~12 Hz)頻帶中的相干值, 針對性地探討mPFC-NAc神經(jīng)環(huán)路活動在ADHD病理機制中的作用。局部場電位的相干值是指相同頻率的兩個振蕩之間相位差的相對恒定性, 反映腦區(qū)之間的協(xié)同性活動。以往的研究證實, 前額皮層與皮層下結(jié)構(gòu)之間在Theta (4~12 Hz)頻段的協(xié)同振蕩活動可以促進目標導向任務中腦區(qū)之間的通信(Donnelly et al., 2014; Moorman & Aston-Jones, 2015; Sackett et al., 2019; Womelsdorf et al., 2007)。因此, 本研究利用相干值計算mPFC-NAc局部場電位在神經(jīng)環(huán)路中的功能聯(lián)系緊密程度, 進而分析mPFC-NAc功能聯(lián)系緊密程度與DDT任務選擇的關(guān)鍵事件(包括編碼整合、獎賞價值計算、對結(jié)果的預期以及根據(jù)結(jié)果進行策略轉(zhuǎn)換等)的關(guān)系, 以探討ADHD決策沖動異常的認知和神經(jīng)機制。
為了探討內(nèi)側(cè)前額皮層?伏隔核環(huán)路在ADHD模型大鼠決策沖動中的作用, 本研究設計了模型組和對照組兩組。根據(jù)常用的實驗動物實驗樣本量測算方法(Charan et al., 2013), 通過方差分析的自由度(E)進行樣本量估算:E = 各組實驗動物之和 ? 組數(shù), E的取值范圍應在10~20之間, 因此初步估算每組樣本量應至少6只。同時考慮到本實驗周期長, 在行為檢測、立體定位手術(shù)準確性以及電生理檢測等實驗過程中可能出現(xiàn)的損耗情況, 為保證最終有效數(shù)據(jù)滿足統(tǒng)計分析要求, 購買對照組大鼠14只, 模型組大鼠10只。
實驗采用雄性WIS大鼠14只和SHR大鼠10只(鼠齡6周, 體重為250~350 g), 購自北京維通利華實驗動物有限公司。動物到達后適應環(huán)境1周, 期間自由進食進水, 環(huán)境溫度24 ± 1 ℃, 12 h光照/黑暗周期, 實驗在光周期內(nèi)完成。首先進行自發(fā)活動量測定, 然后WIS大鼠和SHR大鼠各10只進行DDT任務訓練。WIS組有2只大鼠因飼養(yǎng)過程中死亡被剔除, SHR組有2只大鼠因腦定位不準確被剔除, 最后兩組大鼠各有8只進行了電生理數(shù)據(jù)記錄。所有實驗程序均經(jīng)過“首都師范大學心理學倫理委員會”審核(批準號:CNU-202007001), 實驗程序的執(zhí)行符合有關(guān)動物保護和使用條例。
動物自發(fā)活動量測試在自發(fā)活動箱(locomotive activity)中完成, 活動箱尺寸:350 mm × 350 mm × 350 mm, 采用視頻分析系統(tǒng)記錄實時運動軌跡, 跟蹤分析大鼠水平移動距離。
DDT行為學訓練和術(shù)后電生理測試均在行為學操作箱(30.5 cm × 24 cm × 21 cm; MED Associates, Inc., 型號ENV 008-VP)中進行。操作箱置于隔音箱內(nèi), 隔音箱配有風扇以保持通風并提供背景噪音。操作箱內(nèi)有兩個可伸縮式杠桿, 杠桿對側(cè)設有一個房燈和聲音發(fā)生器(MED Associates, Inc., 型號ENV-224DM)。MED行為學操作箱系統(tǒng)和計算機連接進行刺激的呈現(xiàn)和數(shù)據(jù)的收集。電生理記錄設備采用Cerebus 64導多通道神經(jīng)信號采集系統(tǒng)(Blackrock, 美國), 包括放大器單元和信號采集單元。
整個實驗程序如圖1所示, 主要包括以下階段。
2.3.1 適應期
大鼠適應實驗室環(huán)境1周, 適應期間實驗人員每天撫摸捉拿, 減少實驗時的焦慮和應激反應。自發(fā)活動測試和行為訓練前, 將大鼠分別放入自發(fā)活動箱和MED行為操作箱各30分鐘, 自由活動以適應箱體環(huán)境。
2.3.2 自發(fā)活動量測試
動物適應自發(fā)活動箱3天后, 第4天開始進行自發(fā)活動量測試, 測試時間為30分鐘, 連續(xù)測試3天。

圖1 實驗程序 A. 實驗流程圖。B. DDT任務流程圖。C和D. 分別為mPFC和NAc電極植入位點示意圖和尼氏染色圖。
2.3.3 行為訓練期
自發(fā)活動量測試結(jié)束后開始限食, 每只每天進食數(shù)量隨體重狀況而改變(給食10~15 g/天), 限食過程中自由飲水, 當大鼠體重降至自由攝食時體重的80%~90%后開始行為訓練。
壓桿訓練:訓練大鼠學會按壓左、右杠桿。操作箱房燈亮, 同時伸出左右杠桿, 大鼠按壓任何一側(cè)杠桿均可立即獲得1顆食丸, 以連續(xù)5天在30分鐘內(nèi)左、右杠桿各按壓50次(共100顆食丸)為達到標準, 任何一側(cè)達到50次則杠桿縮回, 指示燈熄滅, 全部完成則房燈熄滅。
線索識別任務:訓練大鼠習得不同的聲音線索。將聲音線索分別與左、右杠桿相匹配, 包括2種聲音:78 dB、3000 Hz的純音和80 dB、8000 Hz的純音。MED箱房燈亮起后, 隨機響起一種聲音, 大鼠需要按壓相匹配的杠桿才能獲得1顆食丸, 若錯誤按壓非匹配的杠桿則無食丸獎賞, 杠桿收回, 若在規(guī)定時間8 s內(nèi)沒有按壓杠桿, 則杠桿收回, 計為漏選(omission)。每個試次持續(xù)20 s, 共計180個試次, 約60 min。同樣的聲音不會連續(xù)出現(xiàn)三次, 2種聲音線索出現(xiàn)的次數(shù)相同。聲音在大鼠之間被平衡, 左右按壓正確率達到80%以上, 且連續(xù)5天達到該水平則可進入下一階段。
2.3.4 電極植入手術(shù)期
待大鼠習得聲音線索識別任務后, 對其進行開顱手術(shù), 植入2組由直徑25 μm的鎳鉻合金絲(California Fine Wire Co., Grover Beach, USA)組成的2×4微電極陣列, 兩組矩陣中心之間的距離為1.41 mm, 兩組電極的長度相差3.5 mm, 電極絲間距約為100 μm, 每組電極陣列的橫截面積約為 0.6 mm × 0.8 mm。大鼠手術(shù)前限食12小時, 按 40 mg/kg的劑量腹腔注射戊巴比妥鈉, 待大鼠麻醉后將頭部固定在立體定位儀(Stoelting, USA)上進行開顱和目標腦區(qū)定位, 按照Paxinos和Watson的腦立體定位圖譜(Paxinos & Watson, 2004), 以Bregma點為參考, mPFC中心坐標選取PL的位點:前囟前+2.5~3.5 mm, 旁開0.1~1.0 mm, 從大腦表面深入2.7~3.2 mm。NAc中心坐標為前囟前+0.7~2.7 mm, 旁開0.5~2.0 mm, 深入6.3~7.0 mm。通過電動步進式微推進器(Narishige, 日本)將電極緩慢推進到達目標腦區(qū)(100 μm/min), 每推進500 μm暫停5分鐘, 參考電極置于目標腦區(qū)附近的組織內(nèi)。在上述區(qū)域周圍安置4~6個不銹鋼螺釘用以固定并用牙托水泥將電極固定在顱骨上。
2.3.5 手術(shù)后恢復期
大鼠手術(shù)后為預防感染肌肉注射氨芐青霉素8萬單位/天, 連續(xù)一周。手術(shù)后自由攝食給水。恢復期過后, 對大鼠進行聲音線索識別任務的恢復訓練, 若連續(xù)3天大鼠正確選擇比率恢復到術(shù)前水平, 并且偏好相同、錯選≤ 20%、漏選≤ 5%, 隨即進入DDT任務訓練階段。
2.3.6 DDT訓練階段
DDT任務分3個組塊(見圖1B), 每個組塊包括30個試次。每個組塊的前10個試次是強迫選擇(一種純音對應一個正確杠桿), 后20個試次是自由選擇(隨機呈現(xiàn)白噪音, 大鼠在左、右杠桿中自由選擇)。每個試次的流程如下:在迫選試次中, 聲音1持續(xù)呈現(xiàn)3 s, 杠桿伸出, 按壓左杠桿立即獲得1顆食丸; 按壓右杠桿則無獎勵。聲音2持續(xù)呈現(xiàn)3 s, 杠桿伸出, 按壓右杠桿, 在延遲時間后才能獲得3顆食丸(不同組塊延遲時間分別為0 s、10 s、20 s), 按壓左杠桿無獎勵。在自選試次中, 聲音3 (白噪音)持續(xù)呈現(xiàn)3 s, 兩杠桿均伸出, 大鼠可以自由選擇左或者右杠桿, 分別對應不同的獎勵。大鼠做出選擇后杠桿收回, 房燈熄滅, 試次結(jié)束。不同聲音在大鼠之間進行平衡, 以偽隨機序列呈現(xiàn), 同樣的聲音不會連續(xù)出現(xiàn)3次。實驗中, 非提示線索下的杠桿按壓都沒有獎勵并算作錯誤試次。如果動物在8 s內(nèi)沒有對任何一個杠桿做出反應, 那么兩個杠桿都會縮回, 該試次計為遺漏。每個試次的持續(xù)時間為35 s, 共90個試次, 持續(xù)時間為52 min。將每個試次按照時間順序分為以下幾個時間段(見圖2):基線期(?3~0 s)、預期期(0~3 s)、動作期(3~6 s)、獎賞期(6 s ~)。
DDT任務訓練達標的標準是:A. 大鼠在自由選擇試次中按桿比例達到80%以上; B. 延遲時間為0 s時, 大鼠在自由選擇試次中選擇大額獎賞桿的比例達到70%以上; C. 訓練成績穩(wěn)定:選取訓練階段最后3個實驗周期的數(shù)據(jù), 運用兩因素重復測量方差分析考察不同實驗周期和延遲時間對大鼠延遲大獎賞選擇比例的影響, 如果延遲時間的主效應顯著, 實驗周期的主效應、實驗周期和延遲時間的交互作用均不顯著, 則表明訓練成績是穩(wěn)定的。
2.3.7 電生理記錄
大鼠學習DDT任務過程中, 利用MED行為學操作箱和Cerebus 64導多通道神經(jīng)信號采集系統(tǒng)同步記錄大鼠的行為學數(shù)據(jù)和電生理數(shù)據(jù)。腦電信號首先進入放大器單元, 進行5000倍的放大, 后經(jīng)過A/D轉(zhuǎn)換變成數(shù)字信號, 通過光纖傳輸進入NSP信號處理單元。局部場電位記錄的采樣率為1 K/s, 濾波范圍為0.5~500 Hz。所采集到的信號被儲存在計算機內(nèi)以待進一步分析。
2.3.8 組織學處理
實驗完成后, 將電極通道兩兩配對分別通正負雙向的直流電流(4 μA; 20 s)對電極位點進行損毀標記。然后用0.1 mL 30%水合氯醛溶液麻醉(劑量0.5 mg/kg), 灌流取腦, 并將其置于10%的福爾馬林固定液中進行后固定。固定10~14天后置于30%和20%蔗糖溶液中進行梯度脫水, 待腦組織完全下沉, 用O.C.T.包埋劑常溫包埋, 用冰凍切片機(Leica, 德國) 將腦組織進行切片, 切片厚度為50 μm。將腦切片放入烘干機干燥8小時后進行結(jié)晶紫尼式染色。最后在顯微鏡下觀察電極位點以確保是否準確定位到目標核團, 在顯微鏡下采集圖像并保存。
將組織學切片觀察結(jié)果與大鼠腦立體定位圖譜進行對照, 確認電極位點是否準確。剔除電極定位不準確的SHR大鼠2只, 最終各有8只WIS和SHR大鼠的mPFC和NAc的電極位點位于核團內(nèi), 每個電極(2×4陣列)選取中間對角線的兩個位點繪制電極位置圖(見圖1C、D)。經(jīng)組織學檢查有效的動物在DDT任務中的行為學和電生理數(shù)據(jù)進行進一步的分析。
使用Microsoft Excel、SPSS 22.0對行為學指標進行整理及統(tǒng)計分析, 利用獨立樣本檢驗分析比較兩組大鼠自發(fā)活動量的差異, 重復測量方差分析對不同組塊下的選擇偏好進行差異分析。在每個延遲組塊(0 s、10 s、20 s)中, 計算大鼠自選時選擇延遲大獎賞百分比來表示大鼠選擇偏好(如公式1), 選擇延遲大獎賞選項的比例越低, 決策沖動程度就越高。

圖2 WIS與SHR大鼠的行為學和電生理活動。A. SHR組自發(fā)活動量顯著高于WIS組。B. (i)在DDT任務中, 隨著延遲時間的增加兩組大鼠對延遲大獎賞選擇百分比逐漸降低, 延遲時間為0 s時, SHR大鼠對延遲大獎賞的選擇率與WIS組大鼠相比無差異, 延遲時間為10 s、20 s時, SHR大鼠選擇率均低于WIS組大鼠。(ii) 比較兩組大鼠在延遲10 s條件下的直線下降斜率, 發(fā)現(xiàn)SHR大鼠下降幅度明顯高于對照組WIS大鼠。C. 決策過程中兩組大鼠的mPFC和NAc在6~12 Hz頻段的功率譜變化。橫坐標是頻率, 縱坐標是功率譜大小, 單位是log of PSD (dB)。D. 兩組大鼠的mPFC和NAc在基線期與預期期6~12 Hz頻段功率譜比較。E. 兩組大鼠的mPFC和NAc的時?頻分析功率譜(WIS, n = 8; SHR, n = 8)。F. mPFC-NAc的Theta頻段相干值隨著時間的變化情況。橫坐標以線索呈現(xiàn)時刻點為0點, 灰色方框表示預期期(0~3 s)。G. 預期期mPFC-NAc的Theta頻段相干值統(tǒng)計直方圖。H. mPFC-NAc的Theta頻段相干值的時?頻分析圖(WIS, n = 8; SHR, n = 8)。M ± SE, *表示p < 0.05, **表示p < 0.01, ***表示p < 0.001。

根據(jù)行為學結(jié)果, 記錄大鼠在延遲10 s的組塊中mPFC和NAc腦電信號, 使用NeuroExplorer5 (Neuralynx, USA)和MATLAB (MathWorks, USA)對每個通道記錄的局部場電位功率譜(Power Spectral Dentities, PSD)進行時間?頻率分析, 形成局部場電位時?頻功率譜, 利用配對樣本檢驗比較基線期與預期期的功率譜差異, 時?頻功率譜計算方法為以下公式:


公式2是在公式3基礎(chǔ)上計算功率值, 公式3是對信號進行傅立葉變換, 將時域上信息轉(zhuǎn)化為頻域上的信息; 其中T是信號總時間, wt(k)是計算功率的窗口長度, xt是信號,代表該窗口函數(shù)序列,代表頻率,為自然對數(shù)。
將分別位于mPFC和NAc兩個腦區(qū)的2×4電極陣列的8個觸點進行兩兩配對。配對完成后, 選取不相鄰電極的部分配對結(jié)果進行統(tǒng)計, 并根據(jù)不同事件對兩個腦區(qū)的局部場電位進行相干分析。使用MATLAB 2015a信號處理工具包Chronux; 參數(shù)設置為:window size = 1 s; time step = 50 ms; tapers = 5; bandwidth = 3 Hz。以50 ms步進式地取1 s窗口的局部場電位數(shù)據(jù)進行疊加平均, 這樣形成以1 s為中心點并以50 ms步進的時?頻相干值。相干值計算方法為以下公式(x和y是公式3計算的功 率值):


S和S分別代表兩個通道經(jīng)公式4計算得出的功率值, C代表的是兩腦區(qū)的相干值。不同試次的預期期(0~3 s) Theta頻段相干值均減去基線期(?3~0 s)的相干值均值進行基線矯正。利用兩因素重復測量方差分析比較不同選擇類型下兩腦區(qū)Theta頻段相干值的差異, 分析以下3種情況時的局部場電位信號:(1)首次選擇:上一個試次為漏選, 下一個試次為延遲/立即選擇時, 則為首次選擇; 或連續(xù)兩次選擇相同時, 則第一個試次為首次選擇。(2)連續(xù)選擇:連續(xù)兩次選擇相同時, 則選擇第二個試次作為連續(xù)選擇。(3)試次轉(zhuǎn)換:上一個試次選擇立即獎賞, 下一個試次選擇延遲獎賞時, 則選擇延遲獎賞的試次為試次轉(zhuǎn)換。
獨立樣本檢驗分析顯示實驗組SHR大鼠的自發(fā)活動量顯著高于對照組WIS大鼠, 兩組大鼠的自發(fā)活動量存在顯著差異((20) = 6.82,< 0.001), 表明SHR大鼠自發(fā)活動量較多(圖2A)。

3.2.1 mPFC和NAc局部場電位振蕩活動
局部場電位功率譜密度分析發(fā)現(xiàn), 決策過程中兩組大鼠的mPFC和NAc局部場電位在6~12 Hz頻段顯著增加(圖2C、D、E)。配對樣本檢驗結(jié)果顯示, 在決策任務的預期期, 與基線期相比WIS大鼠mPFC和NAc在6~12 Hz頻段功率譜密度顯著增強((300) = ?513.27,< 0.001;(300) = ?285.74,0.001)。同樣的, SHR大鼠的mPFC和NAc功率譜密度也增強((300) = ?86.31,< 0.001;(300) = ?251.05,< 0.001)。結(jié)果提示在預期期mPFC和NAc 6~12 Hz頻段的振蕩活動均增加。
3.2.2 在立即和延遲選擇時, 兩組大鼠mPFC-NAc局部場電位Theta頻段相干值差異顯著

選取DDT任務中延遲10 s組塊的預期期mPFC和NAc局部場電位數(shù)據(jù), 分析無論是選擇立即小獎賞還是選擇延遲大獎賞時, 大鼠進行首次選擇和連續(xù)選擇時mPFC-NAc局部場電位Theta頻段的相干值, 探討 mPFC-NAc功能聯(lián)系在信息加工深度中的作用。
3.3.1 在選擇立即小獎賞時, 兩組大鼠首次選擇和連續(xù)選擇時的mPFC-NAc局部場電位Theta頻段相干值差異顯著

3.3.2 在選擇延遲大獎賞時, 兩組大鼠首次選擇和連續(xù)選擇時的mPFC-NAc局部場電位Theta頻段相干值差異顯著


圖3 首次和連續(xù)選擇時mPFC-NAc局部場電位的Theta頻段相干值。A. 在選擇立即小獎賞時, 兩組大鼠首次選擇和連續(xù)選擇時的mPFC-NAc局部場電位Theta頻段相干值隨著時間的變化情況。橫坐標以線索呈現(xiàn)時刻點為0點, 灰色方框表示預期期(0~3 s)。B. 兩因素重復測量方差分析顯示, WIS組和SHR組首次選擇時的mPFC-NAc Theta頻段相干值均顯著高于連續(xù)選擇時。首次選擇時兩組大鼠之間均沒有顯著差異, 而在連續(xù)選擇時, SHR組的mPFC-NAc Theta頻段相干值顯著低于WIS組。C. mPFC-NAc兩個腦區(qū)Theta頻段相干值的時?頻分析圖(WIS, n = 8; SHR, n = 8)。D. 在選擇延遲大獎賞時, 兩組大鼠首次選擇和連續(xù)選擇時的mPFC-NAc局部場電位Theta頻段相干值隨著時間的變化情況。E. 兩因素重復測量方差分析顯示, WIS組和SHR組首次選擇時的mPFC-NAc的Theta頻段相干值均顯著高于連續(xù)選擇時, 無論是首次選擇還是連續(xù)選擇, SHR組的mPFC-NAc的Theta頻段相干值均顯著低于WIS組。F. mPFC-NAc的Theta頻段相干值的時?頻分析圖(WIS, n = 8; SHR, n = 8)。M ± SE, *表示p < 0.05, ***表示p < 0.001。
根據(jù)上述結(jié)果, 大鼠在選擇延遲大獎賞時的mPFC-NAc局部場電位Theta頻段相干值比選擇立即小獎賞時強, 提示在選擇延遲大獎賞時mPFC與NAc之間功能聯(lián)系更密切, 對決策信息進行了更深層次的加工, 此時大鼠的決策沖動性較低。在此基礎(chǔ)上, 本研究進一步比較了大鼠在進行試次轉(zhuǎn)換時(由選擇立即小獎賞轉(zhuǎn)換為選擇延遲大獎賞)與不需要試次轉(zhuǎn)換時(連續(xù)選擇延遲大獎賞)的mPFC-NAc局部場電位在預期期的Theta頻段相干值, 分析mPFC和NAc之間功能聯(lián)系與決策的策略轉(zhuǎn)換之間的關(guān)系, 從而進一步探討mPFC-NAc神經(jīng)通路與決策沖動性之間的關(guān)系。

如圖4D、E所示, 將大鼠在預期期選擇延遲大獎賞時和立即小獎賞時的mPFC-NAc局部場電位Theta頻段的相干差值與延遲大獎賞選擇率做回歸分析, 發(fā)現(xiàn)WIS組大鼠在預期期Theta頻段相干差值與延遲大獎賞選擇率之間存在顯著正相關(guān)(= 0.65;(1, 22) = 15.46,< 0.001,2 = 0.42), 說明mPFC-NAc在預期期的相干差值越大, 決策沖動水平越低。反之, SHR組大鼠的mPFC-NAc的Theta頻段相干差值與延遲大獎賞選擇率之間不存在顯著相關(guān)(= 0.33;(1, 27) = 3.12,= 0.089,2 = 0.11), 該結(jié)果說明SHR組mPFC-NAc在預期期的相干差值不能預測決策沖動水平。
與以往的研究結(jié)果一致(Aparicio et al., 2019; Marx et al., 2018), 我們證實SHR大鼠與WIS對照大鼠相比表現(xiàn)出自發(fā)活動性明顯增加(多動), 以及在DDT檢測中對延遲大獎賞的選擇百分比明顯降低(決策沖動)的ADHD樣行為改變, 為進一步的研究提供了穩(wěn)定的動物模型。伴隨行為改變, 觀察到?jīng)Q策過程中關(guān)鍵事件相關(guān)的mPFC和NAc Theta頻段的局部場電位及相干值改變, 主要表現(xiàn)為:WIS組mPFC-NAc的Theta頻段相干值表現(xiàn)為延遲大獎賞選擇時顯著大于立即小獎賞選擇時、預期期首次選擇時大于連續(xù)選擇時, 以及轉(zhuǎn)換試次時大于連續(xù)試次時, 而SHR大鼠在上述條件時的mPFC-NAc Theta相干值均低于對照組, 且這一不足在延遲大獎賞時尤為明顯。進一步的回歸分析發(fā)現(xiàn)WIS大鼠mPFC-NAc相干差值與延遲大獎賞選擇率呈顯著正相關(guān), 而SHR大鼠的Theta頻段相干值的改變不能預測沖動性。這些結(jié)果表明, ADHD動物模型大鼠決策沖動缺陷與mPFC和NAc兩腦區(qū)的功能聯(lián)系減弱有關(guān), 可能是導致ADHD決策沖動行為的神經(jīng)環(huán)路基礎(chǔ)。
本研究發(fā)現(xiàn)在行為水平, SHR大鼠在DDT中選擇延遲大獎賞的比例更低, 即表現(xiàn)出更高的決策沖動水平。與此同時, 兩組大鼠的mPFC和NAc局部場電位Theta頻段振蕩活動在預期期顯著增強。進一步觀察mPFC-NAc環(huán)路神經(jīng)振蕩活動在預期期的變化, 發(fā)現(xiàn)WIS大鼠在選擇延遲大獎賞時mPFC-NAc局部場電位Theta頻段的相干值顯著增加并且高于選擇立即小獎賞時。與此不同, SHR大鼠mPFC-NAc的Theta頻段相干值的增加幅度顯著低于WIS組, 且在選擇立即小獎賞時兩組之間沒有差異。

圖4 試次轉(zhuǎn)換時mPFC-NAc局部場電位的Theta頻段相干值。A. 試次轉(zhuǎn)換時兩組大鼠mPFC-NAc局部場電位Theta頻段相干值隨著時間的變化情況。橫坐標以線索呈現(xiàn)時刻點為0點, 灰色方框表示預期期(0~3 s)。B. 兩因素重復測量方差分析顯示, WIS組和SHR大鼠在轉(zhuǎn)換試次時的相干值均顯著高于連續(xù)試次; 在轉(zhuǎn)換試次和連續(xù)試次中, WIS組的相干值均顯著高于SHR組。C. mPFC-NAc的Theta頻段相干值的時?頻分析圖(WIS, n = 8; SHR, n = 8)。M± SE, ***表示p < 0.001。D. WIS組大鼠mPFC與NAc局部場電位Theta頻段的相干差值與延遲大獎賞選擇率呈顯著正相關(guān)。E. SHR大鼠mPFC與NAc局部場電位的相干差值與延遲大獎賞選擇率之間不存在顯著相關(guān)。
在決策任務中, 線索呈現(xiàn)后至做出選擇之前的這段預期期是個體對外界信息進行編碼、整合以及價值預判的關(guān)鍵時期, 很多研究發(fā)現(xiàn)在這一階段的mPFC和NAc的神經(jīng)振蕩活動加強(Donnelly et al., 2014; Sackett et al., 2019; Wang et al., 2019)。與我們的發(fā)現(xiàn)一致, Donnelly等(2014)采用5-CSRTT任務觀察大鼠的沖動行為, 也發(fā)現(xiàn)在線索呈現(xiàn)后的等待期和正確反應后, mPFC和NAc局部場電位Theta (7.5~9.5 Hz)頻段的振蕩功率均瞬時增強(Donnelly et al., 2014)。結(jié)合本研究的結(jié)果, 這些一致提示在行為沖動和決策沖動中mPFC和NAc的Theta振蕩參與了對獎勵結(jié)果的預期。由于mPFC和NAc局部場電位Theta頻段的功率譜密度同時在預期期增強, 提示兩個腦區(qū)的Theta振蕩可能存在某種協(xié)同關(guān)系, 所以本研究進一步分析了mPFC-NAc局部場電位Theta頻段的相干值, 發(fā)現(xiàn)WIS大鼠在選擇延遲大獎賞時mPFC-NAc局部場電位Theta頻段的相干值顯著增加并且高于選擇立即小獎賞時, 而且SHR大鼠與WIS大鼠之間的Theta振蕩相干值只有在選擇延遲大獎賞時才出現(xiàn)差異。以上結(jié)果說明mPFC-NAc神經(jīng)環(huán)路功能聯(lián)系是控制決策沖動的重要結(jié)構(gòu), 兩個腦區(qū)之間的密切聯(lián)系可以更好地衡量成本和收益并有效地控制決策沖動。而且, mPFC-NAc之間聯(lián)系的強度可能與認知任務的強度和對信息的加工深度有關(guān), 選擇延遲大獎賞時需要調(diào)用的認知資源要大于選擇立即小獎賞時, 因此選擇延遲大獎賞時, SHR大鼠mPFC-NAc兩腦區(qū)之間的功能聯(lián)系的降低對行為選擇的影響更大, 導致SHR大鼠在預期期對信息的編碼、整合、價值計算以及對結(jié)果的預期不夠充分, 從而表現(xiàn)為決策沖動行為。
神經(jīng)振蕩是中樞神經(jīng)系統(tǒng)中一種節(jié)律性的神經(jīng)活動, 可以表現(xiàn)在各種頻段, 以往研究發(fā)現(xiàn)在決策任務中Theta和Gamma頻段與認知過程密切相關(guān)(Donnelly et al., 2014), 而各頻段的振蕩活動之間相互聯(lián)系是不同腦結(jié)構(gòu)之間進行信息傳遞與交流的神經(jīng)機制(Friston et al., 2015)。局部場電位是局部腦區(qū)神經(jīng)元突觸后電位的總和, 局部場電位之間相干值的分析可以反映腦區(qū)間電壓變化的方向一致性, 從而反映不同腦區(qū)之間活動的協(xié)同性(Donnelly et al., 2014; Wang et al., 2019)。以往研究認為, 前額皮層(prefrontal cortex, PFC)和皮層下結(jié)構(gòu)之間的特定頻率的協(xié)同振蕩活動可以促進目標導向任務中腦區(qū)之間的通信, 其中mPFC神經(jīng)元參與形成對即將發(fā)生的獎勵事件的預測(Moorman & Aston-Jones, 2015; Sackett et al., 2019), 而NAc神經(jīng)元參與對即將獲得的獎勵的價值計算以及提高等待延遲獎勵的能力(Basar et al., 2010; Steele et al., 2018), mPFC-NAc之間的協(xié)同活動對于決策過程中信息的編碼、整合、價值計算以及對結(jié)果的預期具有重要作用(Donnelly et al., 2014; Narayanan et al., 2013; Wang et al., 2020)。以往研究也發(fā)現(xiàn)在5-CSRTT任務中mPFC與NAc之間存在Delta (2~5 Hz)與Gamma (50~60 Hz)之間的相位振幅耦合, 在錯誤觸屏時的耦合較正確觸屏時減少, 說明選擇錯誤時兩腦區(qū)信息交流強度減弱(Donnelly et al., 2014 )。本研究針對mPFC-NAc之間Theta振蕩的關(guān)系進行了分析, 發(fā)現(xiàn)mPFC-NAc神經(jīng)環(huán)路Theta頻段振蕩之間的信息交流減弱是導致ADHD決策沖動缺陷的重要原因, 更進一步說明大腦網(wǎng)絡活動異常是ADHD的重要病理機制之一。此外, 需要說明的是, 本研究通過計算mPFC與NAc兩腦區(qū)局部場電位之間的相干值可以反映兩腦區(qū)之間電活動的協(xié)同性, 但是不能說明信息的流動方向, 這也是本研究的不足之處, 未來可以進一步通過跨頻耦合和格蘭杰因果關(guān)系等數(shù)據(jù)分析方法進一步探討mPFC與NAc在不同頻率之間的調(diào)制關(guān)系以及兩腦區(qū)之間的信息流動方向。
本研究發(fā)現(xiàn)在選擇立即小獎賞時, 首次選擇時SHR大鼠和WIS大鼠之間均沒有顯著差異, 而在連續(xù)選擇時, SHR大鼠mPFC-NAc的Theta頻段相干值顯著低于WIS大鼠。但是在選擇延遲大獎賞時, 無論是首次還是連續(xù)選擇, SHR組的mPFC- NAc的Theta頻段相干值均顯著低于WIS組。
跨期決策的雙過程理論(Carpenter et al., 2015)認為決策過程中神經(jīng)網(wǎng)絡存在兩種不同的激活模式, 包括兩個系統(tǒng):受意識控制的、目標導向的理性分析系統(tǒng)和不受意識控制的、習慣化的自動加工系統(tǒng), 前者主要依賴于皮質(zhì)?紋狀體神經(jīng)網(wǎng)絡的協(xié)同活動, 而后者則主要與皮質(zhì)下的紋狀體活動有關(guān)(Khader et al., 2016)。隨后Piray等人(2016)進一步利用腦影像學和數(shù)學計算模型相結(jié)合的方法發(fā)現(xiàn)PFC和紋狀體之間自上而下信息傳遞較強的個體在決策時能夠更加準確地預測結(jié)果并且在目標導向性行為中可以更好地進行模塊化加工, 也就是說受意識控制的理性分析需要PFC與紋狀體通路有緊密的功能聯(lián)系, 反之當PFC-紋狀體環(huán)路連接強度較低時則主要進行非模塊化加工, 此時主要是非意識控制的習慣化加工系統(tǒng)(Piray et al., 2016)。Pérez-Díaz等人(2017)的研究發(fā)現(xiàn)大鼠的mPFC和背側(cè)紋狀體分別在受意識控制的行為和條件刺激引起的自動化行為的信息處理過程中起到不同的作用, 如果mPFC損傷可對受意識控制的過程產(chǎn)生影響, 而紋狀體病變則可導致自動加工過程受到損害(Pérez-Díaz et al., 2017)。
本研究發(fā)現(xiàn), 不論是在立即小獎賞還是延遲大獎賞, 兩組大鼠首次選擇時mPFC-NAc在預期期的Theta振蕩相干值均顯著高于連續(xù)選擇時, 這一結(jié)果與雙過程理論(Carpenter et al., 2015)的觀點相一致。根據(jù)雙過程理論, 首次選擇較連續(xù)選擇時需要加工和整合的信息更復雜, 需要習得不同選項與獎勵大小之間的關(guān)系并建立行為?結(jié)果聯(lián)結(jié), 這一過程需要大腦進行更加復雜的神經(jīng)網(wǎng)絡活動, 更多的是受意識控制的理性分析系統(tǒng)參與活動。而連續(xù)選擇時更多的是習慣化的自動加工系統(tǒng)的參與, 此時行為?結(jié)果聯(lián)結(jié)已經(jīng)形成自動化的加工模塊, 不需要預先考慮動作與結(jié)果之間的關(guān)系, 而是隨著聲音線索的提示, 無意識地重復上一次的選擇, 當自動加工系統(tǒng)活動時大鼠會更多地選擇立即小獎賞(Zhao et al., 2019)。因此自動化加工需要調(diào)用的認知資源較少, 相應mPFC與NAc之間的功能聯(lián)結(jié)亦較弱。利用ADHD動物模型SHR大鼠, 本研究發(fā)現(xiàn)在選擇立即小獎賞時, 首次選擇時SHR大鼠和WIS大鼠之間均沒有顯著差異, 而在連續(xù)選擇時, SHR大鼠mPFC-NAc的Theta頻段相干值顯著低于WIS大鼠, 說明在進行較簡單的決策活動時, 并不需要調(diào)用過多的認知資源即可滿足行為需求, 此時更多的是無意識的、習慣化的自動加工系統(tǒng)在起作用, SHR大鼠在連續(xù)的自動化加工系統(tǒng)中的腦功能聯(lián)系也較低。但是在選擇延遲大獎賞時, 無論是首次還是連續(xù)選擇, SHR組的mPFC-NAc的Theta頻段相干值則顯著低于WIS組, 說明當需要對信息進行更復雜、更深層次的加工時, mPFC-NAc之間的功能聯(lián)系就更加重要, 而SHR大鼠mPFC-NAc之間的協(xié)同性不能滿足復雜決策任務的需要, 導致SHR大鼠因為對外界信息加工整合的缺陷而造成行為控制的不足, 從而進一步導致決策沖動行為。
本研究發(fā)現(xiàn)WIS組和SHR大鼠在轉(zhuǎn)換試次時的mPFC-NAc Theta頻段相干值均顯著高于非轉(zhuǎn)換試次, 說明mPFC-NAc神經(jīng)網(wǎng)絡的功能聯(lián)系隨著策略的轉(zhuǎn)換而增強。個體行為需要從經(jīng)驗或試誤中不斷地進行策略轉(zhuǎn)換以適應環(huán)境變化。以往研究發(fā)現(xiàn), 大鼠NAc和mPFC中的神經(jīng)元在執(zhí)行交替獎勵任務期間在獎勵交付前的延遲中表現(xiàn)出活動的增加, 能夠區(qū)分對即將到來的食物或水獎勵, 提示NAc和mPFC在認知靈活性上發(fā)揮重要作用(Miyazaki et al., 2004; Narayanan et al., 2013)。大鼠在獎勵標準發(fā)生變化的任務中做出決策, mPFC神經(jīng)元中的表征轉(zhuǎn)變先于行為的變化。結(jié)果提示, mPFC可能反映了動物的行動?選擇策略。損傷大鼠的NAc可以導致對獎勵大小和延遲時間的敏感性下降, 進一步造成策略轉(zhuǎn)換的靈活性降低(Steele et al., 2018)。Bartolo和Averbeck (2020)最新研究發(fā)現(xiàn), 在反轉(zhuǎn)學習任務中, 記錄靈長類動物PFC在反轉(zhuǎn)試次的神經(jīng)活動, 發(fā)現(xiàn)其放電特征與貝葉斯推理策略相一致, 可以隨著任務的改變進行快速調(diào)整(Bartolo & Averbeck, 2020), 說明PFC參與決策策略轉(zhuǎn)換的靈活性。
在神經(jīng)振蕩活動方面, 已有研究發(fā)現(xiàn)在選擇錯誤后的輸轉(zhuǎn)贏試次中, 人類的PFC以及大鼠PL和前扣帶回皮層出現(xiàn)12 Hz以下的低頻振蕩活動, 如果mPFC失活則大鼠進行輸轉(zhuǎn)贏的行為調(diào)整能力受損, 低頻振蕩消失(Narayanan et al., 2013)。目前認為不同的神經(jīng)振蕩頻率與信息傳遞方式有關(guān):自上而下或自下而上。由皮層發(fā)出的自上而下的信息傳遞形成的神經(jīng)振蕩頻率較低, 如Theta振蕩; 而皮層下發(fā)出的自下而上形成的神經(jīng)振蕩頻率較高, 如Beta、Gamma波段振蕩(Friston et al., 2015)。在人類概率反轉(zhuǎn)學習任務中, 雙側(cè)NAc Theta (4~8 Hz)頻段局部場電位在輸轉(zhuǎn)贏試次時增強, 提示Theta振蕩是反映策略轉(zhuǎn)換靈活性的重要指標(Cohen et al., 2009)。有研究表明ADHD患者(或者SHR大鼠)認知靈活性下降(Gauthier et al., 2014), 但其神經(jīng)機制尚不清楚。本研究發(fā)現(xiàn), 在轉(zhuǎn)換試次中, SHR大鼠的mPFC-NAc Theta相干值仍顯著低于WIS大鼠, 說明SHR大鼠mPFC-NAc環(huán)路功能聯(lián)系不足, 這可能是導致ADHD策略轉(zhuǎn)換靈活性下降等癥狀的原因之一。
決策過程中的預期期是對信息進行加工的重要階段, 包括編碼整合、獎賞價值計算、對結(jié)果的預期以及根據(jù)結(jié)果進行策略轉(zhuǎn)換等(Donnelly et al., 2014; Narayanan et al., 2013; Wang et al., 2020), 如果上述信息加工過程缺陷則可能造成決策沖動。我們前述研究發(fā)現(xiàn)在預期期的mPFC-NAc環(huán)路Theta相干與信息加工深度和策略轉(zhuǎn)換有關(guān), 因此mPFC-NAc環(huán)路Theta相干的變化可能與決策沖動有密切關(guān)系。基于此, 將mPFC-NAc環(huán)路Theta相干變化值作為衡量腦功能聯(lián)結(jié)變化的電生理指標, 用延遲大獎賞選擇率表示決策沖動, 將兩者之間進行回歸分析。線性回歸分析顯示, WIS組mPFC-NAc環(huán)路Theta相干差值與延遲大獎賞選擇率呈顯著正相關(guān), 即相干差值越低, 決策沖動水平越高, 說明在預期期的相干變化值可以預測決策沖動的大小:相干增加的程度越小, 則動物的決策沖動性越大。Donnelly等(2014)利用廣義混合線性模型分析5-CSRTT任務中預期期的皮質(zhì)?紋狀體局部場電位和過早反應的關(guān)系, 發(fā)現(xiàn)在預期期mPFC亞區(qū)緣前皮層Theta (7.5~9.5 Hz)頻段振蕩和NAc Gamma (50~60 Hz)頻段振蕩能夠預測即將發(fā)生的過早反應(Donnelly et al., 2014)。最近, Wang等人(2020)利用fMRI發(fā)現(xiàn)正常成人在DDT任務中的前額葉與紋狀體的功能聯(lián)結(jié)可以預測決策沖動(Wang et al., 2020)。利用功能連接性分析與向量回歸分析方法, 發(fā)現(xiàn)NAc核部與mPFC和背外側(cè)前額皮層(dorsal lateral prefrontal cortex, DLPFC)之間的功能耦合可以預測個體的延遲折扣率, 兩者呈顯著負相關(guān)趨勢, 即NAc核部與mPFC/DLPFC之間功能耦合越強, 延遲折扣率越低, 個體決策沖動水平就越高。這些研究均支持本實驗的結(jié)果, 說明決策沖動可能在很大程度上依賴于NAc-mPFC環(huán)路的功能聯(lián)系。本研究還進一步發(fā)現(xiàn)SHR大鼠mPFC-NAc環(huán)路Theta相干差值與延遲大獎賞選擇率之間相關(guān)不顯著, SHR大鼠預期期的mPFC-NAc相干變化值不能對決策沖動進行預測。說明SHR組在決策預期階段mPFC-NAc的相干耦合較低, 反映了SHR大鼠在決策信息加工和交流過程中對獎勵大小或延遲時間的信息收集不充分, 獎勵價值計算過程中神經(jīng)信號交流較弱, 這種沒有在腦區(qū)間達到一定強度的功能聯(lián)系可能是導致ADHD不良決策的原因之一。
SHR大鼠是一種高效度的ADHD動物模型, 行為學上可以表現(xiàn)出ADHD的核心癥狀, 腦內(nèi)神經(jīng)遞質(zhì)系統(tǒng)也呈現(xiàn)ADHD樣病理生理改變, 并且人類常用的治療ADHD的藥物(如哌甲酯)可以改善SHR大鼠的ADHD樣行為, 為開展ADHD發(fā)病機制的研究提供了重要的實驗基礎(chǔ)(Fox et al., 2008; Somkuwar et al., 2016)。利用該模式動物, 本研究發(fā)現(xiàn)mPFC-NAc間功能聯(lián)系減弱是ADHD決策沖動缺陷的重要神經(jīng)環(huán)路基礎(chǔ), 提示針對性地干預mPFC-NAc神經(jīng)環(huán)路可能對ADHD的決策沖動異常具有改善作用, 為人類ADHD的治療提供了新的思路。需要注意的是, SHR大鼠在10周齡以后會出現(xiàn)自發(fā)性高血壓(Christiansen et al., 2002), 這是否可能影響沖動性等行為, 還需要在未來的研究中進一步探討。
mPFC-NAc間功能聯(lián)系是參與控制決策沖動的重要結(jié)構(gòu)。在決策過程的預期期mPFC-NAc局部場電位Theta頻段的相干值改變可以預測決策沖動的高低。ADHD動物模型大鼠mPFC-NAc之間功能聯(lián)系不足是導致決策沖動缺陷的重要原因, 該缺陷與其深度信息加工不足以及策略轉(zhuǎn)換能力受損有關(guān), 這些可能是導致ADHD決策沖動的認知和環(huán)路基礎(chǔ)。上述發(fā)現(xiàn)擴展和加深了對于ADHD發(fā)病機制的認識, 為改進治療和干預策略提供了心理和神經(jīng)生理依據(jù)。
American Psychiatric Association. (2013).(5th ed.). Washington, DC: American Psychiatric Association.
Aparicio, C. F., Hennigan, P. J., Mulligan, L. J., & Alonso- Alvarez, B. (2019). Spontaneously hypertensive (SHR) rats choose more impulsively than Wistar-Kyoto (WKY) rats on a delay discounting task., 480–493.
Asher, A., & Lodge, D. J. (2012). Distinct prefrontal cortical regions negatively regulate evoked activity in nucleus accumbens subregions.,(9), 1287–1294.
Balleine, B. W., & O’Doherty, J. P. (2010). Human and rodent homologies in action control: Corticostriatal determinants of goal-directed and habitual action.(1), 48–69.
Bartolo, R., & Averbeck, B. B. (2020). Prefrontal cortex predicts state switches during reversal learning.(6), 1044–1054.
Basar, K., Sesia, T., Groenewegen, H., Steinbusch, H. W., Visser-Vandewalle, V., & Temel, Y. (2010). Nucleus accumbens and impulsivity.(4), 533–557.
Bossert, J. M., Stern, A. L., Theberge, F., Marchant, N. J., Wang, H. L., Morales, M., & Shaham, Y. (2012). Role of projections from ventral medial prefrontal cortex to nucleus accumbens shell in context-induced reinstatement of heroin seeking.(14), 4982–4991.
Carpenter, K. M., Bedi, G., & Vadhan, N. P. (2015). Understanding and shifting drug-related decisions: contributions of automatic decision-making processes.(8), 607.
Charan, J., & Kantharia, N. D. (2013). How to calculate sample size in animal studies?,(4), 303–306.
Cohen, M. X., Axmacher, N., Lenartz, D., Elger, C. E., Sturm, V., & Schlaepfer, T. E. (2009). Nuclei accumbens phase synchrony predicts decision-making reversals following negative feedback.(23), 7591–7598.
Christiansen, R. E., Roald, A. B., Tenstad, O., & Iversen, B. M. (2002). Renal hemodynamics during development of hypertension in young spontaneously hypertensive rats.,(5), 322–328.
Donnelly, N. A., Holtzman, T., Rich, P. D., Nevado-Holgado, A. J., Fernando, A. B., van Dijck, G., … Dalley, J. W. (2014). Oscillatory activity in the medial prefrontal cortex and nucleus accumbens correlates with impulsivity and reward outcome.(10), e111300.
Erdeniz, B., & Done, J. (2020). Towards automaticity in reinforcement learning: A model-based functional magnetic resonance imaging study.(2), 98–107.
Faraone, S. V., Asherson, P., Banaschewski, T., Biederman, J., Buitelaar, J. K., Ramos-Quiroga, J. A., … Franke, B. (2015). Attention-deficit/hyperactivity disorder.imers,, 15020.
Floresco, S. B. (2015). The nucleus accumbens: An interface between cognition, emotion, and action., 25–52.
Fox, A. T., Hand, D. J., & Reilly, M. P. (2008). Impulsive choice in a rodent model of attention-deficit/hyperactivity disorder.(1), 146–152.
Friston, K. J., Bastos, A. M., Pinotsis, D., & Litvak, V. (2015). LFP and oscillations-what do they tell us?, 1–6.
Gauthier, J. M., Tassin, D. H., Dwoskin, L. P., & Kantak, K. M. (2014). Effects of dopamine D1 receptor blockade in the prelimbic prefrontal cortex or lateral dorsal striatum on frontostriatal function in wistar and spontaneously hypertensive rats., 229–238.
Gui, D. Y., Yu, T., Hu, Z., Yan, J., & Li, X. (2018). Dissociable functional activities of cortical theta and beta oscillations in the lateral prefrontal cortex during intertemporal choice.(1), 11233.
Hauser, T. U., Iannaccone, R., Ball, J., Mathys, C., Brandeis, D., Walitza, S., & Brem, S. (2014). Role of the medial prefrontal cortex in impaired decision making in juvenile attention-deficit/hyperactivity disorder.(10), 1165–1173.
Jackson, J. N. S., & MacKillop, J. (2016). Attention-deficit/ hyperactivity disorder and monetary delay discounting: A meta-analysis of case-control studies.(4), 316–325.
Jenni, N. L., Larkin, J. D., & Floresco, S. B. (2017). Prefrontal dopamine D1 and D2 receptors regulate dissociable aspects of decision making via distinct ventral striatal and amygdalar circuits.(26), 6200–6213.
Kable, J. W., & Glimcher, P. W. (2007). The neural correlates of subjective value during intertemporal choice.,(12), 1625–1633.
Khader, P. H., Pachur, T., Weber, L. A., & Jost, K. (2016). Neural signatures of controlled and automatic retrieval processes in memory-based decision-making.(1), 69–83.
Kim, S., & Lee, D. (2011). Prefrontal cortex and impulsive decision making.(12), 1140–1146.
Li, Y., Wang, X., Li, N., Qu, L., Wang, P., Ge, S. N., & Wang, X. L. (2020). The NAc lesions disrupted the hippocampus- mPFC theta coherence during intravenous cocaine administration in rats., 134986.
Lv, C., Wang, Q., Chen, C., Qiu, J., Xue, G., & He, Q. (2019). The regional homogeneity patterns of the dorsal medial prefrontal cortex predict individual differences in decision impulsivity.,, 556–561.
Marx, I., Hacker, T., Yu, X., Cortese, S., & Sonuga-Barke, E. (2018). ADHD and the choice of small immediate over larger delayed rewards: A comparative meta-analysis of performance on simple choice-delay and temporal discounting paradigms.,(2), 171–187.
Miller, E. M., Pomerleau, F., Huettl, P., Gerhardt, G. A., & Glaser, P. E. (2014). Aberrant glutamate signaling in the prefrontal cortex and striatum of the spontaneously hypertensive rat model of attention-deficit/hyperactivity disorder.(15), 3019–3029.
Miyazaki, K., Miyazaki, K. W., & Matsumoto, G. (2004). Different representation of forthcoming reward in nucleus accumbens and medial prefrontal cortex.(4), 721–726.
Moorman, D. E., & Aston-Jones, G. (2015). Prefrontal neurons encode context-based response execution and inhibition in reward seeking and extinction.(30), 9472–9477.
Narayanan, N. S., Cavanagh, J. F., Frank, M. J., & Laubach, M. (2013). Common medial frontal mechanisms of adaptive control in humans and rodents.(12), 1888–1895.
Ordu?a, V., & Mercado, E. (2017). Impulsivity in spontaneously hypertensive rats: Within-subjects comparison of sensitivity to delay and to amount of reinforcement., 178–185.
Paxinos, G, A., & Watson., C. (2004).. San Diego: Academic.
Pérez-Díaz, F., Díaz, E., Sánchez, N., Vargas, J. P., Pearce, J. M., & López, J. (2017). Different involvement of medial prefrontal cortex and dorso-lateral striatum in automatic and controlled processing of a future conditioned stimulus.(12), e0189630.
Piray, P., Toni, I., & Cools, R. (2016). Human choice strategy varies with anatomical projections from ventromedial prefrontal cortex to medial striatum.(10), 2857–2867.
Robbins, T. W., & Dalley, J. W. (2017). Impulsivity, risky choice, and impulse control disorders: Animal models. In J-C. Dreher & L. Tremblay (Eds.),(pp. 81–93). San Diego, CA: Academic Press.
Sackett, D. A., Moschak, T. M., & Carelli, R. M. (2019). Prelimbic cortical neurons track preferred reward value and reflect impulsive choice during delay discounting behavior.,(16), 3108–3118.
Salavert, J., Ramos-Quiroga, J. A., Moreno-Alcázar, A., Caseras, X., Palomar, G., Radua, J., … Pomarol-Clotet, E. (2018). Functional imaging changes in the medial prefrontal cortex in adult ADHD.(7), 679–693.
Scheres, A., Milham, M. P., Knutson, B., & Castellanos, F. X. (2007). Ventral striatal hyporesponsiveness during reward anticipation in attention-deficit/hyperactivity disorder.,(5), 720–724.
Somkuwar, S. S., Kantak, K. M., Bardo, M. T., & Dwoskin, L. P. (2016). Adolescent methylphenidate treatment differentially alters adult impulsivity and hyperactivity in the spontaneously hypertensive rat model of ADHD., 66–77.
Sonuga-Barke, E., & Fairchild, G. (2012). Neuroeconomics of attention-deficit/hyperactivity disorder: Differential influences of medial, dorsal, and ventral prefrontal brain networks on suboptimal decision making?(2), 126–133.
Starkweather, C. K., Gershman, S. J., & Uchida, N. (2018). The medial prefrontal cortex shapes dopamine reward prediction errors under state uncertainty.(3), 616–629.
Steele, C. C., Peterson, J. R., Marshall, A. T., Stuebing, S. L., & Kirkpatrick, K. (2018). Nucleus accumbens core lesions induce sub-optimal choice and reduce sensitivity to magnitude and delay in impulsive choice tasks., 28–38.
Vanderveldt, A., Oliveira, L., & Green, L. (2016). Delay discounting: Pigeon, rat, human--does it matter?(2), 141–162.
Wang, Q., Lv, C., He, Q., & Xue, G. (2020). Dissociable fronto-striatal functional networks predict choice impulsivity.(8), 2377–2386.
Wang, Z., Yue, L., Cui, C., Liu, S., Wang, X., Li, Y., & Ma, L. (2019). Top-down control of the medial orbitofrontal cortex to nucleus accumbens core pathway in decisional impulsivity.(7), 2437–2452.
Womelsdorf, T., Schoffelen, J. M., Oostenveld, R., Singer, W., Desimone, R., & Engel, A. K. (2007). Modulation of neuronal interactions through neuronal synchronization.(5831), 1609–1612.
Zhao, W. J., Diederich, A., Trueblood, J. S., & Bhatia, S. (2019). Automatic biases in intertemporal choice.(2), 661–668.
The function of mPFC-NAc circuit in decision impulsivity: A study based on an animal model
ZHUO Linan1, ZENG Xiangyu1, WU Bing1, NIU Rongrong1, YU Ping1, WANG Weiwen2
(1Beijing Key Laboratory of Learning and Cognition, School of Psychology, Capital Normal University, Beijing 100048, China)(2Key Laboratory of Mental Health, Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China)
Insufficient behavior control in patients with attention deficit / hyperactivity disorder (ADHD) is closely related to decision impulsivity, which is regulated by medial prefrontal cortex (mPFC) and nucleus accumbens (NAc). In ADHD patients, the mPFC and NAc show abnormality both structurally and functionally, indicating that these two brain regions are involved in regulation of decision-making, especially impulsivity. Although extensive anatomical connections between mPFC and NAc have been found, the role of mPFC-NAc circuit in decision impulsivity remains to be investigated.
Wistar (WIS) rats and ADHD rats (SHR, spontaneously hypertensive rat) were used as subjects of this study. We recorded the local field potential (LFP) of mPFC and NAc using multi-channel electrophysiology during a delay discounting task (DDT). We further analyzed the coherence difference of Theta (4~12 Hz) oscillation in expectation period (0~3s) and compared this measure between the two groups.
Results: (1) SHR rats had higher decision impulsivity level than WIS group. Power spectral density between 6~12 Hz of LFP in mPFC and NAc increased in both groups. (2) When choosing large/delayed rewards, coherence of mPFC-NAc activity increased compared to small/immediate rewards in WIS group. This indicates that the mPFC-NAc circuit mediates decision impulsivity. (3) When choosing large/delayed rewards, mPFC-NAc activity in SHR group showed lower coherence than WIS group, indicating SHR rats have weaker mPFC-NAc functional connections. (4) Coherence of mPFC-NAc activity is higher during initial choice behavioral than continuous choice behavior. It indicated that stronger mPFC-NAc functional connections are required during controlled information processing (dominant in initial choice behavioral), rather than automatic information processing (dominant in continuous choice behavior). Coherence of mPFC-NAc activity is higher in WIS group than SHR group when choosing large/immediate rewards. It indicated that the decision impulsivity deficits in SHR rats results from mPFC-NAc weak functional connections. (5) Coherence of mPFC-NAc activity is higher in shift trials than continuous trials. Plus, WIS group showed an overall higher coherence than SHR group. This indicated that mPFC-NAc circuit heavily involves in controlled information processing, and SHR group has deficiency of this process. (6) Regression analysis showed that coherence difference of mPFC-NAc activity in prediction period has positive correlation with delayed large reward selection rate in WIS group, that is, the more coherence of mPFC-NAc Theta activity increased during prediction period, the less decision impulsivity WIS rats behaved during choice period. However, the coherence difference cannot predict decision impulsivity in SHR group.
Conclusion: mPFC-NAc heavily involves in decision impulsivity. Increase of coherence of mPFC-NAc theta oscillation in prediction period can predict impulsivity level. The study revealed that weak mPFC-NAc functional connections mediate decision impulsivity in ADHD and brought new perspectives in the treatment of ADHD.
attention deficit/hyperactivity disorder, decision impulsivity, mPFC, NAc, neural network oscillation
2022-3-22
* 國家自然科學基金(No.82071517, 31771217), 國家重點研發(fā)計劃(2017YFE0126500), 中國科學院心理健康重點實驗室(中國科學院心理研究所)開放課題(KLMH2020K06)支持。
? 卓利楠和曾祥玉為共同第一作者
于萍, E-mail: pingyu@cnu.edu.cn; 王瑋文, E-mail: wangww@psych.ac.cn
B845