賈東明,鐘祝濤,王玨,姜祖楨
(1.浙江警官職業學院,浙江 杭州 310018;2.云南省第六強制隔離戒毒所,云南 德宏 678400;3.中央司法警官學院,河北 保定 071000)
多巴胺(Dopamine,DA)屬于兒茶酚胺類神經遞質,主要由神經元或腎上腺細胞合成。DA 是人體重要的維持生理活動的神經遞質,例如調節運動活動、情緒、進食、記憶、學習、睡眠、強化和動機。此外,DA 還有調節心血管、胃腸道、腎臟和免疫系統的外周作用[1]。DA 也是研究最廣泛深入的涉及獎賞系統(Reward System,RS)的生理和病理狀態的關鍵神經遞質之一[2]。關于DA參與成癮過程的研究已有近50 年的歷史[3]。早期的解剖學、神經化學、功能和行為證據發現DA在成癮過程中起著重要作用[4],近10 年的研究則進一步證實,DA 系統在成癮的初始、維持、戒斷和復發階段均至關重要[5]。本文對DA、RS 在成癮(常見毒品成癮)研究領域中的作用機制和理論假設進行了總結和綜述,并簡要討論毒品成癮臨床治療的現狀。
多巴胺系統主要涉及DA 神經元、活性和神經元間的調節三部分。大腦內DA 神經元位于中腦的三個區:A8 紅核后區、A9 黑質致密部(substantia nigra pars compacta,SNc) 和A10 腹側被蓋區(ventral tegmental area,VTA)。來自黑質紋狀體系統SNc 和紅核后區的DA 神經元向背側紋狀體(dorsal striatum,DSt)投射;來自VTA 的DA 神經元向中腦-紋狀體系統的伏隔核(nucleus accumbens,NAc)以及其他前腦區投射,例如中腦-皮質系統的前額葉皮層[6]。以往研究認為[7],黑質紋狀體通路主要參與運動控制,而中腦-皮質-紋狀體通路主要參與獎勵學習和動機,實際上DA 系統的功能是不同腦區DA 重疊神經元的內外側梯度共同決定的。
DA 神經元主要有兩種活性狀態:放電(自發活動)或非放電(沉默)。當DA 神經元放電時,它們可以以不規則形式(緊張性活動)或動作電位爆發(時相性活動)放電。其中,緊張性活動的DA 神經元維持突觸外的基線電位水平,時相性活動是由離子型谷氨酸受體和電壓門控離子通道之間的瞬時作用觸發,約半數的處于緊張性活動狀態的DA 神經元可以產生動作電位爆發放電[8]。DA 神經元感受到刺激后快速釋放DA 進入突觸間隙,同時激活突觸后神經元受體,DA 轉運體(DA transporter,DAT)又迅速將DA 從突觸中清除,信號終止。這種大量但短暫的DA 釋放可以通過連續安培法或快速掃描循環伏安法在行為動物實驗中測量,但不能通過微透析或經典伏安法等技術測量[9]。DA 神經元從不規則形式放電到爆發相放電的變化已被證明與強化學習有關,DA 神經元放電編碼了獎賞預測錯誤的信號,即獎賞預測和實際收到的獎賞之間的差異[10]。
VTA 中的DA 神經元放電受不同的抑制性和興奮性輸入調節,緊張性活動放電涉及終紋床核(bed nucleus of stria terminalis,BST)和腹側蒼白球,而時相性活動放電的控制涉及橋腦被蓋區(pedunculopontine tegmentum,PPTg)和外背側被蓋區(laterodorsal tegmentum,LTDg)。另外,DA 神經元的活動也受外側韁核(lateral habenula,LHb)的調節[11]。DA 神經元放電的抑制作用被認為是受多突觸調控,LHb 向DA 神經元進行谷氨酸能投射,可以減少中腦DA 神經元的放電;吻內側被蓋區(rostromedial tegmental nucleus,RMTg)可以接收LHb 誘導,進行γ-氨基丁酸能投射,抑制DA 神經元活性[12]。RMTg 接收來自皮質、中腦導水管周圍灰質、LDTg 和PPTg 等大腦區信號的傳入,這表明RMTg 可能整合多種信息,可以調節VTA 和SNc 的活動[13]。來自NAc外殼部分的投射影響VTA 中的DA 神經元,后者反過來投射到NAc 的核心部分,該核心部分向SNc 提供投射,SNc 將其投射發送到DSt,這被認為是從目標導向(自愿)毒品使用到刺激-反應(習慣)成癮的解剖學基礎[14]。
基因克隆程序發現五種不同的DA 受體,均屬于G 蛋白偶聯受體。DA 受體分為D1 樣(D1Rs)和D2 樣(D2Rs)兩個亞家族:D1Rs 包括D1 和D5 受體,具有高度序列同源性并刺激腺苷酸環化酶(AC)途徑;D2Rs 包括D2、D3 和D4 受體,主要抑制AC 途徑[15]。
D1 受體(D1R)是表達水平最高的DA 受體。通mRNA 檢測發現,在紋狀體、NAc 和嗅結節等區域,強啡肽、GABA 能神經元D1R 蛋白表達程度較高,在PFC、下丘腦和丘腦中表達程度較低。然而,在某些腦區,僅檢測到D1R 蛋白,未能檢測到D1R mRNA[16]。D2 受體(D2R)基因可編輯長和短兩種剪接變體的外顯子,分別稱為D2L 和D2S,其中D2Lw 紋狀體中,由腦啡肽和GABA能神經元共同表達。同時,D2R 也存在于SNc 和VTA 中,由多巴胺能神經元表達[17]。
D3 受體(D3R)受關注較多,主要存在于邊緣區域,例如NAc、嗅結節和Calleja 島,而在DSt 中的表達水平較低。在基底神經節中發現低水平的D4 受體(D4R)表達,而在額葉皮層(frontal cortex,FCs)、髓質、杏仁核(amygdaloid,Amyg)、下丘腦和中腦表達水平相對較高。D5受體(D5R)的表達很弱,似乎僅限于海馬體(Hippocampus,Hipp)、乳頭外側核和丘腦束旁核[18]。另外,D1R 和D2R 在同一神經元內的共定位問題,即D1/D2 協同作用,紋狀體中等棘神經元(MSN)能表達D1R/D3R/D4R 或D2R/D5R,D1/D2 的不平衡可能導致成癮[19]。另有研究表明[20],外周血淋巴細胞能表達酪氨酸羥化酶并產生DA,神經膠質細胞也可以表達功能性DA 受體,并進行DA代謝,提示DA 可能在神經免疫系統中發揮重要作用。
Olds J 等[21]在1954 年發現,DA 在嚙齒動物特定大腦區域會產生有益的刺激,并且存在一個參與強化的特殊回路。Wise RA 等[22]首次闡明這種獎賞回路(Reward Circuitry,RC)的核心是由突觸連接的三個串聯神經元鏈路組成:①從內側前腦束的前床核(anterior bed nuclei of the medial forebrain bundle,ABN)延伸到腹側被蓋區(VTA)鏈路;②從VTA 到伏隔核(NAc)的上行鏈路;③從NAc 到腹側蒼白球(ventral pallidum)的進一步上行鏈路。獎賞回路的神經元串聯鏈路能夠接收其他神經突觸信號傳遞并進行功能調節,包括膽堿能、內啡肽能、5-羥色胺能、GABA 能、谷氨酸能、腦啡肽能、強啡肽能和含P 物質的神經元[23]。在生物進化的進程中,大腦獎賞回路的基本生物學功能是維持正常(自然)獎賞行為,如進食、飲酒、性行為、撫育行為以及社會交往等,通過強化正常獎勵可以鞏固生物基本記憶(例如,動物覓食或狩獵范圍內的食物和水源位置)。大腦獎賞回路的激活程度與主觀興奮程度密切相關。直到毒品出現,大腦獎勵回路被“劫持”,比自然獎勵更強烈,吸毒者因此拋棄了生活中正常的快樂和回報,轉向追求毒品引起的快樂。
RC 是RS 的主要組成部分,獎賞系統還包括其他涉及所有成癮過程的神經元簇[24]。在生理條件下,RS 調節生命繁衍相關的行為和動機,如哺乳或繁殖,以及尋求獎勵和獎勵誘導學習的基本行為。DA 是激活大腦獎賞系統的關鍵神經遞質,幾乎所有毒品(不包括LSD 和麥司卡林類迷幻劑)都是直接或間接DA 激動劑,特別是獎賞回路“第二階段”中與NAc 鏈接的VTA 部位,腦成像研究也證實了DA 系統在非藥物獎勵中的作用。構成RS 的大腦區域主要包括VTA、NAc、FCs、DSt、Amyg 和Hipp[25]。在生理/病理條件下,各區域激活都會引起行為反應或喚起過程。VTA是獎賞系統中DA 的主要來源,VTA 具有不同的神經遞質活性,包括DA(60%~65%),GABA(30%~35%),谷氨酸(2%~3%)。在生理條件下,VTA 細胞釋放DA 進一步傳導激活NAc、Amyg、FCx、DSt 和Hipp。NAc 在動機和獎勵價值中發揮核心作用,Amyg 有助于情緒學習和鞏固記憶,FCx 參與規劃和決策,DSt 是強化習慣形成的基礎,Hipp 則對與藥物線索相關的學習至關重要。
不同類別的毒品分子作用于獎賞回路的不同部位,以激活該回路并誘導增強作用:阿片類、巴比妥類、苯二氮?類、大麻素作用于VTA;苯丙胺類、可卡因、阿片類、大麻素和解離性麻醉劑(如氯胺酮和苯環利定)作用于NAc,因此產生吸毒行為、尋藥行為、渴求和復吸的位點。例如, 阿片類作用于Mu 受體,產生局部抑制性中間神經元超極化,VTA 區DA 神經元的去抑制作用;苯丙胺類作用于DAT,阻斷DAT,抑制DA 再攝取,競爭性增加細胞外DA 水平,同時抑制囊泡單胺轉運蛋白2,促進DA 外流;可卡因能夠與DAT結合,阻斷DA 的再攝取,增加細胞外DA;大麻素類作用于CB1 受體,逆向抑制VTA 區 DA 神經元激活;咖啡因作用于腺苷A1 受體,在DA 神經元突觸前水平,非選擇性競爭阻斷A1R 腺苷A1受體,促進DA 釋放。
腦內DA 的活動受到精細的調節且DA 數量沒有上限,長期超量會誘發病理行為,可能威脅到個體生存。成癮與大腦RS 內的低多巴胺能功能障礙狀態有關[26]。毒品作用于RS,在缺乏正常調節機制的情況下,成癮就會出現[27]。DA 的釋放有兩種機制:一種是神經介導直接釋放,另一種是通過誘導細胞因子分泌,間接增加DA 的釋放。毒品成癮的過程具有階段性特點:從初始偶爾的獎勵驅動娛樂性使用,發展為持續沖動性濫用,再發展為后期強迫性使用,這些行為進展與多巴胺釋放以及獎賞系統的神經解剖學結構和功能改變相關[28]。
醫學研究發現[29],10%~30%的人偶爾嘗試毒品后會隨著時間的推移最終成癮,成癮的風險不盡相同。成癮易感性是由遺傳、毒品種類和環境因素之間的復雜相互作用造成的。個體對毒品成癮的易感性存在基因變異,但壓力和社會失敗等環境因素也會以某種方式改變大腦獎賞機制,促使人容易上癮。事實上,具有遺傳傾向的人如果暴露在積極(降低成癮風險)的環境中不一定會成癮,相反,對毒品具有遺傳抵抗力的人如果暴露在消極(增加成癮風險)的環境中可能會成癮。簡而言之,“生物-心理-社會”病因學模型對成癮非常適用。
4.1.1 遺傳因素
確定毒品成癮的行為表型是相對容易的,人類雙胞胎研究表明,遺傳對成癮的發展有重大影響,遺傳風險估計在40%~60%[30]。個體基因的確切作用尚不完全清楚,成癮的遺傳學因素通常被認為是受多個低影響基因共同作用影響[31]。
4.1.2 環境因素
環境因素包括社會經濟因素、家庭和同伴關系、生活事件、毒品易接觸度等。環境因素參與塑造個體的個性和性格,形成社會文化背景,同時也影響神經元回路和神經適應能力。流行病學數據發現[32],良好的家庭和同伴關系,而且身體(鍛煉)和心理(認知)上的支持都會降低成癮的風險。DA 系統參與了環境因素介導的成癮易感性改變,已明確確定壓力會導致DA 系統發生改變,從而增加藥物的增強作用;相反,暴露于富集環境會導致DA 系統突觸后神經元變化,成癮易感性降低[33]。
毒品能夠增強(直接或間接,甚至跨突觸)NAc 多巴胺能獎賞突觸功能,其欣快效應與DA濃度相關。DA 增加發生在成癮的初始階段,最初的毒品濫用行為是由獎勵驅動的,主要與毒品誘導的獎賞回路中腹側被蓋區(VTA)-伏隔核(NAc)鏈接的激活有關。獎賞回路功能上較為復雜,不只是對主觀快感的強度進行編碼,還編碼注意力、獎勵預期和激勵動機。多巴胺的貢獻似乎主要是導致“想要”獲得享樂的獎勵,而不是“喜歡”或學習這些獎勵[34]。
1996 年,Blum K 等[35]提出“獎勵缺乏假說”,即成癮主要由大腦獎勵機制的慢性基礎功能障礙所驅動,導致主觀快感感受降低甚至缺失,吸毒者尋求使用毒品來彌補這種慢性獎賞缺乏。“獎勵缺乏假說”試圖將毒品成癮解釋成一種具有破壞性和自毀結局的快感自我補償行為。腦神經成像技術證實成癮大腦的多巴胺能獎賞回路結構和功能出現異常,例如內側前腦束多巴胺神經元軸突萎縮,多巴胺D3 受體數量減少,NAc 多巴胺能軸突末端酪氨酸羥化酶的病理缺失,多巴胺釋放不足,以及突觸后神經元的受體后轉導機制(腺苷酸環化酶、環AMP、蛋白激酶A)的病理改變等[36]。
長期使用毒品,大腦對欣快感受的耐受性逐漸增強,吸毒者可能在從日常生活中獲取獎勵和快樂的能力上存在缺陷,焦慮開始主導獎勵回路,吸毒者使用毒品的目的不再是感受快感,而只是為了回到“正常”狀態。Schultz W 等[37]通過記錄非人類靈長類動物的多巴胺能腦區域的電生理反應,發現DA 神經元對新的或比預期更好的獎勵做出反應,但是在反復接觸和學習后,DA 神經元不再對獎勵本身做出反應,而是對可以預測獎勵的刺激做出反應。最新的研究發現[38],部分GABA 神經元也參與了獎勵和強化行為。與獎賞有關的任何刺激或場景、線索都能引起多巴胺釋放,例如地點、物品、人物,甚至是身體的感覺等。被激活的多巴胺能神經元鼓勵個體采取行動,或堅持任何可能帶來獎賞的行為。
長期使用毒品還會導致大腦獎賞回路DA 傳輸功能障礙,產生條件學習效應,稱為適應不良成癮行為[39]。隨著時間的推移,中等多棘神經元中的D2Rs 表達減少,DA 緊張性活動狀態降低,導致對自然獎勵的敏感性降低,繼續攝入毒品也難以發生動作電位爆發放電。此時,出現與毒品相關的提示后攝入毒品,則獲得聯想學習,該過程稱為正向獎勵預測誤差;然而,若未能攝入毒品,DA 釋放減少,則導致負獎勵預測誤差[40]。
隨著時間的推移,濫用藥物尋求和吸毒行為成為由單純獎勵驅動轉變為習慣驅動,主要涉及NAc 反向投射到VTA,以及NAc 向黑質和背外側新紋狀體投射的神經回路[41]。NAc 中的DA 對使用毒品和成癮發展是必不可少的,吸毒行為由NAc 多巴胺水平調節,并將多巴胺保持在病理升高范圍內,以維持所需的快感水平。NAc 中的多巴胺連接組成突觸中轉站,位于攜帶著刺激的強度、持續時間和質量信號的感官通路的分支連接處,這些感官信號被翻譯成“獎賞”,即所體驗到的快樂、愉悅或超級快感[42]。大量的電生理學、神經化學和行為神經科學研究已經明確表明,NAc 獎賞神經元不僅僅是對獎賞的編碼接收,它們還可以表現為編碼獎勵期望、獎勵延遲、獎勵延遲折現和獎勵預測誤差,調節藥物尋求行為的動機,以及促進突觸神經結構可塑性[43]。條件反應和習慣行為形成時,DSt 區域活動最為活躍。阻斷DSt 中DA 受體可防止可卡因尋求和長期戒斷后的復發[44]。NAc 和DSt 都與條件反射和習慣形成有關,這是成癮行為的核心特征[45]。
如前所述,成癮早期,毒品的確會增強大腦的獎賞作用,然而突然戒斷毒品,大腦的獎勵被抑制,會對個體造成嚴重影響。由毒品誘導的神經結構可塑性適應可能會改變多巴胺能系統內的通信,并且可能是導致戒斷癥狀、渴求和復吸的高風險因素。“結構可塑性”是指大腦回路中突觸連接的重組[46]。比如神經元樹突棘結構的形態可以迅速變化以調節神經元之間的突觸接觸[47]。毒品戒斷期間,DA 神經元和紋狀體神經元連接中樹突棘的改變,這些改變可能參與戒斷癥狀和表征,造成負面影響狀態。
關于毒品成癮真正需要解決的臨床問題是持續的渴求和復吸。毒品渴求/復吸的三個經典觸發因素:①再次接觸毒品;②壓力;③再次接觸與吸毒行為有關的環境線索。復吸主要涉及伏隔核和神經遞質多巴胺。壓力應激引發的復吸涉及杏仁核中央核、終紋床核,以及神經遞質促腎上腺皮質激素釋放因子和去甲腎上腺素。線索觸發的復吸涉及杏仁核基底外側核、Hipp 和神經遞質谷氨酸[48]。
鑒于DA 在毒品成癮中的關鍵作用,針對DA代謝機制以及獎賞回路的成癮藥物治療研究也較多。長期效果還需要進一步驗證。
通過藥理學阻斷毒品的對獎賞回路和腦內位點的增強作用,從而減少成癮相關行為。然而,越來越多的證據表明多巴胺能拮抗劑對治療毒品成癮無效,尤其是對鴉片類、尼古丁、酒精和大麻[49]。事實上,對動物和人體的研究表明[50],在大多數情況下,阻斷DA受體反而會增加毒品濫用,吸毒者通過增加毒品劑量來抵消DA 阻斷的影響。選擇性阻斷D2R 受體的藥物還會加劇負性情緒狀態并增加負性強化,導致對治療藥物依從性降低,停止治療并最終復發[51]。其他改進阻斷D2R 和對其他靶標(如血清素5-HT2 受體)的藥物在治療成癮方面的有效性也非常有限,但選擇性D1R、D3R拮抗劑為毒品成癮的藥物治療提供了新的選擇。
多巴胺能激動劑可用于治療興奮類毒品成癮,并且阿片類藥物和尼古丁成癮有效,例如阿片類激動劑美沙酮和丁丙諾啡的替代治療和尼古丁替代療法[52]。多巴胺受體的直接激動劑效果并不明顯,更多的是對作用于DAT 的間接DA 激動劑的研究。其中,莫達非尼、安非他酮、哌醋甲酯以及甲基苯丙胺的緩釋制劑,用于人體治療其他精神疾病,總體療效有限[53]。目前正在開發只與轉運蛋白結合,而不產生精神方面強化作用的新的DAT 阻斷劑[54]。其他間接提高多巴胺能活性的策略,例如通過單胺氧化酶(MAO)拮抗劑司來吉蘭減少新陳代謝或增加DA 前體,但效果有限。
另外,作用于大腦獎賞回路的藥物也很有前景。伏隔核GABA 能中型多棘神經元的抑制構成毒品誘導獎勵的最終共同途徑,GABA-β 受體激動劑巴氯芬可以抑制酒精、可卡因、嗎啡和海洛因的濫用,目前正在對人類酒精成癮治療進行研究[55]。同樣,還有針對可卡因成癮的間接GABA激動劑γ-乙烯基氨基丁酸以及針對大麻成癮的大麻素CB1 受體拮抗劑治療[56]。谷氨酸回路介導尋藥行為,促腎上腺皮質激素釋放因子(CRF)能夠觸發壓力下復吸行為,作用于谷氨酸回路和抗CRF 藥物的開發也值得期待[57]。
參與中樞神經系統(Central Nervous System,CNS)免疫反應的主要是小膠質細胞,小膠質細胞具有產生細胞因子和趨化因子、吞噬作用、降解和免疫細胞募集的能力,免疫反應和多巴胺能作用之間存在相關關系。既往研究表明[58],阻斷TOLL 樣受體(TLR4)可以減少嗎啡獲取行為。磷酸二酯酶抑制劑(AV411,Ibudilast)可降低TLR4 的表達,抑制促炎反應激活,減少NAC 中DA 釋放,能夠降低苯丙胺類和鴉片類濫用和尋藥行為[59]。
DA 是在成癮領域研究最多的神經遞質。在探究毒品成癮的過程中,對大腦DA 和獎賞系統的認知可以幫助更好地揭示大腦功能,理解神經傳導障礙和精神疾病,對成癮疾病的治療效果做出預測。值得注意的是,毒品成癮是一種涉及不同腦區和遞質且具有階段性特征的復雜疾病,考慮到不同種類的毒品可能與不同的成癮行為相關,因此有效建立成癮動物模型以及開發新的治療藥物的工作將十分艱巨,需要耗費大量的時間和精力才能產生有意義的臨床結果。