黃杏 呂浩 顧可瑜 羅新妮



摘??? 要|本研究旨在探究基于認知行為療法的AI機器人PsyBot相較于一般干預方式的有效性,以及對不同嚴重程度抑郁的干預效果。網絡招募并篩選未接受心理或藥物治療、無軀體疾病、無酗酒且無自殺風險的輕度至中
重度抑郁被試共160名,隨機分配到AI組和對照組,最終有效被試分別為71人和53人。AI組需在指定手機??? 應用程序(Psybot?????? APP)完成由機器人提供的7周CBT干預,對照組需在相同APP中完成每日記錄心情和閱讀科普。實驗開始前和實驗第3、5、7周均采用PHQ-9進行評估。結果顯示:(1)干預第3周時,AI組 PHQ-9分數相較于對照組下降幅度更大(p =0.056,d =0.35),且第5、7周尤為顯著(p =0.01/p <0.001, d =0.47/0.53);(2)兩組PHQ-9得分在第7周時出現顯著差異,AI組顯著低于對照組(p <0.05, d =-0.44);(3)中度和中重度在第3、5、7周均顯著低于基線(p <0.001,d >2),且在第7周相較于第3 周再次顯著降低,輕度被試干預前后的PHQ-9分數無顯著差異;不同抑郁程度的分數下降幅度在第3周出現?? 顯著差異(p?? <0.001,ηp2=0.32),由大到小依次是中重度、中度和輕度,兩兩顯著且持續至第5周和第7 周。結論:基于CBT的AI干預可有效改善抑郁癥狀,且在第3周開始起作用,7周可達更佳效果。同時,該干 預方式可能對中度和中重度抑郁有更顯著的干預效果。
關鍵詞|聊天機器人;數字干預;抑郁;認知行為療法;人工智能
1?????? 引言
抑郁癥是一種發病率較高的精神心理疾病,常常表現為持續的心情低落或沮喪、快感缺失或對事物失去興趣,以及不同程度的社會功能損傷[1]。在全球范圍內,患有抑郁癥的人數超過 3 億,約占總人口的 4.4%[2],且在逐年遞增。一方面,亞臨床抑郁群體(未達到抑郁癥或心境障礙臨床診斷標準,仍表現出了抑郁傾向或特征)若未得到及時有效的專業幫助,有發展為臨床抑郁的風險[3];另一方面, 近幾年的新冠疫情除了造成身體健康困擾之外,也給人們帶來了心理健康困擾,其中情緒健康問題尤為凸顯。研究發現,人們在疫情暴發后表現出了更多的抑郁情緒,重度抑郁障礙的發病率增加了 7%[4]。心理干預和精神藥物干預被證明是改善抑郁的有效方法,但仍有大量抑郁個體無法得到及時有效的
幫助。被研究者們廣為提及的原因之一是人們對抑郁、焦慮等心理健康問題存在態度偏差,比如對心理健康服務的效果和起作用的方面存在誤解、不認為自己需要獲得專業幫助,或者對心理健康困擾存在污名化和病恥感,害怕被貼上負面的標簽[5,6];高昂的心理咨詢或治療費用是阻礙人們獲取心理健康服務的另一個重要原因,尤其在低收入地區[7,8,10];此外,高質量心理健康服務資源短缺是全球面臨的一 個難題,心理服務的高需求和低供給的問題在我國尤為嚴峻[7-9,11,12]。
認知行為療法(cognitive behavioral therapy,CBT)是緩解抑郁的有效手段[13],隨著互聯網技術的高速發展,基于網絡的自助式認知行為治療(self-guided internet-based cognitive behavioral therapy, ICBT)逐漸興起,這種新型干預方式的有效性也得到了國內外不少研究的驗證[14-21]。邦特羅克等人
(Buntrock et al.,2017)發現,相較于只進行網絡心理教育的被試,基于網絡的自助式心理干預在實驗完成后的 12 個月回訪中出現重度抑郁的人數占比顯著更少[20];福爾塞爾等人(Forsell et al.,2017)通過隨機對照試驗,證明了為期10 周的ICBT 對產前抑郁的干預有效性[14];任志洪等人(2016)和楊(Yeung, 2018)等人用漢化版的 ICBT 產品 MOODGYM 驗證線上自助式 CBT 對中國人的抑郁干預作用,兩人的研究結果均發現,相較于對照組,MOODGYM 對抑郁水平及抑郁癥狀起到了顯著的緩解作用[22,23]。雖然基于網絡的自助式心理干預與傳統的面對面心理干預(如談話療法)達到的效果持平,ICBT 并未表現出更顯著的干預效果[24,25],但 ICBT 的低成本、標準化、易獲得、一對多、不受限于時間空間等優勢, 可較大程度彌補傳統干預方法的不足,緩解心理服務的供需矛盾;另外,互聯網獨有的匿名屬性可降低人們對心理服務的心理門檻,更有意愿尋求專業的心理幫助。
隨著智能手機日漸普及和大數據、人工智能的快速發展,數字化的心理干預形式也在發生變化,以移動客戶端為載體而開發的心理健康類產品逐漸增多[26,38,39],其中,基于智能聊天機器人(AI-chatbot) 的認知行為治療逐漸成為一種較受大眾喜愛的干預方式[27-29]。我國史夢璐等人(2018)曾探索了當來 訪者認為咨詢師是真人和認為咨詢師是 AI 的條件下感知到的咨詢效果的差異,結果發現兩種條件下的咨詢效果無顯著差異,且當被告知咨詢師是 AI 時,來訪者在傾訴時會有更少的顧慮,且同樣進行了思考、獲得了情感支持[30]。國外已有不少較成熟 AI 心理健康產品,比如Woebot[31]、Tess[32,33]和Wysa[34], 這類產品對抑郁情緒的干預有效性已經得到了實證研究的驗證。我國也少許類似產品,但對于有效性的研究僅有一篇。劉浩(2022)等人發現,相比傳統的閱讀療法,通過聊天機器人提供的認知行為療法, 能達到顯著更高的干預效果[35],但并未進一步探究以聊天機器人為載體的干預方式對不同程度抑郁的 干預效果差異。值得注意的是,托魯斯等人(Torous et al.,2018)曾對市面上大量的心理健康類應用程序(APP)進行了較全面的分析,發現較低的用戶參與度是這類 APP 普遍存在的一個問題[36]。傳統的面對面心理治療需要進行 20 次后才能達到 50% 的改善率,在 50 次后能達到 75% 的改善率[37],直接參照傳統干預周期設計心理健康類產品,用戶的參與度會遇到更大挑戰。因此,本研究也試圖探究一種最佳的數字干預周期,同時確保干預效果和用戶參與度。
綜上,本研究擬探究基于聊天機器人的自助式干預:(1)相較于一般的干預方式是否具有顯著的干預效果;(2)是否對于不同程度的抑郁有不同的干預效果;(3)是否存在最佳干預周期。
2?????? 方法
2.1?? 被試
通過網絡發布招募信息,共 283 人報名,排除 123 名 PHQ-9 得分小于 6 分或大于 19 分,或 PHQ-9 的自殺條目得分大于 2,或正在接受心理 / 藥物治療,或有軀體疾病,或酗酒的被試,符合入組要求的被試共 160 人。將符合要求的被試通過隨機化法分到 AI 組或對照組,分別為 80 人,具體方法為:使用 Excel 產生隨機數,若被試對應的隨機數為偶數則進入 AI 組,為奇數則進入對照組。所有被試(包括排除的被試)在實驗開始前,均詳細了解實驗內容及流程,并簽署知情同意書。入組后,因個人原因未正式開啟實驗的被試共 36 人,最終 AI 組和對照組的有效被試分別為 71 人和 53 人,流程如圖1 所示,兩組被試的人口學信息如表1 所示。
2.2?? 干預
如表2 所示,基于認知行為療法的 AI 干預包括:(1)每周 1 次的會談(共 8 次會談),包括首次的量表評估與半結構化訪談評估、基于認知行為療法(CBT)的干預會談和最后一次總結會談;(2)每天 1 次與會談內容配套的練習(共 49 次),強化鞏固會談效果,同時獲得輕量的情緒舒緩技巧;(3)每日情緒日記,包括心情評分(1 表示非常消極,5 表示非常積極)、情緒命名和記錄困擾事件;(4)每日心理健康教育,了解抑郁相關的科普知識。對照組只需完成每日情緒日記和心理健康教育。
2.3?? 實驗流程
兩組被試正式開通實驗平臺賬戶后,即開啟為期 7 周的實驗。AI 組需每天完成由聊天機器人提供的數字干預內容,對照組需每天完成心情日記和閱讀心理科普。實驗開始的第 1 周、第 3 周、第 5 周和第7??? 周分別通過干預機器人對兩組進行階段性評估(即完成階段性評估的被試均完成了評估之前的干預內容),實驗結束后,對照組也可免費獲得同樣的 AI 干預。
2.4?? 觀測工具
使用病人健康問卷(PHQ-9)來測量被試的抑郁程度。共包含 9 個條目,單條目分數范圍為 0 ~ 3 分,總分范圍為0 ~ 27 分,0 ~ 4 為無抑郁,5 ~ 9 為輕度抑郁,10 ~ 14 為中度抑郁,15 ~ 19 分為中重度抑郁,20 以上則為重度抑郁。
2.5?? 數據分析
實驗數據使用 SPSS(第 21 版)軟件進行統計分析,將缺失值和超過 3 個標準差的數據用同組均值補齊。采用卡方檢驗和獨立樣本 t 檢驗分析干預組和對照組的人口學變量和基線值的差異顯著性,采用重復測量方差分析(Repeated ANOVA)分析組間干預效果的差異顯著性。當方差分析結果顯著時,采用 Bonferroni 進行事后比較(Post-hoc)。在分析結果中,p 值表示統計學上的差異顯著性,p<0.05 意味著差異是顯著的,p 值越小,表示統計學意義上差異越顯著,“ns”表示差異不顯著。t 檢驗的效應量用Cohens d 表示,小于 0.2 則為小效應量,0.2 ~ 0.5 為中效應量,大于 0.5 則為高效應量;方差分析的效應量用η 2 表示,小于 0.01 為小效應量,0.01 ~ 0.59 為中效應量,大于 0.59 則為高效應量。缺失值和極端值(超過 3 個標準差的值)通過組內均值補齊。
3?????? 結果
3.1?? 基線分析
兩組被試在人口學信息,如性別(χ2=0.12,p=0.73)、年齡(t=0.11,p=0.91,Cohens d=0.24)和受教育水平(χ2=1.16,p=0.76)方面無顯著差異;在抑郁得分(t=1.31,p=0.19,Cohens d=0.24)和各程度的人數分布上(χ2=5.52,p=0.06)也無顯著差異。
3.2?? 主要結果分析
3.2.1???????? AI 組和對照組 PHQ-9 分數差異分析
以干預方式(數字干預 vs 一般干預)為組間變量,以測量時間(第0 周vs 第3 周vs 第5 周vs 第7 周)為組內變量,PHQ-9 得分作為因變量進行2*4 重復測量方差分析。結果顯示,施測時間主效應(F(3,366)=95.84, p<0.001,η 2=0.44) 和交互作 用(F(3,366)=4.59,p=0.006,η 2=0.04)均顯 著,組間效應不顯著
(F(1,122)=1.27,p=0.26,η 2=0.01)。事后分析發現,兩組被試在干預前、第 3 周和第 5 周的PHQ-9得分上均未表現出顯著差異(t 第0周=1.31,p=0.19,Cohens d=0.24;t 第3周=-0.83,p=0.41,Cohens d=-0.15; t 第5周=-1.71,p=0.09,Cohens d=-0.31),在實驗進行第 7 周時,兩組PHQ-9 得分差異顯著(t 第7周=-2.43, p<0.05,Cohens d=-0.44),AI 組的抑郁得分顯著低于對照組,如表3 和圖2 所示。
3.2.2???????? AI 組和對照組 PHQ-9 變化幅度差異分析
以干預方式為自變量(數字干預 vs 一般干預),各施測時間測得的分數與基線值之差為因變量進行獨立樣本 T 檢驗。結果顯示,實驗進行至第 3 周時,兩組被試的 PHQ-9 分數變化的差異呈現出邊緣顯著,AI 組的 PHQ-9 得分下降幅度大于對照組(t=1.93,p=0.056,Cohens d=0.35);實驗進行至第 5周和第 7 周時,兩組分值變化差異均顯著,AI 組的 PHQ-9 得分下降幅度均顯著大于對照組(tT3=2.60, p=0.01,Cohens d=0.47;t 第7周=2.896,p<0.001,Cohens d=0.53)。
3.3?? 不同抑郁程度的干預效果差異分析
以 AI 組的不同抑郁程度(輕度 vs 中度 vs 中重度)為組間因子,以施測時間為重復測量因子,將 PHQ-9 得分作為因變量進行重復測量方差分析。結果顯示,施測時間主效應(F(3,204)=97.68, p<0.001,η 2=0.59)、抑郁程度主效應(F(2,68)=13.40,p<0.001,η 2=0.28)和兩因素的交互作用
(F(6,204)=13.40,p<0.001,η 2=0.28)均顯著。事后分析發現,相比干預前,輕度抑郁被試第 3 周、第 5 周和第 7 周 PHQ-9 得分均未表現出顯著的下降(t 第3周=1.03,p=1,Cohens d=0.28;t 第5周=2.77, p=0.40,Cohens d=0.75;t 第7周=2.26,p=1,Cohens d=0.61),而中度(t 第3周=8.82,p<0.001,Cohens d=1.57;t 第5周=11.04,p<0.001,Cohens d=1.96;t 第7周=12.19,p<0.001,Cohens d=2.17)和中重度抑郁被試(t 第3周=9.77, p<0.001,Cohens d=2.80;t 第5周=11.94,p<0.001,Cohens d=3.43;t 第7周=13.38,p<0.001,Cohens d=3.84) 的 PHQ-9 得分均顯著降低;此外,中度抑郁被試在第 3 周和第 7 周測得的 PHQ-9 得分差異出現邊緣顯著(t=3.37,p=0.059,Cohens d=0.6),中重度抑郁被試在這兩個時間得分也表現出顯著差異(t=3.61, p<0.05,Cohens d=1.04),如圖3 所示。
以 AI 組的不同抑郁程度(輕度 vs 中度 vs 中重度)為組間因子,PHQ-9 基線值與各施測時間測得的值之差為因變量進行單因素方差分析。結果顯示,實驗進行至第 3 周時,不同抑郁程度被試的 PHQ-9 分數變化差異顯著(F(2,68)=16.27,p<0.001,η 2=0.32),中度抑郁被試的分數下降幅度顯著大于輕度抑郁被試(t=3.55,p<0.01,Cohens d=1.03),中重度被試的分數下降幅度顯著大于中度(t=3.24, p<0.01,Cohens d=0.99)和輕度抑郁被試(t=5.69,p<0.001,Cohens d=2.02); 在第 5 周和第 7 周時,中度抑郁被試的分數下降幅度依舊顯著大于輕度抑郁被試(t 第5周=3.34,p<0.01,Cohens? d=0.97; t 第7周=5.05,p<0.001,Cohens d=1.47),中重度被試的分數下降幅度依舊顯著大于中度(t 第5周=3.84, p<0.001,Cohens d=1.17;t 第7周=5.16,p<0.001,Cohens d=1.57)和輕度抑郁被試(t=8.57,p<0.001, Cohens d=3.04),如表4 所示。
3.4?? 被試留存率
AI 組被試中,61.97%(44/71)堅持至第 3 周,59.15%(42/71)堅持至第 5 周,50.7%(36/71)堅持至第 7 周;對照組被試中,84.9%(45/53)堅持至第 3 周,83%(44/53)堅持至第 5 周和第 7 周。
4?????? 結論與討論
本研究為 CBT 聊天機器人(AI)對抑郁的干預有效性提供了補充證據,且在驗證其干預有效的同時, 探索了該數字化干預對不同抑郁程度的干預作用及最佳干預周期。在整體干預有效性方面,接受 AI 干預的被試在干預進行至第 3 周時,PHQ-9 得分顯著低于干預前,第 5 周再次顯著降低(相較于第 3 周),
且干預效果持續至第 7 周,并在第 7 周時顯著低于對照組。在不同抑郁程度的干預有效性方面,隨著干
預的進行,輕度抑郁被試沒有表現出顯著的改善,而中度和中重度抑郁被試的抑郁情況在第 3 周均得到
了顯著的改善,且改善效果在第 5 周和第 7 周得以維持;另外,相較于第 3 周,中重度抑郁被試的抑郁
情況在第 7 周得到了進一步改善。
從結果可以發現,相較于干預前,AI 組和對照組的 PHQ-9 在第 3 周均顯著降低,組間差異到第 7周才出現顯著,這與以往研究中在干預第 2 ~ 4 周便出現組間顯著差異的結果不一致[31-34]。以往研究中, 對照組需要閱讀心理健康電子書(即進行心理健康教育),而本研究的對照組在心理健康教育的基礎上, 還需要完成心情日記,這個任務需要被試每天對自己的心情命名,并記錄情緒強度和誘發這種心情的事情,這可能提升了對照組被試對自我情緒的覺察和理解能力[40],從而產生了一些干預效果。另一方面, 雖然從PHQ-9 得分來看,干預第7 周才開始出現顯著的組間差異,但從分數下降幅度來看,干預第3 周時, AI 干預組的分數下降幅度已顯著大于對照組,說明兩組的抑郁緩解程度在第 3 周已經表現出顯著差異性, 且隨著干預的進行,差異性越來越顯著。
從不同抑郁程度被試的干預效果來看,輕度抑郁的被試在經 AI 干預后沒有獲得顯著的改善,中度和中重度抑郁在第 3 周時得到了顯著改善,并且在第 7 周再次出現改善;對對照組進行分析發現,輕度抑郁被試經一般干預后同樣未表現出顯著的改善(t 第3周=1.47,p=1,Cohens d=0.35;t 第5周=2.07,p=1, Cohens d=0.49;t 第7周=2.08,p=1,Cohens d=0.49),而中度和中重度抑郁被試只在第 3 周得到顯著改善。也就是說,兩種干預方式對輕度抑郁均未產生顯著的干預效果,但對中度及中重度抑郁被試起到了一定的干預效果,且 AI 干預的效果會隨干預周期的增加而進一步提升。實際上,福魯沙尼(Foroushani, 2011)[41]和克萊因(Klein,2016,2017)[42,43]等人的研究已經證明了基于網絡或計算機的數字化干 預對輕度及中度抑郁患者的干預有效性,而本研究并未發現對輕度抑郁被試的干預有效性,這可能由于本次研究環境是非臨床環境。一方面,在非臨床環境下,輕度抑郁被試的參與動機不全是尋求治療導向(Treatment-seeking),且改善動機不足[44];另一方面,本次只用了 PHQ-9 作為因變量指標,沒有從抑郁表現的其他方面(如思維反芻、情緒低落、快感缺失、社會功能受損等)進行多維度評估。所以輕度抑郁被試雖在總體抑郁得分上無顯著變化,但可能在其他抑郁表現方面獲得了改善。
另外,經 AI 干預的被試在干預第 5 周和第 7 周再次出現了顯著的干預效果,也就是說,越是堅持到最后越能獲得更好的效果。除了干預周期本身可能起到的作用外,被試的投入程度可能也是其中一個因素,即隨著干預的進行,被試在這個干預過程有更多的投入,這可能會對干預效果產生促進作用,未來還需進一步的實驗探究其機制。
5?????? 不足和展望
基于上述討論,本研究仍然存在一些待優化的地方。第一,由于缺少空白對照,難以完全控制由時間帶來的自然緩解作用。不過,即便兩組被試的干預效果均有一部分來自自然緩解,AI 組的緩解程度也顯著大于對照組。第二,整個實驗的是遠程進行的,這種情況下:(1)被試更容易流失,因此出于盡可能方便被試完成實驗的考慮,實驗僅使用 PHQ-9 作為主要的因變量指標,而未使用更多維度指標對干預效果進行觀測;(2)數據信噪更容易受到影響[44],即數據質量不可控,未來可考慮在干預計劃中加入低強度的真人教練,以提高數據的信度,同時探究真人與 AI 結合的干預方式是否能達到更好的效果[45];(3)雖然通過電話對滿足入組標準的參與者做了進一步的篩查,但難以通過面對面結構化訪談對被試進行更嚴格的入組和排除操作,導致入組的被試可能與真實的抑郁情況有出入,在之后的研究中需通過多種方式對被試進行入組篩查。第三,如討論中所述,由于本研究是非臨床環境,被試的改善動機弱于臨床實驗被試,因此除了報酬這一外部誘因之外,還需要有更多方式來激活被試的動機,以期達到更好的干預效果。
參考文獻
[1]Frances A,First M B,Pincus H A.DSM-IV guidebook[M].American Psychiatric Association,1995.
[2]WHO.Depression and other common mental disorders:global health estimates[R].Geneva:World Health Organization,2017.
[3]Angst J,Merikangas K.The depressive spectrum:diagnostic classification and course[J].Journal of affective disorders,1997,45(1/2):31-40.
[4]Torales J,OHiggins M,Castaldelli-Maia J M,et al.The outbreak of COVID-19 coronavirus and its impact on global mental health[J].International journal of social psychiatry,2020,66(4):317-320.
[5]Hsiu-Lan Cheng,Wang C,Mcdermott R C,et al.Self-stigma,mental health literacy,and attitudes toward seeking psychological help[J].Psychiatry and Health Behavior,2018,96(1):64-74.
[6]Andrade L H,Alonso J,Mneimneh Z,et al.Barriers to mental health treatment:results from the WHO World Mental Health surveys[J].Psychological Medicine,2014,44(6):1303-1317.
[7]WHO.mhGAP:Mental Health Gap Action Program:scaling up care for mental,neurological,and substance use disorders[R].Geneva:World Health Organization,2008.
[8]Arjadi R,Nauta M H,Scholte W F,et al.Internet-based behavioural activation with lay counsellor support versus online minimal psychoeducation without support for treatment of depression:a randomised controlled trial in Indonesia[J].The Lancet Psychiatry,2018,5(9):707-716.
[9]Patel V,Xiao S Y,Chen H H,et al.The magnitude of and health system responses to the mental health treatment gap in adults in India and China[J].The Lancet,2016,388(10063):3074-3084.
[10]Karyotaki E,Riper H,Twisk J,et al.Efficacy of Self-guided Internet-Based Cognitive Behavioral Therapy in the Treatment of Depressive Symptoms:A Meta-analysis of Individual Participant Data[J].JAMA Psychiatry,2017,74(4):351-359.
[11]Xiang Y T,Ng C H,Yu X,et al.Rethinking progress and challenges of mental health care in China[J]. World Psychiatry,2018,17(2):231.
[12]Wu Q,Zhao L,Ye X C.Shortage of healthcare professionals in China[J].BMJ,2016(354):i4860.
[13]李凌江,馬辛.中國抑郁障礙防治指南:第二版[M].北京:人民衛生出版社,2015.
[14]Forsell E,Bendix M,Hollandare F,et al.Internet delivered cognitive behavior therapy for antenatal depression:A randomised controlled trial[J].Journal of Affective Disorders,2017(221):56-64.
[15]Mahoney A,Li I,Haskelberg H,et al.The uptake and effectiveness of online cognitive behaviour therapy for symptoms of anxiety and depression during COVID-19[J].Journal of Affective Disorders,2021(292): 197-203.
[16]Berg M,Rozental A,Johansson S,et al.The role of knowledge in internet-based cognitive behavioural therapy for adolescent depression:Results from a randomised controlled study[J].Internet Interventions, 2019(15):10-17.
[17]Verkleij M,Georgiopoulos A M,Friedman D.Development and evaluation of an internet-based cognitive behavioral therapy intervention for anxiety and depression in adults with cystic fibrosis(eHealth CF-CBT): An international collaboration[J].Internet Interventions,2021(24):100372.
[18]Karyotaki E,Efthimiou O,Miguel C,et al.Internet-Based Cognitive Behavioral Therapy for Depression: A Systematic Review and Individual Patient Data Network Meta-analysis[J].JAMA Psychiatry,2021,78
(4):361-371.
[19]Paulette M S,Marjorie H K,John H G,et al.Computer-administered cognitive-behavioral therapy for depression[J].American Journal of Psychiatry,1990,147(1):51-56.
[20]Cuijpers P,Noma H,Karyotaki E,et al.Effectiveness and Acceptability of Cognitive Behavior Therapy Delivery Formats in Adults With Depression:A Network Meta-analysis[J].JAMA Psychiatry,2019,76
(7):700-707.
[21]Buntrock C,Ebert D D,Lehr D,et al.Effect of a Web-Based Guided Self-help Intervention for Prevention of Major Depression in Adults With Subthreshold Depression:A Randomized Clinical Trial[J].JAMA, 2016,315(17):1854-1863.
[22]任志洪,李獻云,趙陵波,等.抑郁癥網絡化自助干預的效果及作用機制:以漢化 MoodGYM 為例
[J].心理學報,2016,48(7):818.
[23]Yeung A,Wang F,Feng F,et al.Outcomes of an online computerized cognitive behavioral treatment program for treating Chinese patients with depression:a pilot study[J].Asian journal of psychiatry,2018(38): 102-107.
[24]Carlbring P,Andersson G,Cuijpers P,et al.Internet-based vs.face-to-face cognitive behavior therapy for psychiatric and somatic disorders:an updated systematic review and meta-analysis[J].Cogntive Behaviour Therapy,2018,47(1):1-18.
[25]Andersson G,Cuijpers P,Carlbring P,et al.Guided Internet-based vs.face-to-face cognitive behavior therapy for psychiatric and somatic disorders a systematic review and meta-analysis[J].World Psychiatry, 2014,13(3):288-295.
[26]Lee S M,Kang W S,Cho A R,et al.Psychological impact of the 2015 MERS outbreak on hospital workers and quarantined hemodialysis patients[J].Comprehensive Psychiatry,2018(87):123-127.
[27]Ahmed A,Ali N,Aziz S,et al.A review of mobile chatbot apps for anxiety and depression and their self-carefeatures[J].Computer Methods and Programs in Biomedicine Update,2021(1):100012.
[28]Hoermann S,McCabe K L,Milne D N,et al.Application of Synchronous Text-Based Dialogue Systems in Mental Health Interventions:Systematic Review[J].Journal of Medical Internet Research,2017,19
(8):e267.
[29]Ly K H,Ly A M,Andersson G.A fully automated conversational agent for promoting mental well-being:A pilot RCT using mixed methods[J].Internet Interventions,2017(10):39-46.
[30]史夢璐.當事人對“AI”心理咨詢的知覺和體驗研究[D].武漢:華中師范大學,2018.
[31]Fitzpatrick K K,Darcy A,Vierhile M.Delivering Cognitive Behavior Therapy to Young Adults With Symptoms of Depression and Anxiety Using a Fully Automated Conversational Agent(Woebot):A Randomized Controlled Trial[J].JMIR Mental Health,2017,4(2):e19.
[32]Fulmer R,Joerin A,Gentile B,et al.Using Psychological Artificial Intelligence(Tess)to Relieve Symptoms of Depression and Anxiety:Randomized Controlled Trial[J].JMIR Mental Health,2018,5(4):e64.
[33]Klos M C,Escoredo M,Joerin A,et al.Artificial Intelligence-Based Chatbot for Anxiety and Depression in University Students:Pilot Randomized Controlled Trial[J].JMIR Formative Research,2021,5(8): e20678.
[34]Inkster B,Sarda S,Subramanian V.An Empathy-Driven,Conversational Artificial Intelligence Agent
(Wysa)for Digital Mental Well-Being:Real-World Data Evaluation Mixed-Methods Study[J].JMIR Mhealth and Uhealth,2018,6(11):e12106.
[35]Liu H,Peng H,Song X,et al.Using AI chatbots to provide self-help depression interventions for university students:A randomized trial of effectiveness[J].Internet Interventions,2022(27):100495.
[36]Torous J,Nicholas J,Larsen M E,et al.Clinical review of user engagement with mental health smartphone apps:evidence,theory and improvements[J].Evidence-based mental health,2018,21(3):116- 119.
[37]Goodheart C D,Kazdin A E,Sternberg R J.Evidence-based psychotherapy:Where practice and research meet [M].American Psychological Association,2006.
[38]Hantsoo L,Criniti S,Khan A,et al.A Mobile Application for Monitoring and Management of Depressed Mood in a Vulnerable Pregnant Population[J].Psychiatric Services,2018,69(1):104-107.
[39]Zhang X,Lewis S,Firth J,et al.Digital mental health in China:A systematic review[J].Psychological Medicine,2021,51(15):1-19.
[40]Bakker D,Rickard N.Engagement in mobile phone app for self-monitoring of emotional wellbeing predicts changes in mental health:Mood Prism[J].Journal of affective disorders,2018(227):432-442.
[41]Foroushani P S,Schneider J,Assareh N.Meta-review of the effectiveness of computerised CBT in treating depression[J].BMC Psychiatry ,2011(11):131.
[42]Klein J P,Berger T,Schr?der J,et al.Effects of a psychological internet intervention in the treatment of mild to moderate depressive symptoms:results of the EVIDENT study,a randomized controlled trial[J]. Psychotherapy and psychosomatics,2016,85(4):218-228.
[43]Klein J P,Sp?th C,Schr?der J,et al.Time to remission from mild to moderate depressive symptoms:one year results from the EVIDENT-study,an RCT of an internet intervention for depression[J].Behaviour research and therapy,2017(97):154-162.
[44]Williams A D,OMoore K,Blackwell S E,et al.Positive imagery cognitive bias modification(CBM)and internet-based cognitive behavioral therapy(ICBT):A randomized controlled trial[J].Journal of Affective Disorders,2015(178):131-141.
[45]BergerT,H?mmerliK,GubserN,et al.Internet-based treatment of depression:a randomized controlled trial comparing guided with unguided self-help[J].Cognitive behaviour therapy,2011,40(4):251-266.
The Effectiveness of a Chatbot-delivered Cognitive Behavioral Therapy for Depression
Huang Xing1??? Lv Hao1??? Gu Keyu1 Luo Xinni2
1.????? Lianxin Technology, Lianxin Research Institute, Hangzhou;
2.????? The Affiliated Brain Hospital of Guangzhou Medical University, Guangzhou
Abstract: We investigated the intervention effect of an AI robot based on cognitive behavioral therapy (CBT) and its specificity for different depression severity. Methods: A total of 160 participants who scored between 6 and 19 in Patient Health Questionnaire-9 (PHQ-9) were randomly assigned to the AI intervention group or the control group, with 71 and 53 subjects were included in the final analysis, respectively. The AI intervention group completed 7-week chatbot-delivered CBT including weekly sessions with different themes and daily exercises through the PSYBOT Application. The control group (waitlist) were required to give their mood ratings and read mental health science articles daily through the same platform for 7 weeks. All outcomes were measured through the PHQ-9 at baseline, and at the end of the third, fifth and seventh week of the intervention. Results: Participants in the AI group showed improvements in depressive symptoms compared with the control group after the 7-week intervention, as indicated by decreased scores in the PHQ-9 (p<0.05, d=-0.44). At the end of the 3rd week of the chat bot-delivered CBT intervention, significant effects were found among participants with moderate and moderately severe depression (p<0.001, d>2) but not in mildly depressed subjects. The effects remained constant and were further in the 5th and the 7th week of intervention. Conclusions: Chatbot-delivered CBT may serve as a possible modality in alleviating the depressive symptoms of people with moderate and moderately severe depression. Multi-dimensional dependent variable indicators need to be used for further verification.
Key words: Chatbot-delivered intervention; Cognitive behavioral therapy; Digital intervention; Depression; AI