中西方文化差異對虛擬人道德責任判斷的影響*

2024-02-18 09:25:16莫田甜周欣悅

心理學報 2024年2期

閆霄莫田甜周欣悅

(浙江大學管理學院,杭州 310058)

1 問題提出

虛擬人是指通過計算機技術生成的具有真人外觀、特征和行為的虛擬形象(Sung et al.,2022)。隨著元宇宙概念的興起,越來越多的虛擬人以各種各樣的形式出現在全球各地,主要包括活躍在社交媒體平臺上的虛擬博主和虛擬偶像,例如我國的洛天依、美國的Lil Miquela、日本的Imma 等。它們利用計算機圖像軟件制作的數字形象,以第一人稱視角看待世界,并在社交媒體平臺上占據一席之地(Arsenyan &Mirowska,2021)。從2019 年科技部等部門發布的《關于促進文化和科技深度融合的指導意見》到2022 年國務院發布的《“十四五”數字經濟發展規劃》,國家明確鼓勵虛擬數字技術的研發與實踐。在政策的推動下,2021 年虛擬人相關企業融資達2843 起,融資金額高達2540 億元1。然而,在社會關注和資本加持的驅動下,相關的法律和道德倫理問題也不斷產生。

其中一個重要問題就是,人們會對虛擬人犯錯做出怎樣的道德責任判斷？現實案例表明,不同文化背景下,人們的態度會有所不同。在西方國家,虛擬人Bermuda 非法盜用了一位巴西裔美國網紅Miquela 的Instagram 賬號并且擅自刪除賬號內容,其做法非但沒有受到責備,還獲得了外界的認可(Feller,2018)。美國著名雜志《連線》的一名資深編輯曾就《第二人生》游戲中發生的虛擬人強奸事件做出評價,反對了虛擬犯罪的觀點(Lynn,2007)。研究還發現,在歐美等國外的政治大選中存在社交虛擬人在線詆毀候選人的情況(Kollanyi et al.,2016),他們會傳播未經證實的健康聲明,甚至對公眾健康造成危害(Allem et al.,2020),但并未得到有效治理和管控。然而在我國,人們對虛擬人的不道德行為并不寬容。例如,嗶哩嗶哩平臺打造的虛擬女團“四禧丸子”剛一出道就被指認作品抄襲,引起了網民的高度不滿,最終導致官方發文道歉并下架作品。可見,虛擬人會在網絡上進行侵權、抄襲、盜用、詆毀等不道德行為,并且不同文化背景下的人們可能持不同態度。那么,相比于真實人類在社交網絡上進行同樣的不道德行為,人們會如何看待虛擬人的不道德行為？例如,人們在多大程度上會認為虛擬人應該為之負責？這種判斷在不同文化下存在什么差異？現有研究尚未探索這些問題。本文將通過5 個主要實驗考察中西方文化差異對虛擬人道德責任判斷的影響和機制,對虛擬實體道德判斷的相關研究進行延伸,豐富文化差異、心智感知等相關文獻,并為虛擬人設計、運營和在道德倫理上的治理問題提供一定的實踐啟示。

1.1 中西方文化差異對道德判斷的影響

文化會對人們的心理與行為產生重要影響(侯玉波,朱瀅,2002)。文化泛指社會成員之間所共有的價值觀、規范、思維方式和行為方式等(Morling,2016;Na et al.,2010;黃梓航等,2018)。先前的研究發現,東西方文化差異會影響人們的道德判斷。西方文化強調以個人自由、權利、公正、關愛和寬恕等為導向的道德觀,而東方文化強調以集體和個人責任為導向的道德觀(彭凱平等,2011;王恩界,樂國安,2006)。Miller 和Bersoff (1992)的研究指出,西方人更強調公正倫理,東方人更強調責任倫理。個人主義/集體主義文化也會影響人們的道德決策,因為它們涉及到個人利益還是集體利益優先的信念(Oyserman et al.,2002)。基于個人主義/集體主義的文化心理學理論,本文關注到了中西方文化差異對虛擬人道德責任判斷的影響。例如,與個人主義文化(如美國文化)相比,集體主義文化(如中國文化)下的人們會有更高的換位思考能力(Wu &Keysar,2007)和擬人化傾向(Letheren et al.,2016)。因此,相比于西方文化,中國文化影響下的人們是否會對虛擬人的心智能力評價更高,進而認為虛擬人應該為不道德行為承擔更大的道德責任？這是本研究想要回答的問題。

1.2 對虛擬人的道德責任判斷

在以往文獻中,大多數學者認為虛擬人并非真實存在的機器人或是單純的電腦程序,他們將虛擬人定義為計算機生成的擬人化圖像(Arsenyan &Mirowska,2021;Kim &Jo,2022;Sung et al.,2022),并在人工智能技術的加持下能夠用語言、姿勢,甚至表情來和人們進行面對面的交流互動(Kim &Jo,2022;Volante et al.,2016)。目前有關虛擬人的研究集中在探討虛擬人與真人在社交媒體上的互動(Arsenyan &Mirowska,2021)、虛擬偶像特征及代言效果(Sands et al.,2022)。本文關注于社交媒體上的虛擬人,他們是利用計算機圖像軟件制作的數字形象,以第一人稱視角看待世界,并在媒體平臺上占據一席之地。相比于任務導向的人工智能機器人和算法軟件,社交媒體平臺上的虛擬人以獲取影響力為目的進行分享與互動,與真實人類具有更相似的行為,更容易出現不道德行為。盡管虛擬人的不道德行為被頻繁曝光,但尚未有研究直接探討人們對虛擬人的道德責任判斷,大多數研究聚焦人工智能、算法等虛擬實體。由于虛擬人的產生同樣依托人工智能技術,我們可以借鑒有關虛擬實體的研究。

道德責任的歸屬問題是道德哲學的基本問題,可以追溯到亞里士多德提出的理論,他認為一個實體應該同時滿足自由意志和認知條件,才能作為道德主體承擔道德責任(Aristotle,1999)。自由意志條件討論了代理人是否有可能采取不道德行動,認知條件考察了代理人是否能夠為行為后果承擔道德責任(Clarke,1992;Constantinescu et al.,2022;Zimmerman,1997)。在討論人工智能等虛擬實體是否能夠承擔道德責任時,許多學者也提到了這兩個基本條件。相關文獻指出,虛擬實體雖然具有一定程度的自主能力,但缺乏認知能力,仍不能作為責任主體承擔責任(Hakli &M?kel?,2019;Parthemore&Whitby,2014)。如果虛擬實體進行了不道德行為,其背后真實存在的人(如設計師或制造商等)應該對其造成的任何后果承擔責任(Bryson et al.,2017;Champagne &Tonkens,2015;Constantinescu et al.,2022)。

然而,單獨從兩個責任主體條件的角度去分析道德責任的歸屬是存在缺陷的(Shoemaker,2011)。Coeckelbergh (2020)強調了責任客體的重要性,道德責任問題不僅僅涵蓋做什么和知道自己在做什么,還應包括誰對某人或某事負責的問題,即可回答性。這種行為雙方的對應關系能為道德責任的歸屬問題提供更多依據。盡管對于虛擬實體來說,很多行為后果是難以解釋和回答的,因此客觀上難以理清道德責任的歸屬,但主觀上人們依然會對這些虛擬實體產生道德判斷(Malle et al.,2015;Young &Monroe,2019;褚華東等,2019)。基于上述分析,本文預測,人們在對虛擬人進行道德判斷時也會從責任主體和責任客體兩方面因素去歸因。

1.3 心智感知理論

心智是指思考、感受和有意識的行為能力(Tharp et al.,2017)。心智感知,即在其他實體(如技術設備、精神代理和非人類動物)中感知心智的存在,有助于理解和預測他人的行為和意圖(Johnson&Barrett,2003;Waytz et al.,2010)。根據心智感知理論(Mind Perception Theory),心智能力(mental capacity)涉及認知的自主力(agency)和情緒的感知力(experience),包括計劃、自我控制和情緒感受等(Gray et al.,2007;Gray et al.,2011;Gray &Wegner,2009)。將認知自主力歸因于一個實體意味著觀察者認為該實體能夠作為道德主體,像成年人一樣行動、計劃、實施自我控制等;將情緒感知力歸因于一個實體表明觀察者相信該實體能夠作為道德客體,存在情緒感知能力(Gray et al.,2007)。兩者可以被單獨感知。例如,嬰兒被認為具有高情緒感知力和低認知自主力,上帝被認為具有高認知自主力和低情緒感知力(Gray et al.,2007)。

心智能力會影響對實體的道德判斷,在二元道德概念中發揮作用(Gray et al.,2012;Ward et al.,2013)。具有認知自主力的實體能自己做出決定并有意識地采取行動,當行為出現錯誤時,他們被認為應該為此負責(Gray et al.,2012;Sullivan &Wamba,2022)。例如,正常的成年人具備認知自主力,可以作為道德主體承擔道德責任;但未成年人不具備認知自主力,在做出錯誤道德行為時,會受到更輕微的懲罰(Gray &Wegner,2009)。雖然認知自主力對道德責任的判斷至關重要,但情緒感知力是區分人類和其他實體的本質特征,通常被認為具有更強大的解釋力(Gray &Wegner,2012)。心理學研究表明,情緒感知力在道德決策中發揮重要作用(Greene et al.,2001;Haidt et al.,1993)。感受他人的痛苦并表現出同理心是道德判斷的核心要素之一(Bigman &Gray,2018)。情緒感知力也對道德主體的判斷起到重要作用(Bigman &Gray,2018)。例如,Sullivan 和Wamba (2022)發現,當人們認為人工智能故意傷害人類(相比于非人類)時,會將責任歸咎于人工智能,這是由心智能力中的情緒感知力來中介的。基于心智感知理論,本文認為,當社交媒體上的虛擬人犯錯時,如果賦予其類似正常成年人的高心智能力,人們可能會認為虛擬人需要承擔和真人相似的道德責任。

1.4 心智感知及道德責任判斷的文化差異

已有文獻認為,文化差異是影響心智感知的重要因素(Dietze &Knowles,2021)。一方面,文化差異會影響人們的換位思考能力。例如,比起個人主義文化(如美國),集體主義文化(如中國)下的人們會表現出更高的換位思考能力(Wu &Keysar,2007)。比起英國人,中國人對人工智能機器人社會合作屬性的感知更高(Dang &Liu,2022)。因此,比起西方人,中國人更可能將自己的情感和能力投射到別人身上,可能會對虛擬人的心智能力評價更高。另一方面,文化差異會影響人們的擬人化傾向。例如,Letheren 等(2016)發現,東亞人比白種人具有更高的擬人化傾向。西方文化的基督教和伊斯蘭教認為神更不具有固定形狀的身體,而東方文化的佛教和印度教認為神具有有形的身體(Fuller,2004;Ohnuma,2007;Samuel,1989;Willard &McNamara,2019)。東方人還會給神賦予人類特有的能力(McGuire,2018)。而擬人化傾向會影響心智能力的感知,擬人化傾向越高的被試對機器模型Pleo 心智能力的感知越高(Eyssel &Pfundmair,2015)。因此,東方人比西方人更可能對非人類實體進行擬人化,可能會更加認為虛擬人具備心智能力。綜上,本文認為,比起西方文化,中國文化影響下的人們可能會對虛擬人的心智能力評價更高。

研究發現,心智能力的兩個維度：認知自主力(Gray et al.,2012;Gray &Wegner,2009;Himma,2009)和情緒感知力(Greene et al.,2001;Sullivan &Wamba,2022)都對道德責任的判斷起到至關重要的作用。因此,對一個實體心智能力的評價可能會影響人們對其道德責任的判斷。然而,目前對虛擬實體道德責任判斷的文獻存在分歧。部分學者認為虛擬實體不能承擔道德責任(Hakli &M?kel?,2019;Parthemore &Whitby,2014)。也有研究表明,人們會將道德責任歸因于虛擬實體(Awad et al.,2020;Malle et al.,2015;Young &Monroe,2019;褚華東等,2019)。為了得出一致結論,需要深入探索人們對虛擬實體做出道德判斷背后的原因。結合心智感知在道德責任判斷中的重要作用,本文推斷,中西方文化差異能通過影響心智能力的評價,來影響人們對虛擬實體的道德責任判斷。

目前針對虛擬實體道德責任的研究大多針對人工智能,并采用道德兩難問題的研究范式(Awad et al.,2020;Malle et al.,2015;Young &Monroe,2019;褚華東等,2019)。而傳統道德兩難問題(如電車實驗)的道德情景將理性與直覺剝離開,被認為是非典型的(Schein &Gray,2018)。隨著越來越多的虛擬人出現在人們的日常生活中,以虛擬實體為主體的道德問題不再局限于道德困境,取而代之的是更多類人的不道德行為,如侵權、抄襲等。因此,本文聚焦社交媒體上的虛擬人貼近現實的道德情景,進行了實證研究,并提出以下研究假設：

假設1：當看到虛擬人進行不道德行為后,中國文化(相比西方文化)影響下的人們認為虛擬人需要承擔更大的道德責任。

假設2：中國文化(相比西方文化)影響下的人們認為虛擬人具備更高的心智能力,這種更高的心智能力歸因導致他們更加認為虛擬人應該為不道德行為承擔道德責任。

1.5 研究概覽

綜上所述,本研究基于心智感知理論,通過5個實驗考察了中西方文化差異對虛擬人道德責任判斷的影響。實驗1a 發現,中國文化(比西方文化)影響下的人們認為虛擬人犯錯需要承擔更大的道德責任。實驗1b 換用不同的不道德情景和道德責任的測量復制了實驗1a 的結果。實驗1c 操縱了虛擬人背后主體的類型,無論虛擬人由真實人類還是人工智能驅動,這種中西方文化差異的效應依然存在。實驗2 考察了感知心智能力的中介機制,中國文化影響下的人們對虛擬人更高的心智能力感知導致他們認為虛擬人犯錯應該承擔更大的道德責任。實驗3 進一步探討了這種文化差異對人們后續行為(道德懲罰)的影響。

2 實驗1a：網絡暴力情境

實驗1a 的目的是考察文化背景對人們道德責任判斷的影響。本實驗采用2 (真人vs.虛擬人)×2(中國文化vs.西方文化)被試間的實驗設計,考察相比于西方文化,中國文化影響下的人們是否會認為虛擬人在犯錯之后應該承擔更大的道德責任。

2.1 實驗設計與樣本

實驗采用G*Power 3.1 軟件(Faul et al.,2007)計算實驗所需樣本量。對于本實驗適用的雙因素方差分析,當顯著性水平α 為0.05 且效應量為中等效應時(f=0.2 到0.25 之間),要達到95%統計檢驗力所需要的樣本量在279 到434 之間。為保證實驗具有足夠的樣本量且為統一標準,本研究的所有實驗按照每個條件下100 名被試的標準招募,且采用原始數據進行分析。但由于線上平臺存在同時作答以及未完成作答等情況,會出現多于或少于既定被試數量1～2 個的情況。

實驗1a 通過國外問卷平臺Prolific 和國內問卷平臺 Credamo 分別邀請了 200 名美國白人被試(57.50%女性;M年齡=29.49 歲,SD年齡=6.26 歲)和200 名中國被試(75.00%女性;M年齡=25.16 歲,SD年齡=5.21 歲)參與研究,并以小額現金作為實驗報酬。兩種文化背景的被試被隨機分配到真人組或虛擬人組,每組各100 人。

2.2 實驗流程

在真人組中,美國(中國)的被試會看到一位Twitter (微博)博主Rico 的主頁(如圖1 所示)和簡短的文字介紹;在虛擬人組中,被試看到的則是虛擬博主Rico 的主頁(如圖2 所示)和相同的文字介紹以及對虛擬博主的定義(虛擬博主是利用計算機圖像軟件制作的數字形象,他們以第一人稱視角看待世界,并在媒體平臺上占據一席之地)。事實上,Rico是虛構的博主,其主頁頭像采用免費網站(https://generated.photos)人工智能自動生成的真實人形象,對應的虛擬人頭像則是根據真人形象繪制。其中,文字介紹內容為:

圖1 實驗1a 中真人組Twitter 主頁(左)和微博主頁(右)

圖2 實驗1a 中虛擬人組Twitter 主頁(左)和微博主頁(右)

“Rico 是微博/Twitter 上的一個(虛擬)博主。她經常活躍在社交媒體上分享她的穿搭和生活。”

接下來,被試被告知,“最近,Rico 在微博上發帖曝光某一位網民的隱私行為,致使該網民遭到網絡暴力。”為了測量道德責任判斷,被試回答了“你認為對于這起網絡暴力事件,Rico 應該承擔多少責任(7 分量表,1=沒有責任,7=很大責任)”以及“你認為對于這起網絡暴力事件,Rico 應該承擔多少指責(7 分量表,1=沒有指責,7=很多指責)”,測項語句的構成和選取在借鑒前人研究的基礎上有所調整(Gray &Wegner,2009)。由于道德責任判斷的兩個題目高度相關(r=0.76,p＜ 0.001),因此取二者的均值作為道德責任判斷。最后,所有被試報告了性別和年齡。本研究中所有實驗的完整操縱和測量材料見網絡版附錄1。

2.3 數據分析與結果

以文化類型(美國編碼為0,中國編碼為1)和博主類型(真人編碼為0,虛擬人編碼為1)分別作為自變量,道德責任判斷作為因變量進行方差分析。結果顯示,文化類型的主效應顯著,F(1,396)=4.41,p=0.036,=0.011;博主類型的主效應也顯著,F(1,396)=7.23,p=0.007,=0.018;文化類型和博主類型對道德責任判斷的交互效應顯著,F(1,396)=5.83,p=0.016,=0.015,如圖3 所示。具體而言,比起美國人,中國人認為虛擬人應該承擔更大的道德責任(M中國=5.48,SD=1.07,95% CI=[5.23,5.73];M美國=4.91,SD=1.68,95% CI=[4.66,5.16];F(1,396)=10.19,p=0.002,=0.025);而對真人道德責任的判斷沒有顯著的文化差異,F(1,396)=0.05,p=0.824。此外,中國人對真人和虛擬人的道德責任判斷不存在顯著差異,F(1,396)=0.04,p=0.846。以上數據結果表明,當看到虛擬人進行網絡暴力的不道德行為后,中國文化(vs.西方文化)影響下的人們認為虛擬人需要承擔更大的道德責任,從而驗證了假設1。本實驗和后續實驗在控制性別和年齡等變量后均不改變結果的顯著性和方向,詳細數據結果見網絡版附錄4。

圖3 實驗1a 中不同文化類型下對虛擬人和真人的道德責任判斷評分(Error bars: 95% CI;** p ＜ 0.01)

2.4 討論

實驗1a 采用曝光隱私引發網絡暴力的不道德行為情景來檢驗中西方文化對虛擬人作為道德主體在道德責任判斷上的差異。結果顯示,當人們看到虛擬人的不道德行為后,相比于西方文化,中國文化影響下的人們認為其需要承擔更大的道德責任。這一結果從文化差異的角度拓展了人們對虛擬實體道德責任歸因的文獻(Awad et al.,2020;Malle et al.,2015;Young &Monroe,2019;褚華東等,2019),表明不同文化背景下的人們對虛擬人道德責任的判斷存在差異。

3 實驗1b：偷稅漏稅情境

實驗1b 的目的是采用另一種不道德情景和另一種道德責任的測量方法,并招募另一個西方國家的被試來復制實驗1a 的結果。我們預計,相比于西方文化,中國文化影響下的人們認為虛擬人偷稅漏稅需要承擔更大的道德責任。

3.1 實驗設計與樣本

實驗1b 也采用2 (真人vs.虛擬人)×2 (中國文化vs.西方文化)被試間的實驗設計。我們通過國外問卷平臺Prolific 和國內問卷平臺Credamo 分別邀請了199 名英國白人被試(68.84%女性;M年齡=29.87 歲,SD年齡=6.06 歲)和 200 名中國被試(64.50%女性;M年齡=26.64 歲,SD年齡=5.52 歲)參與研究,并以小額現金作為實驗報酬。兩種文化背景的被試被隨機分配到真人組或虛擬人組。在英國被試中,真人組有99 人,虛擬人組有100 人;在中國被試中,真人組和虛擬人組各100 人。

3.2 實驗流程

與實驗1a 的操縱方式和內容類似,在真人組中,中國(英國)的被試會看到博主 Rico 的微博(Twitter)主頁及描述;在虛擬人組中,中國(英國)的被試會看到虛擬博主Rico 的微博(Twitter)主頁及描述。接下來,被試被告知,“最近,Rico 被曝出在直播帶貨的收入上存在偷稅漏稅的行為。現在,她正在被調查中。”接著,本實驗用4 個條目的道德責任量表來測量被試對Rico 道德責任的判斷(7 分量表,1=完全不同意,7=完全同意;Cameron et al.,2010;Cronbach’s α=0.81)。其中兩個條目為“Rico在道德上應該為她偷稅漏稅的行為負責”和“Rico應該為她偷稅漏稅的行為受到處罰”,得分越高表明被試對Rico 道德責任的判斷越高;另外兩個條目為“偷稅漏稅的行為不應該歸咎于Rico”和“偷稅漏稅的責任不應該由Rico 承擔”,得分越高表明被試對Rico 道德責任的判斷越低。我們將前兩個條目的得分和后兩個條目的反向得分相加平均后,得到了道德責任判斷的測量得分。隨后,被試回答了對博主類型操縱檢驗的問題：“就你而言,Rico 是？(0=真人博主,1=虛擬博主)”最后,被試報告了性別和年齡。

3.3 數據分析與結果

操縱檢驗以博主類型(真人編碼為0,虛擬人編碼為1)為自變量,文化類型(英國編碼為0,中國編碼為 1)為調節變量,博主類型的操縱檢驗(0=真人博主,1=虛擬博主)為因變量,在樣本選擇為5000 次、95%的置信區間下采用 Bootstrapping(PROCESS Model 1;Hayes,2015)進行回歸分析。結果顯示,文化類型的主效應不顯著(β=-0.32,SE=0.56,p=0.567,95% CI=[-1.42,0.78]),博主類型和文化類型的交互效應也不顯著(β=1.02,SE=1.35,p=0.450,95% CI=[-1.63,3.58]),僅在博主類型的主效應上存在顯著差異(β=6.32,SE=0.80,p＜ 0.001,95% CI=[4.75,7.90])。具體而言,在虛擬人組中,分別有98.00%的英國被試和99.00%的中國被試認為Rico 是虛擬博主;在真人組中,分別有91.92%的英國被試和94%的中國被試認為Rico是真人博主。這說明關于博主類型的操縱是有效的,且不存在文化上的差異。此外,排除不符合操縱檢驗要求的被試并不會影響現有結果的方向和顯著性。

道德責任判斷以文化類型(英國編碼為0,中國編碼為1)和博主類型(真人編碼為0,虛擬人編碼為1)為自變量,道德責任判斷為因變量進行方差分析。結果顯示,文化類型的主效應顯著,F(1,395)=8.50,p=0.004,=0.021;博主類型的主效應顯著,F(1,395)=28.56,p＜ 0.001,=0.067;文化類型和博主類型對道德責任判斷的交互效應顯著,F(1,395)=9.40,p=0.002,=0.023,如圖4 所示。具體而言,比起英國人,中國人認為虛擬人應該承擔更大的道德責任(M中國=5.36,SD=1.19,95% CI=[5.12,5.61];M英國=4.61,SD=1.66,95% CI=[4.36,4.86];F(1,395)=17.93,p＜ 0.001,=0.043);但對真人的道德責任判斷沒有顯著的文化差異,F(1,395)=0.01,p=0.915。此外,中國人對真人和虛擬人的道德責任判斷不存在顯著差異,F(1,395)=2.60,p=0.108。結果復制了實驗1a 的發現,再次驗證了假設1。

圖4 實驗1b 中不同文化類型下對虛擬人和真人的道德責任判斷評分(Error bars: 95% CI;*** p ＜ 0.001)

3.4 討論

實驗1b 通過新的不道德行為情景(偷稅漏稅)和道德責任測量條目(Cameron et al.,2010)表明,比起西方文化,中國文化影響下的人們認為虛擬人在出現偷稅漏稅的行為后需要承擔更大的道德責任。實驗1b 復制了實驗1a 的結果,擴展了與虛擬實體道德責任相關的研究(Awad et al.,2020;Malle et al.,2015;Young &Monroe,2019;褚華東等,2019)。在實驗1c 中,我們將考察是否不同類型的虛擬人會影響人們對他們的道德責任判斷。

4 實驗1c：虛擬人主體類型的影響

當面對社交媒體虛擬人時,人們可能會聯想到這些虛擬人背后的主體究竟是真實人類還是人工智能技術,從而存在不同的判斷。因此,實驗1c 考察是否不同的虛擬人主體類型會影響人們對虛擬人的道德責任判斷。

4.1 實驗設計與樣本

實驗1c 采用3 (真人vs.虛擬人工智能vs.虛擬真人)×2 (中國文化vs.西方文化)被試間的實驗設計,通過國外問卷平臺 Prolific 和國內問卷平臺Credamo 分別招募了300 名英國白人被試(65.00%女性;M年齡=30.82 歲,SD年齡=5.37 歲)和300 名中國被試(68.33%女性;M年齡=26.78 歲,SD年齡=5.84歲)參與研究,并以小額現金作為實驗報酬。兩種文化背景的被試被隨機分配到真人組、虛擬人工智能組或虛擬真人組。在英國被試中,真人組有99 人,虛擬人工智能組有100 人,虛擬真人組有101 人;在中國被試中,每組各有100 人。

4.2 實驗流程

博主類型的操縱方法與前面實驗的操縱方式類似。不同的是在真人組,被試看到的是有關真人博主的描述：“Rico 是微博(Twitter)上的一個博主”;在虛擬人工智能組,被試看到的是有關虛擬博主的描述：“Rico 是微博(Twitter)上的一個由人工智能和算法驅動的虛擬博主”;在虛擬真人組,人們看到的是有關虛擬博主的描述：“Rico 是微博(Twitter)上的一個由真實人類驅動的虛擬博主”。接著,被試被告知,“最近,Rico 在微博上公開發表的一張圖片被指控侵犯了某位攝影師的作品版權。事后,Rico刪除了這張圖片并公開道歉。”隨后,被試報告了對Rico 的道德責任判斷,測量條目與實驗1a 用到的測量相似(r=0.71,p＜ 0.001)。另外,虛擬人組的被試還回答了操縱檢驗的問題,“就你而言,驅動Rico的背后主體是(0=真實人類,1=人工智能)”。考慮到社會經濟地位可能會影響個體的道德判斷(Sui&Mo,2022),所有被試在最后報告了主觀社會經濟地位(10 點量表;Adler et al.,2000)、受教育程度(5 點量表)、性別和年齡。

4.3 數據分析與結果

操縱檢驗在虛擬組的被試中,以博主類型(虛擬真人編碼為0,虛擬人工智能編碼為1)為自變量,文化類型(英國編碼為0,中國編碼為1)為調節變量,博主類型的操縱檢驗(0=真實人類,1=人工智能)為因變量,在樣本選擇為5000 次、95%的置信區間下采用Bootstrapping (PROCESS Model 1;Hayes,2015)進行回歸分析。結果顯示,文化類型的主效應不顯著(β=0.08,SE=0.36,p=0.829,95%CI=[-0.64,0.79]),博主類型和文化類型的交互效應也不顯著(β=-0.71,SE=0.68,p=0.298,95%CI=[-2.05,0.63]),僅在博主類型的主效應上存在顯著差異(β=4.47,SE=0.53,p＜ 0.001,95% CI=[3.44,5.51])。具體而言,在虛擬人工智能組中,分別有95.00%的英國被試和91.00%的中國被試認為Rico 由人工智能驅動;在虛擬真人組中,分別有82.18%的英國被試和81.00%的中國被試認為Rico由真實人類驅動。這說明關于虛擬人主體類型的操縱是有效的,且不存在文化上的差異。此外,排除不符合操縱檢驗要求的被試并不會影響現有結果的方向和顯著性。

道德責任判斷以文化類型(英國編碼為0,中國編碼為1)和博主類型(真人編碼為-1,虛擬真人編碼為0,虛擬人工智能編碼為1)分別作為自變量,道德責任判斷作為因變量進行方差分析。結果顯示,文化類型的主效應顯著,F(1,594)=95.39,p＜0.001,=0.138;博主類型的主效應也顯著,F(2,594)=21.63,p＜ 0.001,=0.068;文化類型和博主類型對道德責任判斷的交互效應顯著,F(2,594)=12.02,p＜ 0.001,=0.039,如圖5 所示。具體而言,比起英國人,中國人認為無論虛擬人背后的主體是真實人類(M中國=5.41,SD=1.26,95% CI=[5.14,5.68];M英國=3.78,SD=1.50,95% CI=[3.51,4.05];F(1,594)=70.56,p＜ 0.001,=0.106)還是人工智能(M中國=5.13,SD=1.27,95% CI=[4.85,5.40];M英國=3.80,SD=1.57,95% CI=[3.53,4.07];F(1,594)=46.24,p＜ 0.001,=0.072),都需要承擔更大的道德責任;但對真人道德責任的判斷沒有顯著的文化差異,F(1,594)=3.01,p=0.084。此外,中國人對真人和兩種類型的虛擬人的道德責任判斷也沒有顯著差異(F(2,594)=1.83,p=0.162),且兩兩比較的結果都不存在顯著差異(ps ＞ 0.203)。以上結果說明,在得知虛擬人侵犯版權后,不論虛擬人背后的主體是真實人類還是人工智能,中國文化(相比于西方文化)影響下的人們都認為虛擬人需要承擔更大的道德責任。結果進一步為假設1 提供了支持。

圖5 實驗1c 中不同文化類型下對虛擬人工智能、虛擬真人和真人的道德責任判斷評分(Error bars: 95%CI;*** p ＜ 0.001)

4.4 討論

實驗1c 通過操縱虛擬人背后的主體類型,分別在真人組、虛擬真人組和虛擬人工智能組之間比較中西方文化差異。結果發現,無論虛擬人背后的主體是真實人類還是人工智能,相比于西方文化,中國文化影響下的人們都會賦予其更大的道德責任,而在真人組不存在這種文化差異。這說明,道德責任判斷的中西方文化差異同樣存在于由真實人類和人工智能驅動的虛擬人當中。以往有研究認為,在對虛擬實體做出責任判斷時會考慮其背后真實主體(Bryson et al.,2017;Champagne &Tonkens,2015;Constantinescu et al.,2022),但本實驗結果發現虛擬人背后的主體類型并不會影響對其道德責任判斷的文化差異。在實驗2 中,我們將考察對虛擬人感知心智能力的中介機制。

5 實驗2：感知心智能力的中介效應

實驗2 有兩個目的。首先,實驗2 考察了中西方文化對虛擬人道德責任判斷的差異是否源自于感知心智能力的差異。我們認為,相比于西方文化,中國文化影響下的人們認為虛擬人的心智能力更高,因此虛擬人在犯錯后需要承擔更大的道德責任。其次,由于該效應的產生可能是因為中國人比西方人更熟悉虛擬人,或者中國人比西方人認為不道德情景中的事件(如偷稅漏稅)更嚴重而導致的文化差異,與我們假設的機制無關。因此,實驗2 通過測量對虛擬人熟悉度和事件嚴重程度來排除這兩種替代性解釋。

在正式實驗前,我們通過一項預實驗驗證了,文化類型和博主類型對心智能力評價的交互效應顯著,F(1,395)=38.00,p＜ 0.001,=0.088。比起英國人,中國人認為虛擬人的心智能力更高(M中國=4.57,SD=1.08;M英國=3.62,SD=1.49;F(1,395)=32.35,p＜ 0.001,=0.076),這一結果符合我們的預期(預實驗的詳細內容見網絡版附錄2)。

5.1 實驗設計與樣本

正式實驗采用2 (真人vs.虛擬人)×2 (中國文化vs.西方文化)被試間的實驗設計,通過國外問卷平臺Prolific 和國內問卷平臺Credamo 分別邀請了199 名美國白人被試(71.36%女性;M年齡=30.62 歲,SD年齡=5.80 歲)和200 名中國被試(69.00%女性;M年齡=27.81 歲,SD年齡=5.24 歲)參與研究,并以小額現金作為實驗報酬。兩種文化背景的被試被隨機分配到真人組或虛擬人組。在美國被試中,真人組有101 人,虛擬人組有98 人;在中國被試中,真人組和虛擬人組各有100 人。

5.2 實驗流程

與實驗1b 一致,被試在看過有關虛擬人或真人Rico 的描述后被告知,“最近,Rico 被曝出在直播帶貨的收入上存在偷稅漏稅的行為。現在,她正在被調查中。”道德責任判斷的測量與實驗1a 相同(r=0.84,p＜ 0.001)。然后,被試通過12 個題項分別從認知自主力和情緒感知力兩個維度評價了Rico 的心智能力(7 分量表,1=沒有能力,7=很有能力;Gray et al.,2011;Cronbach’s α=0.92)。考慮到不同文化背景的人對虛擬人的了解程度不同,我們還用3 個條目測量了被試對虛擬人的熟悉度(7 分量表,“非常不熟悉/非常熟悉”,“完全不知情/非常知情”,“一點也不了解/非常了解”;Cronbach’s α=0.95;Carlson et al.,2020)。考慮到這種文化差異可能源自于對不道德事件嚴重程度的不同判斷,我們還測量了被試對偷稅漏稅行為嚴重性的評價：“你認為偷稅漏稅的行為有多嚴重？”(7 分量表,1=完全不嚴重,7=非常嚴重)。最后,所有被試報告了性別和年齡。

5.3 數據分析與結果

道德責任判斷以文化類型(美國編碼為0,中國編碼為1)和博主類型(真人編碼為0,虛擬人編碼為1)分別作為自變量,道德責任判斷作為因變量進行方差分析。結果顯示,文化類型的主效應顯著,F(1,395)=28.54,p＜ 0.001,=0.067;博主類型的主效應也顯著,F(1,395)=35.73,p＜ 0.001,=0.083;文化類型和博主類型對道德責任判斷的交互效應顯著,F(1,395)=11.90,p=0.001,=0.029。具體而言,比起美國人,中國人認為虛擬人應該承擔更大的道德責任(M中國=5.62,SD=1.27,95% CI=[5.35,5.89];M美國=4.40,SD=2.07,95%CI=[4.13,4.68];F(1,395)=35.40,p＜ 0.001,=0.082);而對真人道德責任的判斷沒有顯著的文化差異,F(1,395)=1.81,p=0.180。此外,中國人對真人和虛擬人的道德責任判斷不存在顯著差異,F(1,395)=3.21,p=0.074。以上結果再次驗證了假設1。

感知心智能力將文化類型和博主類型分別作為自變量,感知心智能力作為因變量進行方差分析。結果顯示,文化類型的主效應顯著,F(1,395)=4.75,p=0.030,=0.012;博主類型的主效應顯著,F(1,395)=67.79,p＜ 0.001,=0.146;文化類型和博主類型對心智能力評價的交互效應顯著,F(1,395)=20.60,p＜ 0.001,=0.050。具體而言,中國人認為虛擬人的心智能力更高(M中國=4.31,SD=0.98,95% CI=[4.09,4.53];M美國=3.56,SD=1.44,95% CI=[3.34,3.78];F(1,395)=22.40,p＜ 0.001,=0.054);而在真人心智能力的評價上不存在顯著的差異,F(1,395)=2.80,p=0.095。

分別從認知自主力(Cronbach’s α=0.85)和情緒感知力(Cronbach’s α=0.93)兩個維度進行分析,結果具有一致性。方差分析結果表明,文化類型和博主類型對認知自主力(F(1,395)=10.55,p=0.001,=0.026)和情緒感知力(F(1,395)=22.17,p＜ 0.001,=0.053)評價的交互效應顯著。具體而言,中國人認為虛擬人的認知自主力(M中國=4.40,SD=1.05,95% CI=[4.17,4.63];M美國=3.82,SD=1.31,95% CI=[3.59,4.05];F(1,395)=11.84,p=0.001,=0.029)和情緒感知力(M中國=4.23,SD=1.13,95% CI=[3.96,4.49];M美國=3.30,SD=1.90,95% CI=[3.03,3.57];F(1,395)=23.66,p＜ 0.001,=0.057)都更高;而在真人認知自主力(F(1,395)=1.31,p=0.253)和情緒感知力(F(1,395)=3.18,p=0.075)上的評價不存在顯著差異。

感知心智能力的中介作用以文化類型為自變量(美國編碼為0,中國編碼為1),博主類型為調節變量(真人編碼為0,虛擬人編碼為1),感知心智能力為中介變量,道德責任判斷為因變量,在樣本選擇為 5000 次、95% 的置信區間下采用Bootstrapping (PROCESS Model 8;Hayes,2015)分析有調節的中介效應。結果顯示,通過感知心智能力的中介作用,文化類型和博主類型對道德責任判斷的交互效應是顯著的(有調節的中介效應:indirect effectβ=0.35,SE=0.11,95% CI=[0.16,0.58]),如圖6 所示。比起美國人,中國人認為虛擬人的心智能力更高,因此需要承擔更大的道德責任(indirect effectβ=0.26,SE=0.08,95% CI=[0.12,0.43]);而對于真人,感知心智能力的中介效應不顯著(indirect effectβ=-0.09,SE=0.05,95% CI=[-0.21,0.01])。結果驗證了假設2。

圖6 實驗2 中有調節的中介分析結果(* p ＜ 0.05,** p ＜ 0.01,*** p ＜ 0.001)

將心智能力分為認知自主力和情緒感知力,并同時作為中介變量納入模型中,在樣本選擇為5000 次、95%的置信區間下采用 Bootstrapping(PROCESS Model 8;Hayes,2015)進行平行中介分析。結果顯示,情緒感知力有調節的中介效應顯著(indirect effect β=0.48,SE=0.14,95% CI=[0.23,0.79])。比起美國人,中國人認為虛擬人的情緒感知力更高,因此需要承擔更大的道德責任(indirect effect β=0.35,SE=0.11,95% CI=[0.16,0.60])。而認知自主力有調節的中介效應并不顯著(indirect effectβ=-0.06,SE=0.07,95% CI=[-0.20,0.06])。這些結果表明,心智能力中的情緒感知力而非認知自主力是影響中西方文化對虛擬人道德責任判斷的主要原因。

替代性解釋排除將虛擬人的熟悉度作為因變量進行方差分析。結果顯示,僅文化類型的主效應顯著,F(1,395)=241.70,p＜ 0.001,=0.380;文化類型和博主類型的交互效應不顯著,F(1,395)=0.81,p=0.368。以文化類型為自變量,博主類型為調節變量,虛擬人的熟悉度為中介變量,道德責任判斷為因變量,在樣本選擇為5000 次、95%的置信區間下采用 Bootstrapping (PROCESS Model 14;Hayes,2015)分析有調節的中介效應。結果顯示,有調節的中介效應不成立(indirect effectβ=0.38,SE=0.19,95% CI=[-0.01,0.76])。由此,可以排除虛擬人的熟悉度對文化差異的替代中介解釋。

類似的,將事件的嚴重性作為因變量進行方差分析。結果顯示,僅文化類型的主效應顯著,F(1,395)=109.08,p＜ 0.001,=0.216;文化類型和博主類型的交互效應不顯著,F(1,395)=1.46,p=0.228。以文化類型為自變量,博主類型為調節變量,事件嚴重性為中介變量,道德責任判斷為因變量,在樣本選擇為 5000 次、95%的置信區間下采用Bootstrapping (PROCESS Model 14;Hayes,2015)分析有調節的中介效應。結果顯示,有調節的中介效應不成立(indirect effectβ=-0.04,SE=0.15,95%CI=[-0.31,0.29])。由此,可以排除事件嚴重性對文化差異的替代中介解釋。

5.4 討論

綜合以上結果,實驗2 首先通過有調節的中介檢驗,驗證了感知心智能力的中介作用。結果表明,比起西方文化,中國文化影響下的人們認為虛擬人具有更高的心智能力,因此需要承擔更大的道德責任;而在真人組里沒有顯著的中西方文化差異。這一發現進一步表明文化差異對心智感知存在重要影響(Dietze &Knowles,2021)。其次,實驗2 通過將心智能力中的認知自主力和情緒感知力同時納入模型進行平行中介分析,發現這一過程由情緒感知力而非認知自主力完全中介,驗證了情緒感知力存在更強的解釋力度(Gray &Wegner,2012)。最后,實驗2 還排除了對虛擬人的熟悉度、事件嚴重性的替代性解釋。在最后一項實驗中,我們將考察不同文化背景的人們得知虛擬人不道德行為后的道德懲罰。

6 實驗3：道德懲罰

前面的實驗主要考察了中西方文化差異對虛擬人和真人道德責任判斷的影響,在這個實驗中我們進一步考察中西方文化差異對虛擬人犯錯后的道德懲罰的影響。具體而言,實驗3 聚焦于虛擬人并采用另一種不道德情景(抄襲作品)進行研究,旨在探索對虛擬人道德責任判斷的中西方文化差異對人們后續行為的影響(如取消關注等)。

6.1 實驗設計與樣本

本實驗通過國外問卷平臺Prolific 和國內問卷平臺 Credamo 分別邀請了 101 名美國白人被試(56.44%女性;M年齡=29.53 歲,SD年齡=6.19 歲)和100 名中國被試(64.00%女性;M年齡=28.23 歲,SD年齡=5.98 歲)參與研究,并以小額現金作為實驗報酬。

6.2 實驗流程

在本實驗中,中國/美國的被試會看到虛擬偶像Rico 的微博/Twitter 主頁及新版的文字描述和對虛擬偶像定義的解釋：

“Rico,又名Coco,出生于2002 年3 月21 日。她于2021 年以虛擬唱跳偶像的身份出道并且吸引了很多粉絲。她的穿搭別具一格,走在時尚前線。Rico 經常在社交媒體上分享她的日常生活。

虛擬偶像是利用計算機圖像軟件制作的數字形象,他們以第一人稱視角看待世界,并在媒體平臺上占據一席之地。”

接下來,被試會看到Rico 今年三月發布了一則帖子來宣傳她發布的一首原創單曲,內容為“快來聽我的新原創專輯”,如圖7 所示。被試了解到,“這張單曲被曝出抄襲了另一位歌手的歌曲。事后,Rico 為此事公開道歉。”為了測量道德懲罰,被試回答了“你認為Rico 抄襲作品在多大程度上應該被罰款(1=不應該,7=非常應該)”以及“你認為Rico的賬號在多大程度上應該被封禁(1=不應該,7=非常應該)”。被試還回答了“假設你已經關注了Rico一段時間,對于Rico 抄襲作品,你是否會取消關注？(0=繼續關注,1=取消關注)”。之后,和實驗1a 所用的測量一致,被試回答了測量道德責任判斷的兩個條目(r=0.71,p＜ 0.001)并評估了Rico 的心智能力(7 點量表;Gray et al.,2011;Cronbach’s α=0.94)。最后,所有被試報告了主觀社會經濟地位、受教育程度、性別和年齡。

圖7 實驗3 中中國(上)與美國(下)被試分別閱讀的帖子內容

6.3 數據分析與結果

道德懲罰以文化類型(美國編碼為0,中國編碼為1)作為自變量,以“罰款”和“封禁賬號”的測量分別作為因變量進行方差分析。結果顯示,比起美國人,中國人認為虛擬人更應該被罰款(M中國=5.32,SD=1.49,95% CI=[5.02,5.62];M美國=3.92,SD=1.99,95% CI=[3.53,4.31];F(1,199)=31.83,p＜ 0.001,=0.138),并且社交賬號也更應該被封禁(M中國=4.12,SD=1.71,95% CI=[3.78,4.46];M美國=3.50,SD=1.97,95% CI=[3.12,3.89];F(1,199)=5.58,p=0.019,=0.027)。此外,將“取消關注”的測量作為因變量進行卡方分析。結果顯示,比起美國人,更多的中國人選擇取消關注(66.00%vs.45.54%;Pearson χ2=8.52,p=0.004,Odds Ratio=2.32)。

道德責任判斷和感知心智能力將道德責任判斷和感知心智能力分別作為因變量進行方差分析。結果顯示,比起美國人,中國人認為虛擬人應該承擔更大的道德責任(M中國=5.01,SD=1.45,95% CI=[4.72,5.29];M美國=4.10,SD=1.87,95%CI=[3.73,4.47];F(1,199)=14.68,p＜ 0.001,=0.069)并且具有更高的心智能力(M中國=3.89,SD=1.32,95% CI=[3.62,4.15];M美國=2.71,SD=1.27,95% CI=[2.46,2.96];F(1,199)=41.38,p＜ 0.001,=0.172),包括認知自主力(M中國=3.99,SD=1.36,95% CI=[3.72,4.26];M美國=3.19,SD=1.35,95% CI=[2.93,3.46];F(1,199)=17.29,p＜ 0.001,=0.080)和情緒感知力(M中國=3.78,SD=1.60,95% CI=[3.46,4.10];M美國=2.23,SD=1.60,95%CI=[1.91,2.54];F(1,199)=47.27,p＜ 0.001,=0.192),復制了前面實驗的結果。

感知心智能力和道德責任判斷的連續中介作用以文化類型為自變量(美國編碼為0,中國編碼為1),感知心智能力和道德責任判斷為連續中介變量,三種道德懲罰為因變量,在樣本選擇為 5000次、95%的置信區間下采用Bootstrapping (PROCESS Model 6;Hayes,2015)分析連續中介效應。結果表明,中西方文化差異可以通過感知心智能力正向影響道德責任的判斷,從而正向影響對“罰款”、“封禁賬號”、“取消關注”的測量(“罰款”: indirect effectβ=0.28,SE=0.10,95% CI=[0.12,0.49];“封禁賬號”:indirect effectβ=0.07,SE=0.04,95% CI=[0.002,0.18];“取消關注”: indirect effectβ=0.09,SE=0.05,95% CI=[0.01,0.20])。

6.4 討論

實驗3 首先通過抄襲作品的不道德情景驗證了中西方文化差異對虛擬人道德責任判斷的影響。相比于西方文化,中國文化影響下的人們認為虛擬人需要承擔更大的道德責任,復制了前面實驗的結果。其次,本實驗檢驗了對虛擬人道德責任判斷的文化差異所產生的行為后果。相比于西方文化,中國文化影響下的人們認為虛擬人更應該被罰款并被封禁社交賬號,同時更大比例的人們選擇取消對虛擬人社交媒體賬號的關注。最后,本實驗通過連續中介模型驗證了感知心智能力和道德責任判斷的連續中介作用,進一步驗證了本研究機制的穩健性。先前對虛擬實體道德責任的研究大多停留在態度評價和感知上(Awad et al.,2020;Malle et al.,2015;Young &Monroe,2019;褚華東等,2019),實驗3 采用了貼近現實的不道德情景,并考察了針對虛擬實體的道德懲罰問題,從行為后果的角度豐富并延伸了虛擬實體不道德行為的研究。

7 研究結論與討論

本文通過5 個實驗論證了中西方文化差異對虛擬人道德責任判斷的影響。實驗1a 通過曝光隱私引發網絡暴力的不道德情景,比較了中國人和美國人對真人和虛擬人道德責任的判斷。結果表明,與西方文化相比,中國文化影響下的人們認為虛擬人需要承擔更大的道德責任,驗證了假設1。實驗1b采用偷稅漏稅的不道德情景,更換了道德責任的測量方法,在中國和英國被試中復制了實驗1a 的結果。實驗1c 采用侵犯版權的不道德行為情景,并操縱了虛擬人背后主體類型。結果表明,無論虛擬人由真實人類還是人工智能驅動,中國(比起西方)文化影響下的人們都會賦予其更大的道德責任。實驗2 驗證了感知心智能力的中介機制(主要受到情緒感知力而非認知自主力的影響),還排除了對虛擬人熟悉度、事件嚴重程度的替代性中介解釋,假設2 得到驗證。為了進一步研究文化差異的下游影響,實驗3 采用抄襲作品的不道德情景,探索對虛擬人道德責任判斷的文化差異如何影響人們的后續決策。通過連續中介模型,研究發現,比起西方文化,中國文化影響下的人們認為虛擬人有更高的心智能力,當得知虛擬人進行不道德行為后,認為其需要承擔更大的道德責任,繼而更應該被懲罰(罰款和封禁賬號),并且更多中國人會選擇取消對虛擬人社交媒體賬號的關注。

7.1 中西方文化差異對虛擬人心智感知的影響

文化會對人們的心理與行為產生重要影響(侯玉波,朱瀅,2002)。隨著虛擬現實技術的發展以及元宇宙概念的興起,越來越多的虛擬人出現在人們的日常生活中。然而,目前國內外大部分有關虛擬實體的文獻都是以人工智能、算法為研究對象,很少有研究關注到虛擬人。在本文中,我們關注到了中西方文化差異對虛擬人感知和行為反應的影響,在一定程度上能夠彌補虛擬人相關文獻的缺口。

本文拓展了文化差異和心智感知相關的文獻,驗證了中西方文化差異對虛擬人心智感知的影響。有關心智感知前因的研究大多探討了感知者和被感知者的個體差異,例如感知者的社會需要動機(Dietze &Knowles,2016;Waytz et al.,2010)、主觀社會地位(Dietze &Knowles,2021)、換位思考能力(Dietze &Knowles,2016;Dietze &Knowles,2021)和擬人化傾向(Eyssel &Pfundmair,2015)等,以及被感知者的視覺外觀(Appel et al.,2012;Gray et al.,2011;Krumhuber et al.,2015)、情緒表達(Gray &Wegner,2012)和擬人化程度(Waytz et al.,2010)等。也有研究表明,文化差異是影響心智感知的重要因素(Dietze &Knowles,2021)。例如,Willard 和McNamara (2019)通過跨文化樣本的問卷調查發現,北美人和斐濟人對上帝心智能力的看法并不一致,斐濟人認為上帝的心智能力和人類相似,而北美人認為上帝在感受維度上的心智能力更低于人類。最近一項研究表明,比起英國人,中國人對人工智能機器人社會合作的評價更高(Dang &Liu,2022),但該研究并沒有測量不同文化背景下的被試對人工智能機器人的心智感知。為了彌補這一缺口,本文將虛擬人與真人做對比,研究了中西方文化差異對虛擬人心智感知的影響。結果表明,與西方文化相比,中國文化影響下的人們會賦予虛擬人更高的心智能力。

本文的研究發現在一定程度上支持了個人主義/集體主義的文化心理學理論。該理論認為,心理上的文化差異來源于不同文化的價值取向。西方文化的價值取向具有較強的個人主義意識,而東方文化的價值取向具有較強的集體主義意識(劉邦惠,彭凱平,2012)。與個人主義文化(如美國)相比,集體主義文化(如中國)下的人們會表現出更高的換位思考能力(Wu &Keysar,2007)和擬人化傾向(Letheren et al.,2016)。本文通過5 個實驗證明,與西方文化(美國/英國)相比,中國文化影響下的人們會認為虛擬人具備更高的心智能力。這一研究發現豐富了與個人主義/集體主義相關的文獻(Letheren et al.,2016;Wu &Keysar,2007)。

此外,本研究發現了人們對真人和虛擬人心智感知的差異。實驗2 的結果表明,無論是中國人(F(1,395)=6.85,p=0.009,=0.017)還是美國人(F(1,395)=81.35,p＜ 0.001,=0.171),都會認為虛擬人的心智能力比真人更低,這與人工智能、機器人的相關研究結果是吻合的(Broadbent,2017;Gray et al.,2007)。因此,本文也將虛擬人和真人進行了對比,擴大了心智感知在人機交互中的研究范疇。

7.2 中西方文化差異對虛擬人道德責任判斷的影響

本文對虛擬實體道德判斷的研究進行了延伸,驗證了中西方文化差異對虛擬人道德責任判斷的影響。以往研究在對虛擬實體能否承擔道德責任的問題上存在爭議。根據經典道德責任理論,虛擬實體不具有意圖和情緒,不能承擔道德責任(Hakli &M?kel?,2019;Parthemore &Whitby,2014)。然而,近年來的實證研究發現,當人工智能犯錯時,人們依然會將責任歸咎于它們,只是與真人相比程度不同(Awad et al.,2020;Young &Monroe,2019)。Coeckelbergh (2020)同時強調了責任主體和責任客體在對虛擬實體道德判斷中的重要性,而心智感知中的認知自主力與責任主體、情緒感知力與責任客體的判斷存在密切聯系(Gray et al.,2007)。本文引入文化差異的概念,將研究對象從人工智能拓展到虛擬人,研究中西方文化差異對虛擬人道德責任判斷的影響,并驗證了感知心智能力的中介機制,豐富了心智感知、道德責任判斷與中西方文化差異的相關文獻。

在探討中介機制的研究中,本文將心智能力劃分為認知自主力和情緒感知力兩個維度進行了分析,發現了情緒感知力比認知自主力具有更強的解釋力度,這與Sullivan 和Wamba (2022)的研究結論相吻合。他們發現,當人工智能故意(相比于意外)傷害人類時,人們會更多地責備人工智能本身,而這一效應由情緒感知力而非認知自主力中介。由于認知自主力包含了道德責任歸屬的兩個重要前因,即自由意志和認知(Aristotle,1999),一般認為認知自主力評價越高,越應該為行為后果承擔道德責任(Gray &Wegner,2009;Gray &Wegner,2012),但越來越多的研究發現情緒感知力評價在道德判斷中的重要性(Bigman &Gray,2018;Greene et al.,2001;Sullivan &Wamba,2022)。本文的研究結論進一步支持了情緒感知力在道德責任判斷中不可忽視的影響。與Sullivan 和Wamba (2022)的研究不同,本文的研究重點關注中西方文化差異對虛擬人道德責任判斷的影響。本文的研究表明,相比于西方文化,中國文化影響下的人們認為虛擬人犯錯后需要承擔更大的道德責任。本文除了發現感知心智能力的中介外,還探索了虛擬人主體類型的調節作用以及中西方文化差異的后續影響(對虛擬人犯錯后的道德懲罰)。

7.3 實踐意義

本研究對于虛擬人的設計、運營和在道德倫理上的治理問題提供了一定的實踐指導意義。由于近年來明星丑聞頻頻曝光,越來越多的企業選擇與虛擬人合作進行營銷活動,甚至創造自己企業的虛擬人,如屈臣氏的AI 品牌代言人屈晨曦,普拉達香水代言人Candy 等。那么,虛擬人真的不會翻車嗎？由于技術和相關倫理問題,目前社交平臺上的虛擬人依然由人類在背后操縱,無法實現真正意義上的自主,因此出現了虛擬人抄襲、侵權、強奸等不道德事件。本研究發現,不同文化背景下的消費者對虛擬人不道德行為的態度和反應會有差異。例如,在中國文化中,社交媒體上的虛擬人犯錯后,不論背后主體是真實人類還是人工智能,人們都會認為虛擬人和真人會承擔類似的道德責任,也會對虛擬人進行道德懲罰(如取消關注)。有研究者認為,賦予虛擬人等虛擬實體道德責任能夠保證法律的連續性,確立虛擬實體在社會中的法人地位(van Genderen,2018)。因此,相關部門需要針對此類問題制定更加完善的治理方針。另外,我們的研究結果能夠幫助虛擬人的設計者和運營者更加了解虛擬人如何被人們評價和感知。本研究發現,情緒感知力的評價決定了道德責任的判斷。因此,當設計者賦予虛擬人更加擬人化的外觀、情緒和社會互動時,運營者應更仔細地考量虛擬人的公共言論,并做出道德上可接受的行為表達,同時也要準備好面對相關的法律和倫理問題。

7.4 研究局限與未來研究方向

與其他研究一樣,本文也具有一定的局限性。本文是第一篇針對虛擬人探討中西方文化差異對其道德責任判斷的研究,有諸多內容值得今后進一步探討。

首先,本文在討論中西方文化差異對虛擬人道德責任判斷的影響時,西方文化樣本來自于美國和英國,這是因為這兩個國家是西方文化的代表,而中國則是代表了東方國家(Han &Kim,2018)。但許多有關文化差異研究的樣本中也包含了其他東西方國家,如印度、韓國、新加坡等東方國家,加拿大、意大利等西方國家(如Chen et al.,2018;Rhim et al.,2020)。因此,未來的研究可以探索東西方文化下的其他方國家以及不同宗教信仰(例如基督教和印度教)的人們在對虛擬人的道德責任判斷上是否存在類似的差異。此外,由于不同文化影響下的個體存在諸多差異,例如集體主義/個人主義(如Triandis &Gelfand,1998)、整體性思維/分析型思維(如Choi et al.,2007)等。未來的研究可以聚焦微觀的個體層面,考察這種文化差異是否源自于底層的個體差異。

其次,由于心智能力不僅與道德主體的判斷有關,還與道德客體的判斷有關。因此,虛擬人可以作為道德主體去傷害他人,虛擬人也可能作為道德客體成為被害者。例如,在虛擬強奸事件中,施暴者是虛擬人,反過來受害者也可能是虛擬人。2007年,美國林登實驗室 (Linden Lab)公司開發的網絡游戲《第二人生》中發生了一起“虛擬強奸案”。在游戲中,一女子被一玩家利用程序代碼控制了身體并被強奸。2021 年,Meta 公司(前Facebook)開放元宇宙平臺“Horizon Worlds”測試期間,一名女性測試者在虛擬世界里遭遇了多次性騷擾。當虛擬人成為不道德行為的受害者時,人們對他們會持有什么樣的態度呢？未來研究可以探討虛擬人作為道德客體受到傷害后的情緒反應和行為變化。

另外,在我們的研究結果中,中西方文化差異并不影響對真人的道德責任判斷,但也有研究表明,文化也會影響人們的道德判斷(Buchtel et al.,2015;Cowell et al.,2017;Haidt et al.,1993;Vauclair &Fischer,2011)。西方人在進行道德判斷時更加強調個人權力和獨立性的道德準則,但東方人在進行道德判斷時更在意社會責任和精神上的純潔性(Graham et al.,2016;Mo et al.,2022)。因此,不同文化背景的人們在某些不道德行為上可能會存在不同的道德責任判斷,例如性行為(Vauclair &Fischer,2011)。此外,中西方文化對虛擬人進行此類不道德行為的相信程度也可能存在差異。本文所選擇的四種道德問題主要發生在社交媒體平臺上,能夠盡可能避免文化特異性。未來研究也可以考慮其他道德情境是否會影響中西方文化差異對虛擬人的道德責任判斷。

除此之外,未來研究可以考慮其他調節變量,例如虛擬人的個性、外觀及類型。研究表明,當個體被賦予豐富的情感并被描繪成一個情感實體時,它可以被賦予類似人類的心智(Gray &Wegner,2012)。因此,未來研究可以考慮操縱虛擬人的溫暖和能力屬性來影響人們對其心智能力的判斷。視覺外觀和身體是判斷感受力的重要線索,也會影響對心智能力的評價(Appel,2012;Gray et al.,2011;Krumhuber et al.,2015)。因此,當虛擬人的外觀和真人更加逼真,或是當人們可以通過虛擬現實、全息投影等技術與虛擬人實現身體上的交互時,人們可能對虛擬人心智能力的判斷也會有所不同。另外,社交網絡上雖然女性虛擬人占比更大,但是也存在一些男性虛擬人。本研究采用男性虛擬人的實驗材料復制了中介實驗(見網絡版附錄3),并得出了一致的結果。盡管如此,目前網絡上涌現出許多非人型的虛擬網紅,例如動物型(如企鵝Puff)、食物型(如蛋糕Cupcake)等。未來研究可以進一步探討中西方文化差異對其他類型虛擬實體道德責任判斷的影響。

最后,基于對研究內部效度的考慮,本文實驗中所用到的虛擬人都是自擬的社交媒體上的虛擬博主或虛擬偶像,讓被試想象不道德情景。隨著虛擬人翻車事件的增加,未來研究可以考慮采用真實的不道德場景進行研究,或利用社交媒體平臺上的評論、參與度等二手數據進行分析,增加研究的外部效度。

8 結論

本研究結論如下：第一,相對于西方文化,中國文化影響下的人們認為虛擬人犯錯后需要承擔更大的道德責任;第二,無論虛擬人的背后主體是真實人類還是人工智能,這種中西方文化差異始終存在;第三,這一現象的潛在機制是中國文化(相比西方文化)影響下的人們認為虛擬人的心智能力更高,其中情緒感知力比認知自主力具有更強的解釋力度;第四,對虛擬人更高的道德責任判斷會讓中國文化(相比西方文化)影響下的人們更傾向于對虛擬人施加道德懲罰。