路 西 HSEE, Christopher K.
(1北京大學光華管理學院, 北京100871) (2中國農業大學經濟管理學院, 北京 100083)(3 Booth School of Business, The University of Chicago, Chicago IL 60637, United States)
人們的判斷和決策總是在某種評估模式下作出的。現實狀況和決策研究都表明, 人們有兩種基本的評估模式:聯合評估(joint evaluation, JE)和單獨評估(separate or single evaluation, SE)。在聯合評估模式下, 決策者同時面對兩個或兩個以上的選項;而在單獨評估的模式下, 決策者只面對一個單獨選項(Hsee, 1996)。當然, 單獨評估和聯合評估如同一個連續光譜的兩端, 現實生活中, 人們有時會處于兩種評估模式的中間地帶。例如:為了決定報考志愿, 一位高中生參觀了幾所大學校園。如果是數天之內密集地參觀多所學校, 那么他/她的評估模式就更接近聯合評估。如果是隔幾周或幾個月才參觀一所, 那么他/她的評估模式就更接近單獨評估,因為相較于當下的生動場景, 許久前參觀所獲取的信息已經變得比較模糊不清。
單獨評估和聯合評估對于人們的決策過程和結果有著深刻影響, 最為經典就是評估模式導致的偏好反轉現象(Hsee, 1998; Kahneman & Ritov, 1994;Kogut & Ritov, 2005; List, 2002)。請想象你是一位音樂學院的學生, 需要購買一本音樂類詞典。詞典A封面完好, 內含1萬詞條; 詞典B封面破損, 但內含2萬詞條。顯然, 當購買者同時看到兩本詞典時(即聯合評估), 他/她對詞典B的出價會更高。但是, 如果單獨評估, 每個購買者只能看到其中一本詞典, 他/她對封面完好的詞典A的出價更高 (Hsee,1996)。
單獨評估和聯合評估的偏好反轉(下文簡稱JE/SE偏好反轉)至今仍然是研究的熱點, 各類相關現象豐富有趣, 解釋機制逐步細化, 理論的延伸和現實的應用更是不斷發展。
在新現象的發現層面, 許多研究在探討:單獨評估中發現的效應是否在聯合評估中仍然成立?還是會減弱、消失, 甚至反轉?例如 Chatterjee,Heath和Min (2009)探討了單獨評估中已經發現的心理賬戶效應是否在聯合評估時仍然成立, 發現只有當聯合評估提供的情景間比較使得人們認為兩種情況差異較小時(例如丟失 10元的門票和 10元現金在財務損失方面差異較小), 心理賬戶效應才會減弱。又如Evers, Inbar, Blanken和Oosterwijk(2017)考察了同一個政策采用獎勵框架(提高器官捐獻者的受助優先級)或懲罰框架(降低非捐獻者的受助優先級)的效果, 發現單獨評估時人們認為獎勵框架更合理, 聯合評估時, 即使意識到兩種框架的實際結果相同, 人們仍然覺得獎勵框架更合理,這種現象違反了規范性解釋(normative explanation,即理性解釋)。
在理論解釋層面, 廣義可評估性理論(general evaluability theory, GET; Hsee & Zhang, 2010;Zhang, 2015)從選項屬性的可評估性(evaluability)的角度進行了分析, 理論簡潔, 解釋力最強。另外,想要和應要沖突(want-should conflict)、決策的雙系統理論等也常用于解釋JE/SE偏好反轉, 這些解釋和可評估性也有一定的關聯。
最后, 更為重要的是, 評估模式和廣義可評估性理論可應用于政策制訂, 通過設計合理的評估模式, 在對風險決策、跨期決策、慈善捐贈、消費選擇、商業定價以及幸福感等方面助推人們做出更好的決策, 提升決策的客觀質量或者消費者的滿意感受, 甚至提高人們的幸福感。
本文將按照現象、內部機制、助推決策三個層次來介紹單獨評估和聯合評估的研究。首先, 回顧JE/SE偏好反轉的主要現象。其次, 在解釋機制層面, 介紹可評估性和其他解釋。最后, 將評估模式作為助推手段, 無論對消費者個人生活, 還是公共領域(如慈善、健康等方面), 都能有所啟迪。總之,單獨評估與聯合評估是一個既具理論重要性、又有前沿性的話題, 是決策研究的藍海之一, 特別是在現實應用層面, 如何設計恰當的評估模式來助推明智決策, 評估模式的研究具有很高的潛力。
理性決策的恒定性原則假設, 決策者不會受到備選方案表現形式的影響(von Neumann & Morgenstern, 1944), 但是關于評估模式的研究卻發現, 決策者違背了恒定性原則。相比于單獨評估, 聯合評估時存在其他選項的比較, 讓人們產生偏好的變化,這類現象就稱為JE/SE偏好反轉。JE/SE偏好反轉在許多領域中都廣泛存在。
在收入領域, Bazerman, Loewenstein和White(1992)考察了人們對兩種報酬方式的偏好。方案 A是自己獲得600美元, 他人獲得800美元; 方案B是自己和他人各獲得400美元。在聯合評估中, 大部分人選擇自己獲利更多的A方案; 但是在單獨評估時, B方案被評為吸引力更高。Hsee (1993)發現,當實驗參與者同時面對“總收入較高但收入遞減”或者“總收入較低但收入遞增”這兩種方案時, 人們偏愛總收入較高的前者; 但是, 在單獨評估中, 收入遞增的方案被認為更好。
在慈善捐贈中, Kahneman和Ritov (1994)發現,在聯合評估時, 面對兩個慈善項目“海豚救助”和“為農民提供防曬以預防皮膚癌”時, 人們對預防皮膚癌項目的捐款更多; 但是, 單獨呈現一個慈善項目時, 相比于皮膚癌項目, 看到海豚救助時, 參與者捐款更多。
在人事招聘中, Hsee (1996)請參與者想象自己作為咨詢公司的老板需要招聘一位軟件工程師。兩位候選人都畢業于同一院校, 其中候選人A的學業績點(GPA)為4.9分(5分制), 兩年內寫了10個程序;候選人B的GPA為3.0分(5分制), 兩年內寫了20個程序。在聯合評估時, 人們愿意為候選人B支付更高的薪酬; 但是在單獨評估時, 人們愿意為候選人A支付更高的薪酬。
在醫療決策中, Zikmund-Fisher, Fagerlin和Ubel (2004)讓人們想象自己要預約醫生為自己做眼部手術。醫生A畢業于哈佛大學, 進行過80次手術, 都比較成功; 醫生 B畢業于愛荷華大學, 進行過300次手術, 都比較成功。在單獨評估時, 人們預約哈佛畢業的醫生A的意愿更強; 但是在聯合評估中, 人們更傾向于預約手術經驗較豐富的醫生B。
在道德判斷領域, Paharia, Kassam, Greene和Bazerman (2009)研究了人們對 “間接引發較大危害的不道德行為”和“直接引發較小危害的不道德行為”的判斷。在單獨評估時, 人們覺得直接引發危害的行為更不道德; 但是在聯合評估時, 人們的道德判斷發生反轉, 認為間接引發較大危害的行為更不道德。
總之, 在產品消費、收入分配、人事招聘、醫療決策和道德判斷等諸多領域, 都存在著JE/SE偏好反轉。值得注意的是, JE/SE 偏好反轉不是由于因變量測量方式不同帶來的虛假的回應差異。例如在音樂詞典(Hsee, 1996)和慈善捐款(Kahneman &Ritov, 1994)等研究中, 無論單獨評估還是聯合評估時, 消費者的偏好都采用支付意愿(willingness to pay)來測量。接下來, 我們將介紹 JE/SE偏好反轉中一部分特殊的現象, 這類現象不僅和上述 JE/SE偏好反轉現象一樣, 違反了理性決策的恒定性原則,而且還違反了決策的占優性原則。
理性決策的占優性原則是指, 個體永遠都不會采用一個被其他策略或選項占優的策略或選項。占優包括兩種情況:一是強勢占優, 指一項策略或選項在所有方面都比其他策略和選項更好; 二是弱勢占優, 指一項策略或選項至少在某一方面比其他策略或選項更好, 在其他方面與其他策略和選項一樣好(Von Neumann & Morgenstern, 1944)。評估模式的研究發現, 在單獨評估時, 人們有時會違反占優性原則, 偏好那些被其他選項占優的選項。
Hsee (1998)通過冰激凌實驗演示了該現象。他請實驗參與者想象自己在湖畔休息時想吃冰淇淋。單獨評估時, 參與者隨機分配到以下兩種情形之一(如圖1所示):攤位H出售8盎司冰激凌, 裝在容量10盎司的紙杯里; 攤位L出售7盎司冰激凌, 裝在容量 5盎司的紙杯里; 聯合評估時, 參與者同時看到了兩種情況。結果發現:聯合評估時, 人們對8盎司冰激凌給出了更高的價格; 但是在單獨評估時, 人們的支付意愿違背了占優性原則, 人們對溢出紙杯的7盎司冰激凌出價更高, 雖然8盎司冰激凌才是占優選項。

圖1 冰淇淋示意圖
類似的, 餐具套裝的選擇也是一個經典例證,2002年諾貝爾經濟學獎獲得者卡尼曼教授在其獲獎致辭中專門提及了此研究。假設你準備購買一套餐具, 有兩組套裝。套裝A共24件餐具, 餐盤、碗和甜點盤各8個, 每一件都完好無損。套裝B共40件餐具, 包含了套裝A所有的24件, 并且新增了杯子和醬料碟各8個, 其中7個完好, 9個破損了。也就是說, 除了完全一樣的24件餐具, 套裝B還比套裝 A多出了 7件完好的餐具, 是客觀上更好的選項。在聯合評估時, 人們對套裝B的出價更高; 但是在單獨評估時, 人們對套裝A的出價更高(Hsee,1998)。
這一效應在其他領域也得到了多次確證。在現實的二手棒球卡片交易市場中, List (2002)發現, 即使是有經驗的購買者也會受到此效應的影響。研究者展示了兩套卡片:一套是10張嶄新卡片套裝; 而另一套則是13張套裝, 包含了前一套裝一樣的 10張新卡再加上3張中等舊的卡片。如果兩套卡片擺放在一起, 卡片收藏者對13張套裝的出價更高。但是如果只擺出其中一套, 卡片收藏者對 10張套裝的出價更高。此外, 最新一項研究發現:在對他人學術能力的評估中, 學術專家們(教授和博士生)也難免于此效應。有兩位申請人的簡歷:申請人A的8篇論文都發表于排名靠前的期刊上, 申請人B同樣發表了8篇排名靠前期刊上的論文, 但還額外有6篇論文發表在排名較后期刊上。如果專家們處于聯合評估模式, 同時看到兩份簡歷, 那么對兩個申請人的學術能力的評估沒有差異; 但是當專家處于單獨評估模式, 只看到其中一份簡歷時, 對申請人A的評估顯著高于申請人B (Powdthavee, Riyanto,& Knetsc, 2017)。
為何在不同評估模式下, 人們的偏好會出現反轉?目前最簡潔有力的解釋是可評估性的影響。所謂可評估性, 是人們對某個客觀屬性進行主觀優劣判斷時的難易程度和自信程度(Hsee, 1996; see Hsee& Zhang, 2010 as a review)。簡單來說, 屬性的優劣越容易判斷, 則可評估性越高, 越難判斷, 則可評估性越低。研究者對可評估性進行測量時, 通常會詢問參與者認為選項屬性是否容易評估(e.g.Hsee,1996; Hsee, Zhang, Wang, & Zhang, 2013), 例如大學生參與者認為GPA比編程經驗更容易判斷(Hsee,1996)。
值得注意的是, 在前文提到的所有JE/SE偏好反轉中, 所有選項總是涉及到兩個屬性的權衡——一個屬性重要但難以單獨評估; 另一個屬性不太重要但容易單獨評估。所以, JE/SE偏好反轉的研究中,選項通常在兩個屬性上各有優劣(見表1)。比如, 在選擇主刀醫生的情境中 (Zikmund-Fisher et al.,2004), 手術經驗(手術次數)是一個重要但是難以單獨評估的屬性; 相對于經驗, 畢業院校卻是一個沒那么重要但是容易單獨評估的屬性。

表1 JE/SE 偏好反轉的選項結構
在單獨評估時, 容易評估的屬性對決策產生更大影響, 即使該屬性沒那么重要; 但在聯合評估時,如果重要的屬性變得更容易評估了, 人們的偏好就會發生變化。仍以醫生選擇為例, 單獨評估時, 人們更愿意預約哈佛畢業的醫生, 因為大學是一個容易評估的屬性, 即使人們知道手術經驗更為重要,但由于沒有參照點, 人們難以判斷進行過多少次手術算是經驗豐富; 在聯合評估時, 有兩個選項互相對比, 手術次數這個更重要的屬性變得容易評估了,人們就會更愿意預約經驗豐富的醫生。這就是可評估性的變化會引起決策者的偏好反轉。下面, 我們將具體介紹哪些因素會導致可評估性的變化。
根據廣義可評估性理論, 某個屬性的可評估性越高, 人們對其價值的評估就越敏感, 因為人們可以輕松自信地察覺到這一屬性上的差異; 而價值敏感性越高, 該屬性對決策的影響程度就更大。正是因為選項不同屬性和可評估性的交互, JE/SE偏好反轉的現象才會發生。那么, 什么因素會影響可評估性呢?
可評估性是依賴于參照系統的, 存在參照信息的情況下, 可評估性就較高。廣義可評估性理論提出了三個重要的影響因素。(1)天性(nature), 是內在的參照信息, 反映了人類長期進化而來的參照信息體系; (2)知識(knowledge), 是習得的參照信息, 即過去是否學習和積累了目標屬性的數值分布作為參照信息; (3)評估模式(mode), 是當下的參照信息,是否有其他選項作為參照信息。只要有一項因素的可評估性較高, 可評估性就高, 相應的價值敏感性也越高(如圖2所示)。

圖2 可評估性和價值敏感性的影響因素
因素 1:天性, 是指人類對于所評估的價值是否有天然存在的、穩定的生理或者心理度量(即一個參照系統)。如:舒適溫度、睡眠充足與否、社交孤獨等方面, 人們無需學習, 即有天然的、內在的參照系統可以做出評估。但是, 對于鉆石的大小、汽車的馬力等問題, 人們沒有天然的、內在的評估系統, 需要學習相關知識或者比較其他選項才能評估其優劣。因素 2:知識, 是指評估者本人是否了解目標屬性的數值分布信息(例如:數值范圍、均值等)。例如:經常購買紅酒的消費者對紅酒的年份、產地等信息擁有更多知識, 在出價的時候比新手更依賴于知識進行判斷(Gustafson, Lybbert, &Sumner, 2016)。一般而言, 人們對于類別信息的知識較多, 但是對于數量信息的知識較少。比如:我們都知道收益是好的, 損失是壞的, 但是收益多少錢、收益率有多高才是好的, 不是理財專家就難以評估。因素 3:評估模式, 也就是單獨評估還是聯合評估, 在單獨評估時, 因為不存在選項之間的參照, 可評估性較低; 聯合評估時, 由于選項可以互為參照, 可評估性較高。
基于廣義可評估性理論, JE/SE的偏好反轉現象其實可以歸為兩種類型。一類是評估模式和選項屬性(天性)的交互作用, 另一類是評估模式和選項屬性(知識)的交互作用。
2.2.1 評估模式和選項屬性(天性)的交互
評估模式和選項屬性(天性)的交互作用中, 選項一般涉及到兩個屬性, 其中一個屬性是不太重要但是內在易評估的(例如電子相框是否美觀), 另一個屬性是更為重要但內在難評估的(例如電子相框分辨率的高低), 需要通過比較的方式來評估的。相比于內在難評估的屬性, 內在易評估的屬性在單獨評估中權重更大; 但是到聯合評估的模式下, 因為有選項間的參照, 內在難評估的屬性可評估性提高,在決策中的權重也會變大。Yang, Hsee, Liu和Zhang(2011)讓人們選擇兩個電子相框:一個分辨率更高但是外觀難看, 一個分辨率低但是外觀漂亮。 當處于單獨評估時, 人們更多選擇好看的相框, 因為美觀是一種內在可評估性很高的因素, 我們無需比較就可以判斷美丑; 當處于聯合評估時, 人們更多選擇難看但分辨率高的相框, 因為通過選項間的互相比較, 分辨率這一內在難以評估的屬性變得更容易評估了, 人們的偏好就發生了變化。值得注意的是,在本研究中, 研究者對單獨評估組也采用了組內設計, 參與者首先觀看一個電子相框, 然后有10分鐘的間隔時間完成填充任務, 然后再觀察另一個相框。這部分研究表明, 單獨評估和聯合評估的差異不是組間和組內設計的差異導致的, 而確實是評估模式的差異造成的。
2.2.2 評估模式和選項屬性(知識)的交互
評估模式和選項屬性(知識)的交互作用中, 選項一般涉及到兩個屬性, 其中一個屬性是不重要但是人們知識較為豐富的, 另一個屬性是重要但是人們的知識較為缺乏的。因此, 不重要但是知識豐富的屬性在單獨評估中權重更大, 重要但是知識缺乏的屬性在聯合評估中權重更高。例如, 醫療決策的研究發現, 單獨評估時, 人們更偏好成功率 33%但距離自己家 15分鐘的生育門診, 但是在聯合評估時, 人們更偏好成功率 40%但距離自己家 40分鐘的生育門診(Zikmund-Fisher et al, 2004)。因為花費時間這一維度上, 人們擁有更多的知識和了解; 但是醫院的成功率這一維度上, 人們的了解較少, 在聯合評估時有選項間的參照才能提高其可評估性。
評估模式和知識的交互中存在一個典型子類別, 即評估模式和類別?數量信息的交互。以前文提到的餐具套裝的選擇為例(Hsee, 1998), 一套餐具數量多但有破損, 一套餐具數量少但都很完好,選項中存在餐具數量和是否完好兩個維度。在單獨評估時, 餐具是否完好作為類別信息, 人們擁有較多了解, 容易評估, 因此餐具是否完好對評估的影響高; 而在聯合評估時, 因為有了選項間的參照,數量信息的可評估性提高了, 對決策的影響也增大了。類似原理的, 關于道德判斷的研究中(Paharia et al., 2009), 研究者對比了兩種不道德行為(間接引發較大危害的行為和直接引發較小危害的行為)。在單獨評估時, 直接還是間接引發是類別信息, 不需要參照也很容易評估, 因此人們覺得直接引發危害的行為更不道德; 但是在聯合評估時, 危害程度這種數量信息的可評估性提高了, 因此人們對兩種行為的判斷反轉了。
雖然廣義可評估性理論是目前解釋力最強的理論, 但還有其他解釋機制提供了不同的視角。下面我們將簡要予以介紹。
Bazerman等(1992)提出了 “想要和應要沖突”(want-should conflict)的解釋, 他們認為, 在單獨評估時個體更多考慮到“想要” (want)的因素, 但是聯合評估時個體更多思考“應要” (should)的因素。例如:Okada (2005)發現, 面對享樂選項(50元餐廳代金券)和實用選項(50元超市食品代金券)的取舍,在單獨評估時, 人們更喜愛享樂選項, 在聯合評估時, 人們更喜歡實用選項。類似的, Shaffer和Arkes(2009)發現, 人們在聯合評估中更喜歡現金報酬,但是在單獨評估時, 非現金報酬(特別是享樂品而非實用品)更受人喜歡。這類現象可以用想要和應要的沖突來解釋。單獨評估時, 享樂選項激發了更多想要的渴望, 而聯合評估時, 如果要選擇享樂選項, 人們會考慮應要的因素, 比如是否存在合理的理由。不過, 這類現象也可以用可評估性解釋, 相比于實用性, 享樂屬性的內在可評估性較高, 因此在單獨評估時影響更大。
Kahneman和Ritov (1994)提出了組內比較和組外比較的差異。他們探討了“救助海豚項目”和“預防皮膚癌項目”偏好反轉的原因, 指出:在單獨評估時, 人們更多進行組內比較, 海豚組把海豚救援和其他動物救援比較, 海豚屬于動物中人們更愿意救助的; 防曬組把增加防曬措施來預防皮膚癌項目和其他人類救援比較, 這一項目屬于人類救援中比較不重要的。聯合評估時, 人們更多進行了組外比較,顯然救助人類比救助動物更重要。其實組內組外比較的核心機制和可評估性一樣, 都是參照信息。用廣義可評估性理論來解釋, 單獨評估時, 救海豚和救人兩個項目內在的參照系統是不同的; 但是聯合評估時, 當前的參照選項就成為更凸顯的參照點,參照點的變化引起了偏好改變。
最近, Sher和McKenzie (2014)提出了“選項即信息”模型(option as information model), 指出:個體在看到選項前對屬性的數值分布有一個推斷, 但每看到一個選項就類似一次抽樣, 每次抽樣后都會更新自己推斷的模型, 再根據新形成的參照模型來判斷。從本質上而言, 選項即信息模型和可評估性都采用了參照信息來解釋, 但該模型的重點在于論證JE/SE偏好反轉并不是非理性的, 反而是因為有了其他選項作為新信息, 人們理性地重新推理, 才發生了偏好的改變。
此外, 雙系統理論也常被用于解釋 JE/SE差異。在單獨評估中, 個體更多依賴系統1的啟發式加工; 在聯合評估中, 個體更多依賴系統 2的分析式加工(Gino, Moore, & Bazerman, 2008; Bazerman,Gino, Shu, & Tsay, 2011)。Gino 等(2008)提出, 日常生活中, 我們可能面臨兩類不道德行為:一種是過程重度不道德, 恰巧有積極后果, 另一種是過程輕度不道德, 恰巧有消極結果(所謂恰巧, 是指行為者并不能控制后果, 結果好壞只是隨機概率問題)。在單獨評估時, 人們容易出現結果偏差, 覺得“過程輕度不道德但恰好產生消極結果的行為”更不道德; 在聯合評估時, 偏差會減弱。為了證明雙系統的影響, 研究者在單獨評估時, 啟動參與者進行直覺或者理性加工, 發現理性加工確實能減弱結果偏差。但是, 值得注意的是, 如果該研究能在聯合評估的模式下啟動系統1的加工方式也發現結果偏差增大, 才能更確切地證明其中的因果關系。同樣的,這一現象也可以用可評估性來解釋, 結果的積極或消極是一種類別信息, 在單獨評估時可評估性較高;而過程的輕微或重度不道德是數量信息, 在聯合評估時可評估性較高。
廣義可評估性理論中的評估模式和選項維度(知識或天性)的交互與雙系統有一定程度的相似。一般而言, 內在可評估性高的因素經常和系統1比較相關, 依賴于直覺和情緒, 內在可評估性低的因素和系統2相關, 依賴于分析和計算。正如前文提到的外觀美丑, 是一種內在可評估性很高、且依靠直覺判斷的因素; 而各類數字信息, 無論是手術經驗、屏幕分辨率的高低等等, 都是需要分析、計算才能理解的。類似的, 知識豐富的信息, 可能已經轉化為個體自己的經驗法則, 依靠系統1的啟發式加工即可迅速完成; 而知識貧乏的信息, 如果人們不進行較慢的分析和計算則難以推斷和評估。
雖然雙系統理論具有很高的普適性, 但是, 在JE/SE偏好反轉問題上, 廣義可評估性理論具有更為獨特的解釋力, 許多現象單純使用雙系統理論難以充分解釋。例如:Zikmund-Fisher等(2004)關于醫生選擇的研究, 在單獨評估時, 人們更愿意選擇畢業于哈佛大學、進行過80次手術的醫生, 在聯合評估時, 人們更愿意選擇畢業于愛荷華大學、進行過300次手術的醫生。即使在單獨評估時要求人們理性思考采用系統2加工, 或者在聯合評估時增加人們的認知負荷使人們采用系統1加工, 恐怕仍然難以消除這種偏好反轉, 并不是只要采用系統 2的分析思考就能完全彌補知識缺乏或者內在難以評估帶來的影響。
研究人類的判斷和決策, 不僅是希望解釋其中的規律, 更重要的是去影響現實, 幫助人們改善和提升決策的結果。單獨評估和聯合評估在現實中可操作性極高, 因此, 完全可以通過對決策模式或信息呈現的設計, 助推人們的決策。下面, 我們將從以下幾個不同的領域, 分別介紹評估模式會如何影響人們的決策, 希望能啟發政策的設計者選擇合適的評估模式, 達成助推的目的。
生活在充滿風險和不確定性的世界中, 個體的許多經濟決策都與此相關, 例如理財投資中更保守還是更冒險, 是否購買彩票獎券等產品。Hsee及其同事提出:評估模式對于個體的風險決策有顯著影響(Hsee, Zhang, Wang, et al., 2013)。
眾所周知, 在風險和跨期決策的研究中, 最重要的就是三種函數:一是效用函數(value function or utility function, Kahneman & Tversky, 1979), 二是時間折扣函數(temporal discounting function, Fredrick,Loewenstein, & O’Donoghue, 2002), 三是概率權重函數(probability weighting function, Kahneman &Tversky, 1979)。這三個函數都是非線性的, 特別是在原點附近(即價值為零、延期程度為零、概率為零或百分百的時候)更加陡峭。單獨評估和聯合評估可以影響函數的非線性程度(如圖 3所示), 在單獨評估的模式下, 函數的非線性程度較高; 在聯合評估的模式下, 函數的非線性程度較低(Hsee &Zhang, 2010; Hsee, Zhang, Wang, et al., 2013)。基于廣義可評估理論, 在單獨評估時, 人們對于類別的變化更為敏感, 例如價值從零變為正數時、風險從無風險變為有風險時, 都是類別的變化, 因此人們的效用判斷發生了很大改變。但若無其他的數量信息作參考時, 人們對數量的變化較為不敏感, 例如發生概率從10%變為20%時, 人們對數量變化的效用判斷變化就不太大。因此, 和聯合評估相比, 單獨評估時的效用函數、時間折扣函數和概率權重函數在原點附近的非線性程度都更高。

圖3 評估模式和效用函數(A)、時間折扣函數(B)、概率權重函數(C)
現在, 首先討論風險決策領域(查看圖 3中的概率權重函數), 在確定性點附近(概率為 0%或100%), 單獨或聯合評估時, 人們的敏感程度是類似的; 但是, 隨著風險水平的上升, 單獨評估的情況下, 人們對風險的變化更不敏感。例如, Hsee等(2013)發現在公共政策方面, 假設有兩種應對洪水的方案, 方案A可以100%地保護2萬人安全(無風險、小收益), 方案 B有 90%的概率可以保護 4萬人安全, 但是有 10%的概率保護不了任何人(有風險、大收益)。相比于聯合評估, 單獨評估時參與者對方案A的偏好程度更高。更近一步, 研究者們請大學生考慮附近新開的百貨商場正在贈送價值 50美元的開業禮券, 獲獎概率分別為 100%, 90%和80%, 假設自己有120分鐘的空閑時間可以去排隊,問他們最多愿意等多少分鐘。在聯合評估中, 獲獎概率100%, 90%和80%這三種條件下, 參與者愿意等待的時間逐漸下降, 并且兩兩之間差異顯著。在單獨評估中, 對比獲獎概率 100%和 90%的兩組,人們愿意等待的時間有顯著差別; 但是, 對比獲獎概率90%和80%的兩組, 人們愿意等待的時間并沒有顯著差異, 和聯合評估的結果不同。這就是說在單獨評估時, 人們只對于有無風險這一類別信息敏感, 對于多大程度的風險(例如獲獎概率 90%還是80%)這一數量信息不敏感。
此外, 關于不確定性情況下, 評估模式如何影響決策還缺乏系統深入的研究。早期Fox和Tversky(1995)發現了比較忽略效應(comparative ignorance),認為人們的不確定性規避其實來源于和確定性的備選方案的比較, 而當不存在明顯的比較信息時,人們其實并沒有那么回避不確定性。他們邀請參與者想象自己面對這兩個游戲袋, 里面裝了紅色和黑色籌碼, 只要抽到紅色籌碼就可以獲得100美元。袋子A中有50個紅色籌碼, 50個黑色籌碼; 袋子B中紅色和黑色籌碼一共100個, 但是具體每種多少不清楚。研究者詢問了參與者愿意出價多少來參加這個游戲。在聯合評估時, 人們對于袋子A的出價顯著高于袋子 B, 表現出了不確定性規避; 但是在單獨評估時, 人們對兩個袋子的出價卻沒有差異。這和Hsee, Zhang, Wang等(2013)的研究中, 人們在聯合評估時才會在意風險的大小(對概率數值敏感)其實是比較符合的。單獨評估時, 人們對袋子A和B都感到結果無法確定, 卻區分不出哪個不確定性更高, 只有聯合評估時, 才知道B比A更難以預測。
風險決策中的評估模式差異其實是JE/SE偏好反轉的一個子類, 只是處于這種特定的情境下。其根源還是選項存在兩個不同的屬性:一個屬性為類別屬性——有無風險; 另一個屬性為數量屬性——風險大小。在單獨評估時, 有無風險的可評估性更高, 人們對此較為敏感, 風險大小的可評估性較低,人們對此較為不敏感; 但是, 在聯合評估時, 人們對兩類屬性都較為敏感。
因此, 在風險相關的決策中, 如果政策的制定者希望消費者能區分出風險程度的高低, 對概率的數值變化更加敏感, 那么就應該使消費者處于聯合評估的模式中, 例如提供股票和債券兩種投資方式的損失概率對比, 這樣消費者就會對概率的數值更敏感。如果政策制定者希望消費者對有無風險這一類別信息更為敏感, 那么單獨評估的模式更為有效。
正如前文已經提及的, 在跨期決策領域(觀察圖 3中的時間折扣函數), 在零點附近(沒有延遲),單獨或聯合評估時, 人們對時間折扣的敏感程度差不多的; 但是, 當延遲時間增加后, 單獨評估時,人們對時間變化沒有聯合評估時敏感(Hsee, Zhang,Wang, et al., 2013)。例如, 單獨評估下, 人們還會表現出更強的現時偏差(present bias, Laibson, 1997)。讓人們考慮兩種新的網絡服務套餐:套餐 A速度2MB每秒, 現在即可升級; 套餐B速度4 MB每秒,但是3個月后才可以升級。單獨評估時, 參與者對套餐A的偏好程度比聯合評估下更高(Hsee, Zhang,Wang, et al., 2013)。此外, 進一步研究發現, 讓大學生考慮他們為一個初中生補一次課, 就可賺取 100元報酬, 如果報酬立刻獲得、1個月后獲得、3個月后獲得, 他們愿意付出的補課時間為多久(在0~240分鐘之間)。在聯合評估中, 立刻、1個月后、3個月后獲得報酬這三種條件下, 大學生愿意付出的補課時間遞減, 并且兩兩差異顯著。但是, 在單獨評估時, 立刻和 1個月后獲得報酬的兩組, 大學生愿意付出的補課時間有顯著差異, 但是 1個月后和 3個月后獲得報酬這兩組之間無差異; 也就是說, 單獨評估時, 人們對于1個月還是3個月延遲的數量信息并不敏感, 人們只對是否有延遲這一類別信息敏感。
和風險決策類似, 跨期決策中的評估模式差異也是JE/SE偏好反轉的一個子類別。在跨期決策情境中, 選項的類別屬性為有無延遲, 數量屬性為時間長短。在單獨評估時, 有無延遲的可評估性更高,人們對此較為敏感, 時間長短的可評估性較低, 人們對此較為不敏感; 但是, 在聯合評估時, 人們對兩類信息都較為敏感。
因此, 在涉及到跨期決策時, 如果期待人們更耐心、更愿意延遲獲得較大獎賞, 那么政策制訂者應該更多讓人們采用聯合評估的模式; 但是如果需要鼓勵人們獲得即時滿足, 那么政策制定者可以設計單獨評估的模式。
許多關于慈善捐贈的研究發現, 在單獨評估時,人們常出現數量忽略的問題, Desvousges等(1992)很早就發現了人們對數量不敏感, 一個經典例子就是, 在單獨評估時, 人們給予兩千、兩萬或者二十萬只被石油污染困住的候鳥的捐贈金額沒有什么差異。此外, 受害者識別效應的研究也顯示, 人們會捐贈更多金錢給一位受害者, 而不是人數更多的一群受害者(Kogut & Ritov, 2005)。其實, 數量忽略問題和前文中提到的關于違背占優性原則的現象非常相似, 正是因為人們對冰激凌的大小不夠敏感、對棒球收藏卡片數量的不夠敏感, 所以才產生了不合理的決策。
根據廣義可評估性理論, 在這些情景中, 人們知識較少或者缺乏內在參考系統(例如對于鳥類群體的數量), 又處于單獨評估模式, 總體處于可評估性較低的情況, 因此對于數量和時間都比較不敏感。根據規范性解釋, 人們應該給數量較多的鳥群和人數較多的受害者捐款更多, 但是由于人們對數量不敏感, 做出的捐贈決策和人數上的實際需要不相符合。
如何增強我們對數量的可評估性, 使得人們為更多人捐款時真的能捐助更多呢?Hsee, Zhang, Lu和 Xu (2013)提出了一種新方式:單位請求(unit asking)。例如:某慈善網站在為 20個低收入家庭的兒童募款, 單位請求的方式要求捐贈者首先考慮,“如果你要幫助其中一個兒童, 請問你愿意捐多少錢?”, 然后再回答, “為20位兒童捐款, 請問你愿意捐多少錢?”。
單位請求的方式先簡單詢問了一個“單位”的數值, 創造了一種類似聯合評估的比較, 使得人們對較大的數量有了更準確的評估, 從而提高了捐款的總量。因此, 如果數量信息是影響人們明智決策的重要因素, 但是普通人又不具備相應的知識時,采用單位請求這類助推方式, 提升該因素的可評估性, 形成像聯合評價那樣的效果, 是一種簡潔有效的做法。
現實生活中, 除了客觀的決策結果(例如哪個理財方案最終收益最高), 人們也有許多決策的目標是讓自己獲得愉快的感受, 也就是 Kahneman,Wakker和 Sarin (1997)所提到的, 讓自身體驗效用最大化。但是, 在這個過程中, 人們卻不見得能準確選擇。這是因為:人們預測或者購買時往往處于聯合評估的模式, 但實際生活或者使用時處于單獨評估的模式, 因此預測時人們容易高估體驗時的價值敏感性。Hsee和Zhang (2004)將這種過分敏感的預測稱為區別偏差 (distinction bias)。
首先, 區別偏差會導致預測偏差。例如 Dunn,Wilson和Gilbert (2003)對大學生的調查發現:新生剛入學時往往認為宿舍的特征會影響自己的居住體驗, 因為剛申請宿舍時, 大學生更接近聯合評估模式; 但是實際居住一段時間后調查發現:宿舍特征對于學生居住幸福感的影響很小, 這是因為住在其中的學生更接近單獨評估模式。
研究者發現, 區別偏差導致的預測偏差有以下幾種情形。第一, 預測者高估了數量信息對體驗者的影響。例如:Hsee和Zhang (2004)讓大學生想象自己出版了一本詩集, 并且校園書店正在銷售此書。聯合評估下, 想象自己的詩集賣出了0本、80本、160本、240本, 對每種情況都評估自己的感受如何。單獨評估組的參與者只看到了四種數量的其中一種, 評估自己感受如何。在聯合評估時, 人們認為自己的感受呈現線性上升的趨勢, 四組之間差異顯著。但是單獨評估時, 只要有詩集賣出, 人們就比沒有賣出詩集更加快樂, 但是具體是賣出了多少本(80本、160本還是240本)對情緒就不再有影響。此外, Hsee和Zhang (2004)讓參與者預測其他人閱讀10個或者25個積極詞匯(或者消極詞匯)后情緒如何, 預測者處于聯合評估模式, 認為詞匯的效價(積極或消極)和詞匯的數量(10個還是25個詞)都會影響閱讀者的情緒。但是由于閱讀者只閱讀四種列表中的一種, 處于單獨評估模式, 他們的情緒其實只受到詞匯效價的影響, 而不受到數量的影響。這與前文提到的評估模式和類別?數量信息的交互作用是相吻合的。
第二, 預測者高估了比較信息對體驗者的影響。例如:Hsee, Shen, Zhang, Chen和Zhang (2012)考察了天命注定和自由競爭兩種分配方式下人們的感受如何。預測者認為自由競爭組的人們會感覺更公平; 但是在實際體驗者(只處于一種條件)中,天命注定組和自由競爭組的公平感并沒有差異。體驗者在單獨評估的條件下, 判斷公平的參照信息較少, 對公平的敏感程度并沒有預測者想象的那么高。類似的, Cooney, Gilbert和Wilson (2016)也發現:分配者認為分配過程的公平性很重要, 但是被分配者其實并沒有那么重視過程。
由于人們在聯合評估時會錯誤預測自身感受,預測偏差也會導致實際的選擇偏差, 使得人們去選擇那些并不能使自己最愉快的選項。
第一類選擇偏差表現在:人們在選擇時注重數量差異, 忽視類別差異, 但是在體驗時更多受到類別差異的影響。例如:Hsee和Zhang (2004)讓人們在兩種任務間決策:講一個自己失敗的故事并獲得15克巧克力, 或者講一個自己成功的故事并能獲得5克巧克力。為了獲得更大塊的巧克力, 大部分人都愿意選擇去講失敗的故事。但是單獨體驗這兩種不同任務時, 講成功故事獲得少量巧克力的參與者更開心。因為巧克力的多少是數量信息, 體驗者處于單獨評估模式, 大塊或者小塊的巧克力影響不大; 但是講述失敗或成功故事帶來的難過或愉快體驗卻有很大影響。
第二類選擇偏差表現在:在選擇時, 個體更注重外在可比較的信息, 忽略了內在可評估的屬性,但在體驗時, 個體卻更多受到內在可評估屬性的影響。例如:前文提到的電子相框的選擇(Yang et al.,2011), 聯合評估時, 人們更多選擇難看但分辨率高的相框, 但是, 讓人們實際體驗時, 反而是分辨率低但是好看的相框讓人們體驗更好, 因為單獨擺放在家里時, 分辨率的差異是內在難以評估的, 外觀美丑卻是內在容易評估的。
因此, 可以看到, 聯合評估固然能促進人們更為耐心、更合理地進行慈善捐贈, 但這不代表聯合評估總是能幫助人們做出好的決策。要減弱區別偏差的影響, 使得消費者選擇到使自己體驗效用最大化的選項, 消費者需要在預測或選擇階段就采用單獨評估模式, 最直接的方式就是, 讓選項單獨出現在消費者面前, 但是這種做法在現實中實行難度較高, 其他更可行的方式還有兩種。
第一, “半單獨評估”法, 也就是說, 消費者可以每次單獨地觀察一個選項, 間隔一段時間后再去評估其他選項。Yang等(2011)對比了“半單獨評估”和聯合評估的決策差異。在聯合評估下, 參與者多數選擇外觀丑陋但分辨率高的相框, 但是他們的體驗卻并不美好; 在半單獨評估模式下, 參與者先觀看一個相框, 間隔10分鐘后, 再去觀看另一個相框,然后再作出選擇, 這種情況下, 更多的參與者選擇了分辨率低但是外觀漂亮的相框, 也就是令人體驗更愉悅的相框。因此, 這種方式可以降低區別偏差帶來的選擇偏差。
第二, 弱化技術參數。同樣是上文中的選相框實驗, 如果研究者不告知參與者關于分辨率的信息,大部分參與者在仔細觀察后會選擇外觀漂亮的相框(Yang et al., 2011), 即在體驗階段令消費者更愉快的那個選項。當然, 許多商家希望向消費者提供更多、更準確的信息, 但是, 如果一個消費決策的最終目的是擁有更愉快的感受, 那么弱化技術參數等數字的影響, 讓消費者聽從自己的體驗和實際感受, 可能是一個更好的選擇。
區別偏差并不僅僅會導致個體做出不符合自身體驗效用最大化的選擇, 甚至有可能導致商業決策中的錯誤, 使得決策者無法實現經濟利潤的最大化。
Shen, Hsee, Wu和Tsai (2012)提出, 定價者一般處于聯合評估模式, 會考慮到多種參考產品的價格來確定產品定價, 但是購買者往往只看到這個產品的價格, 處于單獨評估模式。當購買者對其他參考產品的價格有所了解時, 一般不存在定價偏差的問題, 因為定價者和購買者都處于聯合評估模式。但是, 當某種產品比較獨特或者陌生時, 就有可能存在定價偏差——定價者處于聯合評估模式, 購買者處于單獨評估模式, 定價者很可能高估購買者的價格敏感性, 定價偏低, 未能實現利潤最大化的目標。
為了驗證定價者和購買者處于不同的評估模式, Shen等(2012)讓具有多年工作經驗的 MBA學生扮演定價者和購買者。定價者需要對一個可以識別情緒的新型相機定價, 目標是最大化營業額(即產品售價乘以售出數量)。在定價結束后, 報告自己的思考過程:是僅僅思考了一個最有利潤的價格(單獨評估)還是思考了一系列價格后選擇了其一(聯合評估)。購買者被告知該相機以3000人民幣的價格出售, 請決定是否愿意購買, 隨后報告自己的思考過程, 是僅僅思考了在該價格下是否愿意購買(單獨評估)還是考慮了其他可能的價格(聯合評估)。結果發現:定價者的確比購買者更多處于聯合評估模式, 而且, 聯合評估模式下的定價者制定出的價格顯著低于單獨評估模式下的定價者。
為了進一步說明定價者處于聯合評估模式下時會產生定價誤差, Shen等(2012)招募了另一批MBA學生進行一個定價購買游戲。對定價者而言,他們要為一個業余攝影家的藝術照片定價, 以獲得最高利潤。為簡化任務, 研究者免費給他們提供照片, 照片成本為零; 其次, 他們有 50份照片, 將要以同樣的價格出售給50名和他們類似的MBA, 50位購買者每人單獨決定自己是否購買1張; 未售出的照片將作廢, 價值為零。定價者被隨機分為控制組、單獨評估組、聯合評估組。結果發現:單獨評估組的定價者制定的價格(中位數 50元)要顯著高于聯合評估組和控制組(這兩組中位數都是20元)。根據定價者的定價結果, 研究者設置了高價組(每張照片50元)和低價組(每張照片20元), 購買者被隨機分配到其中一種情況, 決定自己是否購買一張藝術照片。結果發現:對于購買者而言, 高價還是低價并沒有影響購買者的比例。綜合而言, 單獨評估的定價者制定的價格才是利潤最大化的價格。
因此, 當產品比較獨特或者陌生時, 定價者采用聯合評估模式下制定的價格可能會有所偏差, 定價者很可能高估處于單獨評估模式下的購買者的價格敏感性, 定價偏低, 未能實現利潤最大化的目標。在這時候, 商業機構應該考慮重新審視自己的定價策略, 讓決策者們在單獨評估的模式下思考,或者在對消費者進行市場調研時采取單獨評估的調查策略, 更有可能獲取合理的參考定價。
正如前文所述, 很多時候, 人類不能準確地判斷什么才能給自己帶來幸福快樂。我們以為重要的居住環境(Dunn et al., 2003)、分配方式(Hsee et al.,2012)、經濟收入(Kahneman & Deaton, 2010)等因素可能并不像我們想象地那樣帶來愉快的體驗和感受。人們的幸福到底是來源于哪些因素, 是社會比較讓我們更滿足嗎?通過一項跨城市的幸福感調查, Hsee, Yang, Li和Shen (2009)分析了這一問題。
研究者對中國 31個城市的居民進行了一次電話調查, 調查者詢問了參與人的室內溫度(調查在冬季進行)、擁有珠寶的價值以及對這兩個方面的滿意程度。結果發現:珠寶的價值對于幸福感的影響只存在相對效應(本城內珠寶越貴越幸福), 而不存在絕對效應(珠寶的絕對價值對幸福感沒有影響);但是室內溫度對于幸福感的影響卻存在絕對效應,冬季室內溫度的絕對高低對于幸福感有顯著影響,室溫越高, 幸福感越強, 跨城市的效應仍然顯著(如圖 4 所示)。

圖4 室內溫度和珠寶對幸福感的影響
可能的原因是:人們對珠寶沒有內在的評估系統, 進行判斷時, 城市內的社會比較信息可得性高,在城市內部接近聯合評估模式, 因此珠寶的相對價值對幸福感有影響; 但是一旦擴大到城市外, 社會比較信息可得性較低, 在城市之間接近單獨評估模式, 珠寶價值就影響很小了。相反, 人類對于舒適溫度有著內在的參照系統, 即使人們處于不同城市,沒有其他地區的室溫進行社會比較, 接近單獨評估模式, 室內溫度仍然是可評估性較高的屬性, 在跨城市的層面上, 溫度對幸福感仍有顯著影響。
也就是說:內在可評估性高的因素對于幸福感的影響是絕對的, 不依賴于社會比較信息或者其他外部參考信息。比如 關于食物品嘗的研究發現:無論旁邊放的是更美味的巧克力還是更難吃的沙丁魚, 人們在品嘗薯條時的實際感受并沒有什么差異, 因為我們沉浸在薯條的味道中時, 并不會過多思考其他食品(Gilbert & Wilson, 2009)。
Tu和Hsee (2016)還提出內在可評估性高的因素也更少受到享樂適應的影響。內在可評估性低的因素提升后, 過一段時間, 我們就產生了享樂適應,這種變化就不再影響我們的幸福感了。例如:從1克拉的鉆石換成 2克拉的, 幾個月后, 當初的幸福感就消退了, 因為變化后時間越久, 個體的評估模式越接近單獨評估, 沒有1克拉的鮮明比較, 2克拉鉆石的可評估性降低了。但是, 內在可評估性高的因素卻不會如此, 例如:室內溫度、洗澡水溫度等方面的變化, 即使沒有了過去的寒冷作為對照, 我們也仍然對溫度是否舒適非常敏感。因此, 在提升幸福感的決策中, 更為智慧的做法是去提升那些內在可感知的因素, 例如添置暖風空調、品嘗美味食物等比購買珠寶能帶來更加長久的幸福感。
綜上, 單獨評估和聯合評估能深刻影響人們的風險偏好、跨期選擇、消費體驗等多方面判斷和決策。政策制定者可以基于決策情景和決策目標的差異, 采用不同的選擇結構來助推人們做出適合的選擇。當決策有清晰的外部目標, 需要人們對風險更為中性、更有耐心可延遲滿足、對數量信息的變化更為敏感時, 宜采用聯合評估。即使在決策情境難以實現聯合評估時, 可以設立參照點(例如單位請求法), 或者將數量信息轉化為類別信息, 來助推人們的決策。反之, 當決策目標是提升個體的體驗幸福時, 宜采用單獨評估, 可以通過半單獨評估、減少數量信息等方式, 來避免人們進行直接的比較,獲得更愉快的體驗。
正如渴望成功的開發商不會選擇眾所周知、開發完善的地段, 而會尋找被眾人所忽視的潛力地段。如果一位學者希望做出富有影響力的研究, 那么他/她也不應再進入那些研究已經非常充足的紅海領域, 而應去尋找那些富有潛力的新領域。我們認為, 評估模式(單獨評估與聯合評估)的研究正是一支潛力股, 存在多種的探索方向。
相比于其他的變量, 單獨和聯合評估這一變量在現實中可以簡潔有效地進行操縱, 方便進行現場實驗。Newman, Howlett和Burton (2016)關于標簽的研究給了一個很好的演示:在單獨評估的狀態下,除了客觀的線索, 增加一些主觀評估的標簽能幫助消費者更流暢的決策, 甚至做出更好的決策。例如在速食食品上, 根據其營養成分表, 研究者增加了一個主觀標簽“健康星級”。相比于沒有健康星級標簽的組, 呈現了健康星級組的參與者選擇健康食品的概率從48%提升至了74%。通過組織選項的呈現方式(單獨或者聯合呈現), 單獨評估和聯合評估非常容易進行操縱。如果研究者有志于讓決策研究從實驗室走到現實中去, 考慮單獨和聯合評估這一領域可能是一個較為可行的選擇。
在本文中, 我們回顧了單獨評估和聯合評估帶來的偏好反轉現象, 在許多重要的領域中, 無論是人事招聘、消費選擇、政策評估、道德判斷、風險和跨期決策等, 評估模式都影響了人們的判斷和決策。廣義可評估性理論對JE/SE偏好反轉的成因進行了解釋。評估模式也可以在風險和跨期決策、慈善捐贈、個體消費選擇、商業定價等各個領域助推明智的決策。我們認為:兩種評估模式是一種簡潔并且有影響力的因素, 而且這方面的研究還充滿了新的機遇和空間, 未來研究者會不斷發現新的現象,探索更多的現實應用。
致謝:
衷心感謝陳佳、李希琳、莫子川、戚知之、沈靚、王可、阮博文、張艽對本文的建議和修改。