李 燕 陳文進 張書維
(1 中國海洋大學國際事務與公共管理學院, 山東 青島 266100)(2 中山大學中國公共管理研究中心/中山大學政治與公共事務管理學院, 廣州 510275)
作為行為公共政策的“旗艦行動”, “助推”一經提出便迅速風靡全球, 英國、美國、德國、澳大利亞、新加坡等國家紛紛成立專門的研究機構探索如何運用行為科學知識實現政策目標。雖然助推政策工具在節能減排、教育和扶貧等領域收效良好, 但眾多經驗證據表明, 助推并非矯治個體“行為偏差”的“萬靈藥”: 助推的公眾接受度呈現出明顯的跨文化差異; 助推干預具有“短視效應”, 難以對個體行為產生永久性的形塑效果; 反復使用相同的干預措施將導致效用遞減, 出現重復暴露效應。因此, 不加思考地盲目運用助推不僅無法有效引導公民行為, 甚至會適得其反(Gigerenzer, 2015; 李燕 等, 2021; Thaler, 2015)。助推在實踐中面臨的挑戰促使學者開始反思助推的有效性及其適用條件, 較為常見的做法是針對助推行為干預實驗結果進行元分析。相關研究或是聚焦于評價某種助推工具(如默認效應, 信息干預等)在不同政策領域的行為效果(Jachimowicz et al., 2019; Nemati & Penn, 2020; 張書維 等, 2022;趙寧 等, 2022), 或是關注分析與比較某一特定行為領域中(如飲食習慣、疫苗接種等)不同助推措施的相對優勢(Arno & Thomas, 2016; Re?osa et al.,2021; Vasas, 2023)。
然而, 一方面, 由于效應量指標選取的差異,不同元分析結果之間缺乏可比性, 致使我們無法綜合審視不同助推工具在各常見行為領域中的整體效果。另一方面, 科學而全面的助推分類是對不同助推工具有效性進行綜合評價的前提, 現有文獻大多將構建決策情境(包括決策信息和外界環境)的干預技巧或認知過程作為助推類型的劃分標準, 但這種分類方法無法涵蓋所有助推措施;多種認知路徑及干預技巧常常交織在一起共同發揮作用, 這使得根據決策情境進行助推類型劃分無法對不同助推干預措施的真實效果給予客觀準確的評估, 也無助于回應學界關于不同認知路徑與不同透明性之下助推有效性的爭議。
針對以上局限性, 本文借鑒Hansen 和Jespersen(2013)的分析思路, 從助推方式是否依賴直覺式反思和是否透明兩個維度構建助推分類框架。基于該框架, 首先對行為公共政策專業期刊Behavioural PublicPolicy(2017~2022)與BehavioralScience&Policy(2015~2022)中40 篇助推研究的108 個實證結果進行元分析, 整合分析不同助推工具在各常見行為領域的效應量及其差異, 探索助推效果異質性的根源。其次, 分析與比較不同認知路徑和透明程度助推措施的相對優勢。最后, 探索助推認知路徑、透明性與助推效果異質性影響因素的交互效應。
作為行為公共政策領域最具影響力的兩本專業期刊,BehaviouralPublicPolicy與Behavioral Science&Policy由行為經濟學、行為公共政策領域頂尖學者擔任編委會成員。自創刊以來1注:截至2023 年4 月, Behavioural Public Policy 共出版7卷19 期(2017 年創刊), 期刊網址: https://www.cambridge.org/core/journals/behavioural-public-policy. Behavioral Science& Policy 共出版8 卷14 期(2015 年創刊), 期刊網址:https://behavioralpolicy.org/, 該兩本期刊持續聚焦以助推為代表的行為公共政策理論與實踐, 匯聚高質量研究成果, 在國際行為公共政策領域享有極高的學術聲譽與學術影響力。此外, 相比心理學、經濟學類期刊中的助推實驗研究, 行為公共政策專業期刊更加關注助推在實際政策領域的效果, 以公民在真實政策情境中的行為來衡量助推干預效應(大多為實地實驗), 可以克服傳統實驗室實驗的“外部效度困境”, 研究結果更能體現出助推的實踐價值。因此, 本文聚焦“行為公共政策”領域的助推研究, 選取BehaviouralPublicPolicy與BehavioralScience&Policy中的助推研究成果作為元分析文獻來源,能夠更加有針對性地系統評價不同助推工具在各常見行為領域中的整體效果。
本文學術貢獻主要體現在: (1)基于“認知路徑”與“透明性”二元視角對助推行為效果研究進行元分析, 能將多種心理認知過程以及干預技巧的實際效果相互剝離開來, 有助于形成對不同類型助推真實效果的客觀認知。(2)對不同類型助推效果及其差異性的評價, 不僅回應了關于助推設計是否應該透明的學術爭議, 比較了兩條認知路徑改變行為的效果差異, 還為后續政策實踐中助推工具的選擇提供了實證依據。(3)本研究對助推效果異質性根源的分析, 豐富了相關文獻對助推有效性影響因素與適用條件的闡釋, 促進了行為公共政策科學的知識積累。
科學而全面的分類是對不同助推工具有效性進行綜合評價的前提, 現有助推效果元分析大多沿用經典的“MINDSPACE”框架(Nisa et al.,2019)。該框架以個體行為背后的心理過程作為分類標準, 但卻無法將所有驅動行為改變的心理因素全部涵括其中。例如, Keppeler 等(2022)嘗試通過激發公民對物品的心理所有權(psychological ownership)來引導個體接種新冠疫苗, 該措施背后的心理機制就超出了“MINDSPACE”框架所能解釋的范疇。進一步地, “MINDSPACE”框架所提供的心理驅動因素更側重于激發個體的直覺式思維(automatic system), 忽略反思性思維(reflective system), 導致許多常見的教育性助推(educative nudge)也無法在此框架中進行歸類(Michie et al.,2011)。例如, 醫院給病人提供包含不同診療方案的具體信息(涉及醫療風險、金錢成本等), 病人可以根據偏好選擇更加適合自己的診療方案, 但該行為干預措施卻無法在“MINDSPACE”框架中找到相應位置。
由此可知, “MINDSPACE”框架依據助推措施所對應的認知偏誤和心理特征識別出常見的助推類型, 卻無法涵蓋所有可能的助推干預工具, 也無助于回應學界關于不同認知路徑與不同透明性之下助推有效性的爭議。Hansen 和 Jespersen(2013)以助推方式是否依賴直覺式反思和是否透明兩個維度構建助推分類框架, 由于助推措施的認知路徑只涉及系統1 或系統2, 透明性也可以明確劃分為透明型或非透明型。因此, 任何助推措施都能在“認知路徑?透明性”的二維分類框架內進行明確區分。基于此, 本研究借鑒Hansen 和Jespersen (2013)的分析思路, 從認知路徑?透明性二元視角建立分析框架, 將實踐中常見助推干預手段涵括其中。借鑒該分類框架進行元分析, 比較不同助推類別效果的差異, 對不同認知路徑和透明性助推措施的真實效果給予全面客觀的評價。
根據Kahneman (2011)的認知雙系統理論, 人類大腦運行著兩種行為決策模式: 一種是憑借直覺、不受控制、無意識的快思考, 即系統1; 另一種是深思熟慮的、有意識的、理性的慢思考, 即系統2。多數情況下, 人們并沒有足夠的時間、資源、動機來進行充分的理性思考, 大部分行為都是無意識的經驗決策, 因此早期觀點認為助推應作用于系統1 的自動過程, 無需啟用系統2(Marchiori et al., 2017; Thaler & Sunstein, 2003, 2008)。正如Thaler 和Sunstein (2008)在Nudge一書中寫道的:“辛普森忘記了自己的理性思維系統……而我們寫作本書的目的之一就是去探索現實生活中的辛普森們如何去更好地生活(pp. 26?27)”, 助推最初就是為了巧妙利用個體“非理性”行為特征的局限性來幫助人們做出正確決策。
然而, 隨著助推措施應用的不斷深入, 學界對助推作用機理的認識也開始發生分歧。部分學者堅持認為助推僅通過系統1 的“捷思”來改變行為(Hertwig & Grüne-Yanoff, 2017; Marchiori et al.,2017), 聲稱助推是利用個體認知缺陷來引導行為改變, 核心在于構造環境以適應個體的啟發式思維與認知偏誤, 從而激發出理想的行為結果(de Ridder et al., 2022), 并通過阻止個體對替代方案的利弊進行思考的方式來影響其行為(Mols et al.,2015)。也有研究人員將“助推”與“思考”視為改變行為的兩種不同途徑, 前者針對那些存在認知障礙、依賴經驗、缺少理性思維的個體, 后者則適用于擅長理性思考、渴望知識、具有自我反思能力的個體(John et al., 2013)。另一部分學者則開始關注系統2 對于提升助推干預效果的潛在價值。英國行為洞察力小組(Dolan et al., 2010)擴展了助推的認知作用路徑, 認為系統1 和系統2 都是引導行為改變的有效方式, 就常見的9 種助推措施而言, 規范、默認選項、顯著性、啟動效應、情感與系統1 相關, 報信者、激勵、承諾、自尊則更多涉及系統2。Sunstein (2016)區分了教育性助推與非教育性助推, 教育性助推通過增加目標群體的知識與能力來強化系統2; 非教育性助推則旨在喚起或激活系統1 的自動決策機制, 并不尋求增強個體能力。John 和Stoker (2019)提出“助推+”(nudge plus), 認為在助推過程中應嘗試激發公眾的自主反思, 使個體決策免受專家或精英主導的“家長式”干預, 以盡可能避免對個體自主性的侵犯。如果在助推設計中能夠融入激發個體自主思考的元素, 則有助于強化助推效果(Banerjee &John, 2021)。
實證分析表明, 系統1 助推以其低成本、易實施等特點而在改變個體行為的效率方面略勝一籌(de Ridder et al., 2022), 但系統2 助推更尊重個體自主選擇權, 它通過強化個體能動性來改變其行為, 因而更容易被目標群體所接受, 干預效果也更加持久(Banerjee & John, 2021; Jung & Mellers,2016; Sunstein, 2016, 2017)。事實上, 兩種認知過程并非獨立作用, 任何助推干預都會觸發系統1的自動模式, 而系統2 的反思性思維需要在系統1的自動模式所構建的環境中運行。一項關于環保設施選擇的實驗研究也顯示, 默認選項這一助推干預措施可同時通過系統1 與系統2 發揮作用,不同認知路徑的助推措施均能有效引導行為改變(van Gestel et al., 2021)。因此, 本研究認為, 根據認知路徑對助推進行分類的關鍵在于識別具體干預措施是否涉及反思性思維的運用, 如果干預措施發揮效用以個體深思熟慮為前提, 那么可歸類為系統2 助推, 反之, 則為系統1 助推(Hansen &Jespersen, 2013)。
根據助推實施過程中是否明確告知目標群體干預目的、方式及其背后的心理機制, 可將助推干預分為透明型助推與不透明型助推(Bovens,2009; Hansen & Jespersen, 2013)。不透明型助推主張“潤物無聲”, 通過隱蔽的方式悄然改變目標群體的選擇架構, 默默引導其行為。透明型助推則強調干預信息的公開性, 即通過各種方式讓人們知曉干預的存在與目的, 讓他們知道助推如何影響行為(Loewenstein et al., 2014)。
雖然不透明型助推常常因其違背公開性原則和涉嫌操縱個體行為而飽受爭議與質疑(付春野等, 2022), 但正如Sunstein (2017)所言, 助推在多數情況下需要以人們察覺不到的方式來引導其行為。之所以選擇默默地施加干預, 是因為如果公開宣稱助推政策的意圖和形式, 干預將很可能歸于失敗(Bovens, 2009), 人們是否能意識到自己的選擇受到了影響(Hansen & Jespersen, 2013; Steffel et al., 2016), 這是助推有效性的關鍵。早期的元分析結果也證實, 政策目標群體的充分知情確實會導致其產生心理防御機制來強化原來的態度和行為(Wood & Quinn, 2003), 這不僅將使助推干預變得低效甚至無效, 更有可能引發公眾的逆反心理(Krijnen et al., 2017)。
以上研究似乎表明, 助推的透明性和有效性無法兼顧, 這引發了學界對于透明型助推效果的普遍擔憂(Paunov et al., 2019a)。然而, Sunstein(2015)卻指出, 理論上, 透明型助推并非必然失敗, 其有效性取決于人們所感知到的自主選擇權被限制的程度。若人們認為公之于眾的助推措施并不會對自己的自由選擇權構成威脅(如提供信息、提醒、警告), 那么透明性不會對助推效果產生負面影響; 反之, 如果公開的助推干預使個體明顯感受到自身決策受到了操縱(如默認選項、社會規范), 則會引發人們的排斥。此外, 公民對選擇架構師(政策制定者)的信任、個體“叛逆性”程度等都會影響透明型助推的效果。此后, 越來越多的實證分析也支持了透明型助推的有效性, 例如,Loewenstein 等(2015)和Steffel 等(2016)關于透明與不透明默認選項效果的實驗分析顯示, 透明的默認選項同樣有效, 是否隱瞞干預信息不會影響干預有效性, 即使被試知曉干預是不道德的, 默認選項仍能夠引導行為改變。Kroese 等(2016)操控貨架物品擺放(在視線明顯的地方擺放健康食品)的研究亦表明, 公眾在知曉自身被引導消費的情況下, 也依然會選擇購買健康食品。
需要指出的是, 現有文獻依據公開干預信息的內容(干預手段、干預目的、預期結果)對透明型助推進一步細分并比較其相對效果 (Kroese et al.,2016; Marchiori et al., 2017), 本文并未采取這一做法, 其原因在于: 目前關于透明型與不透明型助推效果的比較研究大多以默認選項這一助推措施為分析對象(de Ridder et al., 2022), 缺乏對其他干預措施的考察, 加之助推行為領域也會影響透明性效果, 但已有研究多聚焦于消費決策, 缺乏對其他行為領域的關注。因此, 為了盡可能分析與比較更加廣泛的行為領域中多種常見助推手段透明型與不透明型的干預效果, 并考慮到元分析的方法可行性和變量可操作性, 本文不對透明型助推的具體類型進行過于細致的分析, 僅根據助推實施過程中是否以目標群體能充分察覺的方式公開干預信息(任何一種均可)來區分透明型助推與不透明型助推, 綜合考量兩者的有效性及其差異。
助推措施在不同決策情境中效果的異質性已得到眾多經驗證據的支持(DellaVigna & Linos,2022; Mertens et al., 2022; Nisa et al., 2019), 對于其差異成因的探討主要形成了兩種思路: 一是選取特定要素作為基準(如行為領域, 實驗設計等)進行元分析, 對比助推措施在不同情境中的效果差異(Hummel & Maedche, 2019; Mertens et al.,2022); 二是綜合各潛在影響要素進行回歸分析,比較各因素對助推效果的影響效應(Cadario &Chandon, 2019; DellaVigna & Linos, 2022; Jachimowicz et al., 2019; 趙寧 等, 2022)。本研究依循第二條分析進路, 探究助推效應異質性的根源。整體而言, 除了助推類別的差異, 可將影響助推效果的因素歸結為研究設計, 行為特征與行為領域三類。
(1)研究設計
研究設計中的實驗類型、被試樣本量、變量的數據類型均可能對助推有效性產生影響。就助推干預的實驗類型來看, 由于不同實驗類型對于實驗條件的控制程度存在差異, 實驗室實驗被認為能夠最大程度避免外界干擾, 因此會產生更好的效果(Cooper, 1981), 其研究結論也更具普遍性(Lunn & Choisdealbha, 2018)。有學者發現實地實驗的效果更好, 這可能是由于進行實地實驗之前一般都會先進行預實驗, 研究者會選擇產生較大效應量的研究結果來進行實驗, 而實驗室實驗大多處于探究階段, 更難發現實際效果(Peterson et al.,1985)。但新近實證分析結果卻并未發現不同實驗類型效應量的差異, 因此哪種實驗類型更適合探索行為干預效果還需更多的經驗分析(Jachimowicz et al., 2019; Mertens et al., 2022)。
根據被試數量, 隨機對照實驗可分為大規模實驗(樣本量 ≥ 1000)和小規模實驗(樣本量<1000)兩類(Lelorier et al., 1997)。現有文獻在研究樣本量(單個實驗中控制組與對照組合計被試數量)對效應量的影響作用時, 通常以此作為分類標準來比較不同樣本量實驗研究之間效應量的差異(Kjaergard et al., 2001)。在醫療、教育等學科領域的元分析研究已經得出一致的結論, 即小規模實驗效應量通常高于大規模實驗(Slavin & Smith,2009), 但在行為公共政策領域, 學者關于樣本量對效應量的影響作用尚未達成共識。例如Nisa 等(2019)對環保領域行為干預實驗的元分析結果顯示, 小規模實驗效應量高于大規模實驗, 但Jachimowicz 等(2019)對默認選項效應量的元分析卻表明, 大規模實驗與小規模實驗的效應量并無顯著差異, 這說明樣本量在助推實驗研究中的影響效應仍需繼續探究。
元分析效應量的計算方式依賴于不同實驗研究所選取的變量類型, 連續變量(如“捐獻或投資的金額”)與二分類變量(如“是或否”)分別代表著被試人員不同的回應方式, 不同回應方式下被試面臨的決策情境也存在差異。雖然通過統計學方法可將根據不同變量類型所計算的效應量化歸到同一維度進行比較(Sánchez-Meca et al., 2003;Tang et al., 2013), 但不同決策情境是否會影響行為干預效果還有待實證探索(趙寧 等, 2022;Jachimowicz et al., 2019)。
(2)行為特征
根據行為科學相關知識, 行為動機與行為是否涉及金錢變動等行為特征變量將影響助推措施的實際效果。理論上, 當人們意識到其親社會行為是被引導而非自發做出的時候, 助推干預的效果就會大打折扣(Arad & Rubinstein, 2018;Sunstein, 2017), 但實驗研究結果卻并未發現利用助推引導利己或利他性行為時的效果存在差異(Jachimowicz et al., 2019; Mertens et al., 2022)。因此, 有學者指出, 行為動機對干預效果的影響可能與助推的透明性及行為的公開性有關(Gr?d et al., 2021)。進一步地, 理性個體的決策行為遵循效用最大化原則, 實際金錢變動較易于感知與計算, 更能激發系統2 的反思性思維進行決策。但是, 對于諸如默認選項等助推措施而言, 其有效性的發揮更多是通過改變選擇架構而依賴系統1的自動思維做出決策, 因此, 當助推措施所調整的行為涉及金錢變動時, 依賴系統1 認知路徑的助推干預可能無法達到預期效果(Thaler &Sunstein, 2008)。此外, 根據動機擁擠理論, 金錢激勵會增加個體外在行為動機, 但同時也可能降低其內在行為動機(Frey & Oberholzer-Gee, 1997;Gr?d et al., 2021)。因此, 涉及金錢變動的行為是否會影響干預效果, 其背后的作用機理是通過認知路徑還是內外動機仍有待進一步實證分析。
(3)行為領域
助推效果在不同行為領域的異質性是行為公共管理研究的熱點議題, 相關成果大多聚焦于對健康、消費、金融及公共利益領域的助推有效性予以比較分析(Mertens et al., 2022)。例如, Jachimowicz等(2019)的研究發現, 默認選項在消費領域的干預效應較高, 在環境領域的有效性較低, 但并未發現健康與其他領域的影響效果存在差異。然而,DellaVigna 和Linos (2022)的分析則表明, 助推干預措施在健康和公共利益領域的干預效應較高,在消費領域的干預效果較差。這一差異可能源于分析對象的不同, 前者僅以默認選項為分析對象,而后者的研究涵蓋了多種助推類型。再如,Hummel 和Maedche (2019)的元分析結果顯示, 助推在金融領域的干預效果要高于健康領域, 但Mertens 等(2022)的元分析結論卻完全相反, 造成這種差異的原因可能是不同研究文獻篩選標準各異(如健康領域可進一步區分為醫療健康、飲食健康等, 而對醫療健康與健康飲食的干預效果可能不同)。這表明已有研究雖驗證了助推在不同行為領域效果的差異, 但對于助推在不同領域效果的比較分析尚未形成一致結論。
一直以來, 學界對于系統1 與系統2 助推、透明型與不透明型助推效果的相對優勢存在較大爭議 (de Ridder et al., 2022), 出現這種爭議的原因可能是由于現有大部分研究都僅基于單一維度進行比較, 未充分考慮不同認知路徑或透明性助推在不同情境中的適用性存在差異, 而這種差異會通過認知路徑、透明性與異質性影響因素間交互作用表現出來。
已有文獻從理論分析和實證研究兩個角度探索了不同認知路徑助推適用情境。理論上, 人們利用系統2 做決策時需要付出努力進行自我控制,那些無法進行自我控制的個體在面臨復雜的認知任務時, 更容易放棄。而系統1 的決策過程無需公民付出努力, 對于自我控制能力弱的公民, 利用系統1 助推的效果會更好。另外, 根據認知負荷理論(Cognitive Load Theory), 人們在處理信息時受到自身記憶能力的限制, 當認知任務超過自身記憶能力的極限時, 會增加公民做出錯誤決策的幾率。由于系統1 決策利用人的直覺思維, 對認知能力要求較低。因此, 有學者認為人們在高認知負荷的情況下, 系統1 助推效果會優于系統2助推(Weijers et al., 2021)。實證研究也印證了系統1 助推與系統2 助推在不同情境中干預效應的差異性。例如, 當助推行為與公民利益相關時(引導公民購買洪災保險、殘疾保險等), 激發公民的反思性思維(系統 2 助推)的效果更好(Banerjee &John, 2021); 當目標群體的個人偏好與助推引導的預期行為方向相反時, 這種情況下系統1 助推更加適用(de Ridder et al., 2022)。
不同條件下透明性對助推效果的影響亦存在差異。學者普遍認為, 不同干預措施對個人自主權的威脅程度, 是影響透明型助推效果的關鍵。Sunstein (2015)提出, 透明型助推的有效性取決于人們所感知到的自主選擇權被限制的程度, 當公民認為助推措施對其自主選擇權構成威脅時, 隱蔽的進行干預效果更好。實證研究結果也表明,對公民自主權侵入性強的干預(如自助餐廳減少盤子尺寸)應保持其隱蔽性; 對公民自主權侵入性低的干預(如默認選項), 政府主動公開干預信息會強化公民信任, 增強干預效果(Paunov et al.,2019b)。另外, 透明型助推在不同行為領域的效果也表現出明顯的異質性。如Kroese 等(2016)操控貨架物品擺放(在視線明顯的地方擺放健康食品)的研究發現, 公開干預信息同樣能夠有效引導公民購買健康食品。Gr?d 等(2021)研究默認選項對捐款行為的影響效果時發現, 透明默認選項效果明顯低于不透明默認選項。因此, 有學者推斷, 當助推所引導的預期行為對公民自身有益時, 透明型助推的效果更佳(Marchiori et al., 2017)。
以上研究表明, 不同認知路徑或透明性助推在具體情境中的效果是存在差異的, 不能脫離具體的干預情境來比較不同認知路徑或透明性助推效果。因此, 分析認知路徑、透明性與異質性影響因素可能存在的交互作用, 有助于回應學界關于不同認知路徑與不同透明性之下助推有效性的爭議。
元分析(Meta Analysis), 也稱薈萃分析, 是一種對已有實證研究結果進行系統評價的統計方法。元分析中效應量指標的選擇非常重要, 其大小表示不同研究中助推行為干預效果的強度。根據行為干預實驗研究的特點, 標準化均值差能更好地體現行為科學領域控制組與對照組的差異(Jachimowicz et al., 2019)。當所有數據轉化為組間標準差等于1 的尺度時, 標準化均值差在不同研究間也具備較高可比性, 因此本文選擇以標準化均值差作為效應量估計值, 通常稱為Cohen’sd系數, 該系數值越大, 表明干預效果越好(Borenstein et al., 2009), 本文運用 Comprehensive Meta Analysis 2.0 軟件計算效應量。
本文選擇行為公共政策權威期刊Behavioural PublicPolicy(2017~2022)與BehavioralScience&Policy(2015~2022)發表的助推干預實驗研究進行元分析, 共篩選出40 篇文章, 得到108 個研究結果。文獻搜索過程中將兩本期刊發表的所有文章全部納入檢索范圍(合計330 篇), 再采用閱讀全文的方式對文獻進行逐一篩選, 元分析文獻搜索及篩選流程如圖1 所示。

圖1 文獻搜索及篩選流程
40 篇樣本文獻中, 關注行為多數集中于健康、消費、公共利益等領域; 其中, 實驗類型以實地實驗(25 篇)和在線實驗(11 篇)為主; 39 篇文章采用隨機對照, 僅1 篇采用前后對照的實驗設計;大多數文章更關注規范(Norm)、凸顯(Salience)、報信者(Messenger)等干預方式的實際效果; 樣本來源以西方國家為主, 以英國、美國、德國、荷蘭被試為樣本的文獻居多; 文獻中的樣本量最低為88, 最多高至11157069, 不同研究樣本量存在較大差異(見表1)。

續表
考慮到不同研究樣本量的差異, 固定效應模型以樣本量作為賦權標準將會產生較大誤差, 故采用隨機效應模型來綜合效應量。根據 Cohen(1988)的判斷標準, 以d= 0.2,d= 0.5,d= 0.8 為分界值, 分別表示小、中、大效應量。研究結果顯示, 助推干預效果的綜合效應量d= 0.21, 95%CI = [0.19, 0.23], 表明本次研究觀測到的效應較小。有6 個研究效應量小于0, 47 個研究效應量在0 到0.2 之間, 55 個研究效應量大于或等于0.2, 不同研究效應量存在明顯差異。
異質性檢驗結果顯示,I2= 99.5%,I2統計量代表有多少變異是由真實差異值導致的,I2為0 說明所有觀察到變異都是由隨機誤差導致, 大于75%說明效應量存在高異質性, 需要進一步探究影響效應值的其他因素。下文將從助推類型、研究設計、行為特征與行為領域來分析異質性的根源,進一步從認知路徑和透明性維度來區分不同助推類別的真實效果。
借鑒Hansen 和Jespersen (2013)的分析框架,本文根據助推是否依賴直覺式反思和是否透明兩個維度, 將108 個研究結果涉及的所有助推方式在“認知路徑?透明性”的二維坐標軸中進行分類(圖2)。認知路徑的分類取決于具體干預措施是否涉及反思性思維的運用, 如果干預措施發揮效用以個體深思熟慮為前提, 那么可歸類為系統2 助推, 反之, 則為系統1 助推。根據助推實施過程中是否以目標群體能充分察覺的方式公開干預信息來區分透明型助推與不透明型助推, 如果被試能夠感知到干預手段、干預目的、或預期結果(任何一種均可)則為透明型助推, 反之為不透明型助推。另外, 編碼僅對干預方式劃分類型, 不對透明性程度或者反思性程度進行打分。分類編碼過程由兩位研究人員獨立完成, 編碼一致性系數Cohen’sKappa值為0.92, 表明編碼具備較高可靠性。其中, 40 個研究采用不透明型系統1 助推, 12個研究采用不透明型系統2 助推, 16 個研究采用透明型系統1 助推, 40 個研究采用透明型系統2助推, 說明不透明型系統1 與透明型系統2 助推是目前學術界關注的重點。

圖2 元分析樣本文獻助推措施的類型劃分
需要說明的是, 按照 Hansen 和 Jespersen(2013)的分類方式, 默認選項應屬于不透明型系統1 助推, 社會規范應屬于透明型系統2 助推。但由于實驗情境的不同和存在人為操縱的原因,導致在對樣本文獻分類時, 默認選項與社會規范兩種助推方式重復出現在不同類別之中。例如, Paunov等(2019b)關于課程選擇行為的分析與Boruchowicz等(2023)關于行蹤app 安裝的研究均人為操縱了默認選項的透明性, Kantorowicz-Reznichenko 等(2022)關于新冠疫苗接種意愿的實驗研究操縱了社會規范的透明性。但整體而言, 以上特例的存在并不影響該分類框架的合理性和可行性。
四類助推干預研究的元分析結果顯示(表2),不透明型系統1 助推與透明型系統2 助推更加高效, 而透明型系統1 與不透明型系統2 助推的效應量則明顯較小。就單一維度而言, 系統1 助推的不透明效果優于透明型, 而系統2 助推的透明效果優于不透明型; 透明型助推激發主動思考的效果優于直覺式思考, 不透明型助推通過直覺式思考干預效果更好。

表2 透明性與認知路徑的效應量研究
4.3.1 助推效果異質性影響因素分析
以樣本文獻的Cohen’sd值為因變量, 從助推類型、研究設計、行為特征和行為領域四個維度來探索效應量的影響因素, 各變量的操作化與賦值情況見表3。其中, 9 篇文獻中24 個研究結果的決策行為涉及多個領域。兩位編碼員對每項研究的行為領域單獨編碼, 編碼一致性系數Cohen’sKappa值為0.95, 表明編碼具備較高可靠性。另外, 為避免虛擬變量陷阱(多重共線性), 在模型設置中, 本文以不透明型系統2 助推作為基準組,在表3 中只對另外三種助推類型進行變量定義。

表3 變量解釋與說明
模型1 至模型6 中(表4), 模型4 的F統計量與調整后R2最大, 表明該模型估計效果最佳。由模型4 分析結果可知。就研究設計而言, 樣本量對效應量存在顯著負向影響(β = ?0.52,p< 0.001),表明被試人員大于等于1000 的實驗研究行為干預效果顯著低于被試人員小于1000 的實驗; 實驗類型與數據類型都不會影響助推干預效果。行為特征變量中, 行為特征與金錢變動對效應量均無顯著影響, 表明決策行為利己或利他、是否涉及實際金錢變動, 都不會影響助推干預效果。就行為領域來看, 健康領域(β = 0.23,p< 0.1)與金融領域(β = 0.26,p< 0.1)對效應量存在顯著正向影響,說明助推在健康領域與金融領域效果更好。以上結果表明, 助推效果受研究設計及行為領域的影響, 其異質性可以由實驗樣本量規模的差異、助推行為是否涉及健康、金融領域進行解釋。

表4 不同類別助推的異質性分析
4.3.2 不同類型助推與異質性因素的交互效應分析
(1)模型設定
為分析透明性、認知路徑與研究設計、行為特征及行為領域的交互作用, 進一步探究已有文獻中從單一維度分類比較助推干預效果的結論存在沖突的原因, 本研究構建如下交互效應模型:
模型中,yi表示每個研究的效應量; 研究認知路徑交互作用時,Di1為每個實驗研究中助推的認知路徑(系統1 = 1, 系統2 = 0); 研究透明性交互作用時,Di1為每個實驗研究中助推透明性(透明 = 1,不透明 = 0),Di2代表研究設計、行為特征與行為領域的具體類別(樣本量、實地實驗、數據類型、行為動機、金錢變動、健康、消費、金融、公共利益),Di1Di2為交互項。
(2)結果分析
調整后R2過低說明自變量解釋能力不足, 若為負值說明模型相對自由度的擬合優度很差(Wooldridge, 2016)。由于因變量個數的限制, 對所有變量同時構造交互效應模型進行回歸分析會造成較大偏差, 因此本文分別對每個變量單獨進行交互效應研究, 這也導致自變量解釋能力有限, 下文僅對F統計量且回歸系數顯著的模型進行探討。
助推認知路徑的交互效應回歸分析結果顯示(表 5), 由交互項為樣本量的模型估計結果可知(模型1) (β1= ?0.27,p< 0.01; β2= ?0.56,p< 0.001;β3= 0.29,p< 0.1), 當單個實驗中控制組與對照組合計被試人數大于等于1000 時, 系統1 助推效果與系統2 助推效果無顯著差異; 當單個實驗中控制組與對照組合計被試人數小于1000 時, 系統2助推效果大于系統1 助推效果(β1< 0) (見圖3a)。

圖3 交互效應分析
助推透明性的交互效應回歸分析結果如表6所示, 由交互項為行為動機的模型估計結果可知(模型4) (β3= 0.38,p< 0.1), 當助推干預行為出于自利動機時, 透明型助推效果大于不透明型助推(β1+ β3> 0), 出于利他動機時不透明型助推與透明型助推效果無顯著差異(見圖3b); 由交互項為健康的模型估計結果可知(模型6) (β3= 0.42,p<0.1), 當助推干預行為屬于健康領域時, 透明型助推效果大于不透明型助推(β1+ β3> 0), 不屬于健康領域時不透明型助推與透明型助推效果無顯著差異(見圖3c); 由交互項為公共利益的模型估計結果可知(模型9) (β1= 0.36,p< 0.01; β3= ?0.4,p<0.1), 當助推干預行為涉及公共利益時, 透明型助推效果小于不透明型助推(β1+ β3< 0), 不涉及公共利益時透明型助推效果大于不透明型助推效果(β1> 0) (見圖3d)。

表5 認知路徑與異質性要素的交互效應分析

表6 透明性與異質性要素的交互效應分析
本文基于“認知路徑”與“透明性”的二元視角,對行為公共政策專業期刊BehaviouralPublic Policy(2017~2022) 與BehavioralScience&Policy(2015~2022)中40 篇助推研究的108 個實證結果進行元分析, 比較不同認知路徑和透明程度助推措施的相對優勢, 并探索了助推認知路徑、透明性與助推效果異質性因素的交互效應。研究發現:
(1)行為公共政策領域的助推研究總體效應較小, 且在實踐中面臨失敗的風險。與已有大部分助推干預元分析結果相比(Cadario & Chandon,2019; Jachimowicz et al., 2019; Mertens et al., 2022;趙寧 等, 2022), 本研究觀測到的總體效應相對較小; 由效應量森林圖分布可知, 部分助推研究結果的效應量甚至為負。這可能是由于相對于其他元分析研究中更多以公民在實驗情境中做出的選擇估計效應量, 聚焦行為公共政策領域的研究大多以公民在真實政策情境下的行為決策來衡量助推干預效果, 而人們在實驗情境中的選擇不一定會轉化為實際生活中的行為(Kalkstein et al.,2022), 這導致了本文統計的助推總體效應量偏小。Nisa 等(2019)的元分析研究也表明, 助推在真實政策情境的行為效果會低于預期, 對于這種情況, 有學者認為即使總體效應較小, 但在目標群體規模較大時, 助推仍然能夠產生巨大效果(van der Linden & Goldberg, 2020)。
進一步地, 雖然默認選項等少數措施在促進或改善個體行為方面具有較強的助推效果(趙寧等, 2022), 但作為行為公共政策一攬子工具筐的助推在解決“行為失靈”的過程中并非總能達到“四兩撥千斤”的效果, 實踐中也面臨著失敗的風險。Sunstein (2017)綜合分析了助推低效或低于預期的原因, 認為目標群體強烈的前因偏好、助推主體的利益動機皆可能造成助推失效, 如果人們無法理解助推措施相關信息或對政策措施存在誤解, 抑或公民對官方的政策引導十分抗拒, 助推干預效果也將大打折扣。Tor (2020)識別出三類失敗的助推: 一是有技術缺陷的助推, 助推設計上需要進行優化; 二是不充分助推, 即不能有效促進行為改變, 需要強制性的干預措施; 三是不適合助推, 不應針對該目標群體或某行為領域進行助推干預。另外, 有學者認為對助推效果的衡量也不能只滿足于研究本身的統計顯著性(statistical significance), 還要兼顧解決問題的充分性(sufficiency)、干預人群的可擴展性(scalability)和干預措施的主觀性(subjectivity) (Mills &Whittle, 2023)。未來研究應該對助推失敗的原因繼續進行深入分析, 為助推工具的優化提供更多實證依據。
(2)助推能同時兼顧透明性與有效性, 不同認知路徑與透明性對助推有效性的影響存在交互效應。本文研究結果表明, 不透明型系統1 與透明型系統2 助推更加高效, 透明型系統1 助推與不透明型系統2 助推效應量則明顯偏小。本文的結論再次證明助推的透明性與有效性可以兼顧(Bruns et al., 2018; Kroese et al., 2016; Loewenstein et al.,2015; Paunov et al., 2019a; Steffel et al., 2016), 并非只有隱蔽的干預才能發揮作用。因此, 如果政策制定者利用助推工具時能夠合理公開干預信息,滿足Thaler 和Sunstein (2008)提出的“公開性原則”, 將有助于化解長期以來助推涉嫌操縱公民行為的爭議。
另外, 本研究還發現認知路徑與透明性對助推有效性的影響存在交互效應, 表現為不透明型系統1 助推效果優于透明型系統1, 透明型系統2助推效果優于不透明型系統2。這一結果可以根據認知路徑的作用機制從兩個角度進行解釋。一是為何系統1 助推更適合隱秘的干預。由于系統1 助推利用人的直覺思維引導公民做出預期行為,這種助推手段大多會對公民自主選擇權構成威脅,公開干預信息會引發人們的反對(Sunstein, 2015)。二是公開干預信息為何能強化系統2 助推效果。因為系統2 的決策過程依賴公民的反思性思維,公開干預信息能夠為公民思考提供更多決策依據,減少不必要的認知負擔, 降低人們主動思考過程中所要付出的努力, 人們在低認知負荷的情況下,系統2 助推效果會優于系統1 助推(Weijers et al.,2021)。認知路徑與透明性的交互作用是本文的一個探索性發現, 可以為不同透明性或認知路徑干預效果的爭議提供一種新的解釋路徑。
(3)助推干預效果受研究設計影響、且在不同行為領域的效果存在差異。首先, 就研究設計來看, 樣本量過大會降低助推干預效果。這表明在醫學、教育等領域的實驗研究中普遍存在的“小樣本?大效應”現象(Slavin & Smith, 2009), 在行為公共政策領域同樣存在; 另一方面, 也說明與小樣本實驗結果的變異性相比, 大樣本實驗結果更加可靠(Kjaergard et al., 2001; Nisa et al., 2019)。
其次, 助推在不同行為領域的效果存在差異,在健康、金融領域的助推干預效果較好。這一研究發現與已有分析結果存在較大差異, 例如,Jachimowicz 等(2019)和趙寧等(2022)未發現默認選項助推在健康領域的效果更好, Mertens 等(2022)也并未發現助推在金融領域的效果顯著高于其他領域。事實上, 現有針對不同行為領域助推效果的元分析文獻也經常得出相互沖突的結論(例如, Hummel 和Maedche (2019)與Mertens 等(2022)對助推在金融和健康領域效果的比較, 其結論完全相反), 研究結論的差異可能緣于: 一是元分析所針對的助推措施不同。Jachimowicz 等(2019)和趙寧等(2022)僅針對默認選項進行研究,本文關注多種助推措施的綜合效果, 元分析對象的差異降低了研究結果之間的可比性。二是元分析納入行為領域的細分類別不同(如金融行為可以細分為儲蓄、借貸等)。本研究中所涉及的金融行為大多是儲蓄和購買保險, 但我們無法知曉Mertens 等(2022)的研究對金融行為領域的細分類別, 也不能確定助推在不同細分類別之下(如金融領域中的儲蓄和借貸)的效果是相同的, 特別是趙寧等(2022)已經證明了助推在環境領域細分類別(利己型或利他型)中的效果存在顯著差異。這表明未來對于助推在健康、金融等行為領域的研究應該進一步細化類別, 增加各研究之間的可比較性。
(4)助推發揮作用的認知路徑、助推設計的透明性與效應量異質性影響因素間呈現出復雜的互動作用。研究結果表明, 認知路徑與樣本量, 透明性與行為動機、健康、公共利益存在明顯交互作用, 這種交互效應反映出不同認知路徑或透明性助推在不同情境中適用性的差異。
就系統1 助推與系統2 助推的適用性差異而言, 已有研究認為不同認知路徑助推適用性的影響因素包含三個方面: 公民認知能力、行為偏好及助推行為領域(de Ridder et al., 2022; Kahneman,2011)。首先, 本文研究結果并未發現助推認知路徑與行為領域存在交互效應, 對于 Banerjee 和John (2021)提出的觀點——系統2 助推對涉及公民自我利益的行為更加有效, 也還需要更多實證檢驗。其次, 本研究發現, 系統2 助推在小規模實驗中效果更好, 這說明不同樣本量實驗設計的差異性會導致系統1 與系統2 助推干預效果的差別。這可以從實驗類型的差異上進行解釋, 本文研究樣本中的小規模實驗70%屬于在線實驗, 大規模實驗82%屬于實地實驗, 相比現實決策情境的復雜性, 在線實驗通過虛擬實驗情境讓公民進行決策, 更有利于人們集中精力, 啟動系統2 進行深思熟慮, 使得在小規模實驗中系統2 助推比系統1助推更加適用。但本文交互效應模型的局限使我們無法進一步探討公民認知能力或行為偏好在其中可能發揮的作用, 這為未來研究提供了新方向。
針對透明型與不透明型助推的適用性差異,已有研究從助推行為領域、公民感知自主權入侵程度兩個角度探討了透明型助推的適用情境。本研究結論表明, 助推行為與公民自身利益密切相關時(自利行為動機、屬于健康領域、不涉及公共利益), 公開干預信息能夠強化助推效果, 這與已有研究發現保持了高度一致(Gr?d et al., 2021;Kroese et al., 2016; Marchiori et al., 2017)。另外,現有研究表明, 人們所感知到的自主選擇權被限制的程度也是影響透明性是否能夠發揮作用的關鍵(Sunstein, 2015), 但是由于對公民感知自主權入侵程度的測量難度較大, 致使我們無法在本研究中評估透明性對此因素的實際影響。綜合而言,本文分析認知路徑、透明性與異質性因素存在的交互作用, 證明了助推的認知路徑、透明性在不同情境中適用性的差異。
以上研究發現, 不僅回應了學界關于不同認知路徑與不同透明性之下助推有效性的爭議, 對不同助推干預措施的真實效果給予了客觀準確的評估, 更為提升助推工具有效性提供了如下政策啟示。
第一, 政策部門應充分認識到助推失敗的潛在風險, 在運用助推干預過程中始終保持審慎態度, 積極采取措施應對助推失敗。近年來, 隨著行為公共政策在西方發達國家政策實踐中所表現出的巨大潛力, 世界各國政府紛紛效仿, 甚至出現了盲目跟風的趨勢。然而, 本文分析顯示, 整體來看, 各項助推措施并非如人們所預期的那樣卓有成效。因此, 政策部門在嘗試運用助推干預個體行為的過程中, 應形成對其行為效果的理性預期,充分認識到助推措施低效與無效的可能。助推和傳統政策工具之間不是相互替代而是互補關系,僅依靠單一工具無法引導公民行為, 將助推和傳統工具相結合能更好的發揮作用(Loewenstein &Chater, 2017)。面對助推失敗, 可采取以下應對策略: 一是尊重公民的自由選擇, 不做任何改變;二是選擇替代方案; 三是改變規則、框架及個性化設置, 或轉而使用激勵、禁令等傳統政策工具(Sunstein, 2017)。
第二, 在設計助推措施的過程中, 決策者應重視通過更加透明的政策設計培養和提升個體反思性決策能力。決策者在選擇助推工具時常常進退兩難: 默默地引導公眾行為會使政策設計變成“詭計”, 并為政府操縱公民的行動提供了合法性,但如果公開宣稱政策助推的意圖和形式, 干預將很可能歸于失敗。本文分析表明, 助推的透明性和有效性并不沖突, 透明型助推激發個體主動思考的效果優于直覺捷思, 不透明型助推利用個體的直覺捷思能夠達到更好干預效果。激發目標群體進行自主思考, 能夠提高其認知水平和決策能力, 還有助于維持行為干預的長期效應。因此, 決策者應著力通過改變認知或決策環境等方式幫助個體提升自己決策能力, 采用“教育型助推”為個體“賦能” (Dolan et al., 2012; Sunstein, 2017)。政策制定階段, 主動向那些對政府干預持有抵制情緒的目標群體及時公開政策目標及實現手段, 以爭取公眾支持; 政策執行過程中, 面對可能存在利益沖突的情境(比如醫患溝通、城管執法等), 提供詳細的決策信息能夠增強公眾認知能力, 引導公民做出理性行為決策以緩解矛盾, 促進政策順利實施。
第三, 政策制定部門應充分考慮助推的適用性, 根據行為領域與行為特征, 依托各種新興技術制定差異化、個性化的助推措施提升政策有效性。在進行健康領域、金融領域的政策工具選擇時, 可優先考慮通過助推干預來引導行為改變;當公共政策更多與公民自身利益相關時, 政策設計應著眼于增加人們的知識儲備和明辨是非的能力來鼓勵人們主動積極地做出促進自身福利的行為, 通過政務信息公開提升政策過程透明度, 充分保障公民的知情權。當政策內容涉及公共利益時, 政府部門應盡可能通過巧妙的設計潛移默化地利用或克服個體 “非理性”心理因素和認知偏誤來引導人們做出政策所期望的行為。進一步地,將新興技術與行為科學知識有機融合, 利用個體行為大數據分析優化個體選擇架構(Yeung, 2017),探索基于大數據的循證助推政策。政策制定部門可將虛擬現實、社交機器人、游戲設計、自我量化、行為信息學等新興技術與行為科學相結合,根據目標群體個體特征設計個性化的選擇方案和助推方式(Mills, 2022)。
本研究局限性主要體現在: (1)元分析樣本文獻涉及的干預行為大多集中在健康與消費領域,導致我們無法考察其他更多行為領域助推干預效果異質性。(2)由于BehaviouralPublicPolicy與BehavioralScience&Policy期刊中助推干預實驗研究樣本大多來自西方國家, 以東方國家公眾作為被試的研究相對比較缺乏, 造成本文無法對助推效果的異質性進行跨文化分析。(3)受樣本文獻數量的限制, 過多的交互變量會導致模型估計誤差偏大, 因此本文未對異質性要素之間交互效應進行研究。(4)“認知路徑?透明性”二維分類框架下四種不同類別助推的效果會受到納入樣本數量的影響, 助推的認知路徑與透明性所呈現的交互效應還有待更多經驗證據的支持。
未來研究應更多關注助推在其他行為領域的實際效果, 進一步細化目標行為研究助推效果的異質性。已有研究結果表明, 默認選項在西方文化背景中的效果要顯著高于東方文化背景(趙寧等, 2022), 未來可以進一步分析其他助推措施在不同文化背景下的效果差異及其原因。對助推效果的交互效應研究可以更好的揭示異質性根源,未來應設計更加多元的交互效應模型, 探索更多異質性要素之間可能存在的交互效應。此外, 不同透明性或認知路徑助推的干預效果也還需要更大樣本量數據的檢驗。