□ 周陳園,浦 悅
(上海工程技術(shù)大學(xué) 管理學(xué)院,上海 201620)
垃圾分類一直被提倡,但成果卻不盡如人意[1]。相關(guān)數(shù)據(jù)表明,有機(jī)物質(zhì)量占城市生活垃圾總量半數(shù)以上,水份多、熱值低且不適宜焚燒是上海城市生活垃圾的主要特點[2]。若垃圾分類能夠從源頭開始實行,可將適合焚燒的垃圾和適合生物降解的垃圾分離,從而提高垃圾焚燒發(fā)電廠和濕垃圾生物降解處理廠的處理收益和效率,降低全鏈條的處理成本。厭氧發(fā)酵是目前常用的濕垃圾處理的主要方法之一,而過程中產(chǎn)生的甲烷及其產(chǎn)生的熱值是其主要收益,而使得濕垃圾無法得到適當(dāng)處理及收益率低下的主要原因來自于源頭分類的不徹底。
基于上述思路,本文探討了濕垃圾生物降解處理廠與居民之間形成的利益博弈,并通過逆向供應(yīng)鏈模擬以及應(yīng)用博弈理論模型和懲罰機(jī)制設(shè)計理論來設(shè)置處理廠與居民收益分配的相關(guān)條例,以提高垃圾分類效率及提高濕垃圾甲烷產(chǎn)率為主要目標(biāo),實現(xiàn)雙方最大化期望收益。
Savaskan R C等[3]討論了最優(yōu)回收策略與產(chǎn)品模塊化設(shè)計在逆向物流中的關(guān)系;Lee C H等[4]研究了如何通過供應(yīng)鏈協(xié)調(diào)實現(xiàn)產(chǎn)品退貨的相關(guān)問題。熊中楷等[5]采用收益分享合同研究了收益協(xié)調(diào)如何在二次消費中實現(xiàn)的問題以及如何通過收益分享合同提高干垃圾燃燒熱值從而降低垃圾焚燒發(fā)電廠成本的問題。上述文獻(xiàn)的研究表明:逆向供應(yīng)鏈中廢棄物回收數(shù)量與質(zhì)量問題能通過供應(yīng)鏈契約來進(jìn)行協(xié)調(diào),以實現(xiàn)雙方的收益最大化;懲罰機(jī)制的設(shè)計可以減少“搭便車”的行為。
但是,上述文獻(xiàn)都沒有考慮到在濕垃圾減量化、資源化的過程中如何應(yīng)用供應(yīng)鏈協(xié)調(diào)機(jī)制以及懲罰機(jī)制以提高其效率。因此,本文主要研究在垃圾可變處置費政策前提條件下,如何應(yīng)用動態(tài)博弈理論模型以及設(shè)置懲罰機(jī)制,從而提高居民參與垃圾分類的意愿和效率,正確分類垃圾并對其進(jìn)行簡單處理以提高可生物降解濕垃圾的甲烷產(chǎn)量。
本文假設(shè),濕垃圾回收處理過程中,處理廠始終占據(jù)著主導(dǎo)地位,采取“從量”的收費原則,通過調(diào)節(jié)收益分享比例,鼓勵居民為了得到自身利潤的最大化而對濕垃圾進(jìn)行簡單處理,以使?jié)窭淄槌霎a(chǎn)率最高,并回收大于等于該出產(chǎn)率的濕垃圾。參考自曹俊等[6]的相關(guān)研究,在居民自行簡單分揀生活垃圾后,假設(shè)其甲烷出產(chǎn)率呈線性增長,并按照該情況進(jìn)行排序。因此,本文假設(shè)居民自行分揀生活垃圾的成本為線性函數(shù),可知原濕垃圾甲烷出產(chǎn)率越低,將其提高的成本就越高。
收益分享契約下,占據(jù)主導(dǎo)地位的濕垃圾生物降解處理廠與居民之間的利益博弈符合Stackelberg理論模型。給定濕垃圾生物降解處理廠按照β的比例將收益分享給居民,而居民為使其期望利潤最大會將第q*噸濕垃圾確定為可回收最優(yōu)甲烷產(chǎn)率的垃圾,即出售q≥q*的濕垃圾給處理廠。而“從量”的垃圾處置費將針對小于q*數(shù)量的垃圾征收。最優(yōu)甲烷出產(chǎn)率的第q*噸垃圾既表示居民回收的可生物降解濕垃圾中最低的生物降解水平,也可得到居民回收的可生物降解濕垃圾的數(shù)量(Q-q*)。環(huán)衛(wèi)部門負(fù)責(zé)回收低于最優(yōu)甲烷產(chǎn)率的垃圾。
式Uc(q)=βmq-(a-bq)表示居民自行分揀加工后第q噸可生物降解濕垃圾的效用,居民的收益分享比例由β表示,居民自行分揀加工的固定成本由c來表示,單位可變加工成本由b來表示,濕垃圾生物降解處理廠處置可生物降解濕垃圾的單位收益表示為m,處理廠處理第q噸可生物降解濕垃圾的收益可表示為mq。
居民的期望利潤函數(shù)為:
(1)
生物降解處理廠處置單位可生物降解濕垃圾所得收益減去支付給居民的利益分配部分即為濕垃圾生物降解處理廠的期望收益:
(2)
獎勵機(jī)制的設(shè)置固然會提高居民參與垃圾分類的意愿與效率,但如果沒有相應(yīng)監(jiān)管機(jī)制的設(shè)立就會發(fā)生大量“搭便車”行為,從而削弱獎勵機(jī)制的效力。因此,本文假設(shè)存在強(qiáng)制度環(huán)境:政府部門實行強(qiáng)監(jiān)管力度、高查處率,對不合規(guī)垃圾分類行為的懲罰采取高強(qiáng)度的措施[7],而居民存在兩種垃圾分類行為分為合規(guī)的垃圾分類行為a0與不合規(guī)的垃圾分類行為a1。監(jiān)管部門提倡合規(guī)的垃圾分類行為a0,而查處和明令禁止不合規(guī)的垃圾分類行為a1。其中,居民實施行為ai時發(fā)生的自然回報假設(shè)為R(ai),i=0,1。
在該不合規(guī)垃圾分類行為獎懲機(jī)制的博弈模型中,居民與政府監(jiān)管部門之間的規(guī)則如下所述。
從居民角度來說,其需要為其選擇并實施的行為支付相應(yīng)的成本。由此,我們可知居民的行為選擇具有兩種不同的結(jié)果:
①當(dāng)居民選擇合規(guī)的垃圾分類行為a0時,政府部門檢測到不合規(guī)的垃圾分類行為a1的概率為0,此時居民以概率pr(a0)履行分類,且以概率pr(a0)獲得自然回報R(a0)。
②當(dāng)居民選擇不合規(guī)的垃圾分類行為a1時,那么其以pv(a1)的概率受到來自監(jiān)管部門的罰金V,未被發(fā)現(xiàn)則獲得R(a1)。
從政府監(jiān)管部門的角度出發(fā),當(dāng)其對居民進(jìn)行檢測時,一旦發(fā)現(xiàn)有不合規(guī)的垃圾分類行為a1,則必定以懲罰強(qiáng)度-V對居民實施懲罰,這是個隨機(jī)事件,它發(fā)生的概率pv(a1)≤1。只要監(jiān)管部門沒有檢測到不合規(guī)垃圾分類行為a1,就認(rèn)為居民實施的垃圾分類行為均為合規(guī)垃圾分類行為a0,則不對其進(jìn)行任何懲罰。因此,即使居民實施了不合規(guī)垃圾分類行為a1,但沒有被發(fā)現(xiàn)的概率為pv(a0)=1-pv(a1)。另外,政府對不合規(guī)的垃圾分類行為進(jìn)行檢測需要付出的成本被稱為觀測成本。
4.2.1 居民成本的數(shù)學(xué)函數(shù)
當(dāng)居民認(rèn)為實施某種不合規(guī)垃圾分類行為的預(yù)期收益超過合規(guī)的垃圾分類行為所帶來的收益時,就可能會從事該不合規(guī)垃圾分類行為。若居民選擇實施不合規(guī)垃圾分類行為時需要支付的成本為-pv(a1)V,其中,V<0。如果居民從事不合規(guī)垃圾分類行為的收益大于成本,即R(a1)>pv(a1)V或R(a1)+pv(a1)V>0時,居民就會選擇不合規(guī)垃圾分類行為a1。換言之,不合規(guī)垃圾分類行為的收益大于其成本是其行為發(fā)生的條件。
4.2.2 居民垃圾分類行為選擇的效用分析
根據(jù)不合規(guī)垃圾分類行為獎懲機(jī)制的博弈原理,我們可以分別計算得到居民選擇合規(guī)垃圾分類行為a0與不合規(guī)垃圾分類行為a1的期望回報,并從效用角度對該模型的懲罰機(jī)制進(jìn)行分析。
居民選擇并實施合規(guī)的垃圾分類行為a0的期望回報,即其效用U(a0)為:
U(a0)=pr(a0)R(a0)-(c-bt)
(3)
居民選擇并實施不合規(guī)垃圾分類行為a1的期望回報,即其效用U(a1)為:
U(a1)=pr(a1)R(a1)+pv(a1)V
(4)
不合規(guī)垃圾分類行為的直接目的是避免合規(guī)垃圾分類所產(chǎn)生的時間和精力成本。當(dāng)U(a0)>U(a1)時,即合規(guī)的垃圾分類行為的效用大于不合規(guī)垃圾分類行為的效用時,居民會選擇合規(guī)垃圾分類行為而不會選擇不合規(guī)垃圾分類行為;當(dāng)U(a0)U(a1),居民選擇合規(guī)的垃圾分類行為a0。
將式(3)、式(4)代入式(5),整理得:
(5)
當(dāng)不合規(guī)垃圾分類行為獎懲機(jī)制滿足式(6)時,居民的最優(yōu)選擇是回避風(fēng)險,即選擇合規(guī)的垃圾分類行為a0,即此時該獎懲機(jī)制是有效的。可見,居民兩種行為選擇所影響的參數(shù)之間的差值和監(jiān)管部門的觀測力度決定了不合規(guī)垃圾分類行為獎懲機(jī)制的有效性,分別定義為自然回報期望之間的差值pr(a1)R(a1)-pr(a0)R(a0)、懲罰強(qiáng)度-V和觀測強(qiáng)度pv(a1)。
已知不合規(guī)垃圾分類行為獎懲機(jī)制有效的必要條件為:
(6)
即:-pv(a1)V>[pr(a1)R(a1)-pr(a0)R(a0)]+(c-bt)
(7)
從而得到不合規(guī)垃圾分類行為獎懲機(jī)制的制度強(qiáng)度[8],設(shè)為J,來衡量該不合規(guī)垃圾分類行為獎懲機(jī)制有效性的強(qiáng)弱。有:
J=-pv(a1)V-[pr(a1)R(a1)-pr(a0)R(a0)]-(c-bt)
(8)
我們可以通過簡單計算制度強(qiáng)度指標(biāo)J來衡量該不合規(guī)垃圾分類行為獎懲機(jī)制模型的有效性。當(dāng)J>0時,該制度是有效的,其達(dá)到了使居民選擇合規(guī)的垃圾分類行為a0的效果;當(dāng)J≤0時,該制度是無效的。
為了使垃圾分類的效率盡量提高以及制止不合規(guī)垃圾分類的行為,針對長期存在的不合規(guī)垃圾分類行為,政府部門需要對居民采取一定的監(jiān)督懲罰措施。我們以監(jiān)管部門與居民之間的混合策略博弈模型為例進(jìn)行分析。
假設(shè)當(dāng)居民實行合規(guī)的垃圾分類行為時,不論監(jiān)管部門監(jiān)管與否,監(jiān)管部門都會獲得正效用(給定M為常數(shù));而當(dāng)居民實行不合規(guī)的垃圾分類行為且監(jiān)管部門又嚴(yán)厲查處時,監(jiān)管部門會在獲得正效用M的基礎(chǔ)上,再額外獲得一部分效用m,與居民實行的不合規(guī)垃圾分類行為程度σ有關(guān),設(shè)m=m(σ)>0;設(shè)監(jiān)管部門投入的觀測成本為C,它與監(jiān)管強(qiáng)度μ=pv(a1)成正相關(guān),即觀測力度越大投入的成本越高,并設(shè)C=C(μ)≥0;如果監(jiān)管部門不對垃圾分類行為進(jìn)行監(jiān)管,就會受到來自國家的懲罰P,這個懲罰通常與監(jiān)管部門的失職程度λ相關(guān),設(shè)P=P(λ)≥0。
在信息不對稱的情況下,居民不合規(guī)垃圾分類行為被檢測的概率會因監(jiān)管部門的監(jiān)管力度不同而不同。并假設(shè)當(dāng)存在居民不合規(guī)垃圾分類行為時,只要監(jiān)管部門進(jìn)行監(jiān)管,就會以pv(a1)的觀測概率檢測到不合規(guī)垃圾分類行為,那么,不合規(guī)垃圾分類行為未被檢測到的概率為1-pv(a1)。
同樣的,設(shè)居民選擇不合規(guī)垃圾分類行為的概率為0≤q(a1)≤1,則1-q(a1)即為選擇合規(guī)垃圾分類行為的概率。在不合規(guī)垃圾分類行為懲罰機(jī)制的純策略博弈模型的基礎(chǔ)上建立一個混合策略的博弈模型,如表1所示。在雙方的博弈模型中,居民有兩種策略:合規(guī)的垃圾分類行為或者不合規(guī)的垃圾分類行為,分別用a0,a1表示;監(jiān)管部門也有兩種策略:不監(jiān)管或者監(jiān)管,分別用b0,b1表示。
表1 不合規(guī)垃圾分類行為獎懲機(jī)制的混合策略博弈模型
分別計算居民和監(jiān)管部門的期望收益。
①設(shè)居民的期望收益為EUA,得:
EUA=[pr(a0)R(a0)-(c-bt)][1-q(a1)]+pr(a1)R(a1)q(a1)+pv(a1)q(a1)V
(9)
②同理,可得監(jiān)管部門的期望收益為:
EUB=[M-(M+P)q(a1)]-Cpv(a1)+(M+m+P)pv(a1)q(a1)-C+(M+m+P)q(a1)=0
(10)
(11)
在式(11b)中,政府每年用于監(jiān)管不合規(guī)垃圾分類行為的觀測成本C(μ)基本持平,M為常數(shù)且m(σ)>0,故當(dāng)增大國家對監(jiān)管部門的懲罰P(λ)時,居民選擇不合規(guī)垃圾分類行為的概率q(a1) 本文研究了變動垃圾處置費政策前提條件下,濕垃圾生物降解處理廠如何與居民進(jìn)行利益博弈,通過建立兩階段動態(tài)博弈理論模型,討論了如何制定收益分享以鼓勵居民實行垃圾源頭分類,通過收益分享的形成提高再生資源進(jìn)行有效利用、提高垃圾處理的針對性和有效性[9]。監(jiān)管部門若能對居民的垃圾分類行為進(jìn)行一定的監(jiān)督,并給予不合規(guī)垃圾分類行為以一定的懲罰,就能夠使居民選擇合規(guī)的垃圾分類行為。相應(yīng)獎懲機(jī)制的設(shè)立有助于解決這個囚徒困境。因此,本文的研究對于政府部門制定進(jìn)一步的生活垃圾處置規(guī)則及采取何種獎懲機(jī)制以促進(jìn)居民自行實行源頭分類具有一定的現(xiàn)實意義。5 結(jié)語