王道平, 張 可, 周 玉
(北京科技大學 經濟管理學院,北京 100083)
隨著科技的進步和人們生活水平的提高,我國的家電制造企業不斷推出綠色健康、智能型的家電產品,在提高消費者生活水平的同時,也導致了廢棄電器電子產品數量的急劇增加[1]。如果這些產品得不到及時合理的處理,將嚴重污染環境。在社會責任和利潤驅使下,回收再制造企業越來越意識到逆向供應鏈所帶來的戰略價值,據相關研究表明,廢棄電器電子產品經過集中無害化加工處理后,99%的資源可以進行再利用,為企業帶來了極大的經濟效益。由于回收具有一定的外部經濟性,回收率也因受到各種不確定因素的影響而呈現不穩定性,所以政府有必要采取相應的獎懲機制對閉環供應鏈成員進行引導。因此,如何進行有效的回收處理成為政府和企業亟待解決的重要課題。
隨著對供應鏈中逆向物流研究的不斷深入,回收行為作為企業的重要一環愈加具有戰略價值,不少學者基于不同視角對企業回收再制造行為進行了深入的研究。Chen Jun等[2]考慮了回收品管理成本和再制造成本,探究直接和間接兩種回收模式對企業收益的影響。李曉靜等[3]以競爭性供應鏈為背景對回收渠道進行研究,從回收率和共贏角度分析了最優回收渠道的選擇。黃少輝等[4]通過構建四種回收渠道模型,發現零售商、第三方和制造商共同承擔回收責任時系統效益最大。曹柬等[5]基于企業收益、消費者剩余和回收率等視角對回收渠道偏好進行研究,結果表明制造商回收渠道下的回收率最高。此外,王忠偉等[6]就回收模式/渠道的選擇、回收策略的比較和制定等方面對回收問題的研究現狀進行分析綜述,并提出復雜環境下多主體混合渠道的選擇問題,多群體不同策略下補貼方式的判定和選擇問題將是未來閉環供應鏈回收問題的研究重點。
以上研究大多以制造商主導的閉環供應鏈為背景,然而近年來,我國家電行業中,國美、蘇寧等大型電器零售商在供應鏈中的地位不斷上升,零售商主導的供應鏈受到國內外學者的廣泛關注。王竟竟等[7]在三種不同渠道權力結構下,分析了聯盟策略下閉環供應鏈的決策問題,發現制造商和零售商勢力均衡時供應鏈期望收益最大。姚鋒敏等[8]研究了雙回收渠道下零售商主導的閉環供應鏈的最優決策問題,結果表明零售商回收更有利于提高系統的整體利潤。王婷婷等[9]運用納什均衡博弈的方法,分別構建了四種供應鏈形態下的逆向物流產品回收決策模型,發現零售商主導時可實現供應鏈共同利潤最大化。Giri等[10]從集中式和分散式的角度研究制造商和第三方共同回收的閉環供應鏈定價和退貨產品收集決策,結果表明零售商主導的分散化情形更有利于供應鏈獲利。
上述文獻并未考慮政府的因素,隨著供應鏈回收模式研究的深入,部分學者開始考慮政府對渠道成員回收的引導作用。Liu等[11]通過構建雙渠道回收競爭模型研究政府補貼對回收的影響,研究表明政府補貼力度越大,對回收量的刺激越弱。張漢江等[12]發現政府補貼政策降低廢舊品處理成本的同時還能有效提高再制造品競爭優勢。孫浩等[13]通過建立制造商回收模式下的多期閉環供應鏈網絡均衡模型,發現政府實施補貼機制有助于促進渠道成員合作進而改善網絡績效。除了上述考慮政府補貼的研究外,為提高政府參與的有效性,有關政府獎懲機制的研究也愈加深入。石純來等[14]進一步研究了規模不經濟情形下,政府獎懲機制對制造商合作策略的影響,發現制造商合作動機大小與政府的獎懲力度相關,合作行為能增加回收量。王文賓等[15]從回收責任分擔的角度建立了四個博弈模型,研究了零售商主導的閉環供應鏈中政府對不同主體實施獎懲機制對回收率的影響,但其研究側重于靜態博弈,并未考慮回收率的動態特征。馬德青等[16,17]利用伊藤過程來刻畫回收率的隨機演進過程,構建微分博弈模型研究具公平行為的供應鏈成員動態均衡決策問題,魯馨蔓等[18]考慮時間因素對產品技術先進度的影響,研究云服務供應鏈技術創新和產品的動態定價問題。但利用微分博弈理論研究政府獎懲對閉環供應鏈成員策略影響的成果較少。
綜上所述,學者們的研究主要集中于回收渠道的選擇和策略的制定對于渠道成員績效的影響以及政府獎懲對降低回收成本和提高回收率的作用,取得了一定的成果。然而大部分研究均是從靜態角度進行分析,但回收行為具有一定的外部經濟性,動態研究更能描述供應鏈成員的持續博弈和均衡策略。因此,本文在已有研究成果的基礎上,以零售商主導的閉環供應鏈為背景,考慮了時間因素對回收率的影響,引入動態回收過程和HJB階段控制,分別構建了政府對不同主體實施獎懲機制的三種微分博弈模型,并對三種模式下系統達到穩定狀態和未達到穩定狀態時的決策均衡解進行了比較分析,使研究更具實際意義。
本文研究零售商主導、制造商回收的閉環供應鏈中成員的動態均衡策略。假設新品和再制品同質,消費者購買兩種產品的價格無差別[19]。制造商負責新產品的制造和廢棄電器電子產品的回收再制造,并以同一批發價格w(t)批發給零售商,零售商以同一零售價格p(t)銷售給消費者。兩者均為風險中性的理性決策者,均以計劃期內的利潤最大化為決策目標,采取Stackelberg微分博弈。政府分別對供應鏈不同成員實施獎懲機制,并設置獎懲力度b和目標回收率τ0,當實際回收率τ>τ0時,政府對相應成員進行獎勵,反之則進行懲罰。假設單位再制品僅由單位回收產品制造而成。為了激勵再制造商進行回收,還需滿足廢棄電器電子產品的殘值Δ大于制造商回收努力投入成本。符號及其含義見表1。

表1 模型符號及其含義
本文在已有研究的基礎上細化了對回收率的描述,認為回收率不僅受到制造商自身回收努力的影響,還受到市場競爭、回收設施老化等各種不可控因素的影響,因此回收率的變化本質上是一種動態隨機過程,參考馬德青[16,17]對回收過程內在動態特性的刻畫,本文認為回收努力對回收率有正向影響,不可控因素對回收率有負向影響,回收率的演化規律可表述如下:
(1)
假設制造商回收投入成本函數為kA2(t)/2(k>0),零售商除批發產品外不產生其他成本,則制造商和零售商的利潤可分別表述如下:
πM(t)=(w(t)-(cn+Δτ(t))·
(2)
πR(t)=(p(t)-w(t))(a-βp(t)+ητ(t))
(3)
其中,w(t)-cn和Δτ(t)分別表示正向和逆向供應鏈為制造商帶來的邊際利潤;a-βp(t)+ητ(t)表示市場需求;p(t)-w(t)表示正向供應鏈為零售商帶來的邊際利潤。
本文從回收責任分擔的角度引入政府獎懲力度,分別構建了三種獎懲機制模式:即政府不對制造商和零售商實施獎懲機制(模式N)、政府只對制造商實施獎懲機制(模式M)以及政府同時對制造商和零售商實施獎懲機制(模式C)。
為了保證模型的完整性和可參考性,本節不考慮政府獎懲機制對閉環供應鏈的影響,作為基準模型與其他模型進行對比。模式N下,以零售商主導的閉環供應鏈系統均衡決策的Stackelberg微分博弈模型表述如下:

(4)
命題1模式N下,制造商最優批發價格、最優回收努力投入、零售商最優零售價格、制造商和零售商最優利潤以及系統回收率分別為:
wN(τN)=((η-3Δβ)τN(t)+a+3βcn)/4β
(5)
AN(τN)=(2f1τN(t)+f2)ρ/k
(6)
pN(τN)=((3η-Δβ)τN(t)+3a+βcn)/4β
(7)
(8)
(9)
(10)

由命題1可知,模式N下制造商和零售商的最優利潤都與τN正相關,這表明提高回收率同時有助于兩者獲利。模式N下制造商的最優回收努力投入與τN正相關,這是因為回收率的提高有利于制造商獲利,進而促使制造商付出更多的回收努力投入。當時間趨于無窮時,回收率趨于一個穩態值,所以制造商回收努力投入并非越多越好,有必要引入政府獎懲機制對供應鏈成員進行引導。
從我國實施生產者延伸責任制的影響中可以看出,制造商在回收過程中起著至關重要的作用,存在政府只對制造商進行引導的情形。假設制造商得到政府的獎勵(懲罰)為b|τ-τ0|[20],閉環供應鏈的Stackelberg微分博弈模型表述如下:

(11)
命題2模式M下,制造商最優批發價格、最優回收努力投入、零售商最優零售價格、制造商和零售商最優利潤以及系統回收率分別為:
wM(τM)=((η-3Δβ)τM(t)+a+3βcn)/4β
(12)
AM(τM)=(2s1τM(t)+s2)ρ/k
(13)
pM(τM)=((3η-Δβ)τM(t)+3a+βcn)/4β
(14)
(15)
(16)
(17)

由命題2可知,模式M下制造商和零售商的最優利潤都與τN正相關。這表明該模式下回收率的提升可同時給兩者帶來更高的利潤。模式M下制造商的最優回收努力投入和穩態回收率都與b正相關。這表明隨著政府獎懲力度的增大,制造商會投入更高的回收努力,進而提高回收率和環保效益。因此,模式M能夠進一步挖掘廢棄電器電子產品的殘值,減少對環境的破壞。
隨著管理決策權力逐漸由制造商向零售商轉移,零售商成為供應鏈的主導者,其在銷售過程中環保觀念的滲透有助于提高回收率,而回收行為又間接作用于零售商,所以制造商和零售商同時承擔回收責任具有一定的合理性。模式C下,假設零售商承擔的獎勵(懲罰)為ub|τ-τ0|,則制造商承擔的獎勵(懲罰)為(1-u)b|τ-τ0|,閉環供應鏈的Stackelberg微分博弈模型表述如下:

(18)
命題3模式C下,制造商最優批發價格、最優回收努力投入、零售商最優零售價格、制造商和零售商最優利潤以及系統回收率分別為:
wC(τC)=((η-3Δβ)τC(t)+a+3βcn)/4β
(19)
AC(τC)=(2x1τC(t)+x2)ρ/k
(20)
pC(τC)=((3η-Δβ)τC(t)+3a+βcn)/4β
(21)
(22)
(23)
(24)

由命題3可知,模式C下制造商和零售商的最優利潤都與τN正相關,結合命題1和2可知,三種模式下回收率的提升都可以同時為兩者帶來更高的利潤,因此,積極開展回收活動增強消費者環保意識以提高回收率對供應鏈雙方成員都有利。模式C下制造商的最優回收努力投入和回收率都與b正相關。結合命題2可知,政府只要對制造商實施獎懲機制,就能激勵制造商投入更高的回收努力,進而提高回收率,但兩種模式下獎懲機制的促進效果不同,具體分析見第3節。結合命題1~3可知,最優批發價格和最優零售價格與τN的關系取決于廢棄電器電子產品再制造所帶來的利潤殘值,具體分析見第3節。


推論1表明,模式M下回收率最大,模式C次之,模式N下最小。說明政府對供應鏈成員實施獎懲機制有利于提高回收率,但在模式M和模式C下,獎懲力度對回收率的影響程度不同,這是因為制造商直接參與回收再制造過程,相比于雙方共同承擔回收責任,制造商單獨承擔更容易提高回收率。

推論2表明,模式M下制造商回收努力投入最大,模式C次之,模式N下最小。結合推論1,模式M和模式C之所以能提高回收率,是因為政府對供應鏈成員實施獎懲機制可以促使制造商投入更多的回收努力,但獎懲力度對制造商回收努力投入的影響程度不同,這說明雖然零售商是閉環供應鏈的領導者,但其并沒有直接參與回收再制造的過程,所以當兩者同時承擔回收責任時,削減了政府只對制造商實施獎懲機制的激勵作用,因此導致模式M下穩態回收率和制造商回收努力投入都高于模式C下的對應值。

推論3表明,廢棄電器電子產品的殘值對批發價格和零售價格都有重要影響。同一種模式,隨著殘值的增加,零售價格和批發價格都先增加后減小,且零售價格的變化趨勢緩于批發價格,即零售價格減去批發價格的差值都增加。這表明殘值越大,消費者剩余價值越大,越有助于降低雙重邊際效應。

推論4表明,當消費者對產品的邊際支付意愿一定時,模式M下消費者剩余價值最大、模式C次之、模式N下最小。這說明模式M能夠最大程度的減緩分散決策給閉環供應鏈帶來的雙重邊際效應。相較于模式N,模式C也有助于減緩雙重邊際效應,進而從消費者剩余角度證明了政府實施獎懲機制的重要性。
推論5模式N、M和C下的制造商最優利潤穩態值比較:



由于零售商最優利潤的比較過于繁瑣,因此在第4節算例分析中進行說明。
本節通過算例對閉環供應鏈成員均衡策略進行了穩態和非穩態分析。穩態分析研究當系統達到穩定狀態時,政府獎懲力度對系統回收率、制造商和零售商穩態策略以及最優利潤的影響。非穩態分析研究當政府獎懲力度一定時,系統回收率和供應鏈成員均衡策略在不同模式下隨時間變化的對比情況。
為了分析政府獎懲機制實施主體不同對系統回收率、成員穩態策略和最優利潤的影響,參數賦值如下:ɑ=1,β=0.5,η=0.01,r=0.05,Δ=0.3,ρ=1,k=1,σ=0.3,cn=0.5,τ0=0.4,μ=0.4,為了保證各穩態策略值有意義,分別計算政府獎懲力度b=0,0.1,0.2,0.3下三種模式的策略,結果如表2所示。

表2 政府獎懲力度敏感性分析
表2將模式N作為基準模式與其他模式進行對比,分析結果如下:(1)就穩態回收率而言,模式N下穩態回收率始終低于目標回收率,不利于制造商和零售商獲利,證實了政府實施獎懲機制的重要性。隨著政府獎懲力度的增大,模式M和模式C都有助于提高系統回收率,但相比模式C,模式M更有利于提高系統回收率。結合兩種模式下制造商的回收努力投入變化情況可知,制造商單獨承擔回收責任有助于直接激勵制造商投入更高的回收努力進而提高系統回收率,進一步證實了推論1和2。(2)就成員定價策略而言,隨著政府獎懲力度的增加,模式M和模式C都能降低批發價格和零售價格。相比于模式C,模式M下批發價格和零售價格降低更為明顯,兩者的差值增加的也更明顯,假設消費者對產品的邊際支付意愿為定值,則政府只對制造商實施獎懲機制時,消費者剩余價值更高,更能緩解閉環供應鏈中的雙重邊際效應,進一步證實了推論3和4。
圖1~圖3分析了當時間趨于無窮即閉環供應鏈系統達到穩定狀態時,三種不同獎懲模式下政府獎懲力度b對閉環供應鏈成員獲利水平的影響。
圖1~圖3表明,(1)隨著b的增大,模式M和模式C下,制造商的最優利潤都是先減小后增大的,進一步證實了推論5,但其數值變動過于微小,因此不予考慮。整體變化主體趨勢是增大,且模式M下制造商最優利潤的增長速度快于模式C,兩種模式下制造商的最優利潤都大于模式N下對應值。因此,就制造商利潤的整體變化趨勢而言,模式M最有利于提高制造商的獲利水平。(2)隨著b的增大,模式M和模式C下零售商的最優利潤持續增加,相比于模式N,模式M和模式C都有助于提高零售商的獲利水平。且在政府獎懲力度的合理區間(0~0.3)內,模式M下零售商的最優利潤大于模式C下的對應值,由此可見,當零售商分擔回收責任時,會降低自身利潤。(3)隨著b的增大,模式M和模式C下供應鏈的最優總利潤持續增加,且模式M下供應鏈總利潤更大。結合圖1和圖2可知,當零售商分擔回收責任時,不僅不利于自身獲利,還會降低制造商的獲利水平,進而降低整個供應鏈的總利潤。
為了突出時間特性,本文在給定政府獎懲力度為0.05時,分別繪制了三種獎懲模式下系統回收率隨時間變化特性(圖4)、制造商回收努力投入隨時間變化特性(圖5)、閉環供應鏈成員價格隨時間變化特性(圖6、圖7)以及閉環供應鏈成員最優利潤隨時間變化特性(圖8~圖10),分析結果如下。
圖4和圖5表明,隨著時間的推移,三種模式下回收率和制造商的回收努力投入均趨于各自的穩態值。相較于其他模式,模式N下回收率低于目標回收率且制造商回收努力投入最低。結合上節穩態分析可知,模式M下,無論是否達到穩態,回收率和制造商回收努力投入都始終高于其他模式。因此,政府可適當加大對制造商的獎懲力度以激勵制造商積極回收。三種模式下的回收努力投入均無明顯變化,這是因為回收率具有飽和效應,過高的回收努力投入并不能帶來同等程度的回收率的提升。
圖6和圖7表明,模式N下批發價格和零售價格都會隨著時間的推移而增加,模式M和模式C則恰好相反,且批發價格隨時間變化的敏感度更大,這說明模式M可有效降低制造商的批發價格,零售商得到讓利后也會相應降低零售價格,由此降低閉環供應鏈的雙重邊際效應以提高消費者剩余,進而使消費者增強回收意識,促使回收率的進一步提高以形成良性循環。


圖8~圖10表明,政府獎懲力度一定時,模式N下制造商利潤、零售商利潤以及閉環供應鏈總利潤隨著時間的推移都有輕微下降的趨勢,這說明政府參與下的閉環供應鏈運營才更加有效。模式M和模式C都會提高制造商利潤、零售商利潤以及閉環供應鏈總利潤,但相比于模式C,模式M對成員利潤的提升作用更為明顯。結合上節的穩態分析可知,模式M下,無論閉環供應鏈系統是否達到穩態,制造商、零售商以及閉環供應鏈總利潤都始終高于其他模式,且在零售商主導的閉環供應鏈中,零售商的獲利水平都高于制造商的獲利水平。
本文考慮了政府獎懲機制,研究了零售商主導、制造商回收的閉環供應鏈中成員的動態均衡策略,得出了三種模式下系統回收率、制造商回收努力投入和批發價格策略、零售商零售價格策略以及成員的最優利潤,在此基礎上對系統穩態和非穩態時的均衡解進行了比較分析,并揭示了回收責任分擔主體的不同對供應鏈成員策略和利潤的影響,得出了以下結論和管理啟示:(1)政府實施獎懲機制對供應鏈成員進行引導是有效的,當政府實施獎懲機制時,有利于提高消費者剩余價值,提高制造商、零售商以及供應鏈整體的利潤水平,且系統回收率高于目標回收率,因此,政府有必要對供應鏈成員進行獎懲以引導其作出最優決策。(2)政府只對制造商實施獎懲機制可實現最低的批發價格和零售價格,最大程度的降低因分散決策給閉環供應鏈帶來的雙重邊際效應,有利于激勵制造商投入更多的回收努力。長期看來,這種模式下系統回收率和閉環供應鏈總利潤都是最高的。由此可見,該模式是最優選擇,可以同時提高經濟和環保雙重效益。(3)當政府同時對制造商和零售商實施獎懲機制時,零售商分擔回收責任的同時,也削減了政府對制造商回收的激勵作用,導致系統回收率高于無獎懲機制時的回收率但低于政府只對制造商實施獎懲機制時的回收率,雖然這種模式不是最經濟有效的,但是也能減緩雙重邊際效應,讓利于消費者。(4)在同一種模式下,制造商回收努力投入隨時間推移變化都不明顯,說明回收努力投入應適量且持續,過高的投入并不能帶來同等程度的回收率的提升,制造商需要合理分配資源,避免出現過高的回收努力投入所帶來的非經濟效應。
本文研究了信息對稱時三種模式下政府獎懲機制對單一制造商和零售商組成的閉環供應鏈成員策略以及利潤的影響,但現實中一條供應鏈由多個制造商和多個零售商構成且存在信息不對稱的情況。因此,考慮多個制造商和零售商競爭情形以及信息的非對稱性將是下一步的研究方向。