錢鑫陽, 李 芳
(上海理工大學 管理學院,上海 200093)
隨著人口、資源和環境之間的矛盾日益增長,循環經濟的發展越來越重視廢舊資源回收再利用。規模巨大的回收、再制造工作需要可持續的閉環供應鏈(CLSC)予以支持[1],傳統的廢舊資源回收體系上下游之間耦合協調程度較低。相關企業在技術、產品、信息上的互補性欠缺[2],未能形成協同發展。因此,造成廢舊資源回收利用效率不高的關鍵在于回收商、再制造商之間存在信息壁壘。解決信息不對稱、提高廢舊資源回收效率,是一個值得關注的問題。
當前已有眾多學者對CLSC開展了深入研究,但各成員間的信息不對稱問題仍是難點。云制造作為一種新型制造模式,使分散的資源被迅速調度利用[3-5],為解決信息不對稱問題提供了新的思路。由于在云平臺中存在自身核心資源被竊取的風險[6],CLSC成員將基于理性的收益分析選擇是否參與到云平臺信息共享中。為研究CLSC成員的信息共享積極性,本文構建了政府部門、回收商、再制造商之間的三方演化博弈模型,探究CLSC成員是否利用云平臺進行信息共享的策略選擇及其影響因素。
與本文相關的文獻主要集中在CLSC回收決策研究、信息不對稱和云制造在供應鏈中的研究這兩個方面。
a.CLSC 回收決策研究。
CLSC回收決策的研究主要包括以下幾個方面:第一,回收渠道的選擇。Savaskan等[7-8]對不同回收渠道進行比較,發現零售商的回收效率和供應鏈整體利潤最優,并分析零售商價格競爭的影響。曹柬等[9]考慮再制造成本,從消費者剩余出發,通過比較回收量和再制品產量,以求最優的回收渠道。孫浩等[10]研究三種雙渠道回收模式的供應鏈利潤受競爭性供應鏈的競爭強度的影響。公彥德等[11]對比雙渠道和三渠道混合回收模式,得出最優回收策略。隨著信息技術的發展,范定祥等[12]比較包括線上回收商在內的四種混合回收渠道,發現由線上和線下回收商、零售商、制造商構成的供應鏈整體利潤最優。第二,從回收策略來看。王道平等[13]考慮拆解商回收努力等因素,研究CLSC成員不同合作方式的最優策略和利潤。蘭龍輝等[14]考慮分銷商和零售商的互惠偏好,應用合作博弈模型協調供應鏈的利潤。繆朝煒等[15]基于以舊換新政策對比研究3種CLSC的最優定價與回收策略。
b.信息不對稱和云制造在供應鏈中的研究。
非對稱信息在CLSC中的研究,一是關于信息不對稱條件下的激勵合同設計,研究如何設計契約合同以獲取不對稱信息,提升供應鏈成員的利潤[16-17]。Biswas等[18]發現線性的關稅和數量折扣契約可以協調供應鏈的利潤。二是研究政策因素下的最優回收再制造策略。李芳等[19]發現,政府最優規制水平下信息不對稱僅對單個成員收益有利,影響CLSC系統利潤。張盼等[20]在零售商的回收成本信息是不對稱時,探究制造商最優激勵合同設計問題。Wang等[21]運用委托代理理論研究雙渠道CLSC模型,設計信息篩選契約使制造商獲得真實信息。
盡管眾多研究提出針對信息不對稱的策略,但信息不對稱仍存在于供應鏈中。有學者提出在供應鏈成員間實施基于云平臺的供應鏈集成[22-23]。Kochan等[24]發現基于云平臺的信息共享提升醫療供應鏈的響應能力。Novais等[25]發現云平臺可以提高物流業務績效,達到精益生產的目的。
以上研究大多關注信息不對稱對供應鏈利潤的影響,對于如何解決信息不對稱以及信息共享積極性的討論較少。本文在以往研究的基礎上,在政府規制下,考慮由單個回收商和單個再制造商組成的供應鏈。政府將回收和拆解工作轉移給回收商負責,自身僅承擔監管作用[26],再制造商則負責制造再制品。基于云平臺的思想,產品的全生命周期與CLSC全過程緊密聯系起來,形成有價值的從產品制造到末端資源回收再利用的全過程回收管理模式(見圖1),為實現廢舊資源的有序、可控、可再生和資源化利用提供決策依據。

圖1 云環境下的信息、資源流圖Fig.1 Information and resource flow diagram in cloud environment
在CLSC中,回收商擁有回收、拆解的能力和回收價格信息,再制造商擁有產品制造、市場產品數量、分布等資源。雙方利用云平臺獲取互補信息和高效率的超額收益,但也面臨核心技術外泄的風險。基于自身利益考慮,回收商和再制造商的策略空間為{積極共享,消極共享}。政府將自身公共責任轉移,為確保廢舊資源回收再制造工作高效開展,政府可選擇監管,考慮到監管成本,也可能選擇消極監管。因此,政府的策略空間為{積極監管,消極監管}。三方之間信息不對稱且均為有限理性人,在博弈中通過了解其他主體的策略以調整自身策略,最終達到穩定均衡狀態。
PG:政府積極監管下的社會公共收益(如:利用云平臺共享后,回收再制造產業趨于規范,效率得到提升,環境變好);
CG:政府積極監管的成本;
FG:政府積極監管下對回收商消極共享的懲罰所得;
Ar,AR:雙方利用云平臺積極共享時,回收商/再制造商獲得的收益;
Cr,CR:回收商/再制造商利用云平臺積極共享的設備成本;
?Ar, ?AR:回收商/再制造商長期積極共享的額外收益(如:業內聲譽得到提升);
Nr:回收商消極共享、再制造商積極共享時,回收商的收益;
NR:再制造商消極共享、回收商積極共享時,再制造商的收益;
Fr:回收商消極共享受到政府的懲罰;
FR:再制造商消極共享的行業損失(如:獲得回收品的成本增加);
Ir:回收商積極共享的設備信息化收益;
LR:再制造商積極共享的技術泄露損失;
fR:再制造商單方積極共享的技術泄露風險;
:雙方積極共享,簽訂協同制造合約后,再制造商的技術泄露風險;
SG,Sr,SR:三方均為消極策略的產業損失。SG表示行業不規范帶來的社會公共損失,Sr表示回收商由于缺乏再制造信息造成回收品拆解不當、拆解件無法取得高售價的損失;SR表示再制造難以獲得優質回收品的損失。
H1:政府積極監管的概率為 α,消極監管的概率為1 ?α。回收商、再制造商的策略概率分別以含β,γ的式子表示,且 α ,β,γ ∈ [0,1];
H2:接入云平臺需耗費設備成本,回收商需購置設備、建立信息系統,再制造商由于本身多生產性業務,信息化程度較高,設備投入較少,即Cr>CR;
H3:共享制造資源還需承擔制造資料被竊取的風險。再制造商單方積極共享的技術泄露風險大于雙方積極共享簽訂協同制造合約后的技術泄露風險,即 0 H4:雙方積極共享的收益大于單方積極共享的收益,即Ar>Nr,AR>NR; H5:Sr>Cr??Ar?Ir>Cr??Ar?Ir?Ar+Nr,即回收商在發生市場秩序混亂時受到的損失Sr大于消極共享與積極共享相比所獲得的收益增量Cr??Ar?Ir。 當政府積極監管或消極監管時,三方收益矩陣如表1和表2所示。 表1 政府積極監管時的三方收益矩陣Tab.1 Tripartite payoff matrix under active government supervision 表2 政府消極監管時的三方收益矩陣Tab.2 Tripartite payoff matrix under passive government supervision 由此,根據演化博弈的復制動態方程理論構建三方博弈復雜動態非線性系統: 為研究三方演化穩定策略,本文利用Lyapunov間接法和赫爾維茲穩定判據對該非線性系統的平衡點穩定性進行分析。 a.Lyapunov間接法:雅可比矩陣所有特征根都為負實部,則對應的均衡點漸進穩定;至少有一個特征根實部大于0,則均衡點不穩定;有一個特征根實部等于0,則均衡點穩定性不能判定。 b.赫爾維茲穩定判據:對三階雅可比矩陣H來說,其特征根均為負實部的充要條件為:T r(H)<0,其中: T r(H)為矩陣H的跡; Je t(H)為矩陣H的行列式;為矩陣H的所有二階主子式的行列式之和。 由F1(α,β,γ)=0, 可 得 α1=0,α2=1 或 β1=由F(α,β,γ)=0, 可 得 β=0,22β3=1或 γ(Ar?Nr)?α(Sr?Fr)+Ir+?Ar?Cr+Sr=0。 由F3(α,β,γ)=0, 可 得 γ1=0,γ2=1或 β4=由此求得政府、回收商、再制造商的演化穩定策略。各方策略相互組合,形成該演化博弈的平衡點。 a.對平衡點進行討論,得到以下3種情形: (a) 情形 1。 ?CR+?AR?fRLR+FR>0,即FR>CR??AR+fRLR。 面對回收商消極共享的策略,此時,再制造商積極共享與消極共享的收益之差大于0,自身損失FR大于收益增量,即再制造商消極共享的損失力 度 足 夠 。 有 β1>1(因 為PG>CG), β4<0。 因此,此情形下的平衡點為: (b)情形 2。(FR?CR+?AR?fRLR)?(?AR+NR+fR?LR?fRLR)>0,即FR>CR??AR?AR+NR+fR?LR。 面對回收商積極共享的策略,再制造商消極共享的損失力度足夠。有 β1>1, β4>1。因此,此情形下的平衡點與情形1相同。 面對回收商積極共享的策略,再制造商消極共享與積極共享的收益之差小于0;面對回收商消極共享的策略,再制造商積極共享與消極共享的收益之差小于0,自身損失FR介于兩者之間,說明再制造商消極共享的損失力度溫和。 b.對情形 3 的討論。 由情形3可知,有 0 <β4<1。當平衡點選擇β=β4時,可再分以下兩種情形: (a)情形3.1: α =α1=0,由F2(α,β,γ)=0可知,γ=Cr?Ir??Ar?Sr。由假設條件H5可知,S>1Ar?Nrr Cr??Ar?Ir,則有 γ1<0。 (b)情形3.2: α =α1=1,由F2(α,β,γ)=0可知,γ=Cr?Ir??Ar?Fr。由于F的大小未知,需作進1Ar?Nrr 一步討論。 c.對情形 3.2 的討論。 (a)情形 3.2.1:Fr 再制造商積極共享時,回收商消極共享與積極共享的收益之差大于0,表示回收商受到的監管懲罰小于消極共享與積極共享的收益增量,即政府對回收商的懲罰力度不夠。此情形下, γ1>1,平衡點與情形1相同。 (b)情形 3.2.2:Fr>Cr?Ir??Ar。 再制造商消極共享時,同理可得,在此情形下, γ1<0,平衡點與情形1相同。 (c) 情 形 3.2.3:Cr?Ir??Ar?Ar+Nr 此時,回收商受到的懲罰介于兩者之間,政府對回收商的懲罰力度溫和。此情形下,0<γ1<1,新增一個平衡點x9。 由此,得到9個平衡點,但只是靜態的均衡,沒有考慮到動態演化過程。若某一主體的策略突變,靜態均衡將有可能被破壞。因此,利用Lyapunov間接法和赫爾維茲穩定判據對動態演化方程的局部漸進穩定的均衡點進行判定。 根據三方復制動態非線性系統以及Lyapunov間接法,對平衡點進行穩定性分析,結果如表3所示。 表3 各平衡點穩定性分析Tab.3 Stability analysis of equilibrium point 結合平衡點分析和穩定性分析,對各情形的平衡點穩定性進行討論。 a.情形 1。FR>CR??AR+fRLR。 此情形下,x5,x7為不穩定點,可能的演化平衡點是x6和x8。由此可得推論1。 推論1當Fr b.情形 2。FR>CR??AR?AR+NR+fR?LR。 此情形下,x7為不穩定點,可能的演化平衡點是x8。x5和x6的穩定性待定。 推論2當Fr>Cr?Ir??Ar?Ar+Nr時,x8是穩定點。說明再制造商消極共享的損失力度足夠,政府對回收商的懲罰力度足夠,政府會選擇積極監管,再制造商、回收商會選擇積極共享。反之,Fr c.情形 3.2.1。CR??AR?AR+NR+fR?LR 此情形下,x5是穩定點,其他均不為穩定點。 推論3當滿足情形3.2.1時,三方博弈系統將收斂于x5。說明再制造商消極共享的損失力度溫和,政府對回收商的懲罰力度不足,政府會選擇積極監管,再制造商、回收商會選擇消極共享。 d.情形 3.2.2。CR??AR?AR+NR+fR?LR 此情形下,x8是穩定點,其他均不為穩定點。 推論4當滿足情形3.2.2時,三方博弈系統將收斂于x8。說明再制造商消極共享的損失力度溫和,政府對回收商的懲罰力度足夠,政府會選擇積極監管,再制造商、回收商會選擇積極共享。 e.情形 3.2.3。CR??AR?AR+NR+fR?LR 首先由Lyapunov法可得:x5和x8是穩定點,其他均不為穩定點。其次,此情形下會增加一個平衡點x9。根據赫爾維茲穩定判據,平衡點x9的雅可比矩陣 Je t(H)<0,故x9不是漸進穩定點。 推論5當滿足情形3.2.3時,三方博弈系統將收斂于x5或x8,說明再制造商消極共享的損失力度溫和,政府對回收商的懲罰力度溫和,政府一定會選擇積極監管,再制造商、回收商則會同時選擇積極共享或消極共享。 通過上述分析,可以發現: a.比較推論1和推論2,發現兩種情形下,再制造商的損失、政府對回收商的懲罰力度相同時,只需提高懲罰力度FR,即可使得三方博弈系統獲得演化穩定。 b.比較推論2和推論4,在提高政府對回收商的懲罰力度的情況下,再制造商損失溫和,即可讓三方博弈系統處于(1,1,1)的穩定狀態。 c.比較推論3和推論5,發現政府提高對回收商的懲罰力度的情況下,再制造商和回收商不一定會采取共享策略,他們仍有可能采取不共享策略,且雙方最終的策略狀態保持一致。 為了使演化穩定分析更直觀,本文利用MATLAB進行數值仿真。根據對上海市廢舊資源回收情況的調研,結合假設條件3.3,對參數初值進行合理設置,限定參數初值在假設條件內,設置數組 1:PG=20,CG=5,FG=9,SG=80,Ar= 80,Cr=70, ?Ar=4,Nr=35,Fr=15,Ir=11,Sr=60,AR=100,CR=20, ?AR=4,NR=40,FR=25,LR=20,fR= 0.4,fR?= 0.15。 a.初始仿真分析。 在博弈系統中,若某一主體的策略突變,系統將失去均衡狀態。通過對三方初始狀態突變的仿真分析,可以發現: (a)如圖2所示,政府策略從0或1突變,其最終都會達到1的均衡狀態。由此說明,政府對于其轉移的公共職能有必要積極監管。 圖2 政府策略從0或1突變的演化趨勢Fig.2 Evolution trend of government strategy from 0 or 1 (b)如圖3所示,在政府積極監管的情況下,回收商從0開始突變,無論再制造商采取何種策略,回收商最終穩定狀態是0。回收商從1開始突變,當再制造商積極共享時,回收商最終穩定狀態是1,當再制造商消極共享時,回收商最終穩定狀態是0。由此可見,當回收商共享意愿弱時,無論再制造商的影響,最終都將選擇消極共享,而當回收商共享意愿強烈時,將受再制造商的影響采取與之相同的策略。 圖3 回收商策略從0或1突變的演化趨勢Fig.3 The evolution trend of recycler strategy from 0 or 1 (c)如圖4所示,在政府積極監管的情況下,再制造商從0開始突變,當回收商積極共享時,再制造商最終穩定狀態是1,當回收商消極共享時,再制造商最終穩定狀態是0。再制造商從1開始突變,無論回收商采取何種策略,再制造商最終穩定狀態是1。由此可見,當再制造商共享意愿弱時,將受到回收商共享意愿的影響,采取與之相同的策略,而當再制造商共享意愿強烈時,不受回收商的影響,都將選擇積極共享。 圖4 再制造商策略從0或1突變的演化趨勢Fig.4 Evolution trend of remanufacturer strategy from 0 or 1 初始仿真結果表明,政府的最優選擇是對其轉移的公共職能積極監管,回收商相較于再制造商的機會主義傾向更加明顯,再制造商更傾向于積極共享。 b.初始意愿對演化的影響。 在數組1的基礎上,探討三方初始意愿對演化的影響。假設三方的初始意愿相同,研究初始意愿在較弱、一般、較強3種情況下對演化結果的影響。由圖5和圖6可知,不論初始意愿如何,最終三方均會到達(1,1,1)的狀態,這是因為回收商受到的懲罰滿足情形1的條件,演化平衡點符合上述分析。其次,當初始概率值足夠小時,回收商傾向于消極共享,隨著政府和再制造商的意愿上升,回收商改變策略,逐漸趨向于共享。三方初始意愿越高,回收商策略轉變得越快。對再制造商來說,初始參與意愿較低時,受回收商消極共享趨勢的影響,傾向于共享策略的速度突然變慢,但此時政府已選擇積極監管,再制造商最終選擇積極共享。對政府來說,隨著三方初始意愿增大,由于高收益的可能性減小,其演化至積極監管策略的速度減慢。仿真結果表明,政府在博弈系統中主導作用顯著,適當的監管力度即可引導參與主體積極共享。其次,再制造商較回收商的積極性更高。最后,三方參與主體初始參與意愿越高,演化至穩定狀態的速度越快。 圖5 初始意愿對演化的影響Fig.5 Impact of initial intention on evolution 圖6 回收商初始意愿對演化的影響Fig.6 Impact of recycler's initial intention on evolution c.外部變量對策略選擇的影響。 (a)政府策略選擇的影響因素。 以(0,0,1)的策略組合為例,假設政府的初始狀態由消極監管開始突變。改變數組1,分別設置CG=5,25,60,110,研究政府的監管成本對策略選擇和演化趨勢的影響。由圖7可知,在政府的監管成本較低時,驗證了政府對于自身轉移的公共職能積極履行監管職責。當政府的監管成本逐漸升高時,政府的演化速率變緩,演化至穩定的積極監管策略時間加長。當政府的監管成本超過收益時,積極監管轉向消極監管的閾值在CG=110左右,小于該閾值時,政府將采取積極監管的策略。 圖7 政府的監管成本對演化的影響Fig.7 Impact of government regulation cost on evolution 比較圖8和圖9可以發現,PG和SG對政府策略的演化影響類似,隨著社會公共收益和社會公共損失的增大,政府越傾向于積極監管且演化速度加快。由此可見,作為政府部門,在推進廢舊資源回收再利用的過程中,不僅對比自身的成本與收益,社會效益也是其考慮的一方面。 圖8 社會公共收益對政府演化的影響Fig.8 Impact of public benefits on government evolution 圖9 社會公共損失對政府演化的影響Fig.9 Impact of public loss on government evolution (b)回收商策略的影響因素。 以(1,1,0)的策略組合為例,假設回收商的初始狀態由積極共享開始突變。改變數組1,分別設置Fr=15,35,55,研究回收商受到的懲罰力度對策略選擇和演化趨勢的影響。由圖10可知,在懲罰力度較小時,驗證了在政府積極監管的情況下,當回收商共享意愿強烈時,將受再制造商的影響采取與之相同的策略,且隨著懲罰力度加大,回收商消極共享的趨勢變緩并逐漸傾向于共享策略。再次說明,政府對于回收商的策略選擇具有引導作用。 經仿真,信息化收益Ir對模型有相似的影響,設備成本Cr對模型有相反的影響,其演化趨勢與圖10相似。這說明,對信息化程度較低的回收商來說,提升信息共享的效率有利于引導其采取共享策略。由于再制造商的策略選擇影響因素與回收商相似,因此不再贅述。 圖10 懲罰力度對回收商演化的影響Fig.10 The impact of punishment on the evolution of recycler d.對演化穩定策略分析的仿真。 (a)FR對演化的影響。 改變數組1,設置Fr=9, α =β=γ=0.5,分別設置FR=50,24,10。由圖11可知,演化結果符合上述演化穩定策略分析。首先,再制造商消極共享策略造成的自身損失較小,再制造商將會消極共享;損失溫和或較大,再制造商將會積極共享。其次,再制造商僅需在溫和的損失刺激下即會選擇積極共享。最后,當回收商受政府的監管力度不足時,無論再制造商的策略選擇,回收商最終都會趨向消極共享,僅有演化速度的不同。 圖11 FR對演化的影響Fig.11 Impact of FR on evolution (b)Fr對演化的影響。 改變數組1,設置FR=10, α =β=γ=0.5,分別設置Fr=8,30,60。由圖12可知,演化結果符合演化穩定策略分析。首先,回收商的演化穩定策略受政府的懲罰力度的影響,懲罰力度越大,回收商演化至積極共享的速度越快。其次,當再制造商的損失溫和時,再制造商積極共享的趨勢更明顯,這會導致政府對回收商的懲罰力度僅保持溫和,即可使其選擇共享策略。最后,再制造商的策略受回收商的影響,與回收商的策略保持一致。通過對比FR和Fr對演化的影響可以發現,再制造商和回收商對彼此的影響不同,再制造商對回收商的策略更敏感,保持跟隨態度。 圖12 F r對演化的影響Fig.12 Impact of F r on evolution (c)對情形3.2.3的討論。 改變數組1,設置Fr=30,分別設置每組α,β,γ概率為0.5,0.3,0.1。由圖13可知,當Fr較為溫和時,回收商和再制造將會選擇相同策略。研究發現,當初始共享意愿強烈時,雙方將會共同選擇積極共享。反之,則雙方共同選擇消極共享。結合前述仿真分析可知,提高初始共享意愿并利用再制造商受回收商策略的影響這一條件可促使雙方積極共享。 圖13 對情形3.2.3不確定穩定情況的討論Fig.13 Discussion on uncertain stability of scenario 3.2.3 為探究基于云平臺的CLSC回收再制造信息共享的積極性及其影響因素,本文通過構建政府、回收商、再制造商之間的三方演化博弈模型,分析各方策略選擇的演化穩定性以及各要素的影響關系,最后通過數值仿真驗證了分析的有效性,得出的結論如下: a.在各方是否選擇云平臺共享回收再制造信息時,政府的主導作用顯著。作為公共職能部門,綜合對社會效益的考慮,其最優決策為積極監管。政府監管力度適當增大,促使回收商、再制造商積極共享以避免損失,演化速度也與監管力度正相關。因此,政府應該發揮導向作用,采取適當的監管力度,提升廢舊資源回收再制造效率。 b.在政府積極監管的前提下,再制造商傾向于積極共享,而回收商則根據監管力度持有機會主義。因此,在推進CLSC回收再制造信息共享工作中,政府監管力度主要針對回收商來調整,以此達到促進信息共享的目的。 c.回收再制造信息共享受初始意愿的影響顯著。初始意愿越高,回收商、再制造商積極共享的概率越大,演化趨勢越快。由于單個企業的策略選擇概率與同類企業的整體策略選擇比例相同,因此,行業內的企業可以形成聯盟,共同選擇使用云平臺進行信息共享,形成行業標桿,將會帶動更多企業參與到利用云平臺進行信息共享中來。 d.回收商、再制造商對彼此的影響是不對稱的,再制造商受回收商的影響更明顯。當再制造商自身損失增大趨向于積極共享時,回收商根據監管力度的情況不一定會積極共享;但當回收商受監管趨于積極共享時,再制造商的策略會保持同步。因此,為推進云平臺信息共享,應主要關注對回收商的監管,使得回收商和再制造商均采取共享策略。 e.當政府監管力度溫和時,回收商、再制造商的策略會保持一致。當初始意愿較高時,雙方會演化穩定至積極共享策略,反之,則雙方采取消極共享策略。因此,政府可以采取宣傳等手段鼓勵更多的行業內的企業參加云平臺共享以提高其初始意愿,促使其演化穩定至積極共享。 本文將演化博弈論和云制造的思想運用到解決CLSC回收再制造信息不對稱中,但現實情況比研究假設更復雜。因此,需要更貼合實際的模型來討論。此外,基于云平臺信息共享的CLSC相較于傳統CLSC的優越性也是未來研究的方向。2.4 復制動態方程



3 三方演化穩定性分析
3.1 理論基礎
3.2 平衡點分析


3.3 演化穩定策略分析

4 仿真分析












5 結束語