洪江濤, 黃 沛
(1上海對外經貿大學國際經貿學院,上海 201620; 2.復旦大學管理學院,上海 200433)
?
基于微分博弈的供應鏈質量協調研究
洪江濤1,2, 黃 沛2
(1上海對外經貿大學國際經貿學院,上海 201620; 2.復旦大學管理學院,上海 200433)
文章以一個制造商和一個供應商所構成的兩級供應鏈為研究對象,應用微分博弈的方法分析了四種不同的質量管理博弈情形下,制造商和供應商的最優質量管理策略、收益和整條供應鏈的總收益。研究結果表明,當制造商和供應商的收益分配比滿足一定條件時,從Nash非合作質量管理博弈情形,到弱激勵Stackelberg博弈情形,再到強激勵Stackelberg博弈情形,最后到合作質量管理博弈情形,對于制造商、供應商以及整個供應鏈系統來說都是一種帕累托改進。所以,合作質量管理博弈情形是供應鏈質量管理所追求的最理想的情形,為了有效促進該情形的實現,文章應用Nash討價還價模型對該情形下合作雙方關于供應鏈系統的剩余利潤分配進行了分析。最后,在對一家電風扇制造商的供應鏈進行調查來獲得仿真數據的基礎上,通過算例分析驗證了理論推導的結果。
供應鏈;質量控制;質量改進;微分博弈;激勵
近年來,各大公司頻頻爆出供應鏈質量管理問題。先是2005年蘇丹紅事件,涉及企業包括世界跨國公司亨氏、肯德基等,在2008年引起社會廣泛關注的“三鹿”奶粉事件, 2010年年初鬧的沸沸揚揚的豐田汽車“召回門”事件,以及近兩年來眾多食品企業的“明膠”問題,都對企業的供應鏈質量管理敲響了警鐘。在這種背景下,供應鏈質量管理對企業來說,顯得尤為重要,因為它貫穿于整個供應鏈中,通過和供應商建立相互合作關系來實現質量管理的改善以及企業整體績效的提高,這種關系不僅惠及合作雙方,更有利于整個供應鏈水平的提升[1]。而這種有效的質量合作關系的建立主要依賴于供應鏈上成員企業間高效的質量協調機制,本文的研究視角正基于此,研究將以傳統的兩級供應鏈為例,應用微分博弈的方法來探討如何在供應鏈上建立最佳的質量協調機制。
在傳統的質量管理文獻中,質量管理和質量控制主要是運用統計控制技術(如控制圖、方差檢驗等)來進行研究的,質量問題也被當作一人決策問題,即供應商以最小的成本來達到事先設定的質量水平。然而,在供應鏈環境下,供應鏈雙方均具有自主決策的能力和意愿,且雙方自主決策的相關策略參數均不被對方所觀測,于是,供應鏈質量管理的核心是供應鏈質量協調。現有供應鏈質量協調的研究主要圍繞供應鏈雙方非合作和合作兩種情形展開[2]。
非合作情形下的研究主要關注的是供應鏈雙方的質量協調策略的選擇,研究的焦點主要放在供應鏈雙方的投資、生產和檢驗等策略的制定[3-7]。例如:Hsieh和Liu Yute[3]調查了傳統兩級供應鏈上供應商和制造商在四種不同程度信息披露的非合作博弈下的質量投資和檢驗策略,研究了與檢測有關的信息對雙方均衡策略和利潤的影響,并評估了均衡狀態下對有缺陷部件進行懲罰的合理性。Xie Gang等[4]研究了全球供應鏈中基于訂單的供應鏈雙方在不確定需求情況下的質量投入和價格決策問題。朱立龍等[5]研究了實際的兩級供應鏈中的質量協調問題,建立了供應鏈雙方的期望收益函數模型,制造商對其生產過程投資水平進行決策并確定其產品質量預防水平,采購商進行質量評價決策并確定其產品質量檢驗水平。
供應鏈雙方合作情形下質量協調研究主要是圍繞基于產品質量的供應鏈契約設計[8-11]。在該種情形下,供應鏈雙方將通過談判的形式來實現雙贏,契約設計的核心問題是供應鏈整體利潤的合理分配。如:Reyniers[8]建立了供應鏈雙方關于供應鏈質量控制的矩陣博弈模型,探討了雙方在Nash討價還價模型下各自質量策略的選取。Yao Dongqing和Zhang Nanyun[9]從總體擁有成本(TCO)的角度運用兩階段領導-跟隨博弈分析了供應鏈上采購商和供應商的質量成本共享契約決策。胡軍等[10]研究了各種不同契約類型在供應鏈質量協調中的有效性。
綜上所述,與現有的供應鏈質量協調文獻相比,本文主要有兩個特點:一是考慮到質量形成的長期性和動態變化特點,本文試圖引入微分博弈的方法從動態角度對典型兩級供應鏈上的質量協調機制進行研究;二是為了系統分析各種供應鏈質量協調機制的優劣,本文將供應鏈雙方的質量管理行為區分為“質量控制”和“質量改進”,根據供應鏈雙方在不同質量管理行為上的合作程度,本文將對供應鏈雙方在非合作、部分合作和完全合作等四種不同質量管理博弈情形下的質量管理策略進行分析,從而探討如何建立一種最優的供應鏈質量協調機制,以實現供應鏈整體效率的提升。
本文研究的對象是以制造商作為核心企業的兩級供應鏈。其中,制造商(m)控制產品研發、加工及裝配質量;供應商(n)控制著零部件質量。為了確保最終產品的質量,核心企業(制造商)應站在全局的系統的角度對其合作企業(供應商)進行質量管理的協調。
由于質量管理活動可劃為兩個類型。一類是維持現有的質量,控制系統的偶發性缺陷,其方法是“質量控制”。另一類是改進目前的質量,其方法是主動采取措施,使質量在原有的基礎上有突破性的提高,即“質量改進”。本文所研究的供應鏈上成員企業的質量管理行為將包括這兩種類型的工作。這里,用A表示成員企業在質量控制上的努力,B表示成員企業在質量改進上的努力。(Am,Bm)、(An,Bn)分別表示m、n在兩種工作上所花費努力的向量。鑒于努力成本的凸性特征,m和n在不同工作上的努力成本可用下面的凸函數表示:

在相關研究并結合實際觀察的基礎上,特做出如下假設:
(1)由于產品質量是一個動態變化的過程,而產品質量的提升是由供應鏈上成員企業在質量改進上的努力程度來決定,于是可用式(1)所示微分方程表示產品質量的變化過程:
(1)
其中:Q(t)表示t時刻產品質量,且初始質量Q(0)=Q0;α、β分別表示m和n各自的質量改進努力對產品質量提升的影響系數;γ是質量水平的退化率。該假設條件是受文獻[12]中產品聲譽變化模型的啟發而得到(因為質量是聲譽的組成部分,它們的變化規律類似)。
(2)質量控制的目的在于監視過程,使之處于受控狀態,并排除質量環中所有階段導致不滿意的原因以取得經濟效益。質量改進的目的在于突破原來的質量水平,達到新的質量水平,進而通過影響客戶對產品的需求來獲得收益。
根據一般性假設,我們認為m和n通過各自質量控制工作所取得的收益函數是與其各自努力程度線性相關的。另外,借鑒張雄會等[13]的研究假設:因產品質量改進而產生的收益函數是與產品質量水平成正比的。
于是,可用式(2)表示m和n在產品質量管理上共同工作所產生的總收益函數:
W(Am(t),An(t),Q(t))=εAm(t)+ηAn(t)+δQ(t)
(2)
其中,ε、η和δ均為常數。ε、η分別代表m和n各自的質量控制努力對收益函數的影響程度;δ為產品質量水平對收益函數的影響系數。
(3)假設m和n聯合質量管理產生的收益函數只在m和n之間分配,由于m為供應鏈上的核心企業,它將確定n獲得收益的份額π,π∈(0,1)為常數是預先設定的,同時m將獲得剩下的1-π份額。
(4)假設制造商m和供應商n有著相同且為正值的貼現率ρ,雙方的目標都是在無限時區內尋求使自身利潤最大化的最優質量管理策略。
基于上述假設,參考微分博弈中目標函數設置方法,得到m和n的目標函數分別為
(3)
(4)
3.1 Nash非合作質量管理博弈情形
當制造商(m)和供應商(n)進行Nash非合作質量管理博弈時,雙方會同時、獨立地決定各自在質量控制和質量改進工作上的努力,以最大化自身的利潤。那么博弈雙方的最優質量管理策略組合即為靜態反饋NASH均衡。(為書寫方便,后文將省略t)
定理1:在Nash非合作質量管理博弈情形下,m和n的靜態反饋Nash均衡策略分別為:
(5)
(6)
證明:運用靜態反饋Nash均衡的充分條件來導出對所有的Q≥0滿足HJB方程的最優值函數Vm、Vn。在非合作條件下m和n的HJB方程分別為:
最大化HJB 方程式的右端可得:
(7)
(8)
將式(7)、(8)代入到HJB方程式的右端得:
(9)
(10)
由式(9) 、(10) 可知, 關于Q的線性最優值函數是HJB 方程的解。
于是,令Vm(Q)=a1Q+a2,Vn(Q)=b1Q+b2;
a1、a2、b1、b2均為常數。把它們代入到式(9)、(10)中得:
(11)
(12)
由式(11)、(12)可以得到最優值函數系數:
將系數a1、a2、b1、b2代入Vm(Q)、Vn(Q)中,得到m和n的最優值函數分別為:
(13)
(14)
進而可算出整個供應鏈系統的最優值函數為:
(15)
接著,將式(13)、(14)對Q的導數代入式(7)、(8),從而得到式(5)、(6)。證畢。
3.2 制造商弱激勵政策下的Stackelberg博弈情形
該種情況下,制造商僅對供應商的質量控制工作提供激勵,即對供應商的質量控制努力成本進行補貼。這也是現實中比較常見的一種情況:制造商比較重視供應商所提供零部件質量的穩定性。此時,m作為領導者而n作為跟隨者,雙方就會進行序貫非合作博弈。m首先確定最優的兩種質量管理工作努力Am、Bm以及對n質量控制努力An的補貼率h。n作為博弈跟隨者在看到m的決策后再決定自己在各項工作上的努力程度,所以雙方的最優策略為靜態反饋Stackelberg均衡策略。
定理2:在制造商m僅對供應商n的質量控制工作提供激勵的Stackelberg博弈情形下,m和n的靜態反饋Stackelberg均衡策略分別為:
(16)
(17)

(18)
證明:該種情況m和n的博弈構成Stackelberg博弈,可運用逆向歸納法。于是問題轉化為n的單方最優控制問題,其最優值函數Vn(Q)必須滿足HJB方程:
(19)
使式(19)最大化的一階條件為:
(20)
m考慮到n將根據給定的決策Am和Bm采取自身的最優策略,因此應根據n的理性反應來確定自己的最優策略,以滿足自身利潤最大化的目標。此時m的HJB方程為:
(21)
式(20)代入式(21)可得:
ρVm(Q)=
(22)
使式(22)最大化的關于Am、Bm和h的一階條件分別為:
(23)
(24)
式(20)、(23)、(24)代入式(19)和(22)整理得:
(25)
(26)
顯然,關于Q線性最優值函數滿足式(25)和(26)。于是,令Vm(Q)=c1Q+c2,Vn(Q)=d1Q+d2;c1、c2、d1、d2均為常數。把它們及其對Q的導數代入式(25)、(26),計算可得到最優值函數系數:
將系數c1、c2、d1、d2代入到Vm(Q)、Vn(Q)中,得到m和n的最優值函數分別為:
(27)
(28)
進而可算出整個供應鏈系統的最優值函數為:
(29)
接著,將式(27)、(28)對Q的導數代入式(20)、(23),結合式(24),從而得到式(16)、(17)和(18)。證畢。
3.3 制造商強激勵政策下的Stackelberg博弈情形
該種情況下,制造商對供應商的質量控制和質量改進兩種工作都提供激勵,即對供應商的質量控制和質量改進努力成本都進行補貼。這是現實中比較常見的另外一種情況:制造商重視供應商所提供零部件質量的穩定性的同時,也非常關注供應商在質量改進工作上的表現。此時, m作為領導者而n作為跟隨者,雙方就會進行序貫非合作博弈。m首先確定最優的兩種質量管理工作努力Am、Bm以及對n的質量控制努力An和質量改進努力Bn的補貼率(分別用h和s表示)。n作為博弈跟隨者在看到m的決策后再決定自己在各項工作上的努力程度,所以雙方的最優策略也為靜態反饋Stackelberg均衡策略。
定理3:在制造商m對供應商n的質量控制和質量改進工作都提供激勵的Stackelberg博弈情形下,m和n的靜態反饋Stackelberg均衡策略分別為:
(30)
(31)

(32)

(33)
證明:同樣運用逆向歸納法,證明過程類似定理2的證明過程,篇幅所限,此處省略過程,僅列出m、n以及整個供應鏈系統的最優值函數:
(34)
(35)
(36)
3.4 合作質量管理博弈情形
當制造商和供應商都能站在整體的角度進行質量管理工作時,雙方將進行合作質量管理博弈。本部分將探討該種理想情形。
(1)合作質量管理博弈情形下的求解
定理4:在合作質量管理博弈情形下,m和n的靜態反饋Nash均衡策略分別為:
(37)
(38)
證明:在m和n進行合作質量管理博弈情形下,雙方能夠以供應鏈系統利潤最優為首要原則共同地來確定各項工作努力的值。證明過程類似定理1的證明過程,篇幅所限,此處省略過程,僅列出整個供應鏈系統的最優值函數:
(39)
(2)合作質量管理博弈情形下的合作利潤分配

s.t.ΔVm+ΔVn=ΔV
(40)
將條件ΔVm+ΔVn=ΔV代入式(40)后,令?U/ΔVm=0和?U/ΔVn=0,即可求出m和n分配后的最優利潤。這樣就可以有效地激發合作企業參與協同質量管理的積極性。
(1) 不同博弈情形下制造商和供應商的質量管理行為比較
由式(5)、(16)、(30)、(37)可知:在三種非合作質量管理博弈的情形下,制造商在兩種質量管理工作上的努力程度是一樣的;而在合作質量管理博弈情形下,制造商在兩種質量管理工作上的努力程度要高于在非合作質量管理博弈情形下的對應值。該結論反映了制造商作為供應鏈上的核心企業,在缺少外界因素激勵的情況下,其在兩種質量工作上的努力程度是不會因不同的博弈情形而改變;但是,在合作質量管理博弈情形下,由于制造商和供應商作為一個整體,他們之間的質量管理行為存在著互補性。
(2)不同博弈情形下制造商、供應商以及整條供應鏈系統最優利潤的比較
Vm(Q0)、Vn(Q0)是m和n在Q0(Q0≥0)的最優值函數,是無限時區上的總利潤。


制造商和供應商在各種不同質量管理博弈情形下,其最優質量管理工作上的努力和利潤依賴模型中參數的選擇。為了獲得仿真數據,作者調查了一家電風扇制造商的供應鏈,根據調查結果,假定取ρ=0.1,ε=0.3,η=0.2,δ=0.6,μ1=0.1,μ2=0.2,μ3=0.1,μ4=0.2,α=0.4,β=0.3,γ=1,Q0=0.50,π=1/3,則在各種不同博弈情形下的制造商、供應商以及整條供應鏈系統的利潤,其隨時間變化的曲線如圖1、2、3所示。

圖1 制造商的利潤在四種不同博弈情形下的比較

圖2 供應商的利潤在四種不同博弈情形下的比較

圖3 整條供應鏈系統的利潤在四種不同博弈下的比較

圖4 不同的π值對于制造商的利潤(Jm)在幾種博弈情形下的影響

圖5 不同的π值對于供應商的利潤(Jn)在幾種博弈情形下的影響

圖6 不同的π值對于供應鏈系統的總利潤(Jm+Jn)在幾種博弈情形下的影響
從圖1、2中可看出, 即使不對合作式博弈下的利潤進行重新分配,制造商的收益從Nash非合作質量管理博弈情形,到弱激勵Stackelberg博弈情形,再到強激勵Stackelberg博弈情形,最后到合作質量管理博弈情形,仍將是一種帕累托改進;然而,類似的結論并不存在于供應商身上,圖2反映了從Nash非合作質量管理博弈情形,到弱激勵Stackelberg博弈情形,再到強激勵Stackelberg博弈情形,供應商的收益是遞增的,然而合作質量管理博弈情形下供應商的收益卻處于Nash非合作質量管理博弈情形和弱激勵Stackelberg博弈情形的收益之間。從圖3中可看出, 對于制造商和供應商所組成的供應鏈系統的總利潤來說,從Nash非合作質量管理博弈情形,到弱激勵Stackelberg博弈情形,再到強激勵Stackelberg博弈情形,最后到合作質量管理博弈情形,將是一種帕累托改進。所以,從圖1、2、3中可以看出要想實現對制造商、供應商以及供應鏈系統在四種博弈情形下的帕累托改進結果,必須對供應鏈系統在合作質量管理博弈情形的利潤增量進行合理分配。顯然,以上結論與理論推導吻合。


[1] Flynn B B, Flynn E J. Synergies between supply chain management and quality management: Emerging implications[J]. International Journal of Production Research, 2005, 43 (16): 3421-3436.
[2] 蒲國利,蘇秦,劉強. 一個新的學科方向——供應鏈質量管理研究綜述[J]. 科學學與科學技術管理, 2011, 32 (10): 70-79.
[3] Hsieh C C, Liu Yute. Quality investment and inspection policy in a supplier-manufacturer supply chain[J]. European Journal of Operational Research, 2010, 202(3): 717- 729.
[4] Xie Gang, Wang Shougang, Lai K K. Quality improvement in competing supply chains[J]. International Journal of Production Economics, 2011, 134(1): 262- 270.
[5] 朱立龍,于濤,夏同水. 兩級供應鏈產品質量控制契約模型分析[J]. 中國管理科學, 2013, 21 (1) : 71-79.
[6] Zhu Kaijie, Zhang R Q, Tsung F. Pushing quality improvement along supply chains[J]. Management Science, 2007, 53(3): 421- 436.
[7] Xie Gang, Yue Wuyi, Wang Shouyang, et al. Quality investment and price decision in a risk-averse supply chain[J]. European Journal of Operational Research, 2011, 214(2): 403-410.
[8] Reyniers D J, Tapiero C S. The delivery and control of quality in supplier-producer contracts[J]. Management Science, 1995, 41(10): 1581-1589.
[9] Yao Dongqing, Zhang Nanyun. Contract design for supply chain quality management [J]. International Journal of Value Chain Management, 2009, 3(2): 129- 145.
[10] 胡軍,張鎵,芮明杰. 線性需求條件下考慮質量控制的供應鏈協調契約模型[J]. 系統工程理論與實踐, 2013, 33 (3) : 601-609.
[11] Zu Xingxing, Kaynak H. An agency theory perspective on supply chain quality management[J]. International Journal of Operations & Production Management. 2012, 32 (4): 423 - 446.
[12] Nerlove M, Arrow K J. Optimal advertising policy under dynamic conditions[J]. Economica, 1962, 29(114):129-142.
[13] 張雄會,陳俊芳,黃培. R&D過程中供應商縱向知識溢出決策分析[J]. 工業工程與管理,2008, 13(4):29-31.
Research on Quality Coordination in Supply Chain Based on Differential Game
HONG Jiang-tao1,2, HUANG Pei2
(1.International Business School, Shanghai University of International Business and Economics,Shanghai 201620, China;2.School ofManagement, Fudan University, Shanghai 200433, China)
With the two-echelon supply chain consisting of a single manufacturer and a single supplier as its research object, the manufacturer and the supplier’s optimal quality management strategy, revenue and the total revenue of the entire supply chain in four different game situations are anylyzed. The results showed that when the income distribution between the manufacturer and the supplier met certain conditions, it was a Pareto improvement for the manufacturer, the supplier and the whole supply chain system from quality management Nash non-cooperative game situation, to weak incentive Stackelberg game situation, to the strong incentive Stackelberg game situation, and finally to the cooperation quality management game situation. Therefore, the cooperation quality management game situation was the ideal situation during the process of supply chain quality management. In order to promote the realization of the situation effectively, Nash bargaining model was applied to analyze the allocation of the remaining profits in the supply chain system between the parties. Finally, based on the simulation data got from the survey on the supply chain of an electric fan manufacturer, a numerical example was given to verify the results of the theoretical derivation.
supply chain; quality control; quality improvement; differential game; encourage
1003-207(2016)02-0100-08
10.16381/j.cnki.issn1003-207x.2016.02.013
2013-04-09;
2013-09-21
國家自然科學基金資助項目(70672071);教育部人文社會科學研究項目(10YJC630076)
簡介: 洪江濤(1980-),男(漢族),安徽東至人,上海對外經貿大學國際經貿學院博士,副教授,研究方向:供應鏈管理,E-mail:hongjiangtao2006@126.com.
F224.1
A