張 侃,劉寶平,黃 棟
(海軍工程大學 裝備經濟管理系,湖北 武漢 430033)
非合作博弈視角下穩定軍事逆向物流體系構建策略研究
張 侃,劉寶平,黃 棟
(海軍工程大學 裝備經濟管理系,湖北 武漢 430033)
基于非合作博弈理論,提出了構建軍事逆向物流體系的靜態完全信息博弈模型,研究了不同均衡條件下軍事逆向物流相關利益主體雙方的行為,給出了形成穩定軍事逆向物流體系的基本條件,總結了軍企雙方構建軍事逆向物流的主要策略。
非合作博弈;軍事逆向物流體系;博弈模型構建;穩定性分析
當前,部隊裝備建設進程不斷加快,裝備更新換代十分迅速,裝備在使用與保障過程中消耗的各種物資器材種類繁多、數量巨大,每年為維持裝備正常使用而投入的各項費用非常高昂,因裝備退役報廢、故障修理、消耗處置、庫存積壓等而淘汰的裝備物資資源更是十分驚人。因此,如何正確、高效處置巨大數量的部隊退役報廢裝備具有非常重要的理論研究價值和非常顯著的現實價值。在此背景下,軍事逆向物流應運而生。它與傳統的正向裝備物流共同構成循環經濟體系,可以使各種裝備物資資源在體系中得到持續而合理的利用,不產生或者只產生很少的廢棄物,同時減少裝備物流活動對環境的影響,從而實現以最少的資源消耗獲得最大的軍事、經濟和社會效益的目的。因此,積極研究并推動軍事裝備物資逆向流動,構建高效的軍事逆向物流系統,對于減輕裝備保障壓力,提升部隊戰斗力,節約資源,改善環境,保守軍事秘密,促進全社會的可持續發展都具有重要意義。
1992年,隨著Stock提出“逆向物流”的概念后,關于逆向物流的研究在歐美發達國家蓬勃興起。學術界通常認為,逆向物流是指通過將回收物資從消費點沿供應鏈反方向流動,經過退貨、不合格品退回、維修與再制造、物料替代、物資循環利用、廢棄物回收等處理環節,使這些物資重新獲得價值或得到正確處理的全流程。
隨著研究不斷深入,國外學術界關于逆向物流的研究多以定量分析和模型構建為主,揭示逆向物流深層運作機理,提高逆向物流經濟效益,具有較強的針對性。Joseph Sarkis等[1](2013)認為逆向物流比正向物流面臨更多的不確定性因素,為提高逆向物流在實際運作過程中的適應性和靈活性,應當構建一個基于戰略功能分解的多維度逆向物流靈活性指標評估體系,該體系可用于第三方逆向物流靈活性評價;Hamed Soleimani等[2](2014)構建了一個兩階段隨機變量風險規劃模型,該模型能夠依據風險假定值來優化逆向物流網絡設計和規劃,提高了逆向物流網絡對隨機風險的承受能力;A.Niknejad等[3](2014)提出了基于不同回收量的整體逆向物流網絡最優路線算法,該模型針對兩種不同的回收量進行討論,考慮了逆向物流需求和回收數量的模糊不確定性,研究了五種主要因素變化下的網絡的敏感性分析,取得了滿意的效果;Michael Mutingi[4](2014)利用系統動力學模型來定量分析逆向物流對于綠色供應鏈管理的影響作用,并找出逆向物流中對于綠色供應鏈績效水平影響程度最大的因素,對逆向物流進行階段性改進。
國內開展逆向物流時間較短,由于缺乏推進逆向物流的相關政策支持和管制措施,逆向物流的生態效益、環境效益和社會效益還未真正體現出來。國內學術界對于逆向物流的研究多數仍處于理論探索階段,多為定性分析和概念描述,重在通過機制設計、行為規范和制度政策引導等來論證逆向物流與中國國情結合的可行性。付瑋瓊[5](2011)構建了委托代理模型,來研究政府在廢舊家電逆向物流當中的激勵強度和角色職能;趙秀榮等[6](2013)從回收、檢驗、處理、再加工等各環節分析了逆向物流的戰略價值和戰略地位,提出穩步推進逆向物流工作開展的實施方案,包括物流信息化、運輸路徑優化、供應鏈集成化等具體建議;李化[7](2013)構建了AHP逆向物流評價指標體系,呼吁政府重視并加強逆向物流績效評估工作;鄭芳等[8](2014)提出基于科學物流管理的第三方逆向物流方式,分析第三方逆向物流在降低企業成本和提高企業效益方面的突出優勢;黨輝等[9](2014)基于循環經濟理念出發,提出了一種逆向物流管理運作模型,認為健全逆向物流法規制度,提高逆向物流技術研發和政府政策傾斜是促進逆向物流健康發展的三大要素。
當前,學術界關于逆向物流研究的焦點主要集中在地方大型國有企業上,對于軍事逆向物流研究不足。由于我國的軍事逆向物流并未真正實施,因而軍事逆向物流研究的焦點問題在于如何有針對性地構建合理的軍事逆向物流體系[10-12],特別是作為軍事逆向物流的利益相關者,軍方和廠方(以下“廠方”均指逆向物流企業)在該體系中扮演的角色和采取的行為策略。由于軍方和廠方在軍事逆向物流的實施過程中具有不同的利益訴求,因此非合作博弈理論不失為研究軍事逆向物流體系構建下的利益相關者行為策略的一種有效方法。
博弈論[13](Game Theory),又稱對策論,是研究決策主體的行為發生直接相互作用時的決策以及這種決策的均衡問題,分為合作博弈(Cooperative Game)與非合作博弈(Non-Cooperative)兩種基本類別。在非合作博弈研究領域,Nash于1950年提出了著名的“納什均衡”理論,奠定了非合作博弈的理論基石。非合作博弈作為現代經濟學的主流博弈論的主要內容,在現代經濟理論體系中占據重要地位,構成了現代經濟學的重要組成部分。本文研究的軍方與廠方的博弈也指非合作博弈。
非合作博弈當中一個非常重要的概念叫做“均衡”,對于不同類型、不同主體、不同條件下的非合作博弈問題形成了特定的均衡概念。在非合作博弈中,以下幾種均衡概念是比較常用的。
(1)占優均衡。當某一參與者獨立進行策略選擇時,其所選擇策略與其他參與者不具有相關性,而即不考慮其他參與者如何進行策略選擇,該參與者最優策略具有選擇唯一性。在博弈G=[N,{Si},{Pi}]中,若每一個參與者i都存在一個策略Si,i∈N,使得占優于Si{}中任何策略,那么策略組合稱為G的占優策略均衡,簡稱占優均衡。
(2)純策略納什均衡。在n個參與者標準式博弈中G={S1,...,Sn;u1,...,un}中,若對于每一個參與者i,是針對其他n-1個參與者所選策略的最佳策略,使得對于Si中所有的si都成立,則稱策略組合為標準式博弈G的一個“純策略納什均衡”。
(3)混合策略納什均衡。在標準式博弈G={S1,...,Sn;u1,...,un}中,參與者的策略空間為Si={si1,si2,...,sik},參與者i以概率分布 pi=(pi1,pi2,…pik)來實現k個策略的隨機選擇,此時形成的“策略”稱為混合策略,有 0≤pij≤1,j=1,2,…,k,且pij=1。當純策略 sij等價于混合策略pij=(0,…,0,1,0,…,0),意味著選擇純策略pij的概率為1,選擇其他純策略的概率為0。
(4)精煉子博弈納什均衡。精煉子博弈納什均衡屬于動態博弈中均衡策略。對于完全信息動態博弈而言,精煉子博弈納什均衡成立,應當滿足兩個基本條件:①參與者的某一個策略組合在整個動態博弈中構成納什均衡;②參與者的某一個策略組合在它的所有子博弈中構成納什均衡。
在軍事逆向物流體系構建博弈模型中,參與軍事逆向物流活動的主體由提供各類回收物資的軍事部隊(簡稱“軍方”)和承擔具體回收技術工作的企業(簡稱“廠方”)二者構成,軍方與廠方通過博弈使得雙方在一個合理的均衡條件下,共同實施逆向物流。
4.1 模型假設
假設1:博弈的參與者為軍方和廠方,在博弈過程中軍方與廠方都具有有限理性或過程理性,廠方追求自身經濟利益的最大化,在作決策時會依據自身情況進行收益與成本的比較;軍方作為理性人,追求軍事裝備物資價值的二次挖掘,實現軍事效益最大化。軍方同樣會計算逆向物流中獲得的二次軍事經濟效益與支出成本的大小,追求以最小的成本獲取最大的效益。
假設2:在該博弈當中,軍方代表國家利益,具有更多的話語權,屬于主導的一方。軍方可以在短期內使用強制手段(如監督)迫使廠方實施逆向物流,具有權威性和約束性。
假設3:廠方與軍方均有兩種策略。其中,廠方可選擇“構建”或“不構建”兩種基本策略,軍方可選擇“監督”或“不監督”兩種基本策略。軍方和廠方在進行博弈時并不清楚對方的策略選擇,而雙方對對方的策略和收益是完全清楚的,該博弈屬于完全信息靜態博弈。
假設4:在軍方的監督下,廠方構建逆向物流體系,軍方會給予相應的激勵,而對于不構建逆向物流體系的廠方則給予相應的懲罰;廠方構建逆向物流體系,會提升其品牌形象,不構建逆向物流則會使其聲譽受到損失。
4.2 博弈模型分析
軍方和廠方在不同策略選擇下的收益矩陣見表1。

表1 軍方、廠方收益矩陣表
其中:
C1—軍方的監督成本;
C2—廠方構建逆向物流體系的成本;
C3—廠方不構建逆向物流而造成的軍方裝備物資經濟損失;
C4—軍方監督下廠方不構建逆向物流而造成的聲譽等無形價值損失;
S1—廠方構建逆向物流體系后獲取的資源二次利用收益;
S2—廠方構建逆向物流體系后帶來的品牌等無形價值增長;
S3—廠方未構建逆向物流系統前的收益;
E—廠方構建逆向物流體系時軍方可獲得的二次軍事經濟效益;
F—軍方監督下對不構建逆向物流的廠方收繳的罰金。
(1)純策略納什均衡。當S3-C2+S1+S2<S3-C4-F時,廠方不構建逆向物流體系的收益大于其構建時的收益,此時顯然有S3-C2+S1+S2<S3-C4-F<S3,所以廠方的占優策略是“不構建”。考察軍方行動,可以分為兩種情況:
若-C1-C3+F>-C3,即C1<F時,此時可得到第①種純策略納什均衡(監督,不構建);若-C1-C3+F<-C3,即C1>F時,此時有第②種純策略納什均衡(不監督,不構建)。這種情況下,就算廠方被查出沒有構建逆向物流體系,但由于采取“不構建”策略時的收益和被監督受到的懲罰后的總和仍然大于構建后獲得的收益,因此,無論軍方監督是否,廠方的最優選擇均是“不構建”。
同樣,當S3-C2+S1+S2>S3-C4-F時,又分兩種情況:
若 S3-C2+S1+S2足夠大,有 S3-C2+S1+S2>S3,此時S1+S2>C2,廠方因構建逆向物流體系獲利,其占優策略為“構建”,此時由于E-C1>E,軍方必然選擇策略“不監督”,此時有第③種純策略納什均衡(不監督,構建);若S3-C2+S1+S2<S3,此時 S1+S2<C2,考察軍方行為,當-C1-C3+F<-C3,即C1>F時,軍方的占有策略是“不監督”,此時有第④種純策略納什均衡(不監督,不構建)。
由收益矩陣知,軍方的期望收益函數為:

廠方的期望收益函數為:



根據軍事逆向物流構建博弈模型的均衡條件,其帕累托最優化均衡結果應當是軍方不監督而廠方能夠主動建立逆向物流體系。但是廠方作為理性的經濟人,是否構建軍事逆向物流體系并不是其所關注的重點,廠方只追求自身利益是否能夠達到最大化。因此,若要求能夠順利建立起逆向物流體系,則需要軍方和廠方通過一定的行為準則來調節各自的活動,從而使得該方案能夠為雙方所接受。
5.1 基本結論
(1)依據第①種、第②種純策略納什均衡結果,如果S3-C2+S1+S2<S3-C4-F時廠方具有占優策略為“不構建”,此時廠方不會主動構建逆向物流體系。只有當軍方采取一定的 措 施 使 得 S3-C2+S1+S2>S3-C4-F , 即C4+F+S1+S2-C2>0時,此時廠方因不構建逆向物流而遭受的損失(軍方罰金、廠方名譽損失)和構建逆向物流將獲得的預期收益(有形收益、無形收益)之和大于廠方構建逆向物流體系的成本,廠方才有可能花費精力和時間去構建逆向物流。為滿足這一條件,博弈雙方的行為準則要求:軍方應當加大對廠方不構建逆向物流的罰金F,增強公眾的環保意識、節約意識,強調逆向物流重要性(此舉能夠提高C4);廠方則應當盡量降低開展逆向物流工作時各環節成本,如優化逆向物流方案設計、加強選址論證和逆向物流專業人員培訓等,力求降低成本C2,同時提高綜合收益S1+S2。
(2)依據第③種、第④種純策略納什均衡結果,如果S3-C2+S1+S2>S3,廠方具有占優策略“構建”。因此,只要能夠保證廠方在逆向物流中能夠獲取一定收益,廠方作為理性經濟人,必然會主動要求構建逆向物流體系。此時,軍方無需“監督”,這也是最優化、最理想的一種博弈均衡結果。但是由于實際逆向物流水平達不到要求,特別是在構建初期,廠方很難通過短期經營而獲利。此時必然要求軍方采取“監督”措施強制廠方構建逆向物流體系,由于軍方監督存在監督成本,因此若要維持軍方長期有效的“監督”,則必須滿足-C1-C3+F>-C3,即F>C1,要求軍方進行監督的成本小于罰金的收益。博弈雙方的行為準則要求:軍方應當通過加大對廠方懲罰力度來促進自身愿意去進行監督,廠方應該采取措施降低成本,提高收益來確保逆向物流有利可圖。
(4)由第(3)條結論,可知罰金F其實是一把雙刃劍,F值過高或過低都會對博弈結果產生不利影響。換個思考角度,假設廠方主動構建逆向物流體系時軍方能夠給予適當獎勵K,此時顯然 α*>α**,因此,可以通過調控獎勵大小來增加廠方構建逆向物流體系的積極性,說明獎勵比懲罰更有效。
5.2 基于動態重復博弈的穩定性條件
當軍方、廠方按照一定的博弈規則構建起軍事逆向物流體系后,需要進一步考慮的問題是:軍事逆向物流體系是否是一個能夠長期地、周而復始運行下去的穩定體系,即如何保證其運行穩定性的問題。從博弈的角度來看,軍方、廠方作為博弈的局中人,此時在進行博弈時,雙方考慮的問題將是自身如何從逆向物流運行過程中獲取長期、持續的收益,博弈過程將是連續的、長期的、反復的。
為保證逆向物流體系的穩定運行,軍方與廠方在這一階段形成了新的博弈,該博弈過程具有不斷重復的特點,且雙方在每一輪博弈中均能夠獲取上一輪博弈的完全信息,從而決定本輪博弈策略的選擇,因此屬于完全信息動態重復博弈討論的情形。軍方的策略變為“補貼”和“不補貼”兩種,廠方的策略對應為“努力”和“不努力”兩種,“努力”時和“不努力”時分別對應兩種回收量Q1和Q2,顯然Q1>Q2。考察重復博弈中第t輪子博弈,該子博弈收益矩陣見表2:
M1—軍方給予廠方的每單位回收物資補貼額;
M2—廠方處理單位回收物資能夠為軍方帶來的經濟效益;
N1—廠方向軍方購買單位回收物資的價格;
N2—廠方處理單位回收物資獲取的收益;
λ—廠方獲取單位回收物資的努力成本。
需要注意λ并不是一成不變的,λ為與時間t相關的變量,記為λ(t)。
若單獨討論第 t輪子博弈,必然有(M2+N1-M1)Q1<(M2+N1)Q1或(M2+N1-M1)Q2<(M2+N1)Q2,因此無論廠方采取何種策略,軍方的占優策略一定為“不補貼”。若t較小,結合5.1中第(2)條結論,此時廠方處于逆向物流構建初期,盈利能力較弱,有 N2-N1-λ<0,從而(N2-N1-λ)(Q1-Q2)>0,廠方沒有采取“努力”策略的主觀要求,該博弈的一個子博弈精煉納什均衡為(不努力,不補貼)。
顯然,該博弈結果并不理想,說明無法構建一個穩定的逆向物流體系。然而,對于動態重復博弈而言,軍方、廠方所考慮的是博弈的長期利益,此時雙方的策略將發生變化,從而形成新的博弈均衡。軍方為獲取長期利益,不會計較在博弈初期的利益損失,而采取相應的“補貼”策略,當M1+N2-N1-λ>0時,廠方的最優策略將變為“努力”。
隨著每一輪博弈的重復進行,廠方從事逆向物流工作的技術水平不斷提高,盈利能力不斷增強。在第t*輪子博弈時,廠方獲取單位回收物資的努力成本λ將不斷下降至λ?,有λ(t*)=λ*,對應的回收量Q1則提升為Q?。當滿足條件

軍方將在t*+1輪子博弈時改變策略為“不補貼”,此時廠方策略仍為“努力”,形成穩定的子博弈精煉納什均衡(努力,不補貼)。
在逆向物流體系構建博弈當中,軍方、廠方作為利益相關的局中人,應當具備相應的權利,并履行相應的責任。軍方具有要求廠方必須構建逆向物流的行為主導權,廠方則具有開展逆向物流具體構建工作的經營運作權。
軍方應采取的策略有:制定合理的獎勵制度,采用必要的激勵手段,運用經濟杠桿調動廠方從事逆向物流工作的積極性;對于拒不構建逆向物流體系的廠方采取必要的懲罰措施,如處以罰金或其他政策性懲罰;積極向廠方人員和社會公眾宣傳節約和環保的理念,加深對逆向物流工作重要性的認識;在逆向物流體系構建初期,軍方應采取積極補貼的方式,扶持廠方逆向物流工作的開展。
廠方應采取的策略有:轉變思想觀念,提高節能環保意識,加快推進逆向物流工作開展;通過降低回收成本和提高回收效益兩個途徑來著手構建逆向物流體系;注重對外宣傳,提升品牌形象,重視和挖掘開展逆向物流工作帶來的潛在無形經濟效益;在逆向物流體系構建后,應加快技術創新,提升科學管理水平,提高逆向物流工作的市場獲利能力,盡快擺脫對軍方的補貼依賴,形成穩定、良好的獨立自主運行機制。
軍事逆向物流研究是近年來軍隊物資經濟研究的一個熱點問題,具有非常可觀的發展前景。軍事逆向物流活動能夠有效提高軍事資源統籌利用效益,二次優化資源配置,改善生態環境,減少浪費,提升部隊戰斗力水平和裝備綜合保障可靠性。開展軍事逆向物流的關鍵則需要理順軍廠雙方的利益分歧,通過采取合理措施加以引導,促進軍事逆向物流發展形成合力。非合作博弈理論的基本假設與軍廠雙方的利益訴求相契合,通過探討軍廠雙方的行為策略,為構建穩定的軍事逆向物流體系提供了較為充分的指導依據。
[1]Joseph Sarkis,Chunguang Bai.Flexibility in reverse logistics:a framework and evaluation approach[J].Journal of Cleaner Production,2013, (47):306-318.
[2]Hamed Soleimani,Kannan Govindan.Reverse logistics network design and planning utilizing conditional value at risk[J].European Journal of Operational Research,2014,237(2):487-497.
[3]A Niknejad,D Petrovic.Optimization of integrated reverse logistics networks with different product recovery routes[J].European Journal of Operational Research,2014,238(1):143-154.
[4]Michael Mutingi.The impact of reverse logistics in green supply chain management:a system dynamics analysis[J].International Journal of Industrial and Systems Engineering,2014,2(17):186-201.
[5]付瑋瓊.家電逆向物流的委托代理政府激勵機制研究[J].物流技術, 2011,30(6):54-56.
[6]趙秀榮,安娜,王婧.逆向物流的價值內涵及其實施方案研究[J].物流技術,2013,32(3):148-150.
[7]李化.基于AHP的逆向物流評價指標排序[J].經濟研究導刊,2013, (24):56-57.
[8]鄭芳,李敉.基于逆向物流的第三方物流管理分析[J].物流科技,2014, (1):125-126.
[9]黨輝,蔣洪平.循環經濟導向下逆向物流管理問題研究[J].物流技術, 2014,(5):70-71,137.
[10]馮海川,于淼,李偉.軍事逆向物流的戰略價值[J].軍隊采購與物流, 2009,(1):67-68.
[11]王宇,連華,王遠軍.加強我軍軍事逆向物流管理的思考[J].后勤科技裝備,2006,(3):9-11.
[12]張義桂,黎明.軍事逆向物流運行機制淺析[J].軍隊采購與物流, 2011,(3):64-66.
[13]張維迎.博弈論與信息經濟學[M].上海:上海三聯出版社,1996.
Study on Establishment of Stable Reverse Military Logistics System:A Non-cooperative Game Perspective
Zhang Kan,Liu Baoping,Huang Dong
(Department of Equipment Economy&Management,Navy University of Engineering,Wuhan 430033,China)
In this paper,based on the non-cooperative game theory,we proposed the static complete information game model for the establishment of the reverse military logistics system where we studied the behaviors of the two stakeholders in the reverse logistics system under different equilibrium conditions,arrived at the basic condition to stabilize the system,and at the end,summarized the major strategies for the establishment of the reverse military logistics system by military and corporate parties.
non-cooperative game;reverse military logistics system;game model establishment;stability analysis
E234;F224.32;F252
A
1005-152X(2015)10-0259-05
2015-06-18
全軍物資經濟研究中心科研計劃項目(DALS2014-TH-023)
張侃(1985-),男,博士生,海軍工程大學裝備經濟管理系講師,研究方向:國防經濟。
10.3969/j.issn.1005-152X.2015.10.069