安鑫山,許佳瑩
(蘭州交通大學交通運輸學院,甘肅 蘭州 730070)
隨著我國機動車保有量的快速增加,城市交通擁堵、交通總效率低等問題越來越突出,人們對高效、綠色、節能出行的需求日益強烈。《“十三五”現代綜合交通運輸體系發展規劃》中提出,我國將規劃建設城市步行和自行車交通體系,逐步打造國家步道系統及自行車路網,并推動慢行交通與公共交通融合發展[1]。從國際大型城市經驗來看,交通機動化在發展到一定程度后,會向慢行交通回歸,“后汽車時代”已成為歐洲城市交通發展的潮流。中國經濟新常態下的城市交通,正在逐步向這一階段進發。完善以自行車出行為主的慢行交通系統,改變城市出行結構,倡導綠色出行,是經濟結構在對稱態基礎上的可持續發展。
城市公共自行車在我國發展大致經歷了三個階段[2]:第一階段(2007—2010 年)自國外引入,由政府主導,分城市管理的有樁租賃單車;第二階段(2010—2014 年)以永安行[3]為代表,由政府主導、企業承包市場運營的租賃單車;第三階段(2014 年至今)以“共享經濟”為背景,由企業主導的無樁租賃單車——“共享單車”。
自2007 年我國引入城市公共自行車系統以來,在北京、杭州等城市開展試點后,已有300多個城市建立了城市公共自行車系統,基本完成了公共自行車使用權在多人之間讓渡及使用權和所有權的分離,實現了城市自行車交通公共化,為城市慢行交通系統終端環節的打造和城市交通“最后一公里”問題的解決提供了可行性方案。然而,公共自行車因受自身“有樁”屬性及相對落后的技術手段的局限,存在消費者取還車不便、辦理用車程序繁瑣等弊端,未從根本上解決民眾出行“最后一公里”的問題。2014年“共享單車”的概念在我國高校校園興起,在“共享經濟”熱潮和“互聯網+”的背景下,憑借“無樁”的便利、靈活等優勢迅速被民眾接受。共享單車的崛起對各城市既有公共自行車服務系統造成了一定程度的沖擊,城市公共自行車被逐漸邊緣化。與此同時,共享單車的發展也出現一些問題,如由于技術含量低,行業不存在高進入壁壘,致使市場過度競爭,企業盈利困難[4];互聯網風口下誕生的新業態對資本過分依賴,共享單車行業無序增長[5],進而引發了共享單車企業運營過程中出現單車停放監管缺位、單車損毀嚴重、消費者退押金難等一系列問題。
國內一些學者認為,我國城市公共自行車與共享單車兩種公租單車模式實為互補關系。馬書紅等[6]構建了用戶滿意度最大化、企業利潤最大化、政府效用最大化的三方博弈多目標規劃模型并加以求解,認為二者并不完全屬于同質競爭,且存在一定的互補關系,其中政府補貼是強化兩者互補關系的關鍵;凌琳等[7]認為城市公共自行車與共享單車應當共存、互補、錯位發展,取長補短,并經過調研與分析,從政策制定、城郊差別化、客群定位、停放管理等7 個方面提出二者共存發展措施;褚宏帆等[8]基于出行者對出行方式的選擇行為,構建了政府與出行者的演化博弈模型,通過對模型穩定點的計算和分析,得出政府加強自行車管理的策略對出行者出行方式的演化趨勢起著促進作用,并提出城市公共自行車與共享單車應遵循協同發展的策略。
當前,正處于共享單車瘋狂增長過后的“退潮期”,公共單車市場競爭的下半程,一些城市政府已經開始對企業的運營進行初步管制。上海、杭州、福州、廣州、南京等多個城市陸續出臺了“以總量控制為基礎”的共享單車“限投令”,暫停新增投放,進行城市治理。兩種模式的公租單車企業也開始相互學習,互相收購、整合,如城市公共自行車的“領頭羊”企業永安行,收購哈羅單車,并通過一年多精細化運營,率先實現盈利。
總體而言,國內外既有關于公租單車博弈的研究多基于非合作博弈理論,針對博弈過程進行建模分析,其中部分關于公租單車企業間互補性的研究也鮮有通過建模和求解的方式對合作結果進行量化分析。然而,無論是政府管控還是企業間模仿、學習或并購,未來城市公租單車的發展必然趨于多方合作的方向。為此,本文將基于合作博弈的思想,構建共享單車企業、城市公共自行車企業及政府的三方合作博弈模型,利用Shapley值法進行求解,并考慮聯盟的形成過程,以一致許可值的合作博弈方法,改進聯盟的收益分配向量,為促成上述兩種企業之間及企業與政府的積極合作提供理論支撐。
由城市公租單車系統中兩種不同運營模式的企業(共享單車、城市公共自行車)及負責監管的政府為參與人三者構成集合N={1,2,…,n},設集合N的任一子集為S,表示各參與人所形成的聯盟,則N中存在2N個聯盟S。每個子集皆對應一個特征函數v(S),表示如果聯盟S中參與人相互合作所能得到的總收益,則特征函數v是從2N={S|S?N}到實數集RN的映射,稱有序數對(N,v)為合作博弈[9]。設xi為當參與人是N,總收益是v(N)時,分配給參與人i∈N的收益,則特征函數v是從2N={S|S?N}到實數集RN的映射,稱有序數對(N,v)為合作博弈[9]。
合作博弈的解,即收益分配向量應滿足:

對于任意S,T∈2N,有:

式(1)表示沒有參與人的聯盟沒有收益;式(2)和式(3)分別刻畫了n人合作博弈中收益的分配方案須同時滿足個體理性和集體理性[10];式(4)表示當任意兩個聯盟的交集為空時,這兩個聯盟中所有參與人組成的新聯盟總收益總是不小于原來兩個聯盟的收益之和,對于這個性質,以下稱為超可加性。
從城市公租單車系統參與人的合作博弈模型中可以看出,大聯盟的形成主要取決于v(N),而大聯盟的穩定性則由大聯盟形成后分配給各參與人的收益xi(即合作博弈(N,v)的解)來決定。
Shapley 值法由Shapley 于1953 年在合作博弈的基礎上提出[11]。在聯盟型合作博弈中,n人合作可帶來最大收益(最小成本),Shapley值法是一種在n個參與人當中分配收益(分攤成本)的方法[12]。
公租單車系統中n人參與的合作博弈(N,v)的Shapley值將大聯盟的收益v(N)按照如下公式進行分配:

式(5)中:s表示聯盟S中參與人個數;v(S∪{i})表示參與人i加入子集后聯盟可取得的收益,參與人i的Shapley值φi(v)等于它對所有聯盟S?Ni的邊際貢獻v(S∪{i})-v(S)的期望收益;s!(n-s-1)! 為排在i前s個參與人與排在i后(n-s-1)個參與人的排序方式數量。
根據以上模型描述,在城市公租單車系統各個參與人的合作博弈中,傳統Shapley值法按照概率調整過的邊際貢獻之和給參與人分配收益。不過,這種方法存在一個不足之處:它只關注聯盟內部結構和所形成聯盟的收益,卻忽略了參與人在進出聯盟時對其他參與人的外部性,即參與人不加入聯盟可得到搭便車的好處,這將影響參與人進行合作時的動機[13]。
一致許可值法在確定參與人的最終收益時,從雙邊角度考慮參與人之間的外部性及聯盟特性[14]。設σj表示{1,2,…,n}到N的某一雙射,則j∈{1,2,…,n!}。對于k∈{1,2,…,n},定義={σj(1),σj(2),…,σj(k)},=φ。定義合作博弈(N,v)中聯盟的標準剩余r()為:

如果參與人按照σj的順序進入聯盟,則定義個體標準剩余(v)為:

合作博弈(N,v)的一致許可值λi(v)是參與人i在所有雙射下所有個體標準剩余的期望值,即:

由式(6)~式(8)可知,一致許可值法是將原有聯盟整體看作一個參與人,與新加入聯盟的參與人平分雙方組成大聯盟所產生的收益,并非像Shapley值那樣將所有邊際收益分配給新加入的參與人。這樣參與人之間便達成了“一致許可”,形成穩定聯盟。
設A,B,G分別為某區域共享單車企業、城市公共自行車企業及管轄該區域相關工作的政府;p為每輛單車自運營起至報廢時用戶為每輛單車所支付的平均費用,為簡化起見,假設用戶為共享單車與城市公共自行車所支付的平均費用相等;Q1,Q2分別為該區域對共享單車和城市公共自行車的實際需求量,由于二者運營模式不同,用戶人群需求不同,因此假設市場對二者需求量各自恒定;q1,q2分別為共享單車和城市公共自行車的實際投放量;c1,c2分別為共享單車和城市公共車自行車投放每輛單車的邊際成本,即平均每輛單車的生產成本與運營成本之和。
在共享單車企業、城市公共自行車企業和政府三方非合作狀態下,共享單車由于過度增長將受到政府的處罰。因此,共享單車企業的收益為用戶使用共享單車的實際支付減去其運營成本和政府對其的罰款,即:

式(9)中:γ為政府獎懲系數(假設政府對企業的補貼和處罰力度一樣大)。
由于城市公共車自行車多采用有樁、定點的運營模式,且享受政府扶持補貼,因此令c2=c1+αq2,表示每輛城市公共自行車的邊際成本是由c1加上每輛城市公共自行車平均多出的站點建設成本并扣除每輛城市公共自行車政府的平均補貼金額。系數α表示平均站點建設成本和平均補貼金額與q2有關。
此時共享單車占據大部分市場份額,即q1≥Q1+Q2,其投放量大于市場實際需求量。同時,運營成本相對較高的城市公共自行車企業則縮小規模(q1<Q2),無法滿足市場對有樁公共自行車的通勤需求,因此政府將減少對企業的扶持補貼,其收益v(B)為:

本文根據福利經濟學原理,用社會效用表示政府收益,即社會效用為生產者剩余與消費者剩余之和減去外部效應成本。生產者剩余即為企業收益,為計算方便,政府收益不再計算這一部分,即政府收益為公租單車總消費者剩余與外部效應成本之差。于是:

式(11)中:β為社會負效應懲罰系數;Cs=p′-p為消費者剩余[15],指消費者在購買一定數量的某種商品愿意支付的最高價格和實際支付價格之間的差額,其中p′為每輛單車自運營起至報廢時用戶愿意支付的最高平均價格,因消費者剩余并不是實際收益,在聯盟收益計算時須乘以收益計算系數ρ;Ec=β(|q1-Q1|+|q2-Q2|) 為外部效應成本,指社會效用產生過程中造成的負外部效應,本文用企業所投放單車規模的過度增長或萎縮所造成的社會負效應來表示這一參數。
當政府與共享單車企業合作時,政府指導并監管共享單車企業就單車投放量回歸理性,設其規模量恰好等于市場需求量,即q1=Q1,且不再受到相關處罰。政府由于監管得當,也降低了外部效應成本。此時,該聯盟收益為:

當政府與城市公共自行車企業合作時,政府須指導并繼續扶持補貼企業滿足城市公共自行車通勤需求,促使企業合理增長,政府的社會效用也相應得到增加。此時q2=Q2,該聯盟收益為:

如果兩種企業決定合作并差異化經營,控制各自單車保有量的過度增長或萎縮,按需投放,則其聯盟收益為:

此時,由于單車市場回歸常態化經營,政府獲得“搭便車”收益v(G)′:

共享單車、城市公共自行車以及政府在三方聯盟形成后,企業收益、社會效用均達到最優,聯盟收益v(A∪B∪G)為:

本文以蘭州市公租單車系統為例,對其共享單車企業、城市公共自行車企業和政府的三方合作博弈構建模型,并對各方收益分配進行求解。
根據上述聯盟收益分析可以看出,由共享單車企業、城市公共自行車企業及政府三個參與人參與的博弈滿足合作博弈條件(1)~(4)。為使求解過程清晰,算例對以上收益模型進行數字量化。
(1)互聯網租賃自行車需求量
截至2018 年底,蘭州市共投放共享單車29萬輛,城市公共自行車1 萬輛,建設城市公共自行車站點376 個。蘭州市公共自行車租賃系統于2014年6月30日正式試運營,城市公共自行車最高日租用人次6.8萬,日周轉率7次。后受共享單車影響其周轉率下滑,并自2017年末以來,蘭州市未再進行城市公共自行車投放。假設由于共享單車客群不同,一部分原城市公共自行車用戶轉移至共享單車,遂取城市實際公共自行車平均日周轉率為5 次。另外,從當前國內公開數據來看,共享單車的平均日周轉率為2 次。一般認為,互聯網租賃自行車的合理日均周轉率為4~5次,取蘭州市互聯網租賃自行車需求日周轉率為4 次,依據出行總量反推法可測算出,蘭州對于共享單車和城市公共自行車的需求量分別為14.5萬輛和1.25 萬輛。對比蘭州市交通運輸委員會《蘭州市互聯網租賃自行車總量需求評估咨詢報告》按照百人擁有量法、出行分擔率法、出行總量反推法預測的蘭州市互聯網租賃自行車需求投放總量分別為不高于15.18萬輛、9.1萬~12.63萬輛、13.26萬~16.6萬輛的數據,故本文所取需求量參數合理。
(2)互聯網租賃自行車成本及價格
因國內互聯網租賃自行車品牌繁雜,各自的生產成本、運營成本差別較大。城市公共自行車因配備固定樁的需要增大了成本,平均造價高于共享單車,不過城市公共自行車企業享受政府補貼。為了消除由于產品成本差異帶來的復雜計算,設α=0,即c2=c1。另外,根據國內公開資料顯示,共享單車的平均成本約為700~1000 元/輛,遂取c2=c1=1000萬元/萬輛。據《2018 中國共享單車行業發展報告》[16]統計,共享單車和城市公共自行車出行距離主要分布在3km 以內,85%的出行時長處于15min 以內,目前蘭州市新一輪調價后規定此出行范圍內的收費標準為1.5 元/次(此前為1元/次)。根據上文,按當前公租單車需求日周轉率4 次及共享單車報廢期3 年(參照北京)為限計算,p=6570萬元/萬輛。
(3)消費者剩余
根據需求定律,設互聯網租賃自行車需求曲線方程為y=az+b,其中z為自行車單次使用價格,y為自行車總投放量,根據上述互聯網租賃自行車價格及投放量變化情況,取(z1,z2)=(1.5,1),(y1,y2)=(15.75,30),可計算出需求曲線方程為y=-28.5z+58.5,則租賃自行車單次使用的消費者剩余為圖1 中陰影部分面積,即4.33 元,則Cs=18971萬元/萬輛(為計算方便,Cs已作取整處理)。

圖1 公租單車市場需求曲線
根據上述模型及參數分析,依據式(9)~式(16)可得公租單車合作博弈各聯盟的收益,如表1所示。

表1 公租單車系統合作博弈聯盟收益
根據聯盟型博弈模型,設蘭州市共享單車企業、公共自行車企業和政府按順序的排列集合為N={1,2,3},其合作博弈(N,v)的Shapley 值根據式(5)分配如下:

同理,可得:

不難看出,Shapley值法雖然簡單易行,但如前文所述,其忽略了參與人在進出聯盟時對其他參與人的外部性。如本例中所示,政府不必參與共享單車企業與城市公共自行車企業形成的聯盟,便可獲得額外收益,而這與實際情況是相違背的,因此采用一致許可值法對算例進一步求解。
當共享單車企業與城市公共自行車企業形成聯盟時,政府收益為v(G)′=298793.25ρ。設σ1:1,2,3→N是σ1(1)=1,σ1(2)=2,σ1(3)=3,則:


同理,可計算出三個參與人在其他映射下的個體標準剩余,見表2。

表2 公租單車系統參與人個體標準剩余
于是,合作博弈(N,v)的一致許可值分配如下:

同理,可得:

根據蘭州市公租單車系統合作博弈Shapley值法和一致許可值法計算結果,可知:
(1)無論采用Shapley值法還是一致許可值法進行收益分配,分配向量均滿足公租單車系統合作博弈參與人的集體理性和個體理性,即φi(v)≥v(i),且;λi(v)≥v(i),且,分配結果實現了超可加性。
(2)政府通過一致許可值分配所得收益λ3(v)顯著大于通過Shapley 值分配所得φ3(v),說明在合作博弈過程中,當共享單車企業和城市公共自行車企業形成聯盟的情形下,政府雖未加入大聯盟,但仍可獲得前兩者合作所產生的“便車”收益,因此,考慮一致許可值法的分配可增加其收益,從而提高其參與合作積極性,消除其不合作動機。
(3)本文將合作博弈中的參與人收益分為四個部分:實際收益、消費者剩余收益、外部效應收益及補貼收益,后三者分別使用系數ρ,β和γ予以調整。對比非合作狀態下參與人的收益情況,兩種收益分配模型均使得共享單車、城市公共自行車企業和政府的實際收益實現增長。而實際情況下,參與人政府的收益應體現為虛擬收益,并非實際收益。于是根據合作博弈的可轉移效用理論,政府的實際收益部分在實際應用中應轉化為補貼及施行監管所耗成本的形式分別轉移至兩種企業的收益和自身開支計算。
本文利用合作博弈理論分析了城市公租單車系統中參與人的合作博弈過程,基于Shapley值法對該合作博弈模型求解,得到較為合理的收益分配向量,并在一致許可值的基礎上,改進了分配向量,增加了聯盟形成的可行性與穩定性。通過兩種方法的計算結果可以看出,收益分配可行,且一致許可值法在政府參與的合作博弈模型中更具科學性和實用性,為城市公租單車系統各方收益分配和聯盟形成提供了理論參考。分析表明,城市公租單車市場在處于無政府監管的狀況下出現單車無序投放、企業收益水平低、民眾認可度等低的亂象。然而市場經過一段時間的自我調節,各方收益及社會效益會向常態水平回歸。但市場調節速度緩慢,各參與主體在市場調節的過程中將付出非必要成本,導致聯盟集體收益差。因此,在政府參與的城市公租單車系統中,須使政府處于主導地位,以監管和補貼為手段促進企業間的合作,指導企業進行精細化運營,促使市場加速回歸正常。
由于公租單車市場上不同運營模式、不同類型的企業多,單車成本、企業運營成本等數據較難獲得,本文將以上數據通過定性分析進行了標定,主觀性較強;另外,受共享單車模式沖擊,當前國內許多城市已停止了對城市公共自行車的投放,故對于城市公共自行車的需求量預測等數據誤差可能相對較大。盡管如此,當前公租單車市場上,仍有類似“永安行”的傳統城市公共自行車企業通過合理運營、模式升級、企業并購等方式實現盈利,所以合作博弈在該領域的研究對政企聯盟的形成具有非常重要的意義。
考慮到本文模型中參與人收益的標定存在主觀因素,應用時具有一定的局限性,因此未來應以經濟學理論和非合作博弈理論為基礎,參考古諾、Stackelberg 等模型,以公租單車市場博弈參與人的收益為目標進行不同策略組合收益研究,改進現有模型,使之更加客觀和普適。