張根明,張曼寧
(中南大學 商學院,湖南 長沙 410083)
習近平總書記在十九大報告中指出創新是引領發展的第一動力,是建設現代化經濟體系的戰略支撐。隨著行業技術變革的加快以及消費者需求的不斷變化,產品的生命周期日益縮短,使得市場競爭愈加激烈,企業唯有不斷創新才能在激烈的競爭環境中掌握主動。由于受到創新資源和研發水平的限制,越來越多的企業選擇與高校、科研院所建立產學研創新聯盟。產學研創新聯盟實質就是企業、高校和科研院所基于自身發展目標,為抓住市場新機遇實現共同利益而建立的一種資源互補、利益共享、互惠共贏的聯盟形式,對我國創新發展以及自主創新能力的提升具有推動作用。
但近來年,聯盟關系不穩定已成為制約我國產學研發展的瓶頸。由于產學研合作的環境、體制和機制尚未完善,在產學研合作中雙方都可能存在投機行為,如單方違約、參與主體存在消極意愿、出于對自身資源的保護而在資源投入、努力程度以及信息溝通方面與合作時的承諾不一致等。這些因素都會導致產學研創新聯盟的不穩定,損害了整體以及個體利益,因此,產學研創新聯盟穩定性對合作雙方都至關重要[1]。
產學研合作具有較高的不穩定性,麥肯錫研究報告指出近一半的聯盟最終走向失敗[2],因此很多學者對聯盟穩定性展開了深入研究。通過梳理國內外相關文獻發現,諸多學者從影響聯盟穩定性的內部因素和外部因素兩方面來進行研究。在探討外部因素方面:Jackson[3]認為聯盟伙伴從聯盟合作創新中所獲的收益要大于其單獨創新所獲得的利益,聯盟才有可能穩定。因此,聯盟利益分配問題是聯盟穩定的關鍵。Flam[4]等研究了聯盟企業在共享聯盟中的技術、任務以及稟賦的情況下成本可轉移的博弈行為,指出在成本最小的情況下的利益分配方式。Gil和Passino[5]討論了合作資源分配的公平性對戰略聯盟穩定性的影響,得出資源分配越公平,聯盟就越穩定。除了利益分配因素外,Hagedoom[6]認為聯盟穩定還會受到技術因素的影響,如果創新所需的技術知識過于先進,不能夠很快地轉化為現實生產力,那么可能會導致聯盟提前終止。曾德明[7]研究得出合理的成本分擔比例有利于加快信息、知識在聯盟內的流通,提高聯盟成員的研發積極性,從而促進聯盟的穩定發展。
在探討內部因素方面:Gill和Butler[8]研究了日本企業在英國和馬來西亞的跨國合資企業,認為成員之間的信任、沖突和依賴是影響穩定性的關鍵因素,并提出只有增強成員間的信任,減少沖突以及技術資源的依賴才能促進聯盟穩定運行。任聲策和宣國良[9]在Sinha和Cusumano模型基礎上,通過引入學習因素,分析得出學習因素會導致互補因子降低,從而會影響合作的穩定性。蔣樟生[10]從知識轉移的角度探討了權益結構和知識學習能力對技術創新聯盟穩定性的影響。高艷慧和萬迪昉[11]利用實驗經濟學的方法研究得出聲譽機制能夠減少聯盟企業的機會主義行為,消除聯盟企業借助信息優勢獲取的額外收益。孫霞和趙曉飛[12]指出,聲譽機制是促進聯盟穩定的重要工具,能激勵合作雙方積極投入到合作中,同時防止機會主義對聯盟穩定性的影響。曹霞[13]研究得出知識資源的互補性、合作聲譽以及溝通交流對產學研合作創新和穩定具有積極促進作用。
目前,學者們對聯盟穩定性的研究多集中在企業間技術聯盟[9,10],而關于產學研創新聯盟研究較少且以靜態研究為主,但是產學研創新聯盟是一個動態的過程,聯盟成員在會在不斷學習和試錯中調整自身策略,最終實現最優選擇。學者在采用演化博弈論對產學研合作穩定性進行研究時多集中在“合作”與“不合作”策略上[1,14],但合作后雙方依然存在機會主義行為使得合作不能持續,損害總體利益。另外,研究多為對稱博弈[15],沒有結合產學研聯盟的特性。產學研聯盟與企業間的技術聯盟不同,聯盟成員之間差別較大,因此所采取的策略也不盡相同。
鑒于以上,本文結合產學研創新聯盟雙方所處環境的現實特征,針對我國產學研合作中存在的具體問題,給出企業策略集為{堅持合作,中途背叛},學研方策略集為{積極研發,消極研發}。產學研合作是一個動態的過程,因此本文從動態視角考慮企業學習能力對產學研創新聯盟穩定性的影響,其次將聲譽損失、長期效益考慮到模型中,通過建立演化博弈模型分析企業學習能力、聲譽損失、長期效益、利益分配系數及懲罰金額對產學研聯盟穩定性的影響,并利用Matlab進行數值仿真模擬,清晰直觀地展現企業和學研方的演化行為及結果,以期為提高產學研創新聯盟的穩定性提供理論指導。
假設1企業在合作中學到足夠的知識就能獲得單方收益,所以企業很有可能在實現單方收益后選擇中途背叛[16]。企業作為產學研合作中的資金支持方,占相對的主導地位,可以根據從產學研合作中獲得的利益來選擇是繼續合作還是中途背叛。因此假定企業策略選擇集為{堅持合作,中途背叛}。學研方作為技術或知識的持有者,是技術和知識轉移的主體,為產學研合作創新活動提供其所需的知識。學研方可能出于對自身資源和技術的保護,選擇消極研發,即提供的知識中核心知識所占比例較低。由于研發出的產品收益受到多方面的影響,比如市場、經濟環境等外生因素,這些外生因素恰恰可以掩蓋學研方消極研發的行為。因此假定學研方選擇策略集為{積極研發,消極研發}。
假設2企業與學研方在不合作的情況下雙方收益為π1和π2。為了便于分析,統一記為0。合作帶來的創新收益增值記為Δπ,為本文的顯性收益。按提成的方式進行利益分配,合作成功時,企業的利潤為αΔπ,學研方為(1-α)Δπ。若企業選擇背叛,則合作失敗,收益增值為0。
假設3為了便于分析,企業和學研方參與合作初始投入成本在這里統一記為0。主要考慮合作后的后續成本。若企業堅持合作,則后續成本為C1;若企業選擇中途背叛,則后續成本為C4,且C1>C4>0。學研方積極研發時的后續投入成本為C2;反之,消極時則記為C3,且C2>C3>0。企業選擇中途背叛,而學研方暫時沒有察覺得到,所以仍然堅持投入成本。
假設4學研方在后續合作中可能會出現消極行為,即在知識轉移過程中降低核心知識的量。我們用θ表示學研方轉移的核心知識與總知識的比。當θ為零時,說明學研方沒有向創新聯盟轉移核心知識,損害了聯盟的利益。當θ為1時,說明學研方積極地將所掌握的核心知識轉移到聯盟中。學研方積極研發時為θ1,消極時為θ2,θ1>θ2>0。
假設5當企業選擇中途背叛時,需要支付給學研方違約金額C。同時聲譽是企業的一項資產并且難積易損,企業擁有良好的聲譽能夠吸引更多的合作伙伴。但企業采取機會主義行為損害了合作伙伴的利益,那么企業聲譽受到損失,在這里記為k。
假設6企業與學研方在尋找各自合作伙伴時會產生交易成本,同時也需要付出時間成本和機會成本,而企業與學研方能建立長期穩定的關系能給雙方節約成本。因此,企業堅持合作,學研方積極研發時能夠帶來長期效益,分別記為T1和T2,為本文的隱性收益。
假設7企業與學研方合作的過程中,企業學習對方的核心知識或者技術的能力為P。若企業沒有自主研發能力,P=0。假設學研方提供的技術價值為ν,可以從學研方獲得的技術價值為Pθν。一般情況下,企業與學研方合作所獲得的創新收益是要大于企業背叛所獲得額外收益,即Δπαθ>Pθν。
根據以上假設,可以得出產學研合作的支付矩陣,如表1所示。

表1 產學研合作支付矩陣
假設產學研合作中,企業堅持合作的概率為x,采取中途背叛的概率為1-x,而學研方積極研發的概率為y,消極研發的概率為1-y。根據企業與學研方的支付矩陣,我們可以得到以下復制動態方程。
2.2.1 企業
堅持合作的期望收益為:U11=y(Δπαθ1-C1+T1)+(1-y)(Δπαθ2-C1);中途背叛的期望收益:U12=y(Pθ1ν-C4-C-k)+(1-y)(Pθ2ν-C4-C-k);企業的平均期望收益為:U1=xU11+(1-x)U12;企業的復制動態方程為:
F(x)=dx/dt=x[U11-U1]
=x(1-x)[y(Δπαθ1-Δπαθ2)+Δπαθ2+
yT1-C1+C4+C+k-y(Pθ1ν-Pθ2ν)-Pθ2ν]
F′(x)=(1-2x)[y(Δπαθ1-Δπαθ2)+Δπαθ2+
yT1-C1+C4+C+k-y(Pθ1ν-Pθ2ν)-Pθ2ν]
2.2.2 學研方
積極研發的期望收益為:U21=x[Δπ(1-α)θ1-C2+T2]+(1-x)(C-Pθ1ν-C2);消極研發的期望收益為:U22=x[Δπ(1-α)θ2-C3]+(1-x)(C-Pθ2ν-C3);學研方的平均期望收益為:U2=yU21+(1-y)U22;學研方的復制動態方程為:
G(y)=dy/dt=y[U21-U2]
=y(1-y)[xΔπ(1-α)(θ1-θ2)+xT2-Pθ1ν+
Pθ2ν-C2+C3+x(Pθ1ν-Pθ2ν)]
G′(y)=(1-2y)[xΔπ(1-α)(θ1-θ2)+
xT2-Pθ1ν+Pθ2ν-C2+C3+x(Pθ1ν-Pθ2ν)]
分別令F(x),G(y)為零,得出均衡點:E1(0,0),E2(0,1),E3(1,0),E4(1,1),E5(X0,Y0)其中:
(1)當Pθ2ν-C4-C-k-Δπαθ2+C1>0,且Pθ2ν+C1-C4-C-k-Δπαθ2<Δπα(θ1-θ2)+T1+Pθ2ν-Pθ1ν,得出Pθ1ν-C4-C-k-Δπαθ1+C1-T1<0,此時0 (2)當Pθ2ν-C4-C-k-Δπαθ2+C1<0,已知Δπα(θ1-θ2)+T1+Pθ2ν-Pθ1ν>0,得出Pθ1ν-C4-C-k-Δπαθ1+C1-T1<0,此時Y0<0。對于任意y∈[0,1],總有F′(1)<0,所以x=1為穩定策略。即不論學研方采取何種策略,企業都會采取堅持合作策略。 (3)當Pθ2ν-C4-C-k-Δπαθ2+C1>0,且Pθ2ν+C1-C4-C-k-Δπαθ2>Δπα(θ1-θ2)+T1+Pθ2ν-Pθ1ν,得出Pθ1ν-C4-C-k-Δπαθ1+C1-T1>0,此時Y0>1。對于任意y∈[0,1],總有F′(0)<0,所以x=0為穩定策略。即不論學研方采取何種策略,企業都會采取堅持中途背叛。 (1)已知Pθ1ν-Pθ2ν+C2-C3>0,當Pθ1ν-Pθ2ν+C2-C3<Δπ(1-α)(θ1-θ2)+T2+Pθ1ν-Pθ2ν,得出Δπ(1-α)(θ1-θ2)-C2+T2+C3>0。此時0 (2)當Pθ1ν-Pθ2ν+C2-C3>Δπ(1-α)(θ1-θ2)+T2+Pθ1ν-Pθ2ν,得出Δπ(1-α)(θ1-θ2)-C2+T2+C3<0,此時X0>1,所以y=0為穩定策略。即不論企業采取何種策略,學研方會選擇消極研發。 將以上的各種情況配對,有6種條件組合,如表2所示。 表2 企業和學研方不同條件組合下的演化穩定點 從上表2我們可以得出: (1)當企業和學研方都滿足條件一時,演化博弈穩定點為E1(0,0)和E4(1,1)。博弈的結果取決于雙方的合作誠意,即企業、學研方選擇堅持合作和積極研發的初始概率大于一定值時,穩定點為E4(1,1)。企業選擇“堅持合作”策略,學研方選擇“積極研發”策略。 (2)當企業滿足條件一,而學研方滿足條件二時,穩定策略點為E4(1,1)。由于企業中途背叛所支付的違約金以及聲譽損失大于其背叛所獲得額外收益以及所節約的成本,所以不管初始狀態如何,企業都會選擇堅持合作,最終博弈的結果為企業采取堅持合作,學研方選擇積極研發,雙方實現共贏。因此違約金機制,聲譽機制能在一定程度上保證產學研合作的穩定性,提高合作的創新收益。 (3)其他四種情況都不會出現雙方積極合作的情況。當學研方滿足條件三時,產學研合作終止。由于企業違約所獲得額外收益比較大,超過了違約支付的懲罰金以及其他損失,或者企業堅持合作投入的成本太大,企業最終選擇中途背叛。因此合理投入的成本也有利于維持產學研聯盟的穩定性。 當穩定點為E1(0,0)和E4(1,1),博弈的結果對初始值具有依賴性。如圖1所示,當初始值落在S1區域(即區域BECD)時,演化結果向E4(1,1)收斂,穩定策略逐漸向“帕累托最優”的方向演化;當初始值落在S2區域(即區域ABEC)時,演化結果向E1(0,0)收斂,最終走向“囚徒困境”。因此產學研合作向哪個狀態演化取決于S1和S2面積的大小。若S1>S2,系統向(堅持合作,積極研發)方向演化的概率更大;若S1 圖1 產學研合作演化博弈相位圖 S1對P求偏導,得出S1的面積隨著P的增加大而減少,系統向E1(0,0)方向演化的概率增大。即企業堅持合作,學研方積極研發的概率將減少。可以理解為當企業學習能力越強,企業從學研方獲得的學習收益就越高,企業更有可能選擇中途背叛。 S1分別對k和C求偏導,得出S1的面積隨著k和C的增加大而增大。系統向E4(1,1)方向演化的概率增大。因此,當企業背叛所受到的聲譽損失值以及違約金額增大時,能夠有效遏制企業的投機行為。 S1分別對T1和T2求偏導,得出S1的面積隨著企業與學研方積極合作所獲得長期效益T1,T2增加而增大。企業堅持合作、學研方積極研發所帶來的長期效益越大,系統向E4(1,1)方向演化的概率就越大。 S1對α求偏導,得出α對S1的影響是非單調的,進行二階求導結果小于零,所以存在極大值。 令一階導數為零,當滿足 時,S1有極大值,此時系統向E4(1,1)方向演化的概率就越大。因此,存在最優的收益分配系數使得雙方均選擇最優策略,實現帕累托最優。 為了更清晰直觀地反映企業與學研方的動態演化過程,下面運用Matlab就具體算例的策略演化情況進行仿真模擬。 當市場對中途背叛的企業處罰力度不夠,學研方對合作企業信譽要求不高時,參數值如下:Δπ=40,ν=25,α=0.7,P=0.6,θ1=0.8,θ2=0.3,C1=15,C2=5,C3=3,C4=5,C=2,T1=3,T2=2,k=1,根據表達式可得X0=0.6129,Y0=0.3263,取數使得0 5.1.1 企業的策略演化情況 取y=0.5>Y0,企業的策略動態演化過程如圖2所示:當y>0.3263時,x→1。當學研方積極研發的初始概率大于0.3263時,企業會選擇堅持合作。 取y=0.2 圖2 企業策略演化過程 圖3 企業策略演化過程 5.1.2 學研方的策略演化情況 取x=0.7>X0,學研方的策略動態演化過程如圖4所示:當x>0.6129時,y→1。當企業選擇堅持合作的初始概率大于0.6129時,學研方會選擇積極研發策略。 取x=0.5 圖4 學研方策略演化過程 圖5 學研方策略演化過程 5.1.3 綜合分析 將企業和學研方的分析綜合企業,當企業和學研方均滿足條件一時,結果如圖6所示,演化博弈穩定點為E1(0,0)和E4(1,1),最終結果取決于初始時企業選擇堅持合作,學研方選擇積極研發的概率。 圖6 企業和學研方策略穩定情況 圖7 企業策略演化過程 當市場對中背叛的企業處罰力度加大,學研方對合作企業信譽要求變高時,其他參數不變,令C=5,k=5,根據表達式可得X0=0.6129,Y0=-0.4105,取數使得0 5.2.1 企業的策略演化情況 任意選取y的取值,結果如圖7所示,不管y的值為多少,x→1,即不論學研方選擇積極研發的初始概率為多少,企業都會選擇堅持合作。 5.2.2 綜合分析 當學研方滿足條件二,而企業滿足條件一時,穩定策略點為E4(1,1)。結果如圖8所示。 圖8 企業和學研方策略穩定情況 本文運用演化博弈理論構建了產學研創新聯盟演化博弈模型并對聯盟過程中的穩定性進行分析,得到的主要結論為:(1)企業和學研方演化結果受到系統初始狀態的影響。(2)學習能力越強的企業越能從學研方處獲得較高的收益,從而搭便車的機會主義傾向就越強,雙方采取{中途背叛,消極研發}的概率就越大。(3)企業選擇中途背叛所支付的違約金額、遭受的聲譽損失和企業選擇堅持合作收獲的長期效益越大,達到最優策略的概率越大。(4)存在最優的收益分配系數使得雙方均選擇最優策略,實現帕累托最優。 (1)構建合理的額外收益分配比例 上述分析得出存在最優的收益分配系數使得雙方均選擇最優策略,當額外分配比例滿足一定條件時,企業選擇堅持合作且學研方選擇積極研發,雙方獲得更多的收益增值。同時由于成員地位差別比較大,產學研聯盟利益也更追求合理性、公平性,所以構建合理的額外收益分配比例是雙方通力合作的基礎,有利于達到系統最優狀態,從而實現雙贏。收益分配比例還受到了其他一些因素的影響,企業與學研方在合作之前應該綜合以上所探討的因素,確定合理、公平的收益分配比例。 (2)建立有效的懲罰機制 從上述分析中,我們發現當增加違約金數額時,產學研雙方選擇堅持合作和積極研發的概率增大,因此違約金能夠有效制約企業投機行為。學研方與企業在合作之前,規定雙方應該遵守的規則,建立有效的懲罰機制,對于違反合約中途背叛的行為應該給予經濟上的處罰,增加違約的成本。 (3)加強知識產權保護 企業選擇投機行為所獲得的學習收益受到知識產權保護強度的影響。若該地區對知識產權保護比較薄弱,加上技術又比較容易復制,那么企業則更容易采取投機行為。政府應加強監管,完善知識產權立法,加強知識產權執法,加大對侵權違法行為的懲治力度。如果合作企業的動機是獲取學研方的技術知識,那么產學研合作終止的可能性較大。因此,學研方在與企業合作時,要對合作企業的發展趨勢、合作動機進行判斷,根據自己的具體情況選擇合適的聯盟伙伴,加強知識產權保護意識,并在合作前明確相關義務和責任。 (4)將企業行為納入社會信用體系 企業的聲譽損失越大越能夠有效減少企業的機會主義行為,因此將企業不良行為納入社會信用體系,記錄參與者在聯盟過程中采取的投機行為,可以增加聲譽對企業的影響,間接增加了企業的違約成本(隱性成本)。信用體系的不斷完善會逐漸減少企業和學研方間的信息不對稱,減少機會主義行為,從而維持產學研聯盟的穩定。 首先受學研方研發積極性難以監測的影響,本文沒有考慮企業對學研方的監督,后續研究可以引入政府、中介機構實現對學研方的監督,探討三者之間的博弈行為。其次,產學研聯盟相關數據獲取較難,所以本文在進行仿真時的參數并不是實際參數,只能反映企業和學研方行為的趨勢。因此在后續的研究中將積極對企業、高校、科研院所、孵化機構等相關單位進行深度調研,使用真實數據進一步研究,使得理論能夠與應用有效地結合。3.2 學研方策略穩定性分析
3.3 企業與學研方演化博弈穩定策略

4 產學研雙方策略的影響因素分析
4.1 系統初始狀態的影響


4.2 企業的學習能力P
4.3 聲譽損失k,違約金C
4.4 長期效益T1,T2
4.5 收益分配系數

5 數值算例的仿真分析
5.1 情形一






5.2 情形二

6 研究結論與展望
6.1 研究結論
6.2 建議與對策
6.3 研究局限和展望