張應青,范如國,羅 明,孫佳勤
(1.貴州財經大學 工商管理學院,貴州 貴陽 550025;2.貴州財經大學 貴州省大數據統計分析重點實驗室,貴州 貴陽,550025;3.武漢大學 經濟與管理學院,湖北 武漢 430072;4.廣西師范大學 經濟管理學院,廣西 桂林 541004)
“創新驅動”是國家高質量發展的根本動力[1]。中國科技創新發展以來,中國企業效益和競爭力不斷提升,實現了同步跨越式發展。但中國企業整體創新能力仍然較弱,核心技術、高端技術仍有待開發,自主創新驅動優勢尚未建立[2,3],無法有效突破關鍵核心技術“卡脖子”問題[4]。而導致這種困境的原因之一是當前仍有較多的企業存在短視行為[5],缺乏長遠的戰略眼光,僅僅注重眼前利益和短期利益,不愿意進行長期的自主創新研發。
目前,學者對于企業技術創新短視行為的內在機理及其行為機制還缺乏系統性、關聯性分析,特別是當企業不再被看成是“應激—反應”式的簡單個體,而是具有心理感知、利益權衡、復雜決策的智能體[6],傳統的研究方法難以刻畫出企業復雜的心理感知、情景決策及其演化行為[7,8]。隨著行為經濟學及其理論的發展,有學者指出企業是具有心理感知、利益權衡、復雜決策的個體,其決策行為會受到心理行為因素的影響。首先,企業對于收益的感知會受到其參考點依賴的影響。參考點是企業判斷實際結果是否會最終帶來“收益”或“損失”的重要基準[9-11],例如在現實的生產和運營實踐中,企業有可能會事先設定一個預期收益目標,通過將實際收益與預期收益對比,從而判斷自身是否獲得“收益”或“損失”。其次,企業往往會表現出損失厭惡心理。具體而言,相對于同等大小的收益企業,決策者對損失的敏感性更大,即損失的失落感是高于相同收益帶來的幸福感。這一點可以用“處置效應”(Disposition Effect)和“沉沒成本效應”(Sunk Cost Effect)來加以解釋。處置效應描述的是當投資受到虧損或資產貶值情形時,投資者會傾向于繼續持有虧損的投資或資產,而期待出現“反彈”的行為現象[12]。從另一個方面來說,先期的投資或損失已經被投資者視為潛在的損失,如果不持續追加投資或持有損失的資產將會使自身損失更大[13]。其次,企業行為具有風險偏好逆轉的特征。企業在面對收益時,表現出風險規避特性,而面對損失時,又表現出風險喜好特性[14]。最后,企業常常對事件發生概率進行主觀預期。從社會認知的角度來看,企業無法完全準確和充分地計算和考慮各個事件和選擇結果的客觀概率,只能通過自己的認知將其轉化為主觀概率[15],而在將客觀概率轉化為主觀概率時,往往會受到經驗、認知以及記憶的影響,對于罕見的“黑天鵝”“灰犀牛”事件,企業往往傾向于高估這些事件發生的概率,而對于那些經常發生的高概率事件,又會低估其發生的概率。上述企業心理行為很難基于傳統的期望效用理論來進行分析。
因此,文章借助前景理論,將企業決策者的參考點依賴、損失厭惡、風險偏好、主觀預期等行為因素納入到企業決策行為的過程之中,并基于演化博弈理論,來系統分析企業在開放的市場競爭環境下的復雜經濟博弈及其決策行為,從而深入地揭示出企業技術創新短視行為的內在機理和行為機制,進而為破解自主創新困境提供可行的機制設計思路和政策指導。
假設H1:在創新過程中,存在兩類同質的企業代表性群體,即企業群體1 和企業群體2,群體中的每個企業都有兩種策略選擇[5]:自主創新(C)和短視創新(D)。
假設H2:自主創新具有一定的溢出效應。創新技術的溢出效應會通過產業鏈或其他渠道擴散至其他企業,從而使得其他企業也享受到自主創新的福利[16],假設由技術溢出帶來利益的增加用Δπ 來表示。
假設H3:當企業都選擇自主創新策略時,由于技術交互和企業協同作用會進一步加速創新知識的轉化和利用效率[17],創造自主創新超額利潤[18],用π2來表示,a∈[0,1]為超額利潤的分配系數。
假設H4:當一方選擇自主創新策略而另一方選擇短視創新策略時,選擇短視創新策略的企業,會受到外界對其行為的指責和輿論壓力,遭受一定的損失,用h 表示。
由上述分析可得,在溢出效應情形下,企業i 和企業j 選不同策略的博弈收益矩陣如表1 所示。

表1 博弈收益矩陣
其中,πi和πj為基礎收益,當企業選擇自主創新策略時,需付出自主創新成本c,并產生創新效應,用η(η>0)表示自主創新增長系數。
傳統的演化博弈理論是基于最終收益水平的期望效用作為策略學習和決策的依據。而前景理論則是基于前景價值來作為策略學習和決策的依據。在企業的策略選擇過程中,策略的前景價值(V)由價值函數(f(Δπ))和主觀預期權重函數(w(χ))共同構成,表示為:

第一,企業的價值函數可用一個S 型曲線來表示[19],其表達式和圖形為:

其中,Δπ 表示實際收益與參考點之間的差距,當Δπ>0時,表示決策企業對選擇該策略的感受是“收益”,會表現出滿意和傾向選擇此策略;而當Δπ<0 時,表示決策企業對選擇該策略的感受是“損失”,會表現出損失厭惡和不傾向于選擇此策略。此外,Δπ 還具有f(Δπx)″<0,(Δπ>0)和f(Δπ)″>0,(Δπ<0)的特征,分別表示企業決策者在面對收益時表現出風險規避特性,而面對損失時又表現出風險喜好特性[14],同時,f(Δπx)′<f(-Δπ)′,(Δπ>0),體現出了敏感性遞減的性質;α,β(0<α,β<1)分別表示決策企業對“收益”和“損失”價值函數的邊際遞減程度,也可以理解為風險偏好系數或風險感知水平[20,21];λ(λ≥1)表示決策企業對損失的規避系數,其含義是企業決策者對相同程度的收益和損失而言,對損失的敏感程度更高,值越大表明對損失的厭惡程度越大。
第二,考慮了企業收益參考點為“目標”和“底線”的混合參考點情形。其中,“目標”指是能達到的最好的預期或抱負水平,如設定企業發展目標以及企業經營業績等,是驅動企業不斷努力和奮斗的重要因素,當達到“目標”則會表現出滿意,否則表現出失落[22];而“底線”則指的是企業至少要實現的最低預期或最低要求[23]。對于選擇自主創新策略的企業而言,其“目標”是期待雙方都采取自主創新策略時能夠獲得的最高收益,即這可以看成是一種互惠行為的試探,或者稱之為一種社會學習過程[24],如果對方也同樣采取自主創新策略,那么企業實現了自身的心理預期,從而會一直保持這樣的策略;而一旦沒有達到自身的心理預期,將會改變自身的策略以應對,而其“底線”是對方選擇短視創新時自身獲得的最低收益,即對于選擇短視創新策略的企業而言,其“目標”是期待對方選擇自主創新策略而自己免費獲得創新溢出下的收益,即這可以看成是一種投機行為,如果對方采取自主創新策略,則其可以獲得超過保底收益的投機收益,而其“底線”是對方也選擇短視創新策略時獲得的保底收益,即
由此,為了將“目標”和“底線”的參考點同時納入到企業的決策行為中,文章引入一個加權系數ψ 和(1-ψ),ψ∈[0,1],用來分別表征“目標”和“底線”參考點對企業策略決策的影響程度。因此,企業選擇自主創新策略和短視創新策略的混合參考點的表達式為:

當ψ=0 時,企業將完全以最低的“底線”收益作為參考點來進行決策;而當ψ=1 時,企業將完全以最高的“目標”收益作為參考點來進行決策。
第三,企業的主觀預期權重函數可用一個反S 型曲線來表示[19],其表達式和圖形為:

其中,χ 為事件發生的客觀概率,w(χ)具有如下特性,π(0)=0,π(1)=1 且當χ 較小時,w(χ)>χ;當χ 較大時,w(χ)<χ,表明決策企業存在這樣一種心理決策傾向,即高估小概率事件,而又低估高概率事件。

圖2 權重函數曲線圖
綜上,可得到基于前景理論的收益感知矩陣,其反映的是企業對損益值的心理感知,即引入參考點后得到的不同策略組合下的相對收益值[21],收益感知矩陣如表2 所示。

表2 基于前景理論的收益感知矩陣
相對于傳統演化博弈理論的收益矩陣而言,企業對于收益感知已經不再是實際收益水平,而是基于參考點的心理預期的變化收益,這種變化帶來的不僅僅是數值上的改變,還有豐富的心理活動、行為內涵和實際意義。通過將企業行為的心理動機與決策過程聯系起來,能夠更加科學、真實地反映企業決策的行為過程和機理。
假設群體1 中企業選擇自主創新策略的實際比例為x,選擇短視創新策略的實際比例為1-x,x∈[0,1]。群體2 中企業選擇自主創新策略的實際比例為y,選擇短視創新策略的實際比例為1-y,y∈[0,1],但由于信息和主觀判斷偏誤,群體2 中的企業會主觀認為群體1 中選擇自主創新策略和短視創新策略的比例為w(x)和w(1-x),w(x)∈[0,1],相同地,群體1 中的企業會主觀認為群體2 中選擇自主創新策略和短視創新策略的比例為w(y)和w(1-y),w(y)∈[0,1]。
因此,根據前景理論,群體1 中任意企業i 選擇自主創新策略和短視創新策略的期望前景價值ViC,ViD分別為:

同理,可以得到群體2 中任意企業j 選擇自主創新策略和短視創新策略的期望前景價值VjC,VjD分別為:

根據上述分析,可以得到復制動態方程組:

可以看出,復制動態方程組的均衡點有5 個:E1(0,0),E2(1,0),E3(0,1),E4(1,1)和E5(x*,y*)。x*,y*可由推導得出:

在構建的復制動態演化機制基礎上,通過數值模擬來進一步分析參考點依賴、損失厭惡、風險偏好以及主觀預期等行為因素對企業創新決策行為的影響機理。
根據相關研究[19,25],文章將損失厭惡系數λ=2.25,風險偏好系數α=0.89,β=0.92,主觀權重函數曲率φ=0.69 設定為企業決策心理的基準情形,并將其他參數設置為通過短視創新行為能夠獲得的增長收益大于受到的懲罰損失,在這種具有高誘惑力的利益刺激下,會誘導企業產生極大的投機動機。通過調節ψ 的數值大小,可以進一步理解企業的參考點依賴心理是如何影響企業的決策行為。文章選取了六組參數:ψ=0,ψ=0.2,ψ=0.4,ψ=0.6,ψ=0.8 和ψ=1,即參考點從完全以最低“底線”收益到完全以最高“目標”收益的變化過程,其余的參數設置為:風險偏好系數α=0.89,β=0.92,損失厭惡系數λ=2.25,主觀權重曲率φ=0.69,技術溢出的增長收益Δπi=Δπj=2,創新的超額利潤獎勵π2=2,創新的研發成本ci=cj=4,創新超額利潤獎勵分配系數a=0.5,短視行為受到的懲罰損失hi=hj=1。其演化結果如圖3 所示。
從演化結果可以看出,隨著ψ 數值從小到大的變化,創新系統最終收斂至E4(1,1)的可能性(用面積來刻畫可能性) 從1(如圖3a 所示) 逐漸降低至0(如圖3f 所示),而最終收斂至E1(0,0)的可能性從0 逐漸降低至1,即創新系統的最終演化結果會發生從全體自主創新到全體短視創新的轉變。這是因為隨著參考點的改變,企業對“收益”以及“損失”的感知會發生改變,如表3 所示。

圖3 參考點依賴心理對企業創新行為演化的相位圖

表3 不同參考點情形下的收益感知矩陣
當以最低“底線”收益為參考時(ψ=0),企業采取自主創新策略能夠獲得很高的“收益”感知,因而提高了企業自主創新的積極性,使得最終的演化穩定均衡為E4(1,1)(如圖3a 所示);而當ψ>0,企業不再將最低“底線”收益作為參考點,而是設定較高的“目標”來進行策略選擇和自主創新決策時,如果企業遭受到其他企業的短視創新風險,會使得自身的收益受到損害,進而使得企業無法達到預期的目標而感到“損失”,并且從圖1 可以看出,相同的“收益”與相同的“損失”相比,“損失”給企業帶來的心理沖擊更大。進一步可以看到,隨著ψ 的逐漸增大,一方企業選擇自主創新而另一方企業選擇短視創新策略時,創新企業感知到的“損失”將會逐漸增大,因而,最終使得創新系統將會演化至E1(0,0)的結果。

圖1 價值函數曲線圖
通過上述分析,可以推斷出企業心理對決策行為影響的第一個重要結論:參考點作為企業衡量是否獲得“收益”與“損失”的重要心理評判標準,其參考點選取會影響企業的決策行為,甚至會形成完全相反的行為選擇,因而選擇符合企業自身現狀和發展需求的參考點會改善企業的心理收支平衡,進而避免企業做出非理性的決策行為。
損失厭惡心理刻畫的是企業決策者在相同的收益和損失之間,會對損失產生更大的敏感性,即損失帶來的負效應是大于相同收益帶來的正效應。根據前文分析,文章將企業損失厭惡心理的強烈程度用損失厭惡系數λ 表示,取低(λ=1.25)、中(λ=2.25)、高(λ=3.25)三個程度,參考點為ψ=0.5 下的混合參考點,其余參數不變。具體演化結果如圖4 所示。

圖4 損失厭惡對企業創新行為演化的相位圖
從演化結果來看,隨著企業損失厭惡系數的增大,創新系統最終收斂至E4(1,1)的可能性將逐漸降低,而收斂至E1(0,0)的可能性將逐漸增大,即創新系統中短視創新行為將會盛行(如圖4c 所示)。這表明較強的企業損失厭惡心理不利于企業自主創新,通過降低企業損失厭惡心理能夠有效提高企業自主創新積極性。出現這種現象的原因在于:損失厭惡系數的增大會增強企業對“損失”的厭惡程度,從而讓企業表現出極強的風險規避行為,對于任何輕微風險的存在,都會做出最為保守的策略選擇。
通過上述分析,可以推斷出企業心理對決策行為影響的第二個重要結論:當創新環境處于溢出風險較大且懲罰力度不強時,適當地降低企業的損失厭惡心理,能夠有效地緩解企業過度擔心的心理壓力,從而在一定程度上激勵企業自主創新的積極性,且當創新環境進一步改善時,如完善監督機制、增大對短視的懲罰力度等,能夠進一步促使企業自主創新。
風險偏好刻畫的是企業對“收益”和“損失”價值函數的邊際遞減程度,也可以理解為風險偏好系數或風險感知水平。當企業處于“收益”狀態時,企業會表現出風險規避偏好;而處于“損失”狀態時,又會表現出風險追逐偏好。因此,為了更好地刻畫企業風險偏好,文章選取三組參數組合來分別表示企業相對風險偏好:(α=0.29,β=0.92)、(α=0.89,β=0.92)、(α=0.89,β=0.32),參考點為ψ=0.5 下的混合參考點,損失厭惡系數λ=2.25,其余參數不變。具體演化結果如圖5 所示。

圖5 風險偏好對企業短視創新行為演化的相位圖
從演化結果來看,當企業對“收益”的風險規避偏好遠遠小于企業對“損失”的風險追逐偏好時,即α<β,創新系統最終收斂至E1(0,0)的可能性是大于收斂至E4(1,1)(如圖5a 所示);而當企業對“收益”的風險規避偏好遠遠大于企業對“損失”的風險喜好時,即α>β,創新系統最終收斂至E4(1,1)的可能性將會逐漸增大(如圖5c 所示)。由此可以看出,當企業表現出強烈的風險追逐偏好時,短視創新策略將成為創新系統中的占優策略,致使企業陷入自主創新的困境之中;而當企業表現出強烈的風險規避偏好時,能夠有效促成企業自主創新的形成。出現這種現象的原因在于:當企業表現出強烈的風險追逐偏好時,即α<β,此時由于損失域曲率的增大,使得企業對于相同“損失”的價值感知遠大于相同“收益”帶來的價值感知,因而也呈現出了強烈的損失厭惡心理;而當α>β 時,此時由于損失域曲率的變小,使得企業對于相同“損失”的價值感知逐漸接近于相同“收益”帶來的價值感知,因而能夠有效地緩解企業過度擔心的心理壓力,從而在一定程度上激勵了企業自主創新的積極性。
通過上述分析,可以推斷出企業心理對決策行為影響的第三個重要結論:當企業在損失域曲率高于在收益域曲率時,即對“損失”的感知水平高于對“收益”的感知水平時,會增大企業的損失厭惡心理,從而抑制企業的自主創新行為;而當企業在損失域曲率低于在收益域曲率時,即對“損失”的感知水平會接近或低于對“收益”的感知水平時,能夠有效地緩解企業過度擔心的心理壓力,從而在一定程度上激勵了企業自主創新的積極性。
主觀預期描述的是企業基于對事件發生客觀概率的主觀評估和判斷,一般會存在這樣一種心理決策傾向,既高估小概率事件,同時又低估高概率事件。在前景理論中,企業對其他企業中選擇某種策略的比例判斷存在信息不充分和信息處理能力不足的問題,會產生判斷偏差,因而會根據自身主觀判斷來評估對方選擇不同策略的概率。因此,為了分析主觀預期對創新系統演化的影響,文章選取低、中、高三種不同的主觀預期權重曲率:φ=0.49,φ=0.69 和φ=0.89,參考點為下ψ=0.5 的混合參考點,其他參數不變。具體演化結果如圖6 所示。

圖6 主觀預期權重對企業短視創新行為演化的相位圖
從演化結果可以看出,隨著主觀預期權重曲率的增大,創新系統最終收斂至E4(1,1)的可能性有較大幅度的提升(如圖6c所示)。適當地調整企業對信息的主觀決策程度時,將有利于企業自主創新行為的形成。以群體1 中企業i 和群體2 中企業j兩個企業的策略決策過程來具體分析上述現象的原因。
當企業處于低懲罰損失創新環境下,可能出現監督機制缺失、懲罰力度不足等現象,因而選擇短視創新策略的概率較大。在主觀預期權重函數曲率較小時(φ=0.49),反S 型曲線的幅度較大,表明企業i 會嚴重高估群體2 中企業i 選擇自主創新策略的概率,即w(y)>y,同時又嚴重低估群體2 中企業i 選擇短視創新策略的概率,即w(1-y)≤1-y。此時,企業i 表現出盲目樂觀地信任企業j 會選擇自主創新策略,有可能使得企業i在博弈過程中選擇自主創新策略,但是這一選擇必然會讓其處于博弈弱勢,從而遭受較大的利益損失,最終又會導致創新系統在很大程度上收斂至E1(0,0)的穩定均衡,如圖6a 所示;而當主觀預期權重函數曲率較大時(φ=0.49),反S 型曲線的幅度變小,表明企業i 會高估群體2 中企業選擇自主創新策略的概率,即w(y)>y,同時又稍微低估群體2 中企業選擇短視創新策略的概率,即w(1-y)<1-y。此時,企業i 表現出了適當理性地信任企業j 會選擇自主創新策略,進而使得企業i 在博弈過程中也選擇自主創新策略,因而能夠在一定程度上提高企業選擇自主創新行為的可能性。
通過上述分析可以推斷出企業心理對決策行為影響的第四個重要結論:適當降低企業對客觀信息的過度臆測和判斷時,能夠有效降低企業主觀決策和信息偏誤的程度,避免企業做出過于樂觀、自信或非理性的決策行為,進而在一定程度上既激發了企業的自主創新熱情,又避免其犯盲目性錯誤。
文章基于前景理論,通過將企業決策者的參考點依賴、損失厭惡、風險偏好、主觀預期等行為因素納入到企業決策行為的過程之中,并利用價值函數構成的收益感知矩陣以取代傳統演化博弈理論中效用函數構成的收益矩陣,從而構建更為合理的企業自主創新與短視創新兩策略的演化博弈模型,由此可以得到以下幾點重要結論:
第一,相對于傳統演化博弈理論的收益矩陣而言,基于前景理論的收益感知矩陣更能真實地反映企業的決策過程。企業對于收益的感知已經不再是實際收益水平,而是基于參考點的心理預期的變化收益,這種變化帶來的不僅僅是數值上的改變,還有豐富的心理活動、行為內涵和實際意義。其中,最為關鍵的是參考點的選取,既不要設定過于容易達到的“底線”參考點,也不要設定太難達到的長遠和戰略性“目標”參考點,而是要依據企業自身發展條件、發展規律和創新環境設置合理的、有效的參考點,這樣既能鼓勵和增強企業自主創新的積極性和熱情,又能不斷激勵企業進步。
第二,企業對“收益”和“損失”的心理或價值感知不同,從而會表現出強烈的損失厭惡行為。在前景理論下,相同“收益”所帶來的幸福感是小于相同“損失”會帶來的痛苦感,特別是當企業表現出強烈的損失厭惡心理時,企業會感知到的損失就越大,從而會使企業即使在有利可圖的情形下,也會因為擔心自己自主創新相比其他企業短視創新,而遭到利益損害,最終放棄自主創新行為,進而陷入“囚徒困境”式的自主創新困境之中。因而,需要適當地降低企業的損失厭惡心理,從而有效地緩解企業的心理壓力,在一定程度上激勵企業自主創新的積極性。
第三,企業對創新環境及其他企業策略選擇的主觀判斷,會改變其決策行為。而通過適當降低企業對客觀信息的過度臆測和判斷時,能夠有效降低企業主觀決策和信息偏誤的程度,避免企業做出過于樂觀、自信或非理性的決策行為,進而在一定程度上激發企業的自主創新,并降低其試錯成本。
由此可以看出,基于前景理論將參考依賴、損失厭惡、風險偏好、主觀預期等行為因素納入到企業決策行為的過程中,對現實的解釋力更強,更能真實地體現出企業決策的心理過程及其對決策行為的影響。