摘要:文章應用演化博弈理論建立了企業群體內規模相當的企業之間在環境技術創新選擇上的博弈模型,并分析討論了五種不同的博弈狀態,結果得出所有博弈方都采取“主動創新”策略不僅是上述博弈的一個穩定狀態,而且是一個演化穩定策略,同時,文章也指出政府應該為這一穩定狀態的實現提供完善的制度保障。
關鍵詞:環境技術創新;演化博弈;制度保障
環境技術創新是指所有能夠維持、改善生態環境或提高人類生存環境質量的技術創新活動或過程,環境技術創新在解決全球環境問題、促進企業節能減排、提升企業競爭力等方面都發揮著重要作用。因此,以促進經濟發展和提高企業競爭力為主,并能夠節約資源,改善環境績效的環境技術創新戰略,引起了社會各界的廣泛重視,特別地,如何激勵企業積極主動實施環境技術創新已成為當前環境政策制定者需要考慮的重要議題之一。
20世紀70年代由史密斯(Smith,1973)和普瑞斯(Price,1974)提出了演化博弈理論的基本概念——演化穩定策略(Evolutionary Stable Strategies, ESS),泰勒和金克(Taylor Jonker,1978)提出了復制動態(Replicator Dynamics),此后演化博弈理論在經濟學、生態學以及社會學等領域得到了廣泛的應用,特別地,演化博弈在環境問題和企業技術創新領域的應用也取得了一系列成果。本文應用演化博弈理論,從對稱角度,對企業之間的環境技術創新行為進行了演化博弈分析,旨在揭示規模相同的企業之間在進行環境技術創新時的各自選擇。
一、 基本模型
針對環境技術創新,有的企業會積極采取措施努力實現創新,有的企業則不愿主動創新,而是等待時機采取模仿或跟隨創新企業。為此,我們不妨假設有兩個企業,企業1和企業2,他們的企業規模相當,市場占有率基本一致。如果雙方都選擇積極主動地實施環境技術創新,則各得到a單位的收益;如果雙方都選擇跟隨或模仿他人的環境技術創新,則各得到d單位的收益;當其中一方選擇積極主動實施環境技術創新而另一方選擇跟隨或模仿環境技術創新時,前者得到b單位的收益,而后者得到c單位的收益。雙方的支付收益如表1所示。
現在我們來分析區域內的企業群體隨機地進行該博弈,假設有比例為x的企業采取主動環境技術創新的策略,比例為1-x的企業采用跟隨或模仿策略。究竟有多大比例的企業采取主動環境技術創新策略不僅取決于該類型企業的期望收益,更重要的是與該類型企業的期望收益超出全部企業平均收益的幅度有關,顯然,這部分超額收益越大越能激勵更多的企業采取主動創新策略。由此可見,“主動創新”類型博弈方比例x是隨時間的變化而變化的,其動態變化速度可以用下列動態微分方程表示:
其中,u1為企業群中采取主動環境技術創新策略的企業的期望收益,u為該企業群中所有企業的平均期望收益。
從模仿者角度來看,博弈方學習模仿的速度取決于兩個因素:其一是模仿對象的數量大小,可以用相應類型博弈方的比例來表示;其二是模仿對象的激勵程度,可以用模仿對象策略得益超過平均得益的幅度來表示,因為這關系到模仿成功的大小。
根據表1所示的收益矩陣,可以得到兩種策略的企業的期望收益和所有企業的平均收益分別為:
u1=xa+(1-x)b(2)
u2=xc+(1-x)d(3)
u=xu1+(1-x)u2(4)
其中,u2為企業群中不實施環境技術創新策略的企業的期望收益。
將(2)式、(3)式、(4)式帶入(1)式中,可以得到:
二、 分析與討論
狀態1:x* 1=0,這說明初始時刻不存在“主動創新”策略類型博弈方,且采用這種策略類型博弈方變化速度為0。從模仿者角度來看,只有出現模仿的對象才能進行模仿,當x=0時就說明沒有模仿的榜樣,因此,所有的博弈方都不會有意識地改變他們的策略。
狀態2:x* 2=1,這說明初始時刻所有博弈方均為“主動創新”策略類型,既然都是主動創新者也就不存在模仿行動。因此,對于有限理性的博弈方而言,因為沒有模仿者,所有的博弈方都不會有意識地改變他們的策略。
三、 演化穩定策略
即使上述學習過程已經停止,即所有博弈方都通過學習找到了最好的策略,也不能排除博弈方還會“犯錯誤”,即博弈方仍然可能會偏離上述復制動態收斂到的納什均衡策略。因此,有必要分析上述復制動態收斂到的穩定狀態是否具有一定的“容錯性”。為此,我們不妨假設,博弈群體中e比例的博弈方在收斂到“主動創新”策略后犯了錯誤,選擇了“跟隨或模仿”策略。此時選擇“主動創新”策略的博弈方比例為1-e。按照前面的分析,采取“主動創新”與“跟隨或模仿”策略博弈方的期望收益和群體平均收益分別為:
uc=(1-e)·1+e·0=1-e(6)
un=(1-e)·0+e·0=0(7)
ucn=(1-e)·uc+e·un=(1-e)2(8)
因為,uc=(1-e)>0,且接近于1,因此,犯錯誤博弈方的期望收益遠遠低于沒有犯錯誤的博弈方收益,也遠遠低于群體的平均收益。因此,犯錯誤方會逐步改正錯誤,最終仍然會趨于x*=1,即所有博弈方都采取“主動創新”策略。由此分析得知,x*=1不僅是復制動態收斂的一個穩定狀態,而且具有對少數錯誤偏離的穩健性,因此,x*=1是上述復制動態下的一個進化穩定策略。同理,我們可以分析上述復制動態的另一個穩定策略x*=0,即所有博弈方都采取“跟隨或模仿”策略,結果顯示,有少量博弈方偏離這個穩定狀態,復制動態會使結果越來越遠離它,最終不再收斂于它,由此得出,該策略不具有對少量犯錯行為的抗干擾性,不是上述復制狀態下的進化穩定策略。
四、 結論與建議
環境技術創新是解決環境問題的根本出路和必然選擇,而企業又是環境技術創新的重要力量之一。一定區域范圍內的企業在環境技術創新方面的選擇會相互影響相互促進,特別是規模相當的企業之間,如果政府能夠為創新成果提供相對完善的制度保障和必要的社會支撐體系,則會有越來越多的企業采取主動環境技術創新策略,即使個別企業會偶爾偏離這一選擇,最終也會重新回到主動創新的隊伍中來。因此,各地政府應建立健全知識產權保護制度、積極完善財政補貼、技術融資等社會服務體系,努力為企業環境技術創新提供更好的社會環境。
參考文獻:
1. 王麗萍.企業環境技術創新研究綜述.天府新論,2012,(2):45-49.
2. 謝識予.經濟博弈論.上海:復旦大學出版社,2002.
3. Weibull W. Evolutionary Game Theory,Cambridge:MIT Press,1995.
4. 盧方元.環境污染問題的演化博弈分析.系統工程理論與實踐,2007,(9):148-152.
5. 楊麗,魏曉平.基于演化博弈的企業技術創新行為分析.科技管理研究,2010,(21):18-21.
6. 劉海濤,孫明貴.關于企業技術創新能力的分析.經濟與管理研究,2009,(7):97-100.
7. 王建成,吳俊.基于蛙鳴博弈的企業技術創新行為研究.湖南文理學院學報(社會科學版),2009,(6):44-46.
8. 馬小明,張立勛.基于壓力—狀態—響應模型的環境保護投資分析.環境保護,2002,(11).
9. 許健,呂永龍,王桂蓮.我國環境技術產業化的現狀與發展對策.環境污染治理技術與設備,1999,(2).
10. 沈斌,馮勤.基于可持續發展的環境技術創新及其政策機制.科學學與科學技術管理,2004,(8).
11. 耿建新,尚會君,劉長翠.企業環境信息披露與管制的理想框架.環境保護,2007,(8).
12. 呂永龍,許健,胥樹凡.我國環境技術創新的影響因素與應對策略.環境污染治理技術與設備,2000,(5).
13.鐘暉,王建鋒.建立綠色技術創新機制.生態經濟,2000,(3).
14.彭海珍,任榮明.環境政策工具與企業競爭優勢.中國工業經濟,2003,(7).
15. 趙細康.環境政策對技術創新的影響.中國地質大學學報(社會科學版),2004,(1).
16. 陳經偉.美國推進環境技術創新與擴散的做法與啟示.科學管理研究,2005,(4).
17. 曲如曉.環境保護與國際競爭力關系的新視角.中國工業經濟,2001,(9).
18. 朱昶.企業綠色發展戰略及其體系研究.武漢理工大學,2003.
19. 翟欣翔.面向生態—技術創新的經濟圈城市發展能級評價研究.天津大學,2004.
20. 秦穎.企業環境管理的驅動力研究.大連理工大學,2006.
基金項目:教育部人文社會科學研究青年基金項目(11YJC790078);河南省政府決策研究招標課題(項目號:2012B267);河南省高等學校人文社會科學研究項目(項目號:2012-GH-101);河南理工大學博士基金項目(項目號:B2009-60)。
作者簡介:王麗萍,河南理工大學經濟管理學院副教授,管理學博士。
收稿日期:2012-12-28。