陳小燕 張崢










摘? ?要:通過構建潛在侵權企業和政府監管部門關于知識產權保護與侵權的演化博弈模型,分析雙方主體策略選擇的演化路徑與均衡,并在此基礎上結合制度工程學的理論與方法探究治理制度有效性的參數邊界條件。結果發現,當參數范圍同時滿足政府監管成本小于其監管所獲正向收益之和、企業侵權所獲不良收益小于其侵權應承擔的負面損失之和這兩個條件時,博弈系統將會演化至政府監管、企業不侵權的理想穩定狀態;這時通過對政府觀測力度、懲罰力度、不良收益的組合控制,可以使治理制度達到理想目標。
關鍵詞:演化博弈;制度工程學;知識產權侵權;政府監管
中圖分類號:F272? ? ? ?文獻標志碼:A? ? ? ?文章編號:1673-291X(2022)02-0151-05
隨著信息時代的到來和知識經濟的發展,知識作為智能資本對于企業價值創造起著越來越重要的作用,由此而形成的對知識產權的管理直接決定著企業的收益與發展以及整個社會的福利水平。自知識產權保護上升至國家戰略層面以來,學者們從不同角度開展了相關研究。關于知識產權保護理論方面的研究,BICAN等探討了在創新活動過程中進行知識產權管理的方法和途徑[1];張志成簡論了新時代嚴格知識產權保護的若干問題,提出了加強知識產權保護工作的思考和建議[2]。在知識產權風險防范治理方面,學者們通過采用系統動力學、實證研究等方法梳理了知識產權風險控制問題[3,4]。在利用博弈論研究知識產權侵權與保護方面,DELERUE從博弈視角分析了聯合專利對合作研發聯盟間中小企業決策的影響[5];黃麗清等通過演化博弈模型探討了科技型中小企業知識產權質押融資問題[6]。
綜上所述,雖然現有的研究已經取得了豐富的理論成果,但也存在一定的研究缺口。現有研究主要集中在知識產權保護方面的實證研究,以及國家層面針對產權保護的協議與法律政策研究,而缺乏對創新實體知識產權侵權行為的分析,以及科學化系統化的懲罰制度設計。為此,本文考慮侵權企業創新能力差異化與面對復雜決策有限理性的情況下,構建政府和企業雙方知識產權侵權與保護行為策略的演化博弈模型,求解在不同參數穩定條件下的演化穩定策略,并在此基礎上結合制度工程學,針對企業侵權行為進行符號化與結構化的治理制度設計,研究治理制度有效的邊界條件,以期為雙方主體參與知識產權保護提供理論參考與對策建議。
一、政府監管部門與企業知識產權保護和侵權演化博弈模型
(一)演化博弈模型假設
為便于分析影響知識產權保護的關鍵要素,本文將給出以下基本假設。
假設1:博弈主體。本文建立的博弈模型是以政府監管部門、合作創新的企業為主體的。在博弈過程中,雙方均為有限理性的經濟個體,都能在彼此博弈過程中不斷優化自己的策略選擇,最終實現自己的行為目標。
假設2:行為假設。政府監管部門可選擇參與知識產權監管活動,從而付出監管成本并對侵權企業收取罰金。其策略集合為(監管侵權行為,不監管侵權行為)。企業方基于對風險的綜合考慮決定是否侵犯產權擁有者的產權,其策略集合為{侵權,不侵權}。由于信息不對稱,雙方對彼此的行為偏好并不了解,因此博弈系統初始狀態并不會趨于均衡。隨著多次重復博弈,雙方經過不斷改進學習、調整自身策略,系統才能達到動態穩定均衡狀態。
假設3:博弈策略的選擇比例。假設政府監管部門選擇監管策略的概率為x,選擇不監管策略的概率為(1-x);企業方選擇不侵權的概率為y,選擇侵權的概率為(1-y),其中0≤x,y≤1。
假設4:參數假設。對于政府監管部門而言,若是選擇監管策略,會獲得由此帶來的市場環境穩定、政府良好形象建立、提升企業自主創新能力等社會效益的增加,設為B,但需要付出一定監管成本C1;若是因選擇不監管策略造成產權擁有者受到侵權時,則政府的公信力下降F1,上級政府部門對其處罰F2。對于潛在侵權者企業而言,若是選擇不侵權行為,企業方的初始收益為R1;若是選擇侵權行為,所獲額外收益為R2;其侵權行為造成的社會福利損失F3需由政府承擔。在政府選擇監管的前提下,企業侵權被發現需要支付政府F0單位的罰款并支付被侵權方賠償款V;另外,侵權企業需要承擔侵權行為所造成的社會公眾對企業的經濟能力、信用狀況等社會評價下降一系列企業信譽損失F4。
(二)構建支付矩陣
根據以上假設,可以得到演化博弈的收益矩陣,如表1所示。
表1? 博弈雙方收益矩陣
二、政府與企業復制動態及演化穩定性分析
(一)政府與企業的復制動態分析
政府選擇監管策略的期望收益E:
E=y(B-C1)+(1-y)(B+F0-C1-F3)=(B-C1)+
(1-y)(F0-F3)(1)
政府選擇不監管策略的期望收益E:
E=(1-y)(-F1-F2-F3)(2)
由此可知政府的平均期望收益Ea:
Ea=xE+(1-x)E=x[B-C1+(1-y)(F0-F3)]+
(1-x)(1-y)(-F1-F2-F3) (3)
政府的復制動態方程:
F(x)=x(E-Ea)=x(1-x)[(1-y)(F0+F1+F2)+
B-C1] (4)
同理,企業方選擇不侵權行為的期望收益E:
E=xR1+(1-x)R1=R1 (5)
企業方選擇侵權行為的期望收益E:
E=x(R1+R2-F0-V-F4)+(1-x)(R1+R2)=R1+R2-x(F0+F4+V)(6)
由此可知企業的平均期望收益Eb:
Eb=yE+(1-y)E=R1+(1-y)[R2-x(F0+F4+V)](7)
企業的復制動態方程:
F(y)=y(E-Eb)=y(1-y)[x(F0+F4+V)-R2](8)
(二)政府和企業演化博弈的穩定性分析
根據政府與企業知識產權保護行為演化博弈的復制動態方程式(4)和式(8)可知,其動態博弈的5個均衡點分別是(0,0)、(0,1)、(1,0)、(1,1)、(x*=,y*=),當且僅當0≤≤1,0≤≤1時成立。利用動態博弈的雅克比矩陣可判斷5個均衡點的演化穩定性,此博弈系統的雅可比矩陣為:
J=(1-2x)[(1-y)(F0+F1+F2)+B-C1]? ? ?-x(1-x)(F0+F1+F2)y(1-y)(F0+F4+V)? ? ? (1-2y)[x(F0+F4+V)-R2]
(9)
將上述5個均衡點帶入J的行列式和J的跡進行分析,若行列式為正值且行列式的跡為負值,則說明該點為博弈系統的演化穩定點,該點對應的演化策略為演化穩定策略。具體分析可分成4種參數范圍來討論,穩定性結果見表2。
由表2可知,政府和企業的演化博弈結果隨著參數范圍的變化而變化,當參數條件滿足B-C1>0,F0+F4+V-R2>0時,即政府選擇監管策略帶來的社會收益大于其監管成本,企業選擇侵權行為受到政府監管支付的罰金、賠償款以及社會形象損失之和大于其侵權收益時,博弈系統會趨向于(1,1)這一演化穩定點,即(監管,不侵權)是演化穩定策略。當參數條件滿足B-C1>0,F0+F4+V-R2<0時,即政府選擇監管策略帶來的社會收益大于其監管成本,企業選擇侵權行為受到政府監管支付的罰金、賠償款以及社會形象損失之和小于其侵權收益時,博弈系統會趨向于(1,0)這一演化穩定點,即(監管,侵權)是演化穩定策略。當B-C1<0且F0+F1+F2+B-C1<0時,無論F0+F4+V-R2如何取值,(不監管,侵權)都是演化穩定策略。政府和侵權企業的動態演化相圖如圖1所示。此演化博弈結果說明,有限理性的政府根據監管成本與社會效益的比較決定是否監管。當政府選擇監管策略時,有限理性的企業會根據其侵權收益與懲罰力度的比較結果決定其是否侵權;而當政府選擇不監管策略時,有限理性的企業會選擇侵權策略。
根據上述分析,博弈系統的演化穩定點與政府監管機構懲罰力度、監管力度、企業侵權收益與成本等參數密切相關,因此,本文將進一步采用制度工程學分析保證制度有效性的參數間的作用邊界以及相互促進關系,對知識產權侵權問題的治理進行深度研究。
三、企業侵權行為的治理制度研究
(一)知識產權侵權監管的制度工程學分析
本文采用制度工程學中“孫氏圖”[7]分析了企業知識產權侵權行為監管制度設計機理,從制度設計的符號結構化和措施優化問題角度出發,設計出一個簡單的制度結構圖(圖2所示)來分析知識產權侵權行為的治理問題。
假設合作創新的企業成員基于科研產出的考慮,其行為集為{積極合作行為b1,知識產權侵權行為b2 }。上級政府監管部門基于行為成本及其社會效益的考慮,其行為集為{強監管,弱監管},且對應的行為概率為{p1,p2},監管部門只有在選擇強監管時,才會以概率p0發現企業的不良行為。概率器(積極合作行為獲得回報的通過率)的設定為p3。須要說明如下幾點:上級政府部門對侵權監管,運用控制回報的方法,企業方選擇積極合作行為b1時,可以得到收益r1;選擇侵權行為b2時,若沒有被政府發現,得到收益r2,若在政府強監管政策下被發現,受到處罰s2。由此得到企業各行為選擇相關參數(見表3)。
根據社會理性人理論,企業方在行為決策時,主要是通過比較各行為的效用大小來進行理性選擇的。通過對圖2和表3的分析可得,若假設c1、c2基本相等,r1≤r2,顯然會得到u1 p3*r1-c1>(1-p1p0)*r2*p3-p1p0*s2-c2 (10) 由公式(10)分析,是否企業拒絕侵權行為、選擇積極創新合作,取決于多個制度參數和制度工具,即受到自身因素包括合作成功概率p3、付出成本c以及外界因素包括懲罰力度s,觀測力度p1、p2等的影響。在一般情況下,政府監管部門難以直接管控企業自身可控因素,若要使得監管制度有效,政府就要通過對觀測力度、懲罰力度等的組合控制,達到知識產權監管制度有效的理想目標。 (二)知識產權侵權治理制度有效性的邊界條件 1.最小觀測力度 觀測器被稱為“制度之眼”,具有良好的觀測器是監管制度有效的最基本條件。如果監管力度不夠,即觀測器制度工具失靈或效果不佳,則侵權行為很難被發現,或只有少部分侵權行為被發現。從式(10)可以看出,當式(11)中兩式同時成立時,才能確保大多數創新合作企業選擇良好行為(不排除存在非理性的鋌而走險者)。觀察(11)式,可以看出觀測力度與其他參數之間的制約關系。顯然,當企業侵權收益r2越大時,政府監管部門執行強監管的概率p1,或強監管下侵權行為被發現的概率p0的臨界值應越大;另一方面,懲罰力度與觀測力度的臨界值呈現出互補關系,即懲罰力度過高時,可以適當降低監管機構的觀測力度,緩解一定的管理壓力。 p1>,p0>(11) 2.最小懲罰力度和最小不良收益 對式(11)變形得到式(12),只有懲罰力度s2和不良收益r2滿足式(12)時,知識產權侵權行為的治理制度才是有效的。式12表明,在制度管理中,懲罰制度的臨界值與企業采取侵權行為時的不良收益和政府的監測力度均成反比。在這種情況下,若懲罰力度太低就會降低其存在的威懾力,理性的企業就會認為較大的侵權收益可以彌補懲罰帶來的損失,此時的監管制度就形同虛設。 s2>-r2p3,r2-r1<(12) 四、結論與啟示 本文通過構建政府、企業雙方關于知識產權保護與侵權的演化博弈模型,分析得出博弈系統趨于理想穩態的參數范圍,并在此基礎上借助制度工程學對知識產權侵權行為進行治理制度研究,探究侵權治理制度有效性的邊界條件。本文的研究結論一定程度上是對企業知識產權侵權治理制度相關研究的補充,其帶來的實踐啟示主要有以下幾個方面。 第一,加大監管力度和懲罰力度,抑制侵權行為。監管力度低導致侵權行為被發現和懲罰的可能性較低時,需要增加懲罰力度和監管力度才能使得u2小于u1,從而有效抑制知識產權侵權行為。第二,提高技術的復制壁壘,降低侵權不良收益。通過重視知識產權的保護,提高關鍵技術的復制壁壘,進而大幅降低企業侵權行為所能獲得的不良收益,降低侵權行為發生的概率。第三,提高社會關注度,擴大社會監督網絡。通過新聞媒體報道等方式增強企業知識產權侵權行為的社會曝光度,由此帶來的企業社會形象的下降會增加其在今后博弈中的侵權成本。另外,發揮社會公眾的監督導向力,促使監管部門為保證社會公信力而從嚴檢測。信息披露及時、社會關注度的增強會減少企業侵權與政府不監管的概率分布,從而實現知識產權侵權行為得到有效治理的理想目標。 參考文獻: [1]? ?BICAN P M,GUDERIAN C C,RINGBECK A,et al. Managing knowledge in open innovation processes: an intellectual property perspective[J].Journal of Knowledge Management,2017,21(6):1383-1405. [2]? ?張志成.簡論新時代嚴格知識產權保護的若干問題[J].知識產權,2019,(8):23-27. [3]? ?周園,袁穎慧.基于SD模型的合作創新全過程知識產權風險控制研究[J].科技管理研究,2012,32(20):175-178. [4]? ?周志剛,丁秋楷,阮麗娟.創新網絡中企業自主知識產權交互對創新績效的影響[J].科技進步與對策,2019,36(21):98-105. [5]? ?DELERUE H.Shadow of joint patents: Intellectual property rights sharing by SMEs in contractual R&D alliances[J].Journal of Business Research,2018(87):12-23. [6]? ?黃麗清,張成科,朱懷念,曹銘.科技型中小企業知識產權質押融資模式博弈分析[J].科技管理研究,2018,38(1):178-183. [7]? ?孫紹榮.制度設計的科學——制度工程學[M].北京:科學出版社,2018. Research on the Governance System of Enterprise Intellectual Property Infringement Based on Evolutionary Game CHEN Xiao-yan, ZHANG Zheng (School of Management, Shanghai University for Science and Technology, Shanghai 200093, China) Abstract: This paper constructs an evolutionary game model of intellectual property protection and infringement between potential infringing enterprises and government regulatory departments, analyzes the evolutionary path and equilibrium of both sides’ main strategy choice, and on this basis, combined with the theory and method of institutional engineering, explores the parameter boundary conditions of governance system effectiveness. The results show that the game system will evolve to an ideal stable state of government supervision and enterprise non infringement when the parameter range meets the two conditions that the cost of government supervision is less than the sum of positive benefits and the bad benefits of enterprise infringement is less than the sum of negative losses. Through the combination control of government observation, punishment and bad income, the governance system can achieve the ideal goal. Key words: evolutionary game; institutional engineering; intellectual property infringement; government regulation [責任編輯? ?妤? ?文] 3460501908290