顧靈娜,蔣 茜,路 云,常 峰
中國藥科大學國際醫藥商學院,江蘇南京,211198
我國醫藥衛生體制改革已進入深水區,而藥品集中帶量采購作為藥品供應保障體系的重要組成部分,在規范臨床用藥、降低藥品虛高價格、改善藥品流通秩序等方面發揮重要作用。自2018年啟動“4+7”帶量采購試點以來,國家已經組織開展八批藥品集中帶量采購,品種數量達333種,涉及金額超公立醫療機構化學藥、生物藥年采購額的35%,平均降幅超50%[1]。同時,地方積極以獨立或跨區域聯盟的形式開展了50余批藥品集中帶量采購,我國藥品集中帶量采購正向著常態化、制度化的方向開展。
醫藥企業和醫療機構是藥品集中帶量采購的主要利益相關者。兩者在不同政策導向及監管力度下面臨的風險與收益不同,同時兩者參與集采的策略選擇會相互影響,因此不可避免地會形成一系列行為博弈。若缺乏有效的激勵機制,兩者可能在權衡利弊后采取消極參與集采的策略,包括醫藥企業消極報價、醫療機構完成約定量后過多使用非中選產品等,導致集采的中選結果和落地效果低于預期。根據學者研究,激勵錯配是導致英國、荷蘭等國家戰略性購買實踐成功案例較少的關鍵原因之一[2-4]。
激勵約束機制是激勵者、約束者與被激勵者、被約束者之間的一種特定的關系或相互作用方式,通過這種關系或相互作用,雙方都力圖達到使對方的行為符合自己效用最大化的目標[5]。為達到提高利益相關者參與集采積極性的目標,按照國務院辦公廳《關于推動藥品集中帶量采購工作常態化制度化開展的意見》文件精神,國家醫保部門對醫療機構和醫藥企業建立了一系列激勵約束機制,包括結余留用、醫保支付和中選價協同等[6]。在此基礎上,上海、遼寧等地方醫保部門補充制定了非中選產品梯度降價等政策,旨在控制價差的同時誘導醫藥企業積極參與集采。本文將此類政策統稱為集采的激勵約束機制。
目前,已有學者分析藥品集中帶量采購對利益相關者產生的正負向影響,提出應調動各相關方參與集采積極性的建議[7-9]。舒茜等根據集采各利益相關者和政策目標的關系,確定其是否支持政策的實施[7];龐佳慧等分析在實施藥品帶量采購和一致性評價雙重政策的情況下,利益相關者的合法性、權力性、緊迫性以及損益、立場[8]。也有學者從博弈論的視角研究集采利益相關者的行為選擇,例如梁峰等對國內外藥企面對集采可能選擇的發展策略及政府的價格決策進行演化博弈分析[10];譚清立等運用博弈論分析中標企業的超額供應問題,引導其在供應和創新上尋求動態平衡[11];趙笑妍等通過動態演化博弈模型分析帶量采購利益相關者的合謀行為[12]。但鮮有學者研究在此背景下,具體應如何激勵集采利益相關者,使其做出更符合政策預期的行為。針對集采的激勵約束機制,張星認為目前集采尚未能有效構建起多元參與主體的合作激勵約束機制,從而制約了價格治理成果的深化[13];傅書勇等認為集采破壞了醫生原有的激勵機制,并利用委托代理理論分析激勵醫生處方“集采”藥品的方法[14],即將集采節省下來的費用合理補貼給醫生或讓醫生處方行為變為可觀察。關于結余留用、非中選產品梯度降價、醫保支付和中選價協同等具體激勵約束機制的研究,更多的是針對其法律問題[15]、相關模式[16]、指標及影響因素[17]、實施情況[18],總體上缺乏有關集采激勵約束機制對利益相關者行為影響成效的系統分析。
集采激勵約束機制的作用效果可以通過機制設計理論中的參與約束和激勵相容原理進行檢驗,其中參與約束指委托人(即信息優勢方)支付給代理人(即信息劣勢方)報酬帶來的效用要不低于代理人從事其他事務所獲得的效用(市場機會成本);激勵相容指委托人為實現自身效用最大化而要求的代理人努力程度也要使代理人自身實現效用最大化[19-20]。為分析激勵約束機制對提高醫療機構和醫藥企業參與集采積極性的作用,本文構建醫療機構-醫藥企業的行為偏好博弈模型,求解基礎模型下的博弈均衡點,并利用參與約束、激勵相容原理分析集采激勵約束機制對均衡狀態的影響,利用數據仿真驗證激勵約束機制的政策效果。在此基礎上,提出完善激勵約束機制的政策建議。
本文根據國家組織藥品聯合采購辦公室2018年以來發布的藥品集中帶量采購文件、省藥品采購平臺有關信息等設定演化博弈模型的基本參數,同時充分吸納傅書勇、李小瑜等學者有關藥品集中帶量采購中醫療機構、醫藥企業的獲益的分析[14,21],引入銷售費用、政府獎勵等特殊參數。激勵約束機制中指標的設定來自2020年國家醫療保障局和財政部聯合發布的《關于國家組織藥品集中采購工作中醫保資金結余留用的指導意見》等。
本文數據仿真部分采用真實世界數據。為控制變量(包括中選產品價格及中選企業供應地區;非中選產品價格及非中選企業供應地區等)、排除干擾因素(包括地區經濟水平;醫療機構的醫療水平、屬性、規模等)的影響,選取同一城市同一級別且第二批集采品種對乙酰氨基酚采購量相同的兩家醫療機構,兩者在實際采購時分別對應博弈模型的兩種策略,即一家醫療機構全部使用中選產品,一家醫療機構完成約定采購量后使用較多非中選產品。參數賦值時以此采購數據和價格信息作為論據,同時充分結合醫療機構和醫藥企業在實際情況中的收益、成本以及博弈模型的約束條件。
本文運用演化博弈分析醫療機構和醫藥企業在參與集采問題上的利益訴求。假定每次都是從醫藥機構和醫藥企業兩類群體中隨機配對進行博弈,雙方都是有限理性的并在長期交互影響中不斷調整自身策略直至達到演化均衡[22]。在明確博弈雙方期望收益的基礎上,本文運用Malthusian復制動態原理構建復制動態方程,求解博弈模型的平衡點[23]。根據Friedman提出的計算微分方程組構成動態系統的群體動態[24],平衡點的穩定性分析可以通過分析該系統的Jaconbian矩陣的局部穩定性得到,當且僅當同時滿足detJ>0(行列式條件)和trJ<0(跡條件),均衡點才是演化穩定策略(ESS)[25]。本文以此為依據求解醫療機構和醫藥企業行為偏好博弈模型的均衡解及其所在的策略集。
集采激勵約束機制通過改變基礎模型中的相關參數,影響博弈主體的策略選擇,引導其在追求自身利益最大化的同時實現最優均衡,具體可分為針對醫療機構方和針對醫藥企業方的激勵約束機制。本文以結余留用政策為例分析針對醫療機構方的激勵約束機制。該政策允許醫療機構按一定比例留用因藥品集采價格下降、合理使用而節約的費用,以鼓勵醫療機構和醫務人員在剩余量市場也更多得使用集采中選藥品。針對醫藥企業方的激勵約束機制包括國家層面的醫保支付和中選價協同政策以及省級層面的非中選產品梯度降價政策。本文以非中選產品梯度降價為例做相關分析,其本質為要求集采同品種非中選產品,根據其與中選產品的價差實現梯度降價后(以中選價托底)方可繼續采購使用。梯度降價后的價格成為全國聯動掛網價。
本文利用參與約束、激勵相容理論分別分析兩類激勵約束機制實現最優均衡的條件,并通過數據仿真驗證兩類激勵約束機制對提高利益相關者參與集采積極性的作用,這對研究集采激勵約束機制的優化策略具有重要意義。在仿真模擬階段,本文采用matlab中較為常用的ode算法,經典采用四階、五階Runge Kutta單步算法[26]。
模型假定涉及醫療機構和醫藥企業兩類群體。由于醫療機構在約定采購量市場不具有選擇權,故本文將其策略選擇設置為“剩余量市場多用中選產品”(S1)和“剩余量市場少用中選產品”(S2),其中,剩余量市場為完成約定采購量后的市場。而醫藥企業的策略選擇包括“以中選方式銷售藥品(即中選企業)”(S3)和“放棄以中選方式銷售藥品(即非中選企業)”(S4)。
模型提出如下假設。①信息是不完全的,博弈醫療機構和博弈醫藥企業都不能提前預知對方的行動策略,且雙方的行動時間一致,無前后順序。②醫療機構已經執行完成約定采購量,即本文探討的是剩余量市場分配和對企業的激勵問題。③醫藥企業銷售的市場集中在醫療機構,而不存在零售市場。④鑒于2016年藥品零加成政策的落地執行,醫療機構藥品方面的收入僅來源于企業的銷售費用(簡稱“SE”)和獲得的政府獎勵。其中,所有醫藥企業對博弈醫療機構的銷售費用均與藥品的采購量正相關,且單位銷售費用會隨著競爭的激烈程度而增加。⑤醫藥企業收益由單位藥品的凈獲益與銷售量共同決定。其中,單位藥品凈獲益受中選降幅、不參與集采增加的銷售費用等因素的影響,而銷售量受企業性質、競爭實力等因素的影響。模型參數設置見表1。其中0≤x,y,m≤1,其余參數均為正數,且q>qd>qs,pf>pz>c。根據上述模型假設及參數設定,構建出有關醫療機構用藥傾向和醫藥企業策略選擇的博弈模型,其收益矩陣如表2所示。

表1 醫療機構和醫藥企業行為偏好博弈模型的基本參數

表2 醫療機構與醫藥企業博弈的收益矩陣
2.2.1 博弈主體的復制動態。假設醫療機構多用中選產品的概率是x,則其少用中選產品的概率是1-x;醫藥企業中選的概率是y,則其非中選的概率是1-y。
醫療機構多用中選產品的期望收益UH1、少用中選的期望收益UH2及平均期望收益分別是:
UH1=[(q-qd)a+R]y+[(q-qd)(a+b)+R](1-y)
(1)
UH2=(q-qs)ay+(q-qs)(a+b)(1-y)
(2)
(3)
同理,醫藥企業中選的期望收益UC1、非中選的期望收益UC2及平均期望收益分別是:
UC1=(pz-c)qdx+(pz-c)qs(1-x)
(4)
UC2=(pf-c-a-b)(q-qd)mx+(pf-c-a-b)(q-qs)m(1-x)
(5)
(6)
構建醫療機構和醫藥企業的復制動態方程為:
(7)
(8)
令F(x)=0,F(y)=0,得出(0,0)、(0,1)、(1,0)、(1,1)、(Xp,Yp)為系統的5個局部均衡點,其中:
2.2.2 穩定點分析。依據微分方程依次求關于x,y的偏導,得出雅克比矩陣(J)為:
(9)
其中,t=(qd-qs)[pz-c+m(pf-c-a-b)]x+(pz-c)qs-(pf-c-a-b)(q-qs)m
通過求解,可得出系統局部均衡穩定時的主要參數取值,如表3所示。

表3 均衡點處的a11、a12、a21、a22的取值

在點(Xp, Yp)處有a11+a12=0,不滿足trJ<0的條件,故該點肯定不是ESS。排除該點后,均衡點的穩定性判斷如表4所示。

表4 演化博弈模型均衡點的穩定性判斷
從雅可比矩陣的分析來看,醫療機構的均衡狀態為“剩余量市場少用中選產品”,醫藥企業的均衡狀態可能是“中選”,也可能是“非中選”,最終的演化結果取決于相關參數的大小。這表明可能存在醫療機構和醫藥企業參與集采的積極性低的風險。
2.3.1 結余留用政策。根據結余留用金額的計算公式,構建醫療機構選擇S1策略相對于選擇S2策略的結余留用差額(R)的關系式為:
R={vdin-in[gzpz+(q-qd)pf]}k-{vdin-in[gzpz+(q-qs)pf]}k=ink(qd-qs)pf
(10)
其中,v表示約定采購量基數,d表示集采前通用名藥品加權平均價格(元),i表示統籌地區醫保基金實際支付比例(%),n表示集采通用名藥品統籌地區參保患者使用量占比(%),gz表示中選產品約定采購量(片),k表示結余留用的比例(%)。
對于醫療機構而言,由于國家藥品集中帶量采購強制要求區域內所有公立醫療機構參與,故醫療機構方不存在參與約束問題。激勵相容原理要求醫療機構的最優選擇與機制設計者的最優目標一致。若國家醫保部門制定激勵約束機制的初衷是引導醫療機構剩余量市場多用中選產品,以增強改革聯動效應,則必須滿足無論醫藥企業選擇何種策略,醫療機構選擇多用中選產品相對于少用中選產品的收益之差應為正,以此定量確定醫療機構選擇多用中選策略時的條件式為:

(11)
對式(10)和(11)求解,可知當結余留用比例k>k0時,醫療機構傾向于在剩余量市場多用中選產品,即結余留用政策能夠應對醫療機構參與集采積極性低的風險。
為了驗證上述理論分析并更加直觀說明博弈雙方策略的演化穩定性,本文采用MATLAB(2019a)進行數值模擬仿真。在滿足情形1的前提下,依據真實世界數據對部分參數進行賦值:q=53760,qd=53760,qs=46080,m=1,pz=0.0492,pf=0.4489,c=0.0299,a=0.0449,b=0.2245(參數說明見表1),并將博弈雙方概率初始值設定為50%。改變結余留用差額(R)的大小,分別令R=0、655、1310。仿真結果如圖1所示,結余留用的高低不僅影響醫療機構的策略演化趨勢,同時會影響醫藥企業的策略選擇。當結余留用比例k超過k0,即結余留用差額超過界限值后,“醫療機構剩余量市場多用中選產品,醫藥企業采用中選方式銷售藥品”為演化穩定策略。

圖1 結余留用對博弈雙方策略演化的影響
2.3.2 非中選產品梯度降價政策。非中選產品梯度降價政策對模型的干預主要體現在減少非中選產品的單價(pf),以此為依據構建pf與梯度降價比例(α)之間的關系式為:
(12)
依據參與約束和激勵相容原理,參與集采的醫藥企業中選后的預期收益不能低于其在同等成本約束條件下自由參與市場競爭所獲得的收益。因此,無論醫療機構選擇何種策略,醫藥企業選擇中選方式相對于選擇非中選方式的收益之差應為正,以此定量確定醫藥企業選擇中選策略時的條件式為:
即
(13)
對式(12)和(13)求解,可知當梯度降價比例α>α0時,醫藥企業傾向于選擇中選策略,即非中選產品梯度降價政策能夠應對醫藥企業參與集采積極性低的風險。
同樣,本文用數值模擬仿真驗證上述理論分析的準確性,得出非中選產品梯度降價政策干預下的演化穩定性。初始值與初始概率的設定與前文一致(參數設定見表1),將政府獎勵差額(R)設定為0,改變非中選產品的單價(pf)的大小,分別令pf=0.4489、0.3036、0.1583、0.0492(0.1583為梯度降價調整后價格,0.0492為中選價)。仿真結果如圖2所示,非中選產品梯度降價政策確實能夠逆轉醫藥企業的行為選擇,但卻不會影響醫療機構的行為選擇。當梯度降價比例α超過α0,即非中選產品的單價(pf)降低至界限值后,“醫療機構剩余量市場少用中選產品,醫藥企業采用中選方式銷售藥品”為演化穩定策略。

圖2 非中選產品梯度降價政策對博弈雙方策略演化的影響
對于醫療機構,在實施藥品零差率政策后,醫療機構主要通過醫療服務收費和財政補助來維持正常運轉,但還是能憑借藥品供應鏈業務獲取藥品收益[7]。而藥品集中帶量采購的實施,切斷了醫療機構與中選藥品間的利益鏈,破壞了原有的不合理的激勵機制,降低了醫療機構獲得灰色收入的可能性。因此,在基礎模型中,醫療機構完成約定采購量后,剩余量市場更傾向于使用非中選產品。其他學者的實證研究也證實,集采任務完成后,部分通用名的非中選產品依舊在臨床使用中占據優勢地位[27]。
結余留用政策作為國家醫保部門對醫療機構方主要的激勵約束機制,本質是在醫療機構優先選用中選藥品的策略選擇上施加額外獲益,提高其對中選藥品的處方積極性。通過把已經納入定點醫療機構總額中的集采藥品預算單獨拿出來,將集采藥品使用的激勵機制明確化,讓社會獲益與醫療機構收入之間建立正向關聯,實現“帕累托改進”[14,28]。其他可以提高醫療機構使用中選產品獲益或對醫療機構使用非中選產品予以懲罰、限制的措施也可以起到類似的效果,例如按病種(病組)等方式付費的地區首年不下調相應病種(病組)醫保支付標準、將集采中選產品配備使用情況納入臨床路徑管理和績效考核,加大非中選產品處方審核和點評力度等等。最終,醫療機構方的激勵約束機制能否逆轉其行為選擇,取決于結余留用資金的發放、績效考核等系列措施能否對等醫療機構使用非中選品種的機會成本,即政策是否符合激勵相容原則,這也是保證藥品集中帶量采購可持續的關鍵條件[7]。同時,博弈結果表明,針對醫療機構的激勵約束機制還具有提高醫藥企業參與集采積極性的附帶效果。醫療機構是藥品集中帶量采購工作的“落地”環節,是絕大多數醫藥企業的核心銷售市場。在市場規模大致固定的情況下,結余留用等政策在誘導醫療機構多用中選藥品的同時,也影響了中選企業用量的預期[29],從而在一定程度上約束醫藥企業的策略選擇,發揮同時提高醫療機構和醫藥企業參與集采積極性的雙向協同作用。因此,國家和地方醫保部門需盡快完善針對醫療機構方的激勵約束措施,依托本文設計的博弈模型及均衡結果,優化結余留用比例的制定,并通過“兩個允許”以及績效改革等措施逐步建立起新的補償機制,以切實提高醫療機構和醫務人員的政策獲益度,實現醫療和醫保的良性互動,提高集采政策的落地效果。
藥品集中帶量采購的本質是通過建立公開透明的市場競爭機制,引導醫藥企業以質量和價格競爭替代原來灰色的銷售渠道競爭[29]。醫藥企業可以通過降低價格獲取中選資格及穩定的市場采購量,中選藥品將直接進入醫院內部市場,極大程度減少了藥品的銷售費用[30]。但在另一方面,為滿足臨床需求、尊重醫師處方權,集中帶量采購政策允許非中選產品在約定采購量以外的市場銷售,即醫藥企業仍可以選擇既往銷售模式,在剩余量市場通過藥品的高售價獲得利潤。其策略選擇取決于兩種模式下經營效益的高低。因此,在基礎模型中,醫藥企業的均衡狀態可能是“中選”,也可能是“非中選”。此前開展的八批國家集采確實存在部分藥企,尤其是原研藥企的降價意愿不強,導致落標甚至廢標的情形[31]。
非中選產品梯度降價政策是地方醫保部門對醫藥企業方主要的激勵約束機制,其實質是對非中選產品進行價格管控,增加醫藥企業在非中選策略選擇上的成本,是對非中選企業的 “負面激勵”。中選產品價格下降將對非中選產品產生波紋效應,從而保證中選和非中選產品價差控制在較合理范圍內,促進同通用名藥品價格回歸合理水平[32]。但是,仿真結果驗證,影響價格的政策無法改變醫療機構的行為選擇。結合博弈模型看,降低非中選產品價格雖然可以在一定程度上壓縮其不合理的銷售費用,但在醫療機構缺乏合理補償機制的情況下,非中選產品對醫療機構帶來的獲益是始終是高于中選產品的,醫療機構仍具有使用非中選產品的偏好。
醫藥企業方的收益受到用量和價格兩方面的影響[33],因此以醫保支付和中選價協同政策為代表的、影響非中選產品用量的激勵約束措施同樣能逆轉醫藥企業的策略選擇。通過逐步以中選價格為基準確定集采品種(含非中選產品)的醫保支付標準,提高患者使用高價非中選產品的自付費用,降低非中選產品的市場競爭力,減少其在剩余量市場的用量,削弱非中選企業的獲益[34]。由于患者自發診療意愿的改變對醫療機構屬于強約束力,醫療機構不是通過衡量自身利弊得失而做出策略選擇,故此類激勵約束措施對醫療機構的影響不做討論。
盡管兩類激勵約束措施的作用機制不同,但其均是在合法范圍內對中選企業予以優待或對非中選企業施加限制,即符合參與約束原理。為確保更多醫藥企業參與集采競爭,促進形成更加合理的市場價格,后續需進一步完善針對醫藥企業的激勵約束機制,豐富政策內涵,優化醫保支付標準調整方式、調整梯度降價比例等政策細節,保證中選企業在市場上的競爭優勢。