基于動態博弈方法的健康整合理論模型構建

2014-08-28 00:49:40唐文熙劉文俊

醫學與社會 2014年8期

唐文熙劉文俊謝添張亮

1 華中科技大學同濟醫學院醫藥衛生管理學院，武漢，4300302 湖北省人文社科重點研究基地農村健康服務研究中心，武漢，430030

整個概念模型建立在復雜自適應系統理論(Complex Adaptive System, CAS)基礎之上，預期給出健康系統中各主體行為的假設，對健康系統的行為、關系、干預構建出理論模型。

1 模型假設

整個健康系統由自組織系統和組織系統構成，前者是服務提供體系，后者主要指政策決策與監管體系。兩大系統中均存在多主體(Multi-Agent)，主體行為的主導機制可以分為指令、利益/風險機制，行為靈活程度主要取決于主體自適應性(Adaptability)的程度，不同水平自適應性的多主體行為構成了系統內部機制的復雜性，從而整個系統表現出不確定性[1]。

1.1 自利行為及主導機制

主體(Agent)，指健康系統中所有具備完整行為能力的組織或機構，可分為政策主體、服務主體和其他行為主體。所有主體的決策和行為都建立在一定的立場上，有一定的自利性(Self-interest)；在市場和規制混合的環境下，與整合執行直接相關的服務主體，包括營利性和非營利性組織，其自利性較為明顯，也稱機構自利行為激勵(Self-interest Motive)假設[2]。該假設主要包括兩方面的內容。

第一，機構行為主導機制主要有3種：指令機制、利益機制和風險機制，機構的決策以及與其他行為主體的關系主要基于其中一種或多種機制。①指令機制是指機構決策和行為完全依賴于行政指令，整個服務體系的行為表現為單一的政策輸入——執行線性過程，缺乏應對和反饋。②利益機制，與完全的經濟生產組織不一樣，醫療衛生機構承擔著很重要的社會職能，其利益包括經濟利益和社會利益兩種。當前者占主導地位時，機構行為主要表現為趨利性；后者占主導地位時，機構行為主要表現為公益性。逐利行為與機構本身營利性或非營利性的組織性質無關，而是基于機構生存和發展的天性；趨利性和公益性的比例主要取決于政府、市場、社會3種因素在機構行為上作用的力量。③風險機制，機構的風險分為機構運行的風險和人員的風險，前者指機構對政府、市場、社會3種因素的適應結果，涉及機構的生存和發展；后者是指服務提供者的風險和管理者的風險，服務提供者的風險取決于社會環境因素的改變，包括社會意識和社會心理的變化；管理者的風險主要指“代理人”風險，目前公立醫療機構管理者的風險主要來自于體制內的政治風險，與指令受命行為有關。從邏輯辯證關系上說，風險也屬于利益的一種，此處將風險機制從利益機制中獨立出來，主要基于衛生行業有一定的特殊性，它受社會意識的約束作用比較明顯，有時候即使存在很明顯的有利行為動機，但也會被過大的風險抵消或化解。

第二，指令、利益和風險機制同時存在于不同的體制環境中，但不同的時期作用程度不一樣，總體來說主要由其中一種或兩種機制起主導作用。計劃體制時期，機構行為主要由指令機制主導，經濟利益只對少數主體起主導作用。市場經濟體制中，公立醫療機構行為主要由利益機制和風險機制主導，指令機制只占很小一部分，非公立醫療機構則完全由利益機制和風險機制主導。但是仍有部分機構行為決策主要依賴于指令機制，如疾控中心[1]。

1.2 機構自利行為對整合的影響

機構自利行為對整合的影響主要表現為：①機構間的關系，合作、競爭或不相關，主要取決于機構對有利行為的動機和風險規避的動機的權衡考慮；②機構中服務提供者的行為，積極或消極，同樣取決于對利益動機和風險動機的權衡。例如目前醫患矛盾的擴大化會強化服務提供者對醫療風險的事先防范意識，從而對協作式醫療等整合措施產生“一票否決”的影響。

1.3 自適應性及測量

自適應性(Adaptability)，主要指機構主體對環境和政策變化作出反應、反饋等應對行為的主動程度和靈活程度。自適應水平應從兩方面界定：①是否能清楚界定自身的得益和損失；②是否能依據得益和損失做出利益最大化的決策。自適應性程度決定了機構與其他利益相關方進行博弈時優勢水平的高低，自適應性越高，有利行為的主動性就越高，應對行為的靈活性就越大，博弈優勢地位就越明顯[3]。自適應性的程度區分是針對同級機構而言的。

對機構自適應性的測量，可以通過兩個方面進行。①自我發展與管理權限范圍和自主權程度，包括人事招聘權、開展新技術服務與項目、績效分配自主權、用地擴張、新建基本建設、儀器設備招標采購、醫保費用談判、醫患糾紛處理、信息系統聯網等管理權和事務處理權。②機構收入能力，可以通過財政投入占比、機構服務能力、人員收入水平3個指標具體刻畫。對政府投入的依賴程度主要是指財政投入、公衛經費、各項補貼補助占總收入的比重，對政府投入依賴程度越高，自適應性越低。機構服務能力主要是指服務市場份額、高技術服務開展例數、萬元以上在用設備數量、目錄藥品配備率，機構服務能力越高，自適應性越高。人員收入水平主要是指人均年收入與同行業相較水準、機構內高低收入差率比，人員收入能力越強，自適應性越強。

1.4 機構適應行為對整合的影響

機構的適應行為(Organization Adaptive Behavior)主要通過以下3個方面對整合產生影響。

與政策的博弈。自適應性越強，行為主體根據自身利益訴求決定對整合政策響應程度的靈活性就越強，從而通過積極的反饋和高自主性，影響政策決策，并在一定程度上影響政策執行過程和效果。如醫療聯合體的改革，大醫院往往有優勢根據自身需要來決定是形式上配合，還是借機擴張，并一定程度上通過談判交換更多的管理自主權和規則制定權；而小醫院只能選擇被動執行，整合效果也依賴于政策的完善性和力度[3]。

與其他行為主體的博弈。自適應強的主體在多主體關系中占主導地位，決定了是否合作，以及合作關系的密切程度。從醫聯體的運行結果來看，往往對龍頭醫院更有利，龍頭醫院能選擇性地控制什么樣的資源“上流”，什么樣的資源“下沉” 。

對區域整合的效果。特定區域的總體整合水平與高自適應性主體個數相關。其他條件不變的情況下，強自適應性主體越多，整合體內部關系越容易朝著分化和整合兩個極端方向發展，如當一地有多家龍頭醫院時，既可以選擇橫向上緊密協作，利益共享；也可以選擇競爭分化，通過小集團利益聯盟分割病源，反而造成集團化割裂的新局面。

2 基于自利行為和適應行為的博弈

自利性描述的是機構行為的主導因素，自適應性刻畫的是機構自利行為的能力水平。前者通過分析主體的利益訴求推測其博弈方向和策略，后者通過測量主體獲益水平給出博弈的動態演變。具體的實證可以通過整合變革收益和成本的測量，利用博弈矩陣進行預測。

2.1 自整合與政策性整合

在未進行政策變革之前，一個地區的醫療衛生機構在環境自適應性的主導下形成了適應當地社會經濟環境(如區域經濟水平、地理交通環境)、人口環境(人口分布、人口流動規律)、疾病環境(慢性病群體增加)、政治環境(改革實驗多少、政策受益程度高低)的運行方式，多個主體之間存在一定程度的自主聯合或分化，表現為自整合性。例如，在縣域醫療體系中，縣鄉兩級機構在病人的轉診、合作培訓、遠程醫療等方面存在一定自發的合作，但由于合作動力和合作能力的不同，自整合程度存在差別。當整合政策出臺之后，出于自適應的水平，不同機構對衛生政策和醫保政策的響應性是不一樣的，各自會與衛生、醫保管理部門進行不同程度的博弈，兩級機構之間也會進行博弈，博弈的最終結果由占優勢地位的博弈主體主導，最終演化至一定的均衡狀態，穩定在一定的整合水平[4]。

2.2 多主體的演化博弈模型

動態演化博弈論(Dynamic Evolutionary Game Theory)是從有限理性的個體出發，認為最終結局的均衡是主體通過對有利戰略的學習與模仿不斷制定自身行為策略，經過多回合博弈而最終實現的[5]。兩主體的博弈矩陣簡要表述如下：S表示主體A、B的行為策略(Strategy，或“策略集”)，可以代表“整合”或“不整合”，主體A的策略空間為{ S1 , S2 }，主體B的策略空間為{ S3 , S4 }；X與Y代表主體策略選擇的初始概率；U表示主體策略端點下的極值得益(Benefit)，得益=收益-成本(圖1)。

圖1兩主體演化博弈策略矩陣示意

由于整合的格局基于主體A、B之間不斷的策略互動，所以彼此之間的策略選擇與對方的支付函數密不可分。A對B的反應指數應該建立在自身互動成本、對方互動收益及變革成本之上，即ρ=CB/(UA+C)；其策略選擇動機是預計B成本與A的互動成本與B的互動收益之和的比值P(P

博弈的趨勢預測。①當博弈處于初始狀態A時，有比例多于η的主體B選擇“整合”，A選擇S1策略的動機大于ρ指標時, 該博弈將會收斂于演化穩定策略x*= 1 和y*= 1，意味著整合將會是A和B共同的必然選擇。②當博弈的初始狀態位于C 區域時，B選擇“整合”策略的動機小于η指數，而A也以小于ρ的概率來整合時，該博弈將收斂于演化穩定策略x *= 0 和y*=0，意味著A和B將選擇保守策略，可能維持原狀態不變。③當博弈的初始狀態位于D 區域時，A選擇S1策略的概率大于ρ，卻只有小部分B支持A的策略選擇，該博弈的演化博弈均衡解具有不穩定性。這種情況意味著A將成為當前局面的主導者：若A有十分強烈的意愿并制定有效的整合措施，通過不斷談判引導B逐漸意識到合作有利可圖的，博弈最終會進入A 區域；而B也會通過對期望收益的比較，越來越多的傾向于S3策略，均衡最終收斂于x*= 1 和y*=1。但是此時A所得收益會因為額外的付出而減少，所以若A為了自身利益不受到任何損失而傾向于放棄S1策略，博弈最終會進入C 區域。④當博弈的初始狀態位于B 區域時, 即大多數B都選擇“整合”，但是A的動力卻很小時，該博弈的演化均衡同樣不具有穩定性。在這種情況下，B就將成為扭轉現狀的動力，博弈過程同情況(3)。該模型對現實最有意義的為情況(2)，其間的博弈過程與均衡結果能幫助解釋整合改革無法推行的原因所在(圖2)。超過兩個主體的博弈過程需要重復該過程，并構建出博弈行為網絡。

圖2 A、B行為演化趨勢預測

2.3 自適應性在現實中的運用

通過自適應性可以預測多主體整合水平的問題。以農村縱向醫療協同組織的構建為例預測如下。

當機構自適應性均比較低時，對政府依賴程度比較高，政策響應性好，由于博弈地位比較對等，此時整合水平取決于整合政策的投入力度，整合政策越完善、越適宜、越協調，整合水平就高，反之就越低。

當機構自適應性均比較高時，對政府的依賴程度就比較低，對整合政策的響應性取決于政策目標與機構自身目標是否兼容，整合對機構越有利，政策越容易執行，此時整合水平取決于兩級機構博弈力量對比關系，縣優勢水平高時，整合水平取決于縣級機構利益取向，縣不占優勢地位時，整合水平取決于鄉級利益取向。

當縣自適應性高、鄉自適應性低時，整合水平取決于縣級機構自身的利益訴求：縣級機構越傾向于趨利，就有可能更關注整合為自身爭取到的資源，從而實質上降低整合水平；縣級機構越傾向于追求高層次服務，就越有可能通過下放優質資源，逐步提高下級機構的能力，使病人流向和費用結構下沉，并提高服務的連續性和協調性。

當縣自適應性低、鄉自適應性高時，整合水平取決于鄉級機構的利益訴求，鄉級越傾向于趨利，就越能夠通過控制病源而對縣級機構提出合作的要求，包括人力設備的支持等，有利于兩級能力差距的縮小，一定程度上整合水平提高；鄉趨利程度越低，越有可能無作為，整合水平可能與“自整合”水平相近。

這個預測過程同演化博弈的思路是一樣的，可在無法實證測量收益和成本的情況下，做簡單預測。

3 健康整合理論模型

整個理論模型的構建策略是：①通過系統分析制定概念模型，確定系統邊界、系統結構和各要素主體；②結合一定自適應性水平下的動態博弈模型，借助系統回路分析方法(System Archetype Analysis，SAA)，形成分析思維范式；③找出關鍵要素與作用靶點，構建靶向整合機制；④求解一定政策目標下系統的最優或次優解[6]。

3.1 基礎模型

整個模型由體制、政策、對象和環境4個模塊組成(圖3)。①體制模塊是決定政策模塊的上層因素，也是對象模塊的自適應性水平的決定因素，在模型中起基礎作用。現實中對應改革區域中最高常設層權力機構，如國務院部委以及省市區縣政府各行政部門，可能涉及的行政主管部門包括發改委、財政、衛生、國資委、人社局、環境等，可能涉及黨內機關包括組織部、編辦。②政策模塊是對象模塊的直接驅動力，也是模型分析的起點和終點，在模型中占據核心地位，現實中常對應衛生、醫保、藥監、疾控。③對象模塊即常規所見的整合體，是政策模塊輸入、輸出的主要對象，也是整合水平的直接決定因素和

圖3 復雜系統模塊與黑箱示意

體現，在模型中起決定作用。現實中橫向對應醫療服務體系(公立和非公立)、公衛服務體系(疾控、結防、地傳)以及其他支持體系(藥招、配送、軟件)。④環境模塊是對象模塊自整合水平的決定因素，也是政策模塊的動力因素，在模型中起動力作用。包括人口分布、收入水平、交通因素、疾病發病率、周邊醫療資源等。

模型的非線性主要體現在行為黑箱和系統嵌套上。①行為黑箱：黑箱1代表機構行為主體之間的博弈，黑箱2代表政策部門之間的博弈，黑箱3代表權力部門之間的博弈。②系統嵌套：第一層嵌套是狹義整合體(即服務子系統)與政策子系統之間的嵌套，第二層嵌套是廣義整合體(即服務與政策的整合體)與外環境之間的嵌套。

3.2 整合的系統回路分析

按照系統回路分析思路，進行政策決策或政策分析共需8個步驟：①背景，環境分析，包括需求形勢、資源配置、能力建設、以及周邊關系等；②目標，制定政策目標；③對象，確定兩類對象——直接執行對象和支持對象；④核心政策，分析直接執行對象之間的博弈行為，及對政策可能的博弈行為，從而確定核心政策規定；⑤支持整合，分析支持對象可能對執行對象產生的影響，從而確定需要配套的支持政策；⑥利益博弈，部門政策博弈，有必要時上溯體制層面的主管權威博弈；⑦反饋，接收反饋信息，再重復第三步到第五步，不斷模擬政策執行效果；⑧控制，對比預期政策執行效果和原設計目標，在可接受的水平下對原指令做出修正，重新輸入系統政策指令。回路示意圖見圖4，相關動作見表1。

圖4 整合系統回路分析示意

動作解釋指令通常狀態下為“政策”輸入“0”代表無外部政策的“自整合”狀態方向輸入-控制輸出-反饋主體行為與政策博弈 1.正向反應:響應,響應對象為"政策"或"環境" 2.負向反應:抵制,抵制性質為"積極"或"消極" 3.不反應相互博弈 1.得益 2.損失關系線性關系非線性關系 1.耦合 2.脫節 3.未知作用協同作用制約作用不定向作用機制行為主導機制信息流結果有效抵消無效不可預期

4 健康整合中的政策設計與現實策略

任何一個改革，都可拆分為兩個層面的整合：要素的整合，即行為機制的設計；關系的整合，即信息——反饋機制的設計。

4.1 要素

要素層面，即圍繞整合的目標從核心政策和配套支持政策的具體設計上應涵蓋5個方面內容：①動力整合，整合的意愿、經濟激勵、績效分配的促進；②能力整合，關鍵事件處理能力培養，如具體的行為；③規范整合，簡單明了的操作流程和偏離軌道的處理方法；④條件整合，最簡單的信息傳遞渠道、建立和維護服務人員關系、降低個體正式溝通成本；⑤評價整合，量化考核、獎懲分明、分配掛鉤。

4.2 機制

機制層面，跨系統機制設計應包括4個層面：主體內部管理機制、主體間鏈接機制、政策子系統內部協調機制、政策子系統與服務子系統的協調機制。

服務主體內部管理機制具體包括：①激勵機制，涉及考核、評定、獎懲、分配機制[7]；②約束機制，如臨床行為規范、組織行為規范；③保障機制，如內部信息傳輸與利用機制、人員培養機制。

服務主體之間的鏈接機制具體包括：①跨主體人員組織機制；②溝通、協調、談判機制；③臨床協作機制；④專業信息傳輸與利用機制；⑤共同能力增長(學習與培訓)機制；⑥利益共享機制；⑦風險共擔機制。

政策的輸入與反饋機制包括：投入機制、反饋機制、長期政策與短期政策的平衡機制。

政策系統內部協調機制是指雙方或多方部門協調機制，主要協調3個內容：政策目標、考核內容、監管方式。行政體制與環境因素的協調機制包括：政策與患者需求的雙向響應機制，如民意聽證機制、政策評估機制；部門政策體系內部平衡機制。

綜上，健康整合的現實策略主要控制/改變以下8個領域：①籌資，通過保險制度的融合整合服務對象，如日本老年人長期照護與保險制度的融合；②學科，如CAM、醫學服務與社會服務、疾病管理；③人力，如全科醫生或家庭醫生，跨學科醫師團隊或健康責任團隊；④支付，協作醫療的綜合支付、根據跨級臨床路徑支付、集團總額預付；⑤管理，內部流程再造、設備技術人才資源互認共享、技術標準化，如整合衛生服務路徑；⑥信息，信息網絡建設、遠程醫療；⑦聯結，轉診制度、連續性服務路徑、集團管理路徑；⑧文化。

健康整合的理論模型可以運用于3個方面：①為整合變革構建具體政策模型和管理模型；②評價涉及多主體行為的國內外整合實踐；③案例研究。尤其適用于多機構合作模型的案例分析，如醫聯體、醫療集團、縱向協作醫療體、縣鄉村一體化管理等。

該理論模型的主要局限在于：對于行為主體自適應性的測量指標賦值尚不能定量化，目前只能根據關鍵人物訪談和研究者的經驗進行主觀綜合，因此在多個地區橫向比較時有一定的局限性；動態演化博弈運用于超過兩個主體的分析時，工作量會大大增加，因此還需制定一個簡化的分析模式，以便進行快速決策。

[1]劉洪. 組織結構變革的復雜適應系統觀[J]. 南開管理評論,2004,7(3):51-56.

[2]李淮涌. 基于多元利益主體合作的公立醫院經濟運行機制研究[D]. 中國人民解放軍軍事醫學科學院,2010.

[3]李淮涌，吳樂山，雷二慶. 公立醫院經濟運行博弈分析和機制選擇[J]. 解放軍醫院管理雜志,2010,17(5):428-430.

[4]馬玉琴. 農村醫療衛生服務系統建模與政策研究[D]. 第二軍醫大學,2009.

[5]威布爾·喬根.演化博弈論[M]. 王永欽，譯. 上海：上海人民出版社,2006.

[6]謝長勇，張鷺鷺，歐崇陽，等. 基于人群健康的國家宏觀衛生政策系統框架研究[J]. 第二軍醫大學學報,2005,26(11)：1236-1238.

[7]林莉，王振維. 基于復雜適應系統理論的創新團隊內部運作機制探析[J]. 中華醫學科研管理雜志,2009,22(3):131-133.