張 靜 王虎峰 崔兆涵
1. 國家神經系統疾病臨床醫學研究中心(首都醫科大學附屬北京天壇醫院) 北京 100070 2. 中國人民大學醫改研究中心 北京 100872 3. 中國人民大學公共管理學院 北京 100872
2015年,我國縣級公立醫院綜合改革全面推開后,國內出現了一批改革的典型地區,但各地改革政策執行的總體情況卻不平衡,仍有相當多的地區改革政策難以落地。在縣級公立醫院綜合改革頂層制度設計已較為完備的情況下,為何各地改革政策執行和推進如此不平衡?為了科學地解釋和評價這一現象,找出政策執行環節存在的問題,本文以跟蹤調研的幾個改革試點和典型地區的客觀資料為基礎,嘗試引入組織變革理論開發科學評價的工具,衡量分析改革進程中組織變革力的現實情況。因此,該研究選擇了盧因組織變革理論的力場分析模型作為框架,基于2015年《國務院辦公廳關于全面推開縣級公立醫院綜合改革的實施意見》(國辦發〔2015〕33號),從改革的驅動力和制約力兩個方向構建改革變革力測評指標體系,審視改革政策執行過程中驅動和阻礙的力量對比,有針對性地評價改革得以推進和受阻的因素。從而為今后縣級公立醫院綜合改革的深入推進提供理論借鑒和工具參考。
本文的研究對象最終確定為“縣政府、縣政府醫改相關的職能部門、縣級公立醫院”這一組織單元,其源于兩方因素:一是我國縣級公立醫院綜合改革的現實,二是政策執行理論的第三代“整合式”研究途徑。33號文件傳遞出這項改革不僅是單體醫院的改革,也不只是涉及縣級公立醫院這個群體,還涉及到中央與地方、不同層級政府內部部門之間、政府不同職能部門之間以及政府與縣級醫院之間的多種關系。同時,當前主流的政策執行理論也考慮了當下現實社會政策執行的復雜性、多元性。溫特的“規劃過程—執行結果”模型中,代表執行過程的中介變項也包含了組織和組織間執行、基層官員行為、目標群體等多個變量。[1-3]
本文研究對象確定和指標體系構建參考模型的理論基礎均來源于CNKI、Pubmed等數據庫所獲取的重點文獻;二、三級指標的選擇依據源自33號文件;案例樣本資料獲取來自于4個案例地區的客觀數據上報,共涉及被訪談者79人,政策文件459份、總結報告和會議紀要41份、訪談記錄9份、歷史性數據1 846條。
本文綜合運用文獻法、半結構訪談、德爾菲專家法、文本分析、錨定分級、配對分析等多種方法來構建測評指標體系。主要技術路線包括(圖1):(1)測評指標體系的開發:引入盧因組織變革理論和力場分析模型及33號文件中的政策任務要點構建測評指標體系;(2)綜合評價體系形成:運用多種方法對指標實施無量綱化處理,使測評指標體系具有可操作性、橫向可比性;(3)測評指標體系驗證:將綜合評價體系應用于案例地區進行評價及驗證;(4)三角互證:將案例研究結論與其他來源證據進行比對,相互解釋和印證,檢驗指標體系的有效性。[4]

圖1 技術路線
庫爾特·盧因(Kurt Lewin)在其“三階段”組織變革理論中提出了解凍Vnfreezing—變革Conversion—再凍結Refreezing三個階段。他指出成功的變革要對現狀進行解凍,然后變革到一種新的狀態,并對新的變革給予再凍結,并使之保持穩定持久,并在這個理論中構建了力場分析模型(圖2),其中驅動力和制約力是一對既對抗又平衡的力量,單獨增加變革的驅動力會導致組織張力變大。如盡量降低變革的制約力則更有效果,它使得變革向期望的狀態發展,而不會增加組織張力。[5-6]基于這一理論基礎,遵循盧因力場模型的框架,本研究分析解構了33號文件,將政策要點中進行變革的力量劃分為兩個部分:一是驅動變革的政策措施,一是要求執行對象克服變革阻力的政策措施,由此作為構建雙向測評指標體系的基礎。

資料來源: Lewin.Group Decision and Social Change[M]. 1952.圖2 盧因力場模型
1.5.1模型改良
本文選取英國NHS使用的力場分析模型[7],結合我國縣級公立醫院綜合改革政策及實踐進一步改良,作為構建雙向測評指標體系的一級框架(圖3)。該框架在驅動力一側仍沿用了NHS的5個維度指標,而在制約力一側則根據我國縣級公立醫院綜合改革政策內容,將原模型中的“既有工作模式”分解為“既有管理體制”和“既有運行機制”兩項指標,其他維度保持不變,以利于測評操作。選取該模型的理由是我國的縣級公立醫院作為國家衛生服務體系中的重要組成部分,其與NHS有著相同的應用領域,并且被應用的組織也與本文將要研究的縣級公立醫院有著高度的相似性。

圖3 本文改良后的力場分析模型[7]
1.5.2 測評指標的選擇
(1)一級指標選取
采用NHS模型中的指標作為本文變革力指標體系中的一級指標(圖4)。其中驅動力包括5個指標:競爭、新技術、激勵、管理壓力、新人力;制約力包括4個指標:技能缺乏、職業不安全、安于現狀、既有工作模式。[7]

圖4 縣級公立醫院綜合改革變革力測評指標體系構建步驟
(2)二、三級指標初步篩取
從“33號文件”目標出發,所有有利于建立和推進新機制形成的舉措為驅動改革的力量,而改革所要破除的舊機制,以及變革舊機制所遇到的阻抗為制約改革的力量。將政策中屬于驅動力量的政策措施劃入驅動力方向,對于可能產生改革阻抗的力量(被破除、被考核、被監管、被統籌、被加強、被要求)劃入制約力方向。
(3)一級指標的拓展
在NHS模型的基礎上對二、三級指標所對應的一級指標進行擴展,其中針對改革實踐中存在的突出問題,如“三醫聯動機制尚不健全,部門利益消解不力,協同掣肘,改革的深度、廣度和力度都未展現出來”和“對既有利益的觸動還較淺,藥品生產流通使用領域改革不全面,藥價虛高問題依然存在,醫療服務價格動態調整不能實現,對醫療機構和醫療技術勞務價值的補償不能體現”這兩個問題,本文在NHS原模型的制約力一級指標基礎上新增了1個指標,即“既有工作模式”,修改為“既有管理體制”和“既有運行機制”,以適應我國公立醫院體制機制改革的情況。
(4)測評指標體系的初步建構
為了使力場模型發揮作用,需要在感知、嚴格和客觀的情況下識別出這些力,再次對指標進行遴選,遴選的原則包括可操作性和可測量性,其中變革阻力的指標要考慮到組織、社會和個人等多個層面。經過以上的幾個步驟,可獲得待論證的縣級公立醫院綜合改革確立的變革力測評指標體系。
1.5.3 德爾菲專家法篩選并形成測評指標體系
按照如上形成的測評初步架構,結合半結構訪談的內容,通過吸收課題組專家小組討論意見,形成了驅動力和制約力共86項指標。再經35位專家兩輪函詢,對指標的重要性以及專家判斷依據和其對指標的熟悉度進行判斷賦分,函詢賦分部分詳見表1。

表1 專家函詢表的賦分部分
1.5.4 無量綱化處理
無量綱化處理是綜合評價步驟中的一個環節,將指標體系中不同類別指標按不同方法處置后變得可以比較和衡量,從而實現指標體系的可運用,以此對評價對象進行整體比較。
1.5.5 測評指標體系的應用與驗證
本文選取了4個示范、試點地區,應用本研究確立的變革力測評指標體系對案例的改革政策執行和改革推動工作進行評價、打分,對案例地區的測評結果進行分析和比較,嘗試分析和解釋究竟是示范地區驅動了改革,還是化解了變革中的阻力,或是綜合運用了兩種方法,其重點和關鍵環節是什么。這既是對測評指標體系的應用,同時也是對現實改革的實際成效即社會評價等結果與指標體系測評結果進行比較和互證,來驗證變革力指標測評體系的有效性。
2.1.1兩輪專家函詢的積極系數
專家的積極系數是指專家咨詢表的回收率,可以反映專家對研究的積極程度。第一輪和第二輪專家的積極性和對本研究的關心程度都比較高,問卷全部有效,且回收率在第二輪達到了100%(表2)。

表2 專家函詢問卷回收統計表/n,%
2.1.2 兩輪專家的權威程度
專家的權威程度一般涵蓋兩個因素,一是指專家對研究內容和指標作出判斷的依據,一個是專家對指標的熟悉度,兩者最后共同合成專家的權威系數。[8]結果顯示兩輪函詢專家對問卷的內容權威系數均在0.8以上,權威性很高(表3)。同時,兩輪專家的權威程度各指標結果非常接近,說明專家于兩輪指標判斷的權威程度均較高,也顯現出專家對第一輪和第二輪函詢指標判斷的一致性較高。[8-9]

表3 兩輪函詢的專家權威程度統計表
2.1.3 協調系數
協調系數是體現專家協調度的指標之一,和變異系數一起反映專家對所有及單個指標評價的協調程度。協調系數w在0~1之間,w越大,表示專家的協調程度越好,反之意味著專家意見協調程度較低。表5是用SPSS23.0進行的兩輪協調系數顯著性檢驗的結果。兩輪專家組的意見非偶然協調的概率很大,在95%的置信度下,P<0.001,說明兩輪專家意見在非偶然協調方面可行。[8-9]同時,第二輪專家的協調系數和第一輪相比均有一定提高,表明專家對指標重要性的認識越來越趨向一致,可信度較第一輪增高,且結果可取(表4)。

表4 兩輪專家協調系數統計表
2.1.4 專家對測評指標的篩選及權重結果
對兩輪回收的70份問卷進行統計,專家對驅動力和制約力兩部分的指標體系分別進行了判斷,專家意見集中度用重要性的平均分值(Mj)、滿分率(Kj)表示,專家意見的協調程度用變異系數(CV)和協調系數(W)表示。本研究采用“界值法”進行指標篩選:根據每項指標的重要性得分計算滿分率、算術均數和變異系數。滿分率和算術均數的界值為:均數-標準差,分值高于界值的指標入選;變異系數的界值為:均數+標準差,得分低于界值的指標入選。參照以上三個衡量尺度均不合要求的指標才被剔除,以防止重要指標丟失。[8-10]
經過兩輪的專家函詢及指標篩選,新增驅動力三級指標1項,合并制約力三級指標1項,在原有指標上進行修改、補充和融入二級指標1項、三級指標6項,變革力測評指標體系最終得以確立。該分析框架共分為兩部分,即驅動力部分和制約力部分,共包含指標84項,其中一級指標10項,二級指標26項,三級指標48項(1)限于篇幅原因,不再詳細列出,有需求請聯系本文作者。。同時,本指標體系框架來源于力場模型和政策任務,結構層次分明,故根據專家的賦分形成了不同級別指標的權重。
本研究共有35位函詢專家參加了兩輪背靠背問卷咨詢。這些專家覆蓋了從政策制定到逐級執行的各層面的行政官員、主管部門行政人員以及一線的院長和從事政策理論研究的學者,其中各層級專家從事本專業年限超過10年的占60%,即親歷了新醫改至今的所有歷程。專職學者9人,還包括部委和省級醫改辦專家,超過半數為專家學者,因此,專家對改革政策的熟悉度和權威度均較高,代表性很強。盡管為保證各層級專家數量均衡,本研究選定的咨詢專家較多,但經兩輪咨詢后,指標內容的協調性達到了較高一致的結果(表5)。

表5 函詢專家基本情況
本研究根據不同類型指標的特點,采用了三種方法對測評指標進行標準處理,并對各項三級指標進行了評分細則確定:一是采用錨定分級法,對大部分的定性指標進行三級錨定。錨定標準依據33號文件的框架和相關評價指標最新的政策要求,按照執行到位為滿分(強),大部分執行為75%得分(中),和少部分執行為50%得分(弱),使用“強、中、弱”三種評價標準加以等級性量化[11-13];二是采用文本分析法對主觀性指標和指標中的主觀部分進行量化處理。將半結構訪談內容按照院長、科主任和醫護人員分類,提取關鍵詞,統計消極要素頻率和制約力大小[14-15];三是采用配對分析法對某一指標中包含的多個、多年度歷史數據指標進行處理。如一個指標中包含藥占比、檢查占比和化驗占比等多個、多年度指標數據,將表示每個指標的復合增速的4組數據列在一起,兩兩配對比較,其價值較高者可得1分,最后將各指標配對所得分數相加,其中分數最高者即等級最高者,按分數高低順序將每個指標進行排序,即可劃定每個指標等級。經過無量化處理,最終形成了雙向的測評指標體系,即驅動力部分和制約力部分,分別以百分制按指標權重確定分值,結合每條指標的評分細則形成可操作性的綜合評價體系。
應用本文建立的變革力測評指標體系對4個案例地區進行評價,獲得了初步測評結果(表6)。

表6 案例地區綜合評價得分結果
之后將變革力測評指標體系測評結果與其他來源的證據結果進行比對,判斷是否能夠形成三角互證。現從三種來源獲得的評價結論進行比較以得出確切、可靠的評價結果(表7),可見案例的初步印象及階段性成果、社會評價和測評結果三個方面的證據結論非常接近,趨勢一致。

表7 多元證據結論間的比較
就政策執行理論而言,政策效果的顯現需要較長一段時間,對政策執行結果的衡量可能需要10年甚至更長時間。[16]從33號文件頂層設計形成至今,按照政策文件要求應該落地實施了,但各地改革政策執行和改革推進的不平衡卻依然存在,雖然評價政策中長期效果可能為時尚早,但尋找一種定量和可比的測評工具來分析政策執行過程中不平衡的原因是可能的。本研究在測評指標體系構建中體現了兩處創新:一是評價的視角。本著33號文政策中性的原則,指標體系重點關注“政策執行過程”,則會得到驅動改革政策執行有力的發現,或者取得改革政策執行不力或失敗的原因,并將信息反饋至改革政策決策階段;二是采用了雙向指標評價體系。可以動態對比改革過程中驅動力和制約力的對抗與轉化,分析和預判改革地區縣級公立醫院綜合改革的階段,研究和解釋改革如何消解來自于社會、組織和個人等多層面的變革阻力,使改革得以推進,是對推動縣級公立醫院綜合改革評價工具開發的有益嘗試。
本研究是要比較相同的頂層設計背景下為何各地政策執行和改革推進不平衡。而本文構建的二、三級指標均來源于被執行政策(2015年的33號文件),這使得政策執行的評價指標體系具有很好的內容效度,也保證了對各地政策執行評價尺度的一致性。同時,指標體系將政策內容從建立新機制的驅動力量和破除舊機制的制約力量兩個方向上構建了相互對抗的雙向指標框架,由此更深入地考量各地政策執行過程中驅動和阻礙改革的力量對比,尋找改革得以推進和推進不力的深層次原因存在于哪一維度,以及程度深淺。這就解釋了為何有些地區面上政策執行較全面,驅動力很強,但改革推進的程度卻不深,就在于其制約力也很強勁,未能很好地化解改革的阻力。因此,本研究指標體系構建的方法將改革政策執行與改革推進分層次可比。
本研究初步構建的變革力測評指標體系,尚不具備實踐價值,無法實現案例應用的橫向可比。因此,對定性指標進行無量綱化處理就顯得很有必要。本論文針對指標體系中的定性指標和定量指標進行不同方式的處理,對于來源于文獻(包括文件)的客觀指標,運用錨定評價法來區分程度;對于訪談獲得的資料,運用文本分析法進行處理,以獲得可供比較的關鍵詞及頻次;有量化數據的部分,運用配對比較法進行去量綱化處理。因此,本文構建的指標體系中原定性指標和定量指標均具備了可以量化評價的條件,即該指標體系可以憑借統一的量化標準去衡量、評價案例地區縣級公立醫院綜合改革變革力的大小,并使不同案例地區的評價結果具有可比性。
本研究采用了三角互證的方法來驗證測評指標體系的有效性,即使用測評工具對多案例進行評價,并將測評結果與其他來源的證據結果進行比對,判斷是否形成三角互證。測評結果是定量評價結果,與已有的社會評價和改革地區的一些數據指標結果進行比較,雖然不是指標體系構建必須的環節,但是不同證據結論間可以相互解釋和佐證,使得理論研究與實踐相對照、相結合。本評價指標體系的應用及研究發現將另文討論。
本文構建變革力測評指標體系的思路與案例應用對于其他改革政策執行的評價,以及對城市公立醫院綜合改革的評價均具有一定的借鑒意義。首先,本文案例選擇了國家試點和示范地區,今后,可進一步拓展評價的范圍,甚至可選取一些極端案例進行比較,會對改革推進中問題的解決提供更多參考;同時,本測評指標體系是基于縣級公立醫院綜合改革33號文件的研究,一是因為縣級公立醫院綜合改革的頂層政策設計的路徑與邏輯與城市公立醫院綜合改革的頂層政策設計高度一致。二是因為我國的縣級公立醫院數量、級別統一、隸屬關系比較清晰,研究起來相對比較簡單。三是研究需要由簡向繁,縣級公立醫院綜合改革變革力測評指標體系對于城市公立醫院綜合改革的研究將有重要的借鑒意義。因此,未來還可進一步對城市公立醫院變革力測評指標體系進行開發研究,進一步拓展量表使用的范圍。
致謝
感謝在測評指標體系構建過程中,35位專家學者所給予的專業、無私的支持與幫助!
作者聲明本文無實際或潛在的利益沖突。