沈士立,吳彬,齊殿君,陳歆悅,張鑫巖,李一萱,張旭,宮雪,于曉松*
2018年,原國家衛生計生委出臺文件:要求所有承擔全科醫學住院醫師規范化培訓的臨床基地(綜合醫院)〔臨床住培基地(綜合醫院)〕必須在2019-12-31之前獨立設置全科醫學科[1-2]。但國內對于如何設置和建設綜合醫院全科醫學科尚缺乏研究和共識。目前,與綜合醫院全科醫學科有關的研究文獻主要集中于探討建科的必要性和重要性、科室建設的現況、全科醫學師資隊伍、人才培養、住培帶教中的發現,而在科室建設的整體規劃與評價方面存在領域的研究缺口。本文旨在報告中國醫科大學附屬第一醫院全科醫學科運用德爾菲法構建臨床住培基地(綜合醫院)全科醫學科配置與建設評價模型的過程,以期為今后發展和完善相關評價工具提供借鑒。
1.1 研究團隊和方法選擇 本課題工作小組成員共9名,包括教授2名、副教授1名、講師1名、在讀博士研究生1名、在讀碩士研究生4名。其中,由1名教授與2名研究生組成文獻檢索小組,主要負責文獻檢索、翻譯、分析與整理;由1名教授與5名研究生組成專題討論小組,主要負責會議布置、專家聯絡、提綱的擬定討論及會議資料的轉錄、編碼與分析;由2名教授、1名副教授、1名講師、1名研究生組成德爾菲專家咨詢工作小組,主要負責專家遴選與聯系、問卷制定、組內研討和決策。針對研究中出現的問題和歧義,均通過組內討論得出一致觀點。
本課題工作小組首先通過文獻檢索和專題小組討論設計制定了臨床住培基地(綜合醫院)全科醫學科配置與建設評價模型的基本框架和草案,然后通過德爾菲法進行全面的指標篩選、權重估計和評價標準的修改,最終完成模型構建。德爾菲法是本研究的主要研究方法,主要通過發揮專家群體經驗對特定項目進行預測,多應用于沒有歷史事件或歷史經驗可以借鑒的預測環境[3]。由于我國全科醫學起步較晚,發展經驗相對較少,且在國際上沒有同類發展模式可以完全借鑒,故德爾菲法具有方法學的適用性。
1.2 文獻檢索 研究者使用“全科醫學科”與“評價或指標”(中文)及“general practice department or family medicine department or family practice department”and“evaluat*or indicator*or index*”(英文)的檢索詞對PubMed、萬方數據知識服務平臺、中國知網及國內外衛生系統的官方網站〔如中國衛生健康委、英國國家醫療服務體系(NHS)、澳大利亞皇家全科醫師協會(RACGP)網站等〕進行了文獻搜集。檢索時間為2000-01-01至2019-06-01,納入與綜合醫院全科醫學科建設相關的研究文獻(包括政策文件、研究論文、制度標準等)。排除標準:(1)與評價指標構建相關較小的文獻;(2)與綜合醫院全科醫學科建設相關較小的文獻;(3)語言為英語/漢語以外的文獻。由1名研究者負責文獻檢索,并通過題目、摘要篩選文獻;由2名研究者獨立地進行全文篩選,并從文獻中提取評價指標和評價內涵,而后交叉核對,意見不一致時通過討論或咨詢第3名研究者得出一致觀點,文獻檢索過程見圖1。
通過文獻檢索,最終納入各類資料15篇[1,4-17],包括原國家衛生部發布的(綜合醫院)臨床重點專科建設項目評分標準2篇[4-5],國家衛生健康委發布的全科醫學政策法規5篇[1,6-9],國外發達國家全科醫療評價研究7篇[10-16],專業書籍1本[17],由此組成了本項目的參考文獻池。

圖1 文獻檢索示意圖Figure 1 Literature retrieval
1.3 專題小組討論 研究者于2019年3月29—31日,兩次邀請數名來自不同省市的綜合醫院全科醫學科的科室負責人參加專題小組討論會議,第1次參會專家7名,第2次參會專家4名。兩次會議均圍繞臨床住培基地(綜合醫院)全科醫學科的科室建設展開討論,尤其對臨床住培基地(綜合醫院)全科醫學科的定位及科室建設相關評價指標進行了深入探討。以上工作已通過《臨床住培基地(綜合醫院)全科醫學科的定位與評價指標研究:基于專題小組討論的歸納性分析》[18]一文進行發表。
1.4 問卷設計 由2名研究者從檢索文獻池、另2名研究者從專題小組討論轉錄文本中提煉了臨床住培基地(綜合醫院)全科醫學科建設的評價指標和評價標準,相關內容經研究團隊集體討論后形成一致觀點。由1名研究者將文獻研究結果和專題小組討論結果進行綜合,經研究團隊集體討論后初步設計形成了一級、二級、三級指標和評價標準的草案,以及德爾菲專家咨詢問卷(第一輪)。
1.5 遴選專家 根據研究的目的和內容,研究者制定了以下專家遴選標準:(1)地域:按照比例分層抽樣,從我國東部、中部、西部和東北部四大區域選取專家[19],因東部地區全科醫學發展較早,專家經驗相對豐富,適當增加了東部地區專家人數。(2)專業經驗:從“中華醫學會全科醫學分會第八屆委員會委員名單”“中國醫師協會全科醫師分會第四屆委員名單”“海峽兩岸醫藥衛生交流協會第二屆全科醫學分會委員名單”等名單中優先選取多年從事全科醫學相關工作或研究的專家,以保證專家對我國全科醫學的發展具有全面的認識和見解。(3)全面性:除全科醫學臨床專家以外,研究者也適當選取了全科醫學兼醫學教育或兼醫院管理或兼公共衛生與預防醫學的專家,以保證參與者在專長領域上的全面性。
1.6 專家邀請和問卷發放 研究者主要通過電子郵件、短信、電話等方式聯系專家。于2019年6—8月,通過E-mail和現場發放問卷的方式發放并回收專家咨詢問卷(第一輪),發出問卷45份,回復38份,均填寫基本完整;于2019年9—11月,通過E-mail發放并回收專家咨詢問卷(第二輪),發出問卷38份,回復35份,均填寫基本完整;于2019年12月—2020年3月,通過E-mail發放并回收專家咨詢問卷(第三輪),發出問卷35份,回復32份,均填寫基本完整。
1.7 指標篩選 采用Likert 5級評分法,請專家對每個指標的同意程度賦分,以非常不同意計1分,非常同意計5分,并請專家在“專家意見”中以開放填寫的形式,闡明自己對評價指標的不同看法。回收問卷后,根據專家的意見,計算各項指標的算數均數、變異系數和滿分比。采用界值法,要求所有納入指標的同意程度必須滿足標準:算數均數≥4.00分且滿分比≥30%且變異系數≤0.25。對不符合界值法標準的指標,根據專家意見進行相應修改或刪除;對滿足界值法標準的指標,針對個別專家的修改建議,經課題組集體討論后決定是否改動。最終,當所有指標均符合界值標準,且專家意見趨于統一,完成指標篩選。
1.8 權重確定 采用層次分析法計算一、二級指標的權重系數,采用專家評分法計算三級指標的權重系數。首先請專家填寫一、二級指標的判斷矩陣,填寫過程見表 1~2。
然后對判斷矩陣進行邏輯性檢驗和一致性檢驗,具體為:(1)對每個判斷矩陣分別進行檢驗,對檢驗結果不合格的數據予以刪除;(2)若同一專家檢驗不合格次數≥3次(最多出現不合格次數為6次),則認為該專家對層次分析法的理解存在偏差,剔除該專家的全部矩陣數據。根據納入數據,計算各項指標的權重系數并取幾何均數形成“初始權重”。隨后,對“初始權重”進行標準化處理,具體為:權重系數為0~2.49%標準化為0%,權重系數為2.50%~7.49%標準化為5%……權重系數為97.50%~100.00%標準化為100%,將一、二級指標權重以5%為單位進行標準化處理,形成“標準化權重”。然后,將“初始權重”和“標準化權重”再次發給專家,征詢專家是否同意“標準化權重”,根據專家反饋,結合初始權重結果,經課題組集體討論后確定一、二級指標的權重系數。同時,采用Likert 5級評分法,請專家對三級指標的重要程度賦分,以非常不重要計1分,非常重要計5分,然后通過直接評分法和Satty法計算獲得各項三級指標的權重系數[20]。

表1 一、二級指標判斷矩陣填寫表Table 1 Judgment matrix filling table of first-level and second-level indicators

表2 αij賦值說明表Table 2 αij assignment description table
1.9 評價標準的修改 由于評價標準是評價模型的具體操作細則,工作量龐大且細碎,為控制工作量和提高效率,本研究未設置評價標準的界值法修改標準。但課題小組整理了專家在問卷中提出的每一條評價標準修改建議,并進行了逐條討論,以不同專家提出的相似觀點為重點參考,以不同專家提出的不同觀點或個別專家提出的個別觀點為輔助參考,最終由課題組集體討論是否修改該項評價標準。當專家對某一個評價標準提出的修改建議明顯減少,則認為專家群體對該項目趨近認可。
1.10 質量檢驗 采用Excel 2010和SPSS 20.0軟件進行數據錄入和分析,采用專家積極系數、專家判斷依據、專家熟悉程度、專家權威系數、專家協調系數分析專家咨詢的可靠性,以P<0.05為差異有統計學意義。專家積極系數為問卷的有效回收率,專家判斷依據由自評得出,賦值說明見表3,專家熟悉程度由自評得出,賦值說明為:很熟悉賦值為1.0,較熟悉賦值為0.8,一般賦值為0.6,較不熟悉賦值為0.4,很不熟悉賦值為0.2。專家權威系數為專家判斷依據與專家熟悉程度的算術均數。專家協調系數由SPSS 20.0計算得出,以協調系數>0.5、P<0.05代表專家意見趨于統一。
2.1 專家基本情況 本研究共選取全國各地全科醫學資深專家45名,根據專家回復情況分別發放3輪德爾菲專家咨詢問卷。三輪函詢的專家基本情況見表4。
2.2 可靠性分析
2.2.1 專家積極系數 第一輪發放問卷45份,回收問卷38份,積極系數為84.4%;第二輪發放問卷38份,回收問卷35份,積極系數為92.1%;第三輪發放問卷35份,回收問卷32份,積極系數為91.4%。
2.2.2 專家權威系數 專家判斷依據為0.955 3,專家熟悉程度為0.926 3,專家權威系數為0.94。
2.2.3 專家協調系數 第一輪咨詢,專家協調系數為0.253,協調性檢驗P<0.001;第二輪咨詢,專家協調系數為0.198,協調性檢驗P<0.001;第三輪咨詢,專家協調系數為0.716,協調性檢驗P<0.001。

表3 專家判斷依據及其影響程度賦值表Table 3 Basis for experts' judgment of the value of indictors and influence degree assignment table
2.3 指標篩選結果 根據界值法標準,第一輪專家咨詢后,共有2個二級指標、15個三級指標不滿足保留標準,對以上指標均進行了修改或刪除。第二輪專家咨詢后,所有指標已符合保留標準,不再進行相應改動。根據專家修改意見,經課題小組集體研討,第一輪咨詢后,一級指標數量增加1個,將原一級指標“教學與科研”單列為“教學”與“科研”兩個一級指標;二級指標數量減少9個,包括刪除7個指標,修改4個指標,合并2個指標。三級指標數量減少30個,包括刪除31個指標,新增8個指標,修改22個指標,拆分3個指標,合并10個指標。第二輪咨詢后,一級指標不做調整;二級指標數量減少1個,包括刪除1個指標,修改3個指標;三級指標數量保持不變,但刪除3個指標,新增5個指標,修改6個指標,合并1次指標。第三輪咨詢后,一、二級指標不做調整,僅修改1個三級指標。一、二級指標修改過程見表5。

表4 專家基本情況表〔n(%)〕Table 4 Basic information of experts invited
2.4 權重確定結果
2.4.1 一、二級指標權重
2.4.1.1 邏輯檢驗和一致性檢驗 經邏輯檢驗和一致性檢驗,一級指標判斷矩陣排除12份,有效錄入23份;“基礎條件”下屬二級指標判斷矩陣排除12份,有效錄入23份;“醫療技術隊伍”下屬二級指標判斷矩陣排除11份,有效錄入24份;“醫療服務能力與水平”下屬二級指標判斷矩陣排除12份,有效錄入23份;“醫療服務質量”下屬二級指標排除9份,有效錄入26份;“教學”下屬二級指標排除15份,有效錄入20份;“科研”下屬二級指標排除11份,有效錄入24份。
2.4.1.2 權重結果 一級指標的權重經標準化處理后,標準化權重方案專家同意人數26名,不同意人數6名,同意率為81.3%。在6名不同意的專家中,有5名專家認為:應進一步提高“教學”指標權重,意見較集中。但是,提高“教學”權重之后,同比降低哪個指標的權重系數,專家意見較分散。對此,筆者團隊結合初始權重計算結果,經課題組集體討論,適當提高了教學的權重,將一級指標權重系數最終調整為16%、20%、18%、18%、18%、10%,權重調整過程見表6。
各二級指標的權重經標準化處理后,專家同意人數波動于28~29名,不同意人數波動于3~4名,同意率為87.5%~90.6%。鑒于各二級指標同意率總體較高,且持有不同觀點的專家意見比較分散,經課題組集體討論,各二級指標權重系數不再調整。

表5 專家咨詢后一、二級指標修改情況Table 5 Modification process table of first-level and second-level indicators according to experts' consultation
2.4.2 三級指標權重 三級指標以專家咨詢“重要程度”賦分為依據,根據直接評分法和Satty法計算確定權重結果。
2.5 評價標準的修改 根據專家建議和課題小組討論,筆者團隊對各項三級指標的評價內容、評價方式、評價分值進行了全面優化和調整。第一輪咨詢后,收到專家修改意見數百條;第二輪咨詢后,收到修改意見一百余條;第三輪咨詢后,收到修改意見三十余條,代表專家對評價標準趨于認可。
本研究起自2018年11月,終止于2020年5月,歷時一年余。由4名全科醫學師資和5名全科醫學研究生組成課題工作小組協調管理研究進展,由38名來自全國22個省、市、自治區的全科醫學學科帶頭人或學科骨干組成德爾菲專家咨詢小組參與指導模型構建。研究前期,通過文獻檢索和2次專題小組討論構建了評價模型的基本框架,然后通過3輪德爾菲專家咨詢進行指標篩選、權重估計和評價標準的修改,最終構建形成包含6個一級指標、22個二級指標、78個三級指標及其評價標準在內的評價模型。研究過程由淺入深,遵循探索性研究的基本設計流程。專家積極系數和權威系數較高,研究結果較為可靠;專家協調系數>0.5、P<0.001,專家意見較為統一。
該模型在設計中,首先通過參考原國家衛生部于2010年頒布的《國家臨床重點專科評估試點評分標準(通用部分)》[4]和2012年頒布的《關于印發腫瘤科等國家臨床重點專科建設項目評分標準(試行)的通知》[5]形成該模型的結構性框架,使模型在主體結構上符合原國家衛生部對醫院臨床科室建設的一般要求。繼而應用三角互證(triangulation)的方法[21]對多元信息和數據進行組合,從方法學上提升了指標收集與篩選、方案收集與篩選和權重設計過程的準確性。在前期資料收集中,由于考慮文獻研究相對全面,但不夠深入;專題小組討論相對深入,但不夠全面,研究者綜合了文獻研究結果和專題小組討論結果,使初步設計的模型框架盡可能完善,為德爾菲專家咨詢的開展提供了必要的準備。在之后的專家咨詢中,采用界值法標準和專家意見相結合進行指標篩選,采用層次分析法和專家評分法相結合進行權重估計,采用課題組集體研討決策專家建議進行指標評價標準的修改,都屬于三角互證設計。
德爾菲法目前在國內較多用于評價指標和權重的設計,較少用于評價標準的修改和咨詢。本課題組在專家咨詢問卷中放入了評價標準,但未設置界值法標準,僅請專家提出開放式修改意見,并經課題工作小組研討后做出決策。這一方面確保了評價標準的準確性,一方面則盡可能地減少專家填寫問卷的工作量,在國內具有一定的方法學創新性。同時,在一、二級指標權重設計中,為了使評價模型便于開展實際評估,本課題組設計了標準化處理和專家再次確認的研究步驟,從而兼顧了評價模型的應用性和科學性,這也具有一定的方法學創新性。

表6 一、二級指標權重調整Table 6 Weight adjustment table of first-level and second-level indicators
然而,這種評價指標的開發和調整方法是否穩健,所生成的結果是否可以在實踐中展現出充分的實用性,仍有待后續研究和實踐檢驗所證實。此外,在一、二級指標的權重確定中,筆者團隊對所有數據進行了邏輯檢驗和一致性檢驗,對一級指標排除了12份數據,有效錄入23份;對二級指標排除了9~15份數據,有效錄入20~26份數據,排除數據總體相對較多,可能存在一定的研究者偏倚。
綜上,本研究完整透明地報告了中國醫科大學附屬第一醫院全科醫學科研究組開發和完善臨床住培基地(綜合醫院)全科醫學科配置與建設評價模型的方法和過程。由文獻檢索—專題小組討論—德爾菲法組成的信息獲取環節,以及由界值法—判斷矩陣—對開放意見的小組討論組成的信息篩取排序環節共同確保了這一評價模型在理論上的全面性、效率和穩健性。這一全新的評價模型開發路徑可以為后續研究提供重要的方法借鑒。
作者貢獻:沈士立、于曉松負責文章的構思與設計、論文撰寫與修改;沈士立、張鑫巖、李一萱、張旭、宮雪負責文獻/資料收集和整理、訪談轉錄與分析;沈士立、吳彬、齊殿君、陳歆悅、于曉松負責專家遴選與聯系、課題小組研討和決策;于曉松負責文章的質量控制及審校,并對文章整體負責,監督管理。
本文無利益沖突。