張 英 陳 紅 孫亞男 于長禾
1.北京中醫藥大學第一臨床醫學院,北京 100700;2.北京中醫藥大學東直門醫院推拿科,北京 100700;3.北京首都醫科大學宣武醫院中醫科,北京 100053
臨床試驗基于報告的結局指標評估干預措施的有效性和安全性。然而臨床研究中的結局指標存在異質性及選擇性報告偏倚的風險[1],可能導致使用無效甚至有害的干預措施,并浪費已經有限的衛生保健資源[2]。有效性試驗核心結局測量倡議(COMET)[3]提出建立在特定臨床領域的所有試驗中進行測量和報告[4]的一套公認的標準化核心結局指標集合(COS)解決上述問題。
隨著COS 相關研究所涉及疾病類型的增多,Comet 數據庫可根據疾病檢索已構建的和正在進行的COS 研究[5-6],然而不同研究選擇的結局指標概念框架不一致,如新型冠狀病毒肺炎(COVID-19)COS 構建的3 個研究中,世界衛生組織(WHO)[7]團隊、天津[8]團隊、北京[9]團隊COVID-19 的COS 研究中結局類別都不一樣,同一疾病COS 結局框架尚未達成共識。結局指標與人群特點和干預相關,不同試驗中對結局概念框架選擇的不一致阻礙了研究之間的比較與合并,不能突顯人群疾病的特點,失去了洞察干預起效機制的機會,而且研究人員缺少對特定結局的所有干預措施的比較,導致其重復工作、研究浪費。此外,現有結局概念框架能否涵蓋所有疾病COS 內容還有待考量。COMET 網站可以通過人群、干預措施進行檢索COS 的研究信息,但還不能根據結局分類進行檢索[10]。因此,本文參考Idzerda 等[11]對結局概念框架系統綜合的結果及后續研究提出的與健康、疾病及其結局相關的框架,對現有結局概念框架進行敘述性綜合比較,分析各框架特點,以期推薦對所有疾病COS 適用性最好的概念框架。
WHO 將健康定義為“一種完全的身體、精神和社會美好的狀態,而不僅僅是沒有疾病和虛弱”[12],此定義可視為健康的框架,包含身體、心理、社會3 個核心域,將健康擴展到心理、社會層面。然而,框架涵蓋范圍過于寬泛,對于健康域的制訂方法及如何測量沒有進一步的論述,并且,有學者認為完全的身體、心理、社會健康的狀態接近于幸福而非健康,對健康和幸福概念的混淆可能會導致幸福感稍有減弱便被視為不健康的狀態[12]。因此,它可能并不適用于所有疾病的結局概念框架。
5Ds 是一個評估臨床結局的實用性概念框架,該框架通過5 個獨立的維度來表示結局:死亡(death)、不 適(discomfort)、殘 疾(disability)、藥 物 毒 性(drug toxicity)、成本(dollar cost),每個維度代表一個與患者病情直接相關的結局,這些結局維度的量化可通過訪談或患者問卷進行[13]。5Ds 框架指導了與結局測量相關的工作,尤其在類風濕性關節炎領域被測量和驗證。目前,5Ds 框架已用于風濕學中的結局測量(OMERACT)內COS 的開發。
ICF 基于生物-心理-社會模式,側重于疾病的負擔和損害[14]。ICF 框架包含個人和社會因素影響下的身體功能、身體結構、活動和參與、環境因素,將人的功能劃分為3 個層次:在身體部位層面的功能(如胰腺結構功能、心血管結構功能)、整個人的功能(如代謝功能、感覺功能、情緒功能)以及在社會背景下的整個人的功能(如家庭關系、心理需求、社交、休閑體育等)。ICF 框架的優勢是它適用于不同衛生專業人員的工作領域,不局限于診斷范疇[15]。ICF 框架已用于特定健康狀況相關核心集研究,例如糖尿病[16]、類風濕性關節炎[17]、職業康復[18]等。
PROMIS[19]框架保留WHO 健康框架,將自我報告的健康狀況分為身體健康、心理健康和社會健康,身體健康包括癥狀和功能,心理健康包括情感、行為和認知,社會健康包括關系和功能。PROMIS 項目始于2004 年,旨在改變臨床研究和實踐中患者報告結局的方式,PROMIS 框架還沒有明確用于COS 構建。目前,該系統包括超過300 項用于一般人群和患有慢性疾病的個人的生理、心理和社會健康的測量。
Porter’s 結局層次[20]指的 是由Porter 提出的一個3 層層次結構的概念框架,每一層次都包含兩個級別,代表患者健康的特定方面,每一級別涉及一個或多個結局維度,其中最高層通常是最重要的。第一層稱為“達到或保持健康狀態”,測量的兩個級別是生存率和健康/恢復程度:第一級生存率,對大多數患者來說是壓倒一切的重要指標;第二級是在高峰或穩定狀態時達到或保持健康或恢復程度,通常包括免于疾病和功能狀態相關層面等維度。第二層與恢復過程相關,包含恢復時間和治療過程兩級,恢復時間指的是實現康復和恢復正常或最佳功能所需的時間,可分為完成護理的各個階段所需的時間,治療過程指的是護理或治療過程中的不適、重新治療、短期并發癥等。第三層是健康可持續性,包含保持健康狀態和治療產生新的問題兩級:第一級指原發疾病的復發或較長期的并發癥;第二級指由于治療而產生的新的健康問題,當復發或出現新的疾病時,必須重新評估所有結局。
Wilson 等[21]開發了HRQL 概念模型,該模型提出了不同干預措施的健康結局分類方案,包含5 個層次:生物和生理因素、癥狀、功能、總體健康認知和整體生活質量。除了對結局指標進行分類外,該模型還提出了層次之間特定的因果關系,將傳統的臨床變量與HRQL 指標聯系起來,在這個模型中,從生物和生理因素類別向整體生活質量類別移動的過程即是從細胞到個體再到社會成員之間的相互作用過程。每一層的概念都越來越一體化,逐漸不易定義和度量,也不再簡單由醫生進行評估。
自1992 年以來,OMERACT 共識倡議已經成功地為許多風濕病開發了核心集,隨著其涉病范圍的擴大,需要制訂其基本概念框架,通過文獻檢索和風濕病學利益相關者的迭代共識過程,2012 年OMERACT 會議討論了核心集合的概念框架草案和開發過程,形成了OMERACT Filter 2.0[22]框架,該框架包括3 個核心域,即死亡、生活影響、病理生理表現,資源利用被強烈推薦。該框架以風濕病為基礎,構建過程包含其他醫學專科專業人員的投入使其盡可能通用,但該框架還不夠詳細,不能提供核心域以外的結局的標準化分類。
Davey 等[23]在Cochrane 系統綜述數據庫根據醫學專業、干預措施類型和結局類型,對每個meta 分析進行分類,得到了11 類結局:反映病情持續/結束的體征/癥狀、不良事件、新的急性/慢性病的感染/發病、生物標志物、一般身體健康、產科結局、全因死亡率、資源使用/住院/流程、特定原因死亡率/重大發病事件/復合(死亡率或發病率)、其他結局(半客觀:外部結構、內部結構、與手術/設備相關的成功/失敗、退出/脫落)、其他結局(主觀:疼痛、心理健康結果、生活質量/功能、消費、護理滿意度、復合(至少1 個非死亡率/發病率)。Smith 等[24]匯總在Cochrane 綜述中使用的結局作為臨床試驗的核心結局測量內容,確定了15 個結局類別,分別是死亡率/生存率、生理/臨床、感染、疼痛、日常生活活動、社會心理、生活質量、依從性、退出治療/研究、滿意度(患者、護理人員、醫療保健提供者)、藥物治療、經濟、住院、手術、不良事件。此外,Cochrane 與COMET 合作開發了結局類別集,共14 類,分別為生理或臨床、死亡率、感染、疼痛、心理健康、功能、生活質量、社會心理、治療依從性、不良事件、護理的滿意度、資源利用、退出研究、干預失敗,用于Cochrane 系統評價的初始注釋。3 種分類均未能建立具有層次化的結局框架。
為了系統全面的對所有臨床試驗結局進行分類,Williamson/Clarke 等[11]基于Smith 等開發的結局指標15 類別表改良形成12 類別版本,分別為死亡率/生存率、生理/臨床、感染、疼痛、功能(身體、心理、社會)、社會心理、心理健康、HRQL、依從性(包括停止治療)、滿意度、資源利用(經濟、住院、手術、藥物)、不良事件。12 個類別的版本隨后進一步發展,形成了死亡、生理或臨床、生活影響、資源利用、不良事件5 個核心域,以及死亡率/生存率、血液和淋巴系統結局、心臟結局、先天性、家族性和遺傳性結局、內分泌結局、耳與迷路結局、眼睛結局、胃腸道結局、一般結局、肝膽結局、免疫系統結局、傳染和感染結局、傷害和中毒結局、新陳代謝和營養結局、肌肉骨骼和結締組織結局。與腫瘤相關的結果:良性、惡性和未指明(包括囊腫和息肉)、神經系統結局、妊娠、產褥期和圍產期結局、腎和尿液結局、生殖系統和乳房結局、精神病結局、呼吸胸部和縱隔結局、皮膚和皮下組織結局、血管結局、身體功能、社會功能、角色功能、情感功能、認知功能、整體生活質量、感知健康狀態、護理提供、個人情況、經濟、住院、需要進一步干預、社會/照顧者負擔、不良事件等38 個結局類別的概念框架。將這一新的分類方法應用于COMET 數據庫中的COS,發現92%COS 至少包括一種生理結果,59%COS 包括至少一種生活影響領域的測量,35%的COS 提到不良事件,數據表明該結局框架適用性好,在COMET 網站可詳詢該框架內容。
將8 個結局指標框架與Williamson/Clarke 框架比較(見表1)。WHO 對健康的定義中身體、心理、社會屬于核心域,沒有下屬結局類別標準化分類,并且其身體、社會等含義寬泛。如WHO 對健康的定義中的身體層面包含Williamson/Clarke 結局框架生理或臨床、身體功能等,社會層面包含社會功能、角色功能、個人情況、資源利用等。因此,不能簡單地將WHO健康定義中身體、心理、社會理解為Williamson/Clarke結局框架中的身體功能、情緒功能、社會功能。5Ds 框架中死亡對應Williamson/Clarke 框架的死亡/生存,藥物毒性對應不良事件,成本對應資源利用中的經濟,不適屬于生理/臨床中的一般結局,一般結局包括不能歸因于身體某系統的影響全身的疾病,例如疲勞、寒戰、不適、厭食癥、癥狀(與特定身體系統無關)等。殘疾屬于生活影響中身體功能的一部分,身體功能指疾病對日常生活、體育活動的影響,例如,自理能力、殘疾指數、性功能等,5Ds 框架缺乏生理或臨床核心域下詳細的類別。ICF 框架中的身體功能指的是身體的整體生理功能,如排尿功能、意識功能,涵蓋范圍廣泛,從生理層面對身體功能進行描述,而Williamson/Clarke 框架的身體功能從生活影響方面進行表達。ICF 框架身體結構是身體系統或部位層面的功能,可對應Williamson/Clarke 框架生理或臨床域中各系統功能。因此,ICF 框架身體功能、身體結構歸為生理或臨床核心域。Williamson/Clarke 框架社會功能指疾病對社會功能的影響,例如社交能力、溝通、心理社會發展、參與等,角色功能是疾病對角色的影響,例如照顧兒童的能力、工作狀況等,個人情況指與患者的財務、家庭和環境有關的結局,ICF 框架中活動和參與可歸為社會、角色功能,環境因素如家人、社會態度,法律,政策等可歸為個人情況。ICF 框架更關注功能,并不能涵蓋所有核心域及類別。PROMIS 框架中身體癥狀歸為Williamson/Clarke 框架生理或臨床核心域,生理或臨床核心域包含身體各系統的疾病癥狀、體征、理化檢查等系列結局,對于不能歸為某一身體系統的疾病情況則歸為一般結局,兩個框架中身體功能是相互對應的。Williamson/Clarke 框架精神病結局包括所有與心理健康狀況和相關行為有關的結局(例如成癮和行為問題),情緒功能指疾病對情緒及整體幸福感的影響,心理健康情感歸為情緒功能,心理健康行為可歸為精神病結局,認知歸為認知功能,社會健康歸為社會功能。Porter’s 層次框架生存率歸為死亡/生存,Williamson/Clarke 框架中死亡/生存包括全因生存/死亡率和特定原因的生存/死亡率,以及無疾病生存,無進展生存等。保持健康或恢復程度、恢復時間、治療過程、保持健康狀態歸為生理或臨床核心域,與干預相關的治療和非治療反應如無效、治療失敗等及一般癥狀改善、惡化、并發癥、復發、出院等可歸為一般結局,由于治療而產生的新的健康問題歸為不良事件。Porter 的層次結構框架注重時間,更適合急性和可逆性疾病。HRQL 概念模型中生物和生理因素、癥狀可對應生理或臨床,功能對應生活影響,兩框架中整體生活質量是相互對應的,感知健康狀態指受影響個體對其相對健康水平的主觀評分,總體健康認知可對應感知健康狀態。OMERACT Filter 2.0 核心集框架和Williamson/Clarke 框架在死亡、生活影響、生理或臨床3 個核心域是對應的,OMERACT Filter 2.0 核心集框架中資源利用只是強推薦,未提到不良事件核心域。Cochrane 框架推薦的結局類別可分別歸屬于Williamson/Clarke 框架結局類別,雖包含了5 個核心域的內容,但未建立有條理的層次結構,結局類別不夠詳細。

表1 結局指標框架比較
現有結局框架多為核心域,沒有結構化的分級,缺乏標準化的結局類別,并且,有的僅適用于特定疾病,有的僅包含患者結局,不適用于所有疾病的分類,不能提供核心域外的詳細結局類別。相較而言,Williamson/Clarke 結局框架層次結構較為清晰,包含結局核心域和類別,內容全面,提供了適用于所有疾病潛在結局詳細的分類,保證研究之間結局表達的一致性,有助于了解改善特定結局的相關干預,方便臨床數據搜索、報告和分類,而且該框架未來可以將其他框架的內容進行統一歸類,方便橫向比較,減少研究浪費,可用于所有試驗、COS、系統評價及臨床試驗注冊。Williamson/Clarke 結局框架該框架適用于個人層面的結局分類,不適用于家庭或社區干預試驗的健康結局分類,針對特定的干預措施的相關結局也需要進一步詳細分類[25],未來將進一步細化研究。