秦小莉 ,高秀容 ,何 琴 藕順龍 ,羅 靜 ,魏 華 ,蔣 倩 (.成都市第三人民醫院藥學部,成都 600;.成都醫學院藥學院,成都 6000;.四川省腫瘤臨床醫學研究中心/四川省腫瘤醫院研究所/四川省癌癥防治中心/電子科技大學附屬腫瘤醫院藥學部,成都 600;.電子科技大學醫學院,成都 600;.成都市第二人民醫院藥學部,成都 600)
靜脈血栓栓塞癥(venous thromboembolism,VTE)包括深靜脈血栓(deep vein thrombosis,DVT)和肺血栓栓塞癥(pulmonary thromboembolism,PTE),其發生率僅次于急性心肌梗死和腦卒中[1],已成為患者非預期性死亡的主要原因之一,也是腫瘤患者常見的并發癥之一。腫瘤患者并發血栓風險是非腫瘤患者的4~7倍,約占所有VTE的20%,已成為腫瘤患者死亡的第二大原因[2—3]。而正確評估、早期預防可降低患者血栓發生率和病死率[4],但過度預防又會增加出血風險和經濟負擔。因此,使用恰當的風險評估工具預測腫瘤相關性血栓栓塞癥(cancer-associated thromboembolism,CAT)至關重要。目前國內外針對CAT風險評估工具的研究雖然較多,但我國尚未發布統一的標準或規范。本研究基于循證方法對全球CAT風險評估工具進行評價,以期為構建我國CAT風險評估工具提供方法學參考與循證依據。
本研究的納入標準包括:(1)CAT風險評估工具、量表或模型;(2)腫瘤類型不限,語種限制為中文與英文;(3)同一機構發布的評估工具,僅保留最新版本。本研究的排除標準包括:(1)關于CAT風險評估工具的評述、系統評價;(2)復發性CAT 風險評估工具;(3)CAT 風險評估的臨床研究;(4)重復發表的研究。
全面檢索中國知網(CNKI)、萬方數據庫(Wan-Fang)、維普網(VIP)、中國生物醫學文獻數據庫(CBM)、PubMed 及Embase,同步檢索21 個相關機構與學會網站,納入CAT風險評估工具量表、模型,檢索截止時間為2022 年6 月30 日,并于2023 年1 月再次補充檢索。另外手動檢索相關研究的參考文獻,以避免檢索遺漏。檢索采取主題詞與自由詞相結合的方式,英文檢索詞包括:venous thromboembolism、deep vein thrombosis、pulmonary embolism、cancer、tumor、neoplasms、risk assessment tool/score/model、risk evaluation tool/score/model;中文檢索詞包括:腫瘤相關靜脈血栓、深靜脈血栓、肺栓塞、肺血栓栓塞癥、風險評估工具、風險評估模型、風險評估量表、風險評估評分。21 個相關機構及學會網站包括:(1)中國、美國、日本、加拿大等國家的15個衛生相關網站;(2)中華醫學會、中國臨床腫瘤學會、美國國家綜合癌癥網絡(National Comprehensive Cancer Network,NCCN)、美國臨床腫瘤學會(American Society of Clinical Oncology,ASCO)、歐洲腫瘤內科學會(European Society for Medical Oncology,ESMO)、國際血栓與止血學會(International Society of Thrombosis and Hemostasis,ISTH)共6個學會網站。以PubMed為例的具體檢索策略見圖1。

圖1 PubMed檢索策略示例
2名研究者獨立通過閱讀文題、摘要,排除明顯不符合納入標準的文獻后閱讀全文,確定文獻是否納入。如遇分歧,由第3位研究者協助裁定。資料提取內容主要包括:(1)基本特性——發布作者、年份、國家、研究設計類型、VTE 定義以及納入與排除標準、數據來源、樣本量、適用人群及隨訪期等;(2)工具評估維度、CAT 風險因素或預測因子;(3)工具形成方法、特異性、敏感性、是否風險分層、是否驗證、結果呈現形式等。
采用定性分析描述納入評估工具適用人群,發布國家、機構、年份,評估工具構建方法等基本特征;重點比較工具評價維度、工具性能、風險分層能力等關鍵要素。
初檢共獲得文獻717篇,補充檢索25篇,經過篩選,最終納入14個CAT風險評估工具,見圖2。

圖2 文獻篩選流程圖
全球迄今共發布CAT風險評估工具14個[5—18],發布于2008-2021年,來自美國、意大利、西班牙等國家。其中美國5 個、中國1 個。2008 年,美國學者Khorana 等[5]研制了Khorana predictive model,為全球首個適用于評估門診化療腫瘤患者VTE 風險的評估工具。隨著對CAT 風險的廣泛關注,風險評估工具發布數量逐年增加,僅2016-2021年就發布了11個,詳見圖3。

圖3 CAT風險評估工具發布國家和數量
納入的14 個工具研究樣本量為208~18 956 例,受試者平均年齡為53.1~74.0 歲(2 項研究未報道[5,7]),女性受試者比例為3.0%~81.3%(3項研究未報道[5,7,17]),隨訪時間3~24 個月不等;其中,4 個工具采用回顧性研究[7—8,15—16],8 個采用前瞻性或觀察性研究[5—6,9—14],2 個采用病例對照研究[17—18];9個工具的構建基于Logistic回歸模型[5,8—9,11—12,14—15,17—18];2個基于其他模型改進所得[6—7];1個基于多變量模型[16];1 個基于懲罰回歸模型[13];1 個基于競爭風險模型[10];納入工具的主要研究對象為門診腫瘤患者(n=6)[5,10—14]、淋巴瘤患者(n=2)[9,18]、多發性骨髓瘤患者(n=2)[15—16]、肺癌術后患者(n=1)[17]、住院或接受化療的腫瘤患者(n=3)[6—8]。全球CAT風險評估工具的基本特征詳見表1。

表1 全球CAT風險評估工具的基本特征
患者、疾病、治療因素及實驗室指標是工具中常見評價維度,各維度囊括多種風險因素。大部分工具將身體質量指數(body mass index,BMI)和VTE 既往史作為風險因素,7 個工具均將此因素納入最終的預測因子。但不同工具之間定義肥胖的BMI閾值卻不盡相同,包括BMI≥16~19 kg/m2(n=1)[17]、>25 kg/m2(n=2)[12,16]、>30 kg/m2(n=1)[9]、≥35 kg/m2(n=3)[5—7];VTE 既往史包括VTE 個人史(n=6)[8,11—12,15—16,18]、PTE 或下肢深靜脈血栓史(n=1)[10]。原發性腫瘤部位是風險評估工具中常見的影響因素(n=5)[5—7,12—13],胃癌、胰腺癌歸為極高危風險因素,肺癌、淋巴瘤、婦科腫瘤等歸為高危風險因素,其賦予權重評分也不同。實驗室指標中:血紅蛋白和血小板計數是常見的風險因素,分別有4個工具將此納入最終風險預測因子。2個工具將活動能力下降作為最終的預測因子[9,18],但不同工具對此項目的定義差異較大。CAT 風險評估工具的評價維度和風險因素比較詳見表2。

表2 風險評估工具評價維度和風險因素比較
納入工具的預測因子數量為2~9個,占比較高的是VTE 既往史和BMI。其中9 個工具進行了風險分層[5—11,15—16],即根據權重加和評分或風險預測因子數量區分CAT 高、中、低風險,以便識別高危患者并及早干預。納入的工具均進行了方法學驗證,主要采用內部驗證(n=8)[5—6,9—12,15,17]、內外部驗證(n=1)[16]、外部驗證(n=1)[13]、對比驗證(n=3)[7—8,18]和引導驗證(n=1)[14]。9個工具以風險評分的方式呈現[5—11,15—16],2個以列線圖模型量化[14,17],3個工具結果呈現形式不明確[12—13,18]。另外,在工具性能方面,4 個工具[11—12,17—18]采用曲線下面積(area under the curve,AUC)(0.73~0.85)檢驗工具的區分度,AUC值>0.7提示預測性能較好;5個工具[5,9,13—14,16]采用C統計量(0.66~0.88),C統計量<0.7 提示工具性能較弱,>0.8提示工具性能較優秀;2個工具[10,15]采用相關系數進行檢驗;另有3 個工具[6—8]未提及其性能指標。同時進行了特異性、敏感性、陰性預測值(negative predictive value,NPV)、陽性預測值(positive predictive value,PPV)和AUC 或C統計量分析的工具僅有7個[5,9,11—13,17—18],見表3。

表3 工具預測因子及性能指標比較
3.1.1 工具構建偏倚風險較高
大部分工具(n=13)[5—6,8—18]均明確了研究對象的納排標準,以減少選擇性偏倚,提高工具適用性;但部分工具[5,7,17]構建納入患者信息不完整、未報告盲法、未恰當處理缺失數據、缺少性能評估、隨訪時間不足,增加了偏倚風險。9 個工具[5,8—9,11—12,14—15,17—18]構建采用Logistic 回歸模型,雖適用性較好,但整體偏倚風險高。而部分工具研發僅基于專家意見或經驗[7],主觀性較強;或是根本未報告其建立的具體方法和細節,導致偏倚風險較高。
3.1.2 工具驗證結果異質性較大
研究設計類型(包括前瞻性、回顧性、多中心研究)及納入人群基本特征的不同是導致異質性增加的主要原因。再者VTE 定義存在差異:某些工具[5,15—16]僅使用國際疾病分類第九次修訂本(international classification of diseases ICD-9)診斷代碼定義VTE,其并不足以確診VTE,建議將ICD-9代碼與急性VTE診斷試驗陽性證據相結合。另外VTE 預測終點方式不同:Saved[15]將慢性VTE、上肢VTE或單純淺表VTE納入模型終點,然而幾乎沒有證據表明這些VTE類型預防有益,從而導致工具驗證結果異質性增加[19]。
3.1.3 工具風險分層能力有待考究
盡管納入的14個工具都有不同的驗證方式,但部分工具[13,16]驗證結果顯示預測性能不佳。再者某些工具即使在其原始研究中表現良好,但缺乏相關外部效度的驗證研究,或者與已經進行的驗證研究報道矛盾[20]。
(1)評估維度和預測因子不完全一致:幾乎所有工具均將患者因素、疾病因素、治療因素納入評估維度,但工具最終風險預測因子卻差異較大,無法區分其導向性和重要性。再者預測因子過于簡單或復雜,都會造成CAT 風險評估偏差。(2)相同預測因子、權重評分不同:Saved[15]和Impede[16]同樣用于評估多發性骨髓瘤患者VTE 風險,但對同一風險預測因子如VTE 既往史,賦予權重評分有所差異——前者賦予3分、后者賦予5分,導致其CAT風險評估結果不同,最終可能影響臨床預防決策的實施。(3)工具實施方法與結果呈現形式不同:部分工具[12—13,18]未交代具體實施方法,透明度低,以定性描述為主,臨床可操作性差。再者不同工具結果呈現形式也有所差異,不便解讀與比較,大部分工具通過權重評分加和進行風險分層,少數工具僅按風險因素數量進行評估。
截至目前,中國本土唯一的CAT風險評估工具僅有Li等[17]研發的A nomogram model(用于肺癌),但與國外基于大量臨床資料及充分文獻回顧構建的工具相比還需更多前瞻性研究來驗證其有效性。因此,迫切需要開發符合我國人群特征的CAT風險評估工具。據此,筆者針對我國CAT風險評估工具的構建提出以下建議:
(1)不宜直接照搬國外工具,而應充分參考借鑒其構建方法和實踐經驗,兼顧我國人群特點,探索研發具有我國知識產權和可操作性強的CAT風險評估工具,例如中國人群與西方人群BMI均值的差異,直接影響風險評估對象的納入,進而影響工具的準確性。(2)CAT風險高低受疾病治療進展或患者基本特征的改變而動態變化,故應賦予風險評估工具更新功能與機制,能夠動態評估患者入院前、出院后和隨訪過程中的風險水平等級。(3)克服現有工具主要基于回顧性研究和Logistic回歸模型開發的局限性,補充長期觀察性高質量研究作為重要證據來源,拓寬工具適用性。同時,按照循證醫學方法及學科決策理念開發評價工具,強調證據的重要性,提升工具可信度[21]。(4)基于科學研究構建全方位、多層次的風險評估維度,確定各維度指標的重要性、并進行權重賦分,以提高工具適用性和可行性,最終構建符合我國實際需求、全面、重點明確、可操作性強并可持續更新與改進的CAT 風險評估工具。(5)將工具與醫療機構電子警報系統整合統一,并控制警報疲勞,以提高工具在臨床實踐中的可操作性。(6)在工具驗證研究中,建議對有預防和無預防患者進行亞組測試,以證明工具的預測價值不受先前預處理的影響。綜上,理想的CAT風險評估工具應當涵蓋患者特點、腫瘤特征、治療因素和檢驗指標等全方位、多層次的評估維度,并能動態識別抗凝預防的風險-收益閾值,賦予醫務人員和目標使用人群多維度評估能力,且結果應簡單清晰,方便區分高、中、低風險,輔助臨床決策,以降低CAT 發生率和病死率,提升醫療質量。
本研究的局限性包括:(1)僅納入了中文和英文文獻;(2)部分研究樣本量較小、證據質量可能較低,所得結論尚需更多大樣本、多中心研究進一步證實。
綜上所述,本研究對CAT風險評估工具進行了循證研究,對于推進我國CAT風險評估工具研發和臨床應用具有重要意義,有助于推動CAT風險評估工具領域的進一步發展。