賴偉翊,王珣,趙蘭琴,林浩添,2
(1.中山大學中山眼科中心,眼科學國家重點實驗室,廣州 510060;2.中山大學精準醫學科學中心,廣州 510080)
在醫學各學科中,對患者進行手術治療前,除了與本次主要診斷疾病相關的檢驗檢查,常常還開具評估一般身體情況和手術風險的常規檢查,包括血常規、血生化、凝血功能、常見傳染性疾病篩查、尿常規、胸部X線檢查、心電圖等。種類繁多的術前檢查不僅給患者帶來不便,延長了疾病治療流程,也在一定程度上增加了醫療費用,給醫療保障系統帶來了負擔。但出于保證醫療質量和患者安全的目的,對所有手術患者開具近乎無差別的術前常規檢查處方,仍是目前階段絕大多數醫院的普遍做法。從現象成因來看,醫療傳統和法律法規的要求是重要原因之一;同時也有部分醫生開具術前檢查是因為認為其他醫生需要,例如眼科醫師常常因為認為麻醉科或內科醫師需要而開具大量術前檢查,即使他們自己并不重視這些檢查結果[1-2]。且對大多數外周器官、只可能極少量失血的擇期手術而言,給大量患者開具術前常規檢查的經濟成本較高,開具這些術前檢查也對指導醫療決策、減少醫療不良事件沒有顯著影響。
本文將從2個角度對有關常規術前檢查效率的既有研究進行回顧:一是術前常規檢查對低風險擇期手術安全的影響及其所帶來的經濟負擔;二是合理控制術前檢查數量的現有方法和效果,并進一步探討在大數據時代,能否通過機器學習的方式方法,以眼科為例,對現行的術前檢查模式進行改進(圖1)。

圖1 本文內容結構Figure 1 Content structure flowchart
自20世紀末開始,已有學者發現術前常規檢查對一些低風險手術的安全性和醫療不良事件發生率并無影響。例如美國梅奧診所[3]早在1988年就通過回顧各類擇期手術患者術前實驗室檢查結果,發現術前實驗室檢查異常與醫療不良事件發生之間并無顯著關聯,因而不再推薦對病史、體格檢查無異常的擇期手術患者進行其他術前常規檢查。針對一些更具體專科的擇期手術,也有大量研究發現術前常規檢查項目與手術安全、預后并無顯著關聯,也不影響治療決策。例如擇期的兒童胸心外科手術術前的血液實驗室檢查結果并不影響治療決策和預后,因此不必要給這些患兒開具常規的血液實驗室檢查[4];在泌尿外科尿道中段懸吊術患者、耳鼻喉科鼻中隔成形術患者、浸潤性乳腺癌患者等多專科情景中,類似的對醫療安全、患者預后無顯著影響的低效率檢查也廣泛存在[5-7]。
眼科是手術風險相對更低的專科,白內障手術是眼科最常見的低風險手術,有研究團隊[8-11]針對常規術前檢查對白內障手術安全和預后的影響進行了全面細致的研究,他們通過系統評價美國、巴西、意大利共納入21 531例白內障手術的3項隨機臨床試驗,發現各類醫療不良事件的發生率,包括占比最高的術中心血管事件和術后眼部不良事件的發生率,在常規術前檢查組和選擇性術前檢查組之間并不存在顯著差異,且相比于選擇性術前檢查,常規術前檢查對是否取消手術的醫療決策也并未產生顯著影響。由此可見,常規術前檢查對于白內障手術而言并非必要,對其他眼科手術的價值也值得進一步研究。
盡管白內障術前檢查對手術安全和預后的影響并不顯著,但其卻帶來了沉重的經濟負擔[12]。Chen等[13]于2015年總結了44萬接受白內障手術的患者在術前1個月接受檢查的情況,結果顯示:相比于之前11個月的平均水平,術前這1個月中,患者的檢查花費提高了480萬美元,門診就醫費用提高了1 240萬美元,分別提升了42%和78%。該團隊[14]后續針對42萬人白內障手術隊列的研究顯示:該隊列術前門診就診和檢查費用達到2 270萬美元,預計每年白內障術前常規檢查項目共計花費美國醫保費用4 540萬美元。
非臨床指南要求、缺乏臨床指征的術前檢查在醫療實踐中廣泛存在。以上文提到的尿道中段懸吊術為例,經回顧性分析發現:76%的凝血功能檢查、73%的血常規檢查、47%的血生化檢查、39%的胸片檢查、21%的心電圖檢查均沒有合適臨床指征[5]。而通過個性化設計術前檢查方案等多種方式控制這些術前常規檢查的數量,則可明顯降低醫療費用[5-7,15]。
合理控制術前檢查數量最直接的方式是總結臨床實踐經驗,通過發表聲明、編寫指南和專家共識等方式,以患者病史和體格檢查情況為參考,推薦不同的術前檢查組合。有學者[16]建議在失血風險極低的外周器官手術,應以年齡和性別為標準,針對不同患者開具不同的檢查組合,40歲以下男性無需接受常規術前檢查,41~64歲男性只需接受心電圖檢查,65歲以上男性則需要接受心電圖、胸部X線檢查、血常規、血生化在內的一系列術前檢查。在此基礎上,也有研究者[17]嘗試將指南和共識以計算機軟件的形式體現出來,通過輸入人口學資料、病史資料和手術資料,軟件自動輸出應該開具的術前檢查項目,如根據該指南軟件的建議,減少不符合指南要求的術前檢查和重復的術前檢查,每1 000名患者可節約2.7萬美元醫療費用。針對白內障手術,有學者[18]呼吁心電圖檢查應該僅在心血管疾病高風險人群中開展,而尿常規檢查和凝血功能檢查應該停止。而美國眼科學會[19]早在2000年就建議減少白內障手術前的常規檢查項目。
但可以預見的是,必須持續大力地推廣這些新理念、新標準,佐以對執業醫師的指引和教育,鼓勵重視術前病史采集和體格檢查,方可達到理想的效果[20]。一方面大量術前檢查異常可通過回顧病史和體格檢查提前發現蹤跡[3];另一方面,一些專科醫師常常輕視病史和體格檢查,因而相比于病史、一般身體狀況和人口學特征,患者是否需要接受過度術前檢查,與其主診醫生執業模式相關性更高[13]。有研究[21-22]表明:低風險手術前咨詢心內科醫生可能導致接受更多術前檢查、住院時間延長和醫療費用提高;而經過麻醉科醫生評估后再開具檢查處方,則可以顯著降低醫療費用。
為減輕醫療機構或醫師個人執業習慣對過度術前檢查的影響,已有一些地區性的實驗通過長時間執業教育和宣傳,持續降低了常規術前檢查的數量和整體醫療費用[23]。例如經過數年時間減少非必要術前常規檢查的倡議,加拿大亞伯達省所有擇期手術患者中,術前僅13.4%接受了心電圖檢查,23.2%接受了胸部X線檢查[24]。Mafi等[25]在美國洛杉磯2個相互獨立的醫學中心進行前瞻性的研究,發現與作為對照的醫院相比,實驗干預的醫院通過眼科和麻醉科主任制定新的術前檢查指南,以及質控護士協助監督等一系列干預措施,大大降低了該中心白內障手術患者接受術前胸部X線檢查(從90%降至24%)、心電圖(從95%降至29%)及其他常規實驗室檢查的比例(從92%降至37%),且即使在干預結束后的1年內這一效應仍然顯著。該醫院每年白內障手術量約1 000例,但從社會經濟角度3年內預計可節省21.7萬美元。
上述控制常規術前檢查數量的干預方法,常常僅基于基礎的統計分析和簡單實踐經驗的總結,納入考慮的因素較少,常常只包括年齡和簡單的病史情況,對患者而言個性化程度較低;且其設計僅為了保障手術安全和降低醫療費用,忽視了術前檢查對發現其他潛在健康隱患的意義和價值。開展真實世界大數據研究能綜合大量人口學、病史和體格檢查特征,使得為患者設計更個性化的術前檢查方案成為可能。而機器學習的方法正適用于在大數據集中挖掘多變量與結局之間的關聯,已被成功應用于預測各類醫療不良事件的發生,例如早產兒疾病、感染性休克、ICU中患者病情惡化以及全身麻醉過程中低氧血癥的發生等[26-30]。
筆者所在中山大學中山眼科中心團隊,針對如何為眼科手術患者個性化判斷是否需要進行術前胸部X線檢查進行了前期研究。團隊回顧了2017至2019年3.4萬名眼科手術患者的術前胸部X線檢查結果及其相關的人口學、病史、體格檢查資料,以機器學習的方式建立算法模型,預期通過人口學、病史、體格檢查資料預測患者胸部X線檢查發現異常的風險。推測為胸部X線檢查異常低風險的患者,將來可能在術前免予接受胸部X線檢查。
在研究過程中,我們依據對眼科手術安全的影響和對潛在健康風險的提示作用,將胸部X線檢查結果劃分為3個風險層級:1)低風險,既對眼科手術安全和治療決策無影響,又未發現潛在健康風險,主要指未發現任何明顯異常的胸部X線檢查結果;2)中風險,對眼科手術安全和治療決策無影響,但發現了潛在的健康風險,可指導患者至其他專科進一步檢查的結果,例如發現性質不明的肺部結節、肺間質感染、氣管移位、肺動脈段突出等問題;3)高風險,發現可能影響眼科手術安全和治療決策的胸部X線檢查異常結果,例如發現心影明顯增大、活動性的肺結核感染等。由于筆者所在中山大學中山眼科中心為眼科專科醫院,就診患者大多沒有循環或呼吸系統全身合并癥,胸部X線檢查結果為低風險的患者占比高達73.3%,更提示了在眼科專科場景,通過個性化設計精簡術前檢查項目不僅可為患者帶來方便,提高醫療效率,還可能帶來巨大的社會經濟效益。
研究現階段用于預測胸部X線檢查風險程度的變量包括:1)人口學信息,包括年齡、性別、出生和居住地區、婚姻狀況、職業、教育水平等;2)病史信息,眼科診斷、是否多次住院、是否吸煙、是否飲酒、其他疾病既往史等;3)體格檢查和護理信息,視力和眼壓情況、入院時體重指數(body mass index,BMI)、呼吸、體溫、脈搏、精神狀況、是否存在肢體活動障礙、能否行走入院、能否生活自理、有無跌倒墜床史等。因為中高風險度胸部X線檢查樣本占比較低(26.7%),研究采用上抽樣的方法進行組間樣本數量的平衡。最終數據集劃分68%作為訓練集,17%作為驗證集,15%作為測試集。將這些變量納入logistic回歸進行初步變量篩選后,以隨機森林模型對胸片檢查所屬風險度進行預測(圖2)。
初步訓練后的模型在訓練集中對胸部X線檢查中高風險和低風險的分類準確率達到99%以上,在測試集中也可達到81.2%,ROC曲線下面積0.864。為更大限度保障高齡患者群體的手術安全,實現對胸部X線檢查中高風險人群的高敏感度檢出,還可對模型閾值進行調整,使測試集中胸部X線檢查中高風險人群檢出敏感度特異度中均達到80%以上。經分析,影響分類結果權重最高的3個因素為入院時的收縮壓、舒張壓和BMI,印證了體格檢查對個性化制訂術前檢查方案的重要性。此外,對分類結果的影響較大的因素還包括是否離退休人員、較好眼的視力、年齡段、文化程度、是否就診于眼底科等。除年齡段外,這些變量傳統上并不用于評估系統性的健康風險,更不影響是否開具胸部X線檢查的診療決策,但在機器學習算法模型中成為眼科術前胸部X線檢查風險分類的重要影響因素。后續如繼續擴大樣本量和樣本來源,納入更多有關變量,進一步提高模型分類效果,并完善對分類影響因素的解釋,將有可能實質性地改變眼科術前檢查模式,除胸部X線檢查外,繼續個性化定制原本術前常規檢查的心電圖、血常規等一系列檢查內容。
但利用大數據和機器學習預測術前常規檢查風險程度的研究,在帶來改革眼科術前檢查模式新契機的同時,同樣存在一定掣肘,主要為以下幾個方面:1)真實世界樣本特征分布不均。以本研究為例,預測目標胸部X線檢查中高風險樣本數量明顯低于低風險樣本,白內障手術患者明顯多于眼底手術、角膜手術患者,這些特征的不均衡使機器學習算法模型在特定亞組人群中的應用效果可能不穩定;2)醫療機構和各專科之間數據壁壘的存在。受各單位數據存儲形式、標準的差異以及各方合作意愿的影響,真實世界大數據研究常常難以獲得理想的數據量和廣泛的數據來源,使算法模型應用范圍和魯棒性受到影響;3)高質量數據的稀缺。現實醫療環境中存在大量紙質書寫的病歷和護理文書,難以直接用于大數據研究。而數字化存儲的數據也有大量存在錄入過程紕漏和數據完整性問題,需要花費大量的人力物力進行數據的整合和清洗。隨著數字化醫療實踐和多中心大數據研究合作模式的成熟,這些問題都在逐步得到解決。相信在不遠的未來,大數據研究將為眼科術前檢查的精簡和個性化設計提供更大的助力。

圖2 研究流程圖Figure 2 Study design flowchart