王定君 陳曉榮 應明亮 黃朝暉 李魯 王向明 曹登攀 高源統 潘江峰 舒錦爾* 馬志超 劉柏韻
322100浙江省東陽市人民醫院(黃朝暉)
322000浙江省義烏市中心醫院(王向明)
321300浙江省永康市第一人民醫院(曹登攀)
325200浙江省瑞安市人民醫院(高源統)100025北京推想科技有限公司(馬志超 劉柏韻)
新型冠狀病毒肺炎(Corona Virus Disease 2019,COVID-19)在各國的死亡率存在巨大差異,與各國對于COVID-19的早期防控和病程管理具有重要相關性。胸部CT影像具備高效快速、可獲得性高的特點,在COVID-19的早期發現和病程監測中具有重要價值,對有癥狀的疑似患者進行篩查的陽性率達97%,有效彌補了由RT-PCR檢測引起的假陰性高的缺點[1]。CT的影像學表現還可為COVID-19的疾病進展評估提供了重要參考,包括病灶的大小,位置和密度等信息[2-3],但多以定性的影像學表現分析為主,存在較大的主觀診斷差異。而人工智能技術可實現對CT影像上可疑感染病變的快速定位和定量分析,在新冠肺炎的早期篩查、鑒別診斷、預后評估等多個方面體現出巨大的優勢和潛力[4-5]。本研究擬應用人工智能技術進行病灶的自動分割,并交互式地進行結果校對,分析不同臨床分型組的CT影像定量結果,比較不同組別之間的臨床和影像學表現差異,為新冠肺炎的早期診斷、病程監測及嚴重程度評估提供快速、精準的臨床工具。
1.1 一般資料 多中心回顧性分析2020年1月至2020年3月浙江省(非疫區中心)5家醫院的確診COVID-19患者(金華中心醫院(16例)、義烏市中心醫院(17例)、永康市第一人民醫院(5例)、瑞安市人民醫院(30例)以及東陽市人民醫院(13例)。(1)納入標準:①兩次COVID-19核酸檢測(RT-PCR方法)為陽性者;②胸部CT圖像為發病以來首次檢查;③分析圖像為肺窗圖像;④實驗室檢查、臨床表現、臨床分型等資料完整者。(2)排除標準:①非COVID-19確診患者;② COVID-19復查患者;③胸部CT圖像質量不佳,模型分割結果過小或者不符合圖像分析要求;④無法對CT影像拍攝時的臨床分型進行判斷的患者。共納入COVID-19患者81例,其中男47例(58.0%),女34例(42.0%);平均年齡(43.0±16.8)歲。根據新型冠狀病毒感染的肺炎診療方案(試行第七版),并基于COVID-19患者的臨床癥狀和影像學表現,將其分為輕型、普通型和重型,診斷結果由1名具有十年以上胸部CT診斷經驗的放射科醫生和1名呼吸科臨床醫生共同確認。記錄所有患者首次入院的臨床癥狀(發熱、咳嗽、肌肉酸痛),實驗室檢查指標(白細胞計數、淋巴細胞計數及中性粒細胞計數),發病至進行CT檢查的時間和CT檢查至PCR檢測的時間間隔。
1.2 CT檢查設備及層厚分布 由于多中心數據收集,入組的81例患者中,使用中國聯影uCT550 4例(4.9%)、美國GE Optima CT540 21例(25.9%)、德國Siemens SOMATOM Emotion 16 43例(53.1%)及飛利浦Pilips16 Lightspeed CT 掃描儀21例(25.9%)。CT影像重建后的層厚分布為1~5 mm。所有患者均采用仰臥位,頭先進,屏氣方式進行掃描,掃描范圍為肺尖至肺底。
1.3 CT影像定量分析 將所有脫敏后的CT影像數據導入推想科技肺炎特別版AI系統(北京推想科技有限公司,https://www.infervision.com/)進行肺部感染區域的自動分割。該系統基于遷移學習技術和精確標記的肺炎數據訓練的深度學習模型,能夠自動識別并定位肺炎病灶。前期在5303張內部測試集上,此模型達到了DICE系數為0.8481的分割準確率[3,7]。然后由兩名分別具有20及21年心胸疾病診斷經驗的放射科醫師對分割后的病灶范圍進行補充修正,意見不一致時經兩者協商達成一致。所有修正后的工作在InferScholar AI科研平臺(北京推想科技有限公司)上完成。基于人工校正后病灶分割區域(見圖1)進行以下定量參數計算:(1)受累肺葉數:包括右肺(上葉、中葉、下葉)、左肺(上葉、下葉),總數為5;(2)肺炎病灶體積占比(%),整肺及各肺葉肺段;(3)感染病灶密度分布(%)。

圖1 深度學習分割模型對于人工修正后的對新冠CT圖像上ROI勾畫結果
1.4 統計學方法 采用SPSS 24.0 統計軟件。計量資料符合正態分布以(±s)表示,采用單因素方差分析;不符合正態分布以[M(IQR)]表示,采用Kruskal-Wallis 秩和檢驗或Mann-Whitney檢驗。計數資料以[n(%)]表示,采用χ2或Fisher確切概率法。以P<0.05 為差異有統計學意義。
2.1 三種臨床分型COVID-19患者的臨床表現及實驗室檢查比較 臨床分型,輕型29例、普通型44例和重型8例。三組患者的年齡比較,差異有統計學意義(F=4.25,P=0.018)。其中,輕型患者的平均年齡顯著小于普通型(P=0.022)。輕型、普通型和重型患者出現發熱(>38℃)癥狀的比例比較,差異有統計學意義(P=0.038)。實驗室檢查,輕型和普通型的中粒細胞計數,均表現為正常或降低,而重型患者的中粒細胞計數顯著升高(P=0.042)。見表1。

表1 不同臨床分型COVID-19患者的臨床特征
2.2 三種臨床分型COVID-19患者的CT量化參數分析 通過AI分割+醫生修正,81例COVID-19患者的感染肺葉計數的中位數及四分位間距為3(3)。其中,重型和普通型COVID-19患者感染肺葉的計數明顯多于輕型患者(P<0.001)。81例肺炎病灶占整肺體積的百分比的中位數及四分位間距為1.14%(2.99%)。其中,輕型COVID-19患者的肺炎病灶占比明顯小于普通型和重型(P<0.001),而普通型和重型組之間無統計學差異(P>0.05)。三種臨床分型COVID-19患者的肺炎病灶在右肺上、中、下葉以及左肺上、下葉的感染分布比較,差異均有統計學意義(P<0.001)。81例新冠肺炎患者中,肺炎病變的最大占比表現在-370~-270 HU的CT值區間,而重型在不同的CT區間內的肺內受累占比最大。見表2。

表2 不同臨床分型COVID-19患者的CT量化信息參數
臨床表現方面,研究結果表明三組COVID-19患者的年齡差異存在統計學意義,其中輕型患者的平均年齡顯著小于普通型。相較于中老年人群,這些輕型患者可能不存在較多的基礎疾病,自身的免疫能力使其不容易受到病毒的侵害。三組患者發熱(>38℃)比例存在顯著性差異,其中重型患者全部表現出發熱癥狀。實驗室檢查指標顯示,中性粒細胞計數在不同分型之間有明顯差異,其中重型患者的中粒細胞計數出現升高,可能是合并了細菌感染所導致。白細胞計數和淋巴細胞計數均正常或表現為不同程度的降低,三組間無明顯統計學差異。
CT影像分析,基于人工精準校正的深度學習分割肺炎病灶,發現輕型COVID-19患者的感染肺葉計數、感染病灶分布及感染病灶密度均明顯小于普通型及重型患者,為患者臨床分型提供科學依據。前期研究已表明,COVID-19患者呈現典型的CT影像肺炎病灶征象,包括磨玻璃密度影、肺實變、纖維化等[8]。隨著病程進展,各個征象呈現不同程度的變化,并在最初病發癥狀后約10天達到峰值[5]。早期COVID-19患者表現雙肺多發斑片狀磨玻璃樣密度病灶,密度較低且同質[2],隨著病情加重病灶呈現進行性增長和擴大趨勢,密度增大或出現“瘋狂鋪路”模式。前期有研究利用半定量方法人工評估肺內受累程度,然而這種方法不夠精確,且不利于進行全病程評估和管理。啟動成熟的AI應用軟件可以提供整個肺和每個肺葉以及代表類型病變的不同CT值的定量體積和百分比。這樣的量化信息對于COVID-19胸部病變的全病程跟蹤分析與病情轉歸預測有重要參考價值。值得一提的是,自動化AI分割模型存在假陽性高的缺點,本研究增加人工校正這一步驟,通過手動去除假陽病灶并修正分割不精準的病變區域(圖1所示),提高病變分割的準確率。通過比較分析CT影像量化參數,結果發現輕、普通、重型COVID-19的感染肺葉計數、肺炎病灶占整肺及各肺葉肺段的比例、[-570,60 HU] CT值區間肺炎病變占比均呈現遞增趨勢,即感染病灶密度存在明顯差異,可輔助COVID-19的臨床診斷及分型。
本研究存在一定局限性,由于是多中心數據收集,各中心收集的初診患者存在基線差異,且不同設備和掃描參數影像的非標準化的影像質量在一定程度上影像模型的分割效果。經過深度學習分割模型分析的量化參數非正態分布且分布不均一,為保證統計分析顯著性差異的準確性需要增加樣本量。