葛小玲 尚于娟 徐 錦 曾 玫 王傳清 李 靜施 宇 王 一 胡子欣 徐 虹 張曉波
(1國家兒童醫學中心/復旦大學附屬兒科醫院統計和數據管理中心,2臨床檢驗中心,3感染傳染科,4院內感染控制與防保辦公室,7腎臟科,8呼吸科 上海 201102;5萬達信息股份有限公司數據中心 上海 201112;6 復旦大學生命科學學院 上海 200433)
流行性感冒(流感)是由甲、乙、丙等分型流感病毒導致的急性上呼吸道傳染病,其中甲型和乙型病毒具有高度傳染性,容易造成大范圍甚至世界性的大流行[1]。流行病學研究顯示,近年來兒童占全部流感確診患者的比例>60%[2],<2歲易發生嚴重并發癥[3],且臨床癥狀并不典型,極易與普通感冒或急性呼吸道感染相混淆,早診斷、早治療對降低兒童流感危害、控制疾病進程、防止并發癥具有重要意義。流感早期診斷途徑包括血常規、病毒核酸檢測、病毒抗原檢測等,通過鼻咽拭子檢測及血常規檢驗是臨床最快捷、常用的方法。多項研究顯示,甲、乙流患者血常規數值差異明顯[4]。
在大數據時代,通過醫療大數據+ 人工智能(artificial intelligence,AI)可應用于流感流行趨勢預測、疾病轉歸、輔助診斷等多個方面[5-7],所采用的研究數據包括但不局限于外源性天氣數據、互聯網搜索數據[5]、國家流感監測數據[8]和電子病歷記錄(electronic medical record,EMR)等。在疾病輔助診斷領域,結合大數據量級的EMR 記錄和其他相關信息學習后,算法可在很短的時間內完成復雜的分析任務,并根據輸入信息反饋出最佳的分類模式結果,輔助醫師提高患者診斷的準確性和效率。Sauthier 等[9]通過機器學習算法、隨機森林機器學習算法和Logistic 回歸,預測了258 名小兒重癥流感患者的長期急性低氧性呼吸衰竭,實現住院期間的早期確診;廣州婦兒醫院利用2016年到2017年7月的136萬例EMR 數據開發出用于兒科55 種疾病的AI診斷系統,其中在31萬余例原發性呼吸系統疾病中診斷流感的正確率達94%[10],但模型遷移性和臨床應用價值仍待研究?,F階段鮮有將AI 技術專項用于兒童流感輔助診斷的研究。
本研究以2013年1月—2020年6月在上海單中心門診就診的數百萬呼吸道感染性疾病患兒為研究對象,納入基本特征信息(包括年齡和性別、鼻咽拭子及血常規檢驗數據),建立專項鑒別甲流、乙流感染陽性的AI 輔助診斷模型,協助開展傳染病門診診前預診。
數據來源考慮到醫院門診新舊信息系統更迭及過去門診數據存在完整性不足的問題,本次分析從門診HIS/EMR 系統選取2013年1月—2020年6月間就診且具有血常規檢驗記錄的呼吸道感染疾病門診患兒為研究對象。
診斷標準以病原體膠乳檢測(鼻咽拭子)結果作為甲流、乙流感染病例組納入標準。甲流病例組:甲流陽性且乙流陰性;乙流病例組:乙流陽性且甲流陰性;對照組:病原體膠乳檢測陰性或未做該項檢測。

圖1 研究對象納入流程Fig 1 The inclusion process of research objects
統計學分析對計量資料,即連續性連續型變量資料,使用±s進行統計描述,兩組樣本間采用配對t檢驗確定差異;對計數資料,即結果表現為屬性特征的資料使用頻數分析,采用χ2檢驗確定差異,P<0.05 為差異有統計學意義;使用Python 軟件進行數據處理和統計分析。
模型構建本研究分別采用邏輯回歸(Logistics regression,LR)模型和梯度提升決策樹(gradient boosted decision tree,GBDT)模型兩種機器學習算法針對甲流病例組、乙流病例組進行調參、訓練和測試,構建輔助診斷模型。通過計算模型特征重要性,探索對疾病診斷具有重要價值的臨床指標。
模型算法
LR 模型 LR 是一種在疾病預測研究中十分常用的廣義線性回歸分類模型,通過輸入未知樣本的特征屬性,可計算出樣本屬于某一類別的概率[11]。
GBDT 模型 GBDT 是機器學習算法中對真實分布擬合得最好的算法之一,通過設定閾值,大于閾值為正例,反之為負例,適用于分類、回歸問題,并能夠篩選特征,是目前醫學診斷研究中最常用的模型之一[12-13],模型構建流程見圖2。

圖2 輔助診斷GBDT 模型構建流程圖Fig 2 Flow chart of auxiliary diagnostic GBDT model construction
數據處理數據集成:不同時期數據庫結構存在差異,采用門診號+日期模糊匹配。數據變換:將字符類型變量轉換為模型可以識別的數值變量。缺失值處理:分別采用均值填充法和眾數填充法來處理連續型變量和類別型變量缺失值。數據歸一化處理:為消除不同指標之間的量綱影響,采用最大值-最小值標準化方法,將原始指標縮放到0-1 區間內,使各指標處于同一數量級。
特征選擇基于門診患者血常規檢驗指標實現對疾病的輔助診斷,選擇檢測率較高的血常規指標作為模型特征。
樣本處理每一組模型病例組樣本和對照組取樣比例為1∶1。采用10 折交叉驗證法,使用9 個子集的并集作為訓練集,剩余1 個子集作為測試集,最終返回10 次測試結果的均值。
模型評價根據模型測試結果,采用精確率(查準率)、召回率(查全率)、F1 值、ROC 曲線、AUC值和模型概率預測箱型圖多種指標評估模型效果,以衡量模型的泛化能力,并對比兩種模型在分類性能上的差異。AUC 越接近1.0 真實性越高。
一般情況2013年1月—2020年6月期間5503350例門診常見呼吸道感染疾病患者中,做過血常規檢驗的共計3199113例,納入為本研究對象。其中做過病原體膠乳檢測(鼻咽拭子)的共303944例(9.5%),確診為流感陽性共計63101例,單甲流感染陽性38094例(60.37%),單乙流感染陽性24792例(39.29%),甲乙流合并感染陽性215例(0.34%)?;純耗挲g分布顯示,甲流病例組和乙流病例組平均年齡分別為4.59歲和5.73歲,乙流患兒年齡相對較大;患兒性別分布顯示,甲流病例組和乙流病例組男女性別比分別為1.22∶1 和1.19∶1,男童發病率高于女童。研究對象中未做過鼻咽拭子檢測病例2895169例(90.5%),鼻咽拭子檢測結果為陰性240843例,將兩者合并作為對照組(3136012例)。
模型特征選擇患兒性別、年齡和血常規檢驗完整率超過20% 的22 個指標(表1)作為模型訓練特征值。鑒于已有研究發現的中性粒細胞/淋巴細胞比值在不同分型流感患者中具有明顯差異[14-15],將其一同納入,共計25 個特征值。

表1 血常規各項指標檢測情況Tab 1 The detection of various indexes in blood routine test
模型結果在模型構建前,對病例組及對照組間納入的各類指標進行統計檢驗。除乙流病例組與對照組的嗜堿性粒細胞百分比之外,其他指標的差異均有統計學意義。甲流、乙流病例組的血小板、嗜酸性粒細胞百分比、淋巴細胞百分比、白細胞、C 反應蛋白、淋巴細胞絕對值、嗜酸性細胞計數顯著低于對照組,單核細胞百分比、中性粒細胞百分比、中性粒細胞/淋巴細胞比值顯著高于對照組(表2)。屬性類特征中,病例組男童比例明顯高于女童(表3)。

表2 甲流/乙流與對照組計量特征統計檢驗結果Tab 2 Statistical results of measurement data of Flu A/B and control group

表3 甲流/乙流與對照組屬性特征統計檢驗結果Tab 3 Statistical results of attributive characteristics of Flu A/B and control group (n)
對于二分類的模型,當計算兩組數據量一致時可達到較佳的分類效果,經數據處理,在模型構建時納入甲流病例組及對照組各38094例,乙流病例組及對照組各24792例,分別進行甲流及乙流輔助診斷模型的訓練和驗證。
模型性能比較利用查準率、查全率和F1 值等多種指標評估模型效果(表4)。從ROC 曲線和模型概率箱型圖(圖3~4)可看出,兩類算法均具有較好的性能,模型能夠比較準確地從呼吸道感染性疾病患者人群中檢測出甲流、乙流陽性,在實際應用場景中,模型可發揮輔助診斷的作用。 相比于Logistics 模型,GBDT 模型的分類性能更好(AUC=0.894,0.895,0.902),在鑒別乙流與非乙流陽性時性能最佳(AUC=0.902),已接近醫師診斷水平。

圖3 Logistics 模型(左)及GBDT 模型(右)模型ROC 曲線圖Fig 3 ROC curves of Logistics model(left)and GBDT model(right)

表4 模型結果Tab 4 The model results
模型特征重要性通過計算模型特征重要性得出區分陽性病例組及對照組的關鍵因素(圖5)。甲流輔助診斷GBDT 模型前5 個特征為年齡、單核細胞百分比、白細胞、淋巴細胞絕對值和C 反應蛋白;乙流輔助診斷模型GBDT 模型前5 個特征為年齡、單核細胞百分比、嗜酸性細胞計數、白細胞和血小板。

圖5 甲流、乙流GBDT 模型特征重要性排序Fig 5 Sequence of feature importance of GBDT model for Flu A and Flu B
流行性感冒具有季節性流行和周期性爆發的特點,兒童屬高危人群,其發病率及感染率最高。本次分析結果顯示,該單中心醫院歷年流感病例中,主要為甲型流感病例,乙流病例組患兒相對甲流病例組平均年齡更大。男性患兒約占比55%,發病率略高于女性,通過文獻檢索,證實與國內近年來多項調查結果基本一致[16-17]。本文采用兩種模型進行流感病例的輔助診斷實驗并比較模型結果,其中GBDT 模型在鑒別乙流與非乙流陽性時性能最佳,AUC 值高達0.902,已接近醫師診斷水平。LR模型因其形式簡單、可解釋性好在前期得到廣泛應用,但其在自動發現有效的特征并組合特征方面不及GBDT 模型。另外,相比于LR 模型,GBDT 模型利用患兒特征,通過對二分類問題的回答來得到陽性病例更符合臨床醫師的思維方式。

圖4 Logistics 模型(左)及GBDT 模型(右)模型概率箱型圖Fig 4 Model probability box diagram of Logistics model(left)and GBDT model(right)
經特征重要性計算,血小板、白細胞、C 反應蛋白、淋巴細胞絕對值、嗜酸性細胞計數、年齡、單核細胞百分比是本研究中可以判斷患兒是否感染甲流或乙流的重要特征,與對照組存在較為顯著的差異。這可能與不同病原體引起各類血細胞敏感反應不同,作為一種急性呼吸道傳染疾病,流感起病急、傳染性強,通過血常規可與一般細菌性感染進行區分。已有多項研究發現,白細胞計數、中性粒細胞百分比等指標在甲流及乙流患兒間比較差異均有統計學意義[2,18-19],甲流患兒白細胞計數及中性粒細胞升高更明顯[20]。此外,流感合并肺炎支原體感染患兒易發展為重癥病例,本研究中乙流病例組肺炎支原體陽性率(21.18%)高于甲流組(16.93%),與國內已有研究一致[21],提示我們在診斷之余須重點關注流感合并IgM 陽性、尤其是乙流患者后續轉化為重癥的可能性,其他呼吸道病原的臨床檢驗由于檢驗率未達到本研究納入標準而未被納入。本文的研究還存在一定的不足之處和局限性,感染性疾病在兒科發病率極高,感染原因包括但不限于各類細菌、病毒、真菌、支原體、衣原體、寄生蟲感染。此外,生理、藥物治療以及檢測相關因素也可能導致檢驗結果異常[22]。本研究未對照實驗室檢查結果對非流感病例感染原因進行具體區分,有待進一步完善和改進。應用血常規檢驗進行流感(甲流/乙流)的輔助診斷具有一定的可行性,然而后續在嘗試對兩者進行鑒別區分時模型表現一般,單純以這25 個特征來區分甲流和乙流人群仍具有一定難度,未來將結合甲、乙流患兒臨床病歷及住院數據進一步加強模型鑒別能力。
本文所研究的基于AI 的輔助診斷模型通過訓練大量呼吸道感染性疾病患者血常規特征數據,在實際應用場景中能較為準確地從呼吸道感染性疾病患者人群中檢測出“甲流感染陽性”及“乙流感染陽性”人群,且納入數據結構簡單,可在其他醫療中心部署應用,模型可遷移性高。該模型可幫助醫師判斷患者是否進行病原體膠乳鼻咽拭子檢測,協助開展傳染病診前預檢,縮短就診流程,減少院內交叉感染。
通過結合甲流、乙流患兒臨床病歷及住院數據,可進一步優化模型診斷能力,為臨床輔助診斷提供可靠的決策支持,并基于人機診斷結果對比開展隨機對照試驗,為模型診斷能力提供可循的依據。
作者貢獻聲明葛小玲 論文構思、撰寫和修訂。尚于娟 數據收集和保存,文獻調研,論文撰寫。徐錦,曾玫,王傳清 監督指導,數據解釋。李靜 提供分析工具。施宇 數據統計和建模。王一,胡子欣 研究咨詢,可行性分析。徐虹 獲取資助,研究設計,論文修訂。張曉波 研究設計,數據解釋,論文修訂。
利益沖突聲明所有作者均聲明不存在利益沖突。