王 巖,霍愛華,王大為,沈 云,彭 蕓,3*
(1.國家兒童醫學中心 首都醫科大學附屬北京兒童醫院影像中心,北京 100045;2.推想醫療科技股份有限公司,北京 100025;3.北京航空航天大學&首都醫科大學北京大數據精準醫療高精尖創新中心,北京 100083)
骨齡是骨骼發育的年齡,能較時間年齡更準確地反映人體發育成熟程度,廣泛應用于臨床醫學、法醫學和體育醫學等領域。骨齡測評(bone age assessment, BAA)是臨床確定兒童骨骼成熟度的常用方法[1],用于診斷兒童內分泌、遺傳和生長障礙等疾病,也可用于預測健康兒童的成年身高等[2]。國內外已有多種骨齡評價標準,我國目前采用中華-05骨齡評定標準[3],該標準經過多年研究論證得到眾多專家認可和推薦。既往測評骨齡需由兒科放射醫師人工閱讀手腕骨X線片并計算評分而實現,工作量大、耗時,且易受主觀因素影響。近年來,人工智能(artificial intelligence, AI)BAA系統研究[4-7]日漸增多,但多側重于概念驗證。本研究觀察在臨床環境中BAA系統的效能及其對低年資兒科放射醫師的輔助作用。
1.1 一般資料 選擇2019年1月在首都醫科大學附屬北京兒童醫院接受BAA的兒童作為研究對象,排除存在生長發育異常、內分泌疾病及骨折等影響觀察因素者,收集5~12歲兒童手腕骨X線正位片,每個年齡組各10名,男、女各5名,不區分左右手。
1.2 BAA手正位X線片 采用柯達、GE或 Philips CR或DR機攝左手或右手正位片。攝片時掌面向下,緊貼暗盒,中指軸與前臂軸成直線,五指自然分開,拇指與手掌面呈約30°角,球管中心正對第3掌骨頭,管片距為70~90 cm。
1.3 BAA系統 采用推想醫療科技股份有限公司BAA系統,分別用于獨立性能測試和輔助低年資兒科放射醫師閱片。
1.4 標準 BAA系統和閱片醫師均采用中華-05法中的TW3-RUS標準針對掌指骨測評骨齡。由1名具有10年經驗的高年資兒科放射醫師(副主任醫師)借助BAA系統(不限制測評時間)建立參考骨齡(金標準)。將1名具有4年測評骨齡經驗的兒科醫師的閱片結果、BAA系統測評結果與金標準進行對比,評價結果的準確性和一致性。
1.5 閱片試驗 低年資兒科放射醫師首先獨立測評骨齡,記錄測評所需時間;同一醫師間隔4周(洗脫期)在BAA系統輔助下再次閱片,記錄測評時間。與金標準對比,評價BAA系統對低年資兒科放射醫師的輔助作用。
1.6 統計學分析 采用SPSS 19.0統計分析軟件。以Pearson相關分析評價測評骨齡與參考骨齡之間的相關性,以Bland-Altman分析觀察測評骨齡與參考骨齡的一致性。采用均方根誤差(root mean square error, RMSE)和平均絕對誤差(mean absolute error, MAE)評價BAA準確度。P<0.05為差異有統計學意義。
2.1 BAA系統臨床效能 BAA系統預測結果和參考骨齡顯著相關[r=0.969,95%CI(0.953,0.979),P<0.01],見圖1。Bland-Altman一致性分析顯示二者平均差異為0.22歲[95%一致性界限為(-0.921,1.359)],見圖2。BAA系統RMSE和MAE分別為0.62歲和0.47歲。

圖1 預測骨齡與參考骨齡的相關性 圖2 預測骨齡與參考骨齡的Bland-Altman一致性
按年齡分組,BAA系統預測骨齡與參考骨齡在各年齡組中均顯著相關(P均<0.05),見表1,尤以5~10歲年齡段為著。各年齡組中BAA系統預測骨齡RMSE和MAE結果見表2。

表1 不同年齡組BAA系統預測骨齡與參考骨齡的相關性分析

表2 不同年齡組BAA系統預測骨齡的RMSE和MAE(歲)
按性別分組,男性組和女性組BAA系統預測骨齡與參考骨齡均顯著相關(r男=0.967、r女=0.970,P均<0.05),見圖3。Bland-Altman一致性分析顯示,女性組BAA系統預測骨齡與參考骨齡平均差異為0.28歲[95%一致性界限為(-0.80,1.36)],男性組為0.16歲,[95%一致性界限為(-1.06,1.36)]。結合BAA系統預測骨齡,男性組RMSE和MAE分別為0.63歲和0.47歲,女性組分別為0.61歲和0.48歲。

圖3 BAA系統預測不同性別兒童骨齡與參考骨齡的相關性 圖4 醫師獨立閱片與AI系統輔助醫師閱片預測骨齡與參考骨齡間的相關性分析
2.2 BAA系統的輔助作用 BAA系統輔助醫師閱片預測結果與參考骨齡顯著相關[r獨立=0.968,95%CI(0.947, 0.981),P<0.05;r輔助=0.988, 95%CI(0.981, 0.993),P<0.05],見圖4。Bland-Altman一致性分析顯示,醫師獨立閱片預測骨齡與參考骨齡平均差異為-0.52歲[95%一致性界限(-1.98,0.94)];BAA系統輔助下,平均差異減小至-0.11歲[95%一致性界限為(-0.82,0.60)]。醫師獨立閱片預測結果RMSE和MAE分別是0.71歲和0.9歲,而BAA系統輔助醫師閱片RMSE和MAE分別減少至0.27歲和0.38歲。
BAA系統輔助下,平均測評時間由醫師獨立閱片的4 min 40 s縮短至2 min 15 s。
測定骨齡是目前臨床衡量個體生長水平較為準確的方法之一[8],常用于評價兒童和青少年實際年齡,診斷兒童內分泌和生長紊亂等疾病以及監測生長發育異常的治療情況等[9]。較為常用的測定骨齡方法主要有圖譜法和計分法,均以骨發育成熟度指征為基礎,前者快速、簡單,但組內、組間結果差異較大,準確性較差;后者準確性較好,但測評所需時間較長,臨床應用受到一定限制[10-11]。結合不同臨床場景,現已開發出多種測定骨齡的AI模型,但均需要進行相應臨床驗證和評估[12]。本研究在臨床環境下驗證商品化AI測評骨齡模型的應用效能和輔助作用。
本研究所用BAA系統基于中華-05計分法,采用深度學習算法,經數萬例訓練而成,通過自動精準定位和形態分析評價橈骨、掌骨及指骨共13塊骨骼的發育程度,實現快速、準確測評骨齡,與參考骨齡之間的一致性較高,且其預測骨齡與參考骨齡間平均誤差僅為0.47歲,優于許多其他深度學習模型BAA測試集結果(0.6歲、0.75歲)[13-14]。進一步分析各年齡組數據,發現該系統識別測評掌指骨骨骺發育形態較為準確,尤以5~10歲年齡段為著,預測骨齡與參考骨齡一致性較高;11/12歲年齡組預測骨齡一致性差異稍大,可能與其骨骺較成熟且所代表的分值間差異較大有關。無論對于男性還是女性兒童,該系統預測骨齡與參考骨齡均有較高的準確性和一致性,與LEE等[6]的結果類似,可在一定程度上保證其臨床應用的穩定性。采用該系統輔助醫師,尤其是低年資兒科放射醫師閱片,可顯著提升測評骨齡的準確性和一致性[15]。
本研究存在一定局限性,可能會使結果出現偏倚:納入樣本量有限;參考骨齡及實驗測評數據均僅來源于1名醫師,設計略顯單薄,也會對測評結果產生影響;僅利用本院數據進行臨床驗證,存在局限性。
總之,基于深度學習的BAA系統用于評價不同年齡、不同性別兒童掌指骨骨骺發育情況及骨齡評估具有良好準確性和一致性,可輔助低年資兒科放射醫師測評骨齡,提高臨床工作效率。