錢軍 馬芮 曲妍 鄧少純 段瑤 左飛飛 王亞杰 毋育偉
1.北京大學口腔醫學院·口腔醫院第二門診部國家口腔疾病臨床醫學研究中心口腔數字化醫療技術和材料國家工程實驗室,北京 100020;2.首都醫科大學附屬北京康復醫院口腔科,北京 100144;3.北京朗視儀器股份有限公司,北京 100084
口腔臨床工作中常見的慢性根尖周炎在組織學上主要表現為炎癥細胞浸潤及牙槽骨破壞,在影像學上主要表現為根尖周出現透射影像。完善的臨床檢查及高分辨率的影像學檢查是其治療計劃的重要診斷工具,在根尖片、曲面體層全景片和錐形束計算機斷層掃描(cone-beam computed tomography,CBCT)上可檢測到慢性根尖周炎。由于根尖片的成本低及輻射劑量小的特點,目前在臨床中應用最廣泛。但與傳統的根尖片和全景片相比,CBCT不受拍攝區域牙槽骨及牙齒結構影像失真和疊加的影響,顯著增加了根管間、根尖病變及周圍解剖結構的三維可視化[1]。
Meta 分析指出,根尖片的靈敏度和特異性(0.70、0.78)明顯低于CBCT成像的靈敏度和特異性(0.95、0.88)[2]。近年來深度學習(deep learning)作為人工智能(artificial intelligence)的一個分支,在臨床許多醫學領域已經達到甚至超過臨床專家的水平[3]。卷積神經網絡(convolutional neural network)是其代表算法之一,它主要從圖像中抽象出高度復雜的特征,進而構建一個自動識別模式的神經網絡以進行自動判斷和分類[4]。在口腔醫學領域,卷積神經網絡通過X 線片主要應用于檢測齲齒病損部位、評估牙根形態及牙周骨質缺損等研究,但目前仍處于初級的階段[2]。本文旨在探討基于卷積神經網絡算法的計算機輔助診斷系統在CBCT 影像中檢測慢性根尖周炎的診斷應用。
收集北京大學口腔醫院第二門診部2017 年1月—2021 年12 月罹患單根牙慢性根尖周炎的CBCT影像,總計49例患者55個樣本。
納入標準:1)均采用HiRes3D 型CBCT 儀器(北京朗視儀器股份有限公司)拍攝;2)技師的拍攝操作經過統一培訓;3)設置相同的CBCT 拍攝參數:坐姿拍攝,100 kV,4 mA,360°旋轉,拍攝持續時間12 s。CBCT 設備可以提供多個視野,像素間距0.125 mm×0.125 mm×0.125 mm,分辨率為640 px×640 px×640 px;像素間距0.2 mm×0.2 mm×0.2 mm,分辨率為800 px×800 px×250 px;像素間距0.25 mm×0.25 mm×0.25 mm,分辨率為640 px×640 px×400 px,醫生可以根據具體情況選擇最佳掃描方式;4)單根單病變(含單根牙及多根牙的單根病變)。
排除標準:1)病變同時累及多根(單顆牙或多顆牙);2)病變累及周邊結構且無法區別病變界限,如:根分叉區、牙槽嵴頂、大面積骨皮質破壞、其他鄰近解剖結構(上頜竇、下頜神經管、鼻腭管、頦孔);3)圖像質量不佳或偽影過大(含金屬偽影運動偽影或軟組織對比度差)。
1.2.1 學習樣本的手動逐層分割 從49 例CBCT 原始數據中隨機抽取6個根尖病變,慢性根尖周炎的CBCT 數據以DICOM 格式導出,圖像由4 名主治醫生先后2 次(間隔2 周)記錄頜骨病變的位置并對于慢性根尖周炎病變區域進行識別同時使用Ma‐terialize Mimics Medical 軟件進行手動逐層分割(圖1)。在Statistical Package for Social Science 軟件(SPSS V16,SPSS 公司,美國)用組內相關系數(intraclass correlation coefficiets,ICC)評估重復測量和測量者之間的一致性。
1.2.2 數據預處理 1)為了提高網絡性能,加快訓練速度,原始DICOM 數據需要進行預處理后再用于訓練。使用的預處理包括數據歸一化,數據增強(旋轉、平移、添加噪聲) 等。2) 按照80%、10%、10%將數據分為訓練集、驗證集和測試集,49 例患者CBCT 數據作為訓練集,測試集和驗證集各5例CBCT數據。
1.2.3 使用3D U-Net網絡識別根尖病變 網絡的總體結構如圖2 所示,似U 型的網絡由編碼器(en‐coder)和解碼器(decoder)組成。U 型左側為編碼器,編碼器由3 個模塊組成,每個模塊經由2 個卷積層和1個池化層組成;每次卷積使用1個3×3×3 的卷積核,并且每次卷積之后經過1 個ReLU 激活函數。U 型右側為解碼器,同樣是由3 個模塊組成;每個模塊先做1 次反向卷積,得到1 個高分辨率的特征圖,再將高分辨率的特征圖與左側編碼器部分對應的低分辨率的特征圖結合;之后使用3×3×3 的卷積核做2 次卷積;最后一層的卷積是用1 個1×1×1 的卷積核實現的。除此之外,為了更好地訓練網絡并提升網絡性能,使用深監督(deep supervision)的技術在網絡右側的隱藏層中增加了一個輔助分類器,這些輔助分類器作為網絡的分支對主網絡進行監督。使用Dice Loss+Cross Entro‐py Loss 作為損失函數,結合EarlyStop 和可調節學習率對網絡進行訓練。
1.3.1 觀察者一致性檢驗 ICC 用于評估檢查者之間的一致性和可靠性,隨機選取6例樣本以確定觀察者的一致性,觀察者內部一致性由同一研究者在第一輪觀察后2周進行重復分割計算。
1.3.2 人工智能分割效果的評估 使用交聯比(in‐tersection over union,IOU)、Dice 系數(Dice)和像素精確度(pixel accuracy,PA)3 個指標對網絡進行評估。
其中:Ground 是臨床專家標注的病變金標準區域;Predict為人工智能預測病變區域。IOU即為真實病變區域與預測病變區域之間的重合程度,IOU值越高代表重合程度越高;IOU值越低代表重合程度越低。
其中:Ground 是臨床專家標注的病變金標準區域;Predict為病變人工智能預測病變區域。Dice的取值范圍為[0,1],Dice 越接近1,病變人工智能預測病變區域的結果與臨床專家標注的病變金標準區域就愈加重合。
其中:TP(true positive)代表預測值為1,真實值為1 的部分;TN(true negative)代表預測值為0,真實值為0的部分;FP(false positive)代表預測值為1,真實值為0 的部分;FN(false nega‐tive)表預測值為0,真實值為1 的部分。PA 指的是人工智能預測病變正確的像素占圖像總像素的比例,該比值越接近1,說明網絡預測的準確性越高。
測量者之間一致性的ICC 值為0.994(95%CI:0.986~0.998),測量者1 的自身重復測量的ICC 值為0.999(95%CI:0.990~1.000),測量者2 的重復測量ICC 值為0.995(95%CI:0.968~0.999),測量者3的重復測量ICC值為1(95%CI:1.000~1.000),測量者4的重復測量ICC值為0.999(95%CI:0.995~1.000)。
本研究中測量者的一致性檢驗ICC 相關系數值均>0.9,這些數值提示4 名醫生的重復測量結果的差異無統計學意義。
神經網絡在測試集的結果如下:IOU為92.18%,PA為99.27%,Dice為95.93%。
神經網絡在236輪迭代后停止,網絡訓練集和驗證集的各指標都高于90%;并且訓練集和驗證集各指標提升趨勢相似,均在前100 輪快速提升,之后趨于平穩(圖3~6)。
隨著深度學習和神經網絡的應用,人工智能在醫學領域中的應用正加速發展,而在口腔醫學中的多個領域都有一定的研究應用,例如使用人工智能自動分類影像數據中的牙齒類型[5],分類計數下頜第一磨牙遠中的根數目[6],利用深度卷積神經網絡識別影像中的鄰面齲壞[7],檢測曲面體層片中的牙周骨質的缺損[8],利用人工智能檢測CBCT中的根折[9]等。利用卷積神經網絡檢測成釉細胞瘤和牙源性角化囊腫,其一大特點是較臨床醫師的人工鑒別來說能節省更多時間[10]。對于那些系統病在口腔中的表現,也可用人工智能進行檢測,包括骨質疏松癥[11]和上頜竇炎[12]等。Ekert 等[13]使用卷積神經網絡檢測了曲面體層中的根尖周病損,其系統具有檢測出根尖周病損的能力,但其敏感性仍有待提高。
一般深度學習網絡需要大量數以千計的標記數據用于訓練,而U-NET 可更高效地利用已有的標記數據進行自動分割和學習[14],這與本研究結果相一致。本研究選取了49 例患者的55 個數據,人工智能深度學習算法的U-NET 可以較好地檢測出慢性根尖周炎根尖區病變,網絡在測試集的IOU為92.18%,Dice為95.93%,PA為99.27%,這些指標表示網絡在測試集性能較優,明顯優于利用深度學習算法監測CBCT中根尖周低密度影的研究[15],其Dice為52%(其靈敏度為0.93,特異性為0.88)。人工智能在影像診斷中的誤差較小,與其深度學習算法關系密切。深度學習算法的病變識別能力強于一般算法[16-17],其可以識別更加豐富的圖像特征,包括人眼可識別的密度、形狀、紋理等特征以及肉眼無法感知的一些圖像特征[16-17],因此深度學習對CBCT 影像的解讀具有一定的可靠性,基于本研究深度學習方法的人工智能系統,為下一步檢測CBCT圖像中的慢性根尖周炎奠定了基礎。本文在收集數據集時納入了不同視野及層厚的CBCT影像,更加符合數據在樣本空間的分布情況,有利于增強算法的泛化能力,為今后算法應用于實際環境中提供依據,但同時不同視野及層厚的CBCT影像也增加了網絡的學習難度,降低了分割的精度,為進一步提高人工智能算法學習效果,將在后續的研究中增大樣本量。
CBCT影像可以在三維方向上觀測慢性根尖周炎的病損大小,對病損實際范圍及毗鄰結構的識別更加清晰準確,這較根尖片以及曲面體層全景片具有明顯優勢,目前的CBCT成像技術尚存在一些局限性,比如:1)影像中高密度結構會因射線散射產生偽影(如根充物,高密度充填物,修復體或鄰牙種植體);2)軟組織顯像對比度差,因而對部分病例來說,尤其是慢性根尖周炎累及骨皮質,存在無法區別病變界限的情況時,圖像分割可能存在誤差。由于以上原因,CBCT對于部分病例的應用尚存在局限性。
同時在本研究的過程中發現,人工智能在識別根尖周低密度影時,受到一些因素的影響,譬如慢性根尖周炎病變累及骨皮質骨缺損范圍較大而無法區別病變界限時,頰舌側骨板不完整會影響人工智能識別軟組織與骨的邊界,牙周牙髓聯合病變表現的牙槽骨吸收與慢性根尖周炎形成的低密度影,鄰近根尖病變的正常低密度影像結構(如切牙管、頦孔、下頜管、上頜竇等),累及多顆牙的大范圍病變,有根充物的牙根,牙中牙、未閉合的根尖孔等。同時,為了增加人工智能的準確性,本研究還需增加樣本量、合并解剖知識于人工智能的深度學習設計中。
利益沖突聲明:作者聲明本文無利益沖突。