吳 玥,嚴 斌
Stomatology,2022,42(1):29-35
機器學習是人工智能的一個分支,近30多年來已發展為一門多領域交叉學科,主要研究使用以往的數據或經驗,分析和設計一些讓計算機可以自動“學習”的算法。此類算法可以從數據中自動分析獲得規律,并利用規律對未知數據進行預測。機器學習根據不同的側重點有多種分類方法。最常使用基于學習方式的分類,即將機器學習分為監督學習、無監督學習和強化學習[1]。監督學習和無監督學習都是從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。訓練集要求包括輸入和輸出,即特征和目標。監督學習要求訓練集中的目標是由人標注的。常見的監督學習算法包括回歸分析和統計分類。無監督學習的訓練集沒有人為標注的目標,常見的算法有人工神經網絡和聚類分析。強化學習是指機器為了達成目標,隨著環境的變動,而逐步調整其行為,并評估每一個行動之后所得到的回饋是正向或負向的[2]。圖1展示了人工智能、機器學習及深度學習的關系。

圖1 人工智能、機器學習與深度學習關系
作為大數據時代的主力軍,機器學習使得醫學、工程學、金融學、計算生物學等領域產生了重大變革。同樣,機器學習在口腔醫學中也得到初步應用,如智能預測齲病的發生[3]、頜面外科模擬手術方案中下頜骨的自動分割等[4]。機器學習算法的進步也在口腔正畸學相關的臨床和科研實踐中呈現出先進的成果。目前在自動顱頜面影像分析中應用最為廣泛,與此同時,其在輔助正畸診斷和治療方面也有較好的表現。以往正畸醫師通過收集的診斷信息進行主觀判斷并制定實施治療計劃,而由于醫師經驗的不同,診療過程存在很大的差異和不確定性。機器學習有助于推進正畸診療精準化,縮小醫師間的經驗差異,有利于實現醫療水平的同質化。
本文擬從顱頜面影像處理和分析、正畸診斷和治療、臨床研究支撐三個方面來介紹機器學習在口腔正畸學領域中的應用現狀,并展望其未來趨勢。
機器學習已在醫學圖像處理等領域發揮重要作用,其相關方法被廣泛應用于計算機視覺中。計算機視覺是使用計算機及相關設備對生物視覺的一種模擬,在顱頜面影像處理和分析中已得到較多應用。
錐形束CT(cone beam computed tomography,CBCT)已常規用于顱頜面畸形患者的診斷和治療。對定量評估各種畸形來說,將顱頜面骨骼的CBCT影像進行精準的分割以構建精確的三維骨骼模型是非常必要的。近年來隨機森林算法及其變種形式通過決策樹模型從采集的圖像特征和訓練樣本中學習,在多種圖像分割任務中表現優異[5]。Wang等[6]開發了先導序列隨機森林算法對CBCT圖像進行顱頜面結構自動分割。其采用初始分割概率圖作為后續分割模型訓練的前期指導,對從CBCT中及初始概率圖中提取的特征進行一系列隨機森林的連續訓練,將所得分割結果與手動標記的金標準比較,表明此方法具有優越的性能。還有學者采用卷積神經網絡(convolutional neural networks, CNN)對CBCT圖像進行分割。如Wang等[7]訓練和驗證了一種混合尺度密集(mixed-scale dense,MS-D)CNN,實現了頜骨、牙齒和背景的多類別分割。Chung等[8]對單個牙齒進行了分割。Chen等[9]介紹了另一種多源集成框架(learning-based multi-source integration framework for segmentation, LINKS)的機器學習算法,在上頜骨的自動分割上取得了較好的結果。
頭顱側位片中標志點檢測是定義顱頜面部軟硬組織畸形分類的基礎。基于解剖標志點的測量項目值為正畸醫師確定最佳矯治計劃提供了重要信息。傳統手工頭影測量中存在的問題在于其耗費時間較長,同時標志點定位可重復性欠佳,因而可能導致顱頜面畸形問題的診斷出現偏差,從而影響治療計劃的制定。為此,21世紀初本課題組開始研究應用仿射變換基于模板匹配的頭顱側位片標志點自動識別方法,可以較好地識別常用標志點,但在精確度上仍需進一步改進[10-11]。其后,在基于經典機器學習的方法中,隨機森林算法表現較好。Lindner等[12]使用隨機森林回歸算法在2 mm范圍內的成功檢測率(successful detection rate in the range of 2-mm,2-mm SDR)上達到了84.7%的精確度。近年來,不同學者使用計算機視覺的新方法對此進行了研究,其中深度學習模型通常比經典機器學習技術識別準確度更佳[13]。但在實際運用中仍然存在兩個主要的挑戰,一是同一標志點的局部外觀形態在不同的患者中可能大相徑庭,另一在于牙齒充填物、義齒等金屬修復體產生掃描偽影給圖像識別造成了干擾,這都對于頭影測量自動定點提出了更高的要求。
頜面部缺損部位的重建修復手術能否成功在很大程度上取決于準確的手術規劃[14]。在傳統的臨床實踐中,患者需要在手術前接受CBCT掃描,應用模擬手術軟件從中提取三維骨骼模型,在數字模型上切取骨塊至需要區域來模擬手術,并計算出其正確的三維位置。Xia等[15]針對骨塊較難準確定位問題提出了3D計算機輔助手術模擬系統,通過三維分析來評估頜面部畸形,較傳統基于二維的方法提高了手術規劃的性能。近年來,為了更好地量化和恢復患者的特異性缺陷,Xiao等[16]提出可以從已有大量頜面缺損患者創傷前的面部照片來預測其個性化的參考骨骼形狀。該研究使用了稀疏表示和字典學習的方法,將基于患者創傷前的2D面部照片重建的3D面部表面數據輸入事先以正常受試者面部和骨骼構建的相關模型,從而為該患者生成正常的骨骼形態模型,并通過與患者當前面部骨骼匹配對結果進一步優化改進。與傳統方法相比,此方法可以處理更多種類型的頜面缺損,可用于指導手術規劃并改善臨床的手術效果,具有可觀的應用前景。除了顱頜面缺損中的應用,Liu等[17]針對腺樣體肥大的問題也使用機器學習方法進行三維結構的預測研究,其使用深度學習模型VGG-Lite,在頭顱側位片上自動評估腺樣體肥大程度,提高了評估準確性和速度。
在正畸檢查中,醫師常通過面部照片、頭顱側位片、計算機斷層掃描影像等來對患者的頜面形態進行評估,并做出相應的診斷和適當的治療。傳統上,與面部評估相關的參數包括大小和形狀,并可根據測量參數將面部形態分類,如直、凸、凹面型。此種方法簡單方便,但難以表達與人面部有關的復雜整體信息。Tanikawa 等[18]開發了一個自動表型系統來進行面部輪廓識別和分類,該系統使用模式匹配算法,包含整體面部輪廓,特別是唇部和鼻部形態。其研究表明,結合人類專家知識經驗的特征提取在創建面部輪廓模式方面更為有效。深度卷積神經網絡模型在面部識別上也具有較好的應用。例如使用深度學習算法的面部識別程序軟件(Face2Gene),其可以進行面部表型識別并提供基因診斷。在面部畸形識別上,Murata等[19]提出端到端深度學習方法來診斷各類面部畸形,并達到62.9%準確率;Takeda等[20]提出了一個基于深度學習的CNN算法系統,支持自動分析下頜偏差和檢測面部不對稱。這些智能系統可以通過識別面部特征自動化提供客觀的面部形態評估,大大減少了醫師的評估工作量和診斷過程中的差異。盡管如此,在面部識別機器學習實際運用中,仍需解決數據集圖像有限、數據集及標注質量控制等相關問題。
對于生長發育期的患者來說,骨齡的評估是影響正畸治療方案和預后的重要因素。頸椎成熟度(cervical vertebral maturation, CVM)可在頭顱側位片上進行評估,是判斷患者骨骼年齡和成熟度的常用方法。機器學習算法受主觀因素影響較小,現已有研究用于檢測頭顱側位片上的頸椎骨齡分期。Amasya等[21]標記了一組特定的頸椎標志點,從標志點彼此的關系中提取特征并訓練模型,此方法的缺點在于需要人工定點測量,而這需要耗費時間且后續結果依賴于初始手動定位標志點的準確度。Makaremi等[22]利用CNN等對圖像進行預處理,并針對不同的CVM分期進行分類,取得了較高的準確度,具有一定的臨床應用價值。K?k等[23]利用人工神經網絡來確定頸椎的生長發育時期和性別,并評估了手腕骨齡、CVM和年齡之間的相關性,表明神經網絡技術可以較好地完成相關工作。本課題組[24]基于多階段模型采用邏輯回歸算法也對頸椎骨齡進行了智能定量評估,整體模型受試者工作特征曲線下面積(AUC)為 0.91,并在優化后達到0.94,顯示了較好的臨床應用潛力。圖2列出了其流程。

圖2 頸椎骨齡智能評估流程圖
錯牙合畸形診斷和治療計劃制定是正畸過程中最基本、最重要的環節之一,醫師需要通過綜合運用知識和經驗來以盡可能低的風險獲得最佳的治療效果。機器學習能幫助醫師更全面地收集信息、減少主觀性誤差,實現更好的正畸診斷和治療。
確定診斷和規劃治療計劃的基礎是患者信息的收集,包括收集患者信息、整理問題清單、制定治療策略等。最早有學者采用專家系統[25]的方法應用于正畸診斷和治療規劃,但存在知識的選擇即特征提取困難的瓶頸。近年來有學者使用人工神經網絡來預測正畸治療計劃,即使用計算機技術來分析、理解和處理自然語言(人類交流使用的語言)。如El-Dawlatly等[26]建立了計算機決策支持系統來制定深覆牙合患者的治療計劃。該程序的輸入值和影響因素主要包括臨床常用的深覆牙合診斷信息,醫師與計算機之間用自然語言進行有效通信,輸出程序為深覆牙合的治療計劃選項,并通過與患者的實際治療變化進行比較,評估了由該算法做出決定的準確性,結果表明建立的決策支持系統是一種有效的工具,可用于制定恒牙列深覆牙合的治療計劃,同時證明了人工智能可用于輔助正畸醫生制定方案。圖3顯示了智能化的正畸診斷和治療計劃制訂流程。

圖3 基于機器學習的智能正畸診斷和治療計劃制定流程
選擇拔牙或非拔牙矯治在正畸界一直存在爭論。在確定是否拔牙時正畸醫生必須權衡多種因素,如牙齒排列、咬合穩定性、頜面軟硬組織平衡、顳下頜關節障礙、牙周健康等等。但是由于相當多的正畸病例屬于臨界類別,且不同的醫師經驗、理念及偏好存在差異,拔牙方案沒有所謂的正確答案,也較難量化比較不同的方案[27]。在循證醫學和個性化醫學的時代,有學者尋求使用機器學習的方法來改進這一決策,以減少個人主觀性影響。大多數研究應用了人工神經網絡模型(artificial neural network, ANN)。Xie等[28]提出了基于ANN的拔牙檢測,發現開唇露齒和下頜中切牙-下頜平面角(IMPA)是在檢測是否拔牙中最有貢獻的兩個特征,局限性在于其測試集的可泛化低,需要進一步研究。Jackson等[29]研究發現種族、安氏分類、初始覆牙合覆蓋和上下頜擁擠度是影響拔牙概率的因素。Jun和Kim[27]除預測是否拔牙外還應用深度學習方法判斷拔除牙齒的牙位,他們把數據分成驗證組和測試組,以改進Xie等[28]研究中的低泛化問題。Li等[30]研究使用多層感知器人工神經網絡在拔牙-非拔牙預測中實現了94%的精確度,比Xie等[28]高出14%。也有學者使用其他的機器學習算法,如Suhail等[31]使用隨機森林算法,其研究的局限性在于僅限于非手術正畸治療,且未考慮非典型的拔牙模式。隨著數據集的增加、更多臨床變量的納入和研究的推進,機器學習在正畸拔牙決策中顯示出較好的應用前景。
無論是出于先天性還是后天性的原因,臨床上不乏患者存在較嚴重的頜骨畸形。對于這些畸形,Lee等[32]使用深度學習方法檢查了正頜手術或正畸治療的需要,其優點在于使用整體圖像進行評估,而不是使用特定的測量值,可以考慮到測量值中無法顯現出的細微差別,從而減少傳統的頭影測量值造成的誤差。但深度學習研究的局限性在于口腔修復體引起的數據連續性、圖像失真等問題,以及對于大量數據的需求。對于只能依賴于正頜外科手術來矯正而無法僅憑正畸來改善的異常頜骨形態,其成功取決于正頜外科醫生的技能和完善的手術規劃。Vannier等[33]使用計算斷層掃描影像來劃定異常的面部軟組織和骨骼形態以進行手術規劃和評估;Zachow等[34]建立了下頜骨的三維形態統計模型,可以為手術重建提供合理依據。另外,Stehrer等[35]預測了正頜手術前的失血量,從而有利于在手術前制定最佳的治療方案,這是該領域的首次研究,仍需要臨床和外科診療過程中進行更多的研究以驗證此結果。
CAD/CAM在當代口腔醫學中起著重要作用,世界各地的許多現代化診所使用CAD/CAM進行口腔疾病的輔助治療。在正畸學中,三維數字牙頜模型已廣泛用于幫助醫師移動和重新排列牙齒,以模擬治療結果以及指導矯治器設計。其中,準確的牙齒分割是基本步驟,但由于不同患者之間牙齒變異大、擁擠錯位、牙齒缺損缺失、口內掃描時倒凹區域較難掃描等問題,牙齒圖像分割存在一定的困難和挑戰。最近,機器學習在多種不同類型的牙齒圖像分割中表現出了較好的性能。Liao等[36]開發了基于諧波場的自動牙齒分割,能夠自動、高效、高質量、完整地分割牙齒。Charles等[37]提出了名為PointNet的端到端神經網絡來進行三維形態分析和分割,在效率和精度方面性能良好。以此為拓展,Lian等[38]提出了MeshSegNet端到端深度神經網絡,專門用于自動牙齒分割。在臨床CAD/CAM應用中,Choi等[39]報告了1例基于 CAD/CAM 虛擬正畸系統設計的個性化托槽對骨性Ⅲ類畸形患者進行治療的案例。
醫學領域一直處于使用人工智能分析策略的前沿,應用大數據的優勢來指導個性化治療干預,滿足患者需求并對療效進行評估。口腔醫學領域在利用機器學習技術評估臨床結果方面也取得了進展。Thanathornwong等[40]在貝葉斯網絡的基礎上開發了一個正畸專家系統,基于患者的口內外錯牙合畸形相關數據生成臨床決策支持結果,以輔助全科醫生評估治療的必要性。盡管訓練的數據數量有限,但正畸醫生的判斷與專家系統的結果之間沒有顯著差異。Riri等[41]提出了基于正畸診斷用口內外和模型圖像分類的計算機視覺和機器學習方法,其針對提取的特征通過決策樹、面部特征檢測等評估治療的進展來為正畸醫生提供參考。同時隨著智能手機的廣泛使用,有學者研發了相關遠程治療監測程序。Caruso等[42]介紹了一種遠程正畸牙移動監測系統(dental monitoring),是世界上第一個用于遠程監測牙科治療過程的應用程序,其利用機器學習算法建模,通過患者使用手機拍攝的口內照片和視頻來計算三維牙齒運動。此類技術可以幫助正畸醫師更頻繁、更有效地監控治療目標完成情況,并減少患者不必要的預約復診,但是仍需更多的研究來驗證。
在口腔正畸相關的臨床研究中,機器學習展現出了其在分析歸納數據、減少工作量、優化工作流程等方面的應用潛力。
循證臨床實踐基于使用最佳可用證據、醫學專業知識和患者價值觀來為臨床決策提供信息[43]。在循證研究中,檢索相關文獻再篩選的工作往往非常耗費人力,且導致項目完成時間的延長。研究設計方法的過濾是機器學習在文獻篩查中的應用之一,例如可判斷文章為隨機對照試驗(randomized controlled trial,RCT)概率的RCT Tagger工具[44]。RobotSearch同樣是一種開放性訪問工具,其除了可判斷是否為RCT之外,還允許用戶選擇是否希望系統應用最大化“靈敏度”或“特異性”的輸出,對于快速回顧文獻具有較大的應用潛力[45]。在標題/摘要篩選和文獻數據提取中,機器學習也具有高效率的特點,可使需手動篩選的數量減少10%~90%,極大地縮短了篩選時間,優化了工作流程[46]。在實際應用中,仍建議通過相關策略以確保人工智能方法和循證分析結果的透明性和可重復性。
顱面部的發育及正畸矯治中伴隨著復雜的遺傳學、生物學、基因學等過程,可以通過收集生物樣本、細胞和基因測序等方法對其進行研究和探索,通常需要復雜的計算工具來分析所產生的大量數據。機器學習算法為分析高通量數據并從這些數據集中獲取有價值的信息提供了機會。在基因組學領域,機器學習策略可在識別基因變異和建立表型-基因型相關性方面發揮重要作用,在預測與DNA和RNA結合的蛋白質序列特異性方面也取得了很大進展[47-48]。此外,近期的研究表明深度學習如DeepCpG算法可以幫助分析單細胞甲基化數據,并做出準確的預測[49]。
有限元分析是指利用數學近似的方法對真實物理系統(幾何和載荷工況)進行模擬,通過簡單而又相互作用的元素,就可以用有限數量的未知量去模擬無限未知量的真實系統。在口腔正畸學中,研究人員利用有限元分析可以對復雜的牙及牙周組織在矯治器施力加載后的變化進行生物力學分析,但是存在模擬時間長、計算成本高等問題。機器學習可幫助優化有限元分析過程,但口腔醫學中有限元分析機器學習的應用還較少見。機器學習在其他醫學領域的應用可以為其在口腔正畸生物力學仿真分析中的應用奠定基礎。如Liang等[50]對主動脈模型開發了基于機器學習算法的計算機模型框架,并進一步采用深度學習方法,在有限元計算、結果輸出等方面取得了較好的結果。通常來說口腔醫學領域研究對象的幾何形態和邊界條件更為復雜,在實際應用中仍需進一步研究。
作為人工智能的重要分支,機器學習正在口腔正畸學領域的多個方面迅速擴展應用。 機器學習可以幫助正畸醫師分析患者在矯治前后生成的多種類型數據,并輔助醫師更高效地進行診斷和制定治療規劃。目前機器學習在頭影測量標志點檢測、拔牙矯治決策、循證分析等方面已有了較深入的研究,但總體來說在口腔正畸領域的有關臨床研究數量仍相對較少,在臨床也未得到廣泛應用。機器學習存在考慮不全面、無法明確病因、無法對結果提供解釋等局限性。精準診療將是口腔正畸學的未來發展目標。隨著不斷納入更多種類和數目的病倒數據,高質量正畸學研究不斷深入和機器學習能力的不斷提升,利用我國病例大數據的優勢,一定可以促進顱頜面畸形實現個性化診療和矯治過程監測分析,從而能夠更高效地獲得更好的矯治效果。