陳沖,陳俊,夏黎明
在當今臨床工作實踐中,醫學影像技術已成為日常診斷重要工具。從X射線到CT、MRI,再到超聲和核醫學影像,這些影像技術不僅幫助醫生進行疾病診斷,還在病情的監測和治效評估中發揮著至關重要的作用。但是醫生的閱片精準度、操作效率以及定量分析方面仍然存在局限性,往往依賴于放射科醫生的經驗、專業知識以及醫生所處工作狀態。這些主觀因素均可能導致診斷結果的不穩定,從而影響患者的疾病診斷、手術治療以及預后監測。
近年來隨著醫學影像成像技術的規范及其廣泛使用,基于數據驅動和端到端學習的人工智能(artifical intelligence,AI)算法逐漸在醫學影像輔助診斷中大放異彩。人工智能的醫學影像分析算法在海量數據中學習訓練,自適應地匹配不同的影像決策任務,這些技術不僅提高了疾病診斷的精確性和效率,還減少了放射科醫生的工作負擔,使他們能夠更專注于復雜案例的分析。其中基于人工智能算法的診斷和分割是其應用在醫學影像領域的兩個重要研究方向,本文將重點介紹人工智能算法在醫學影像自動分割、診斷中的研究現狀以及未來的應用前景。
21世紀以來,隨著計算機軟件、互聯網技術以及微電子集成電路的發展,困擾AI領域多年的數據以及算力等問題得到了很大程度的解決,2006年圖靈獎獲得者Geoffrey Hinton利用深度神經網絡訓練自編碼器以降低數據維度[1],文章中提出的很多思想為后續的研究提供了新的視角和方法。2012年Hinton和他的學生Alex Krizhevsky設計AlexNet獲得ImageNet圖像分類的冠軍[2]。相比傳統機器學習特征的淺層判別,卷積神經網絡通過不斷堆疊的卷積層和池化層對原始數據進行自主地特征提取和篩選,由淺層圖像紋理特征到深層語義特征轉變,“深度學習”(deep learning,DL)由此得名。從2012年開始,在算法層面,數據科學家們在深度學習基礎網絡的理論研究,計算機視覺以及自然語言的應用等方面有了重大突破,深度學習算法能夠適配越來越多的落地應用場景,特別是醫學影像領域;在硬件層面,以NVIDIA公司、Intel公司為代表的AI芯片公司在人工智能模型的訓練端芯片、云服務器的推理芯片以及邊緣計算的部署芯片等取得了多樣性的發展,在硬件的加持下,人工智能產品和解決方案能夠更快發展;在數據層面,萬物互聯理念和大數據技術的發展將越來越多的圖像數據以及文本分享到互聯網上,進一步推動深度學習技術的發展。2022年,openAI公司分別在GPT-3[3]的基礎上提出智能對話機器人chatGPT,在CLIP[4]和擴散模型(diffusion model)[5]的基礎上提出了多模態繪圖產品DALLE系列,這些產品極大地推動了大模型以及弱人工智能模型向強人工智能模型的發展。在過去的十年里,這些技術也逐漸應用到醫學影像領域中,給放射科醫生的工作模式以及疾病的診療預后優化帶了巨大的革新。
影像組學作為一種高通量的影像特征提取建模方法,能夠將高維的原始影像學數據轉換為所研究區域的影像學特征,主要包括形態學特征、一階特征、紋理特征以及高階特征[6]。相比于傳統放射學參數,影像組學特征通過客觀的圖像描述以及信息論原理等方法更加全面地體現所研究區域的形態學參數、影像信號強度分布、統計學參量、影像紋理定量指標、影像變換的全局-局部特征以及頻域變換的特征等。機器學習作為人工智能的重要分支,在影像組學的后續研究中起到了關鍵性的作用。目前影像組學作為一種無創的疾病評估方法,在疾病診療與預后的全流程中都有廣泛研究和應用。
在疾病診斷方面,研究人員從不同的醫學影像以及影像模態上提取影像組學特征,通過mRMR、LASSO以及特征差異性分析等方法進行影像特征篩選后,利用多因素邏輯回歸、支持向量機、隨機森林以及XGBoost等方法構建影像學風險評分,將其與臨床因素結合構建聯合模型,應用于疾病診斷并通過模型的判別性、校正性以及臨床應用驗證其臨床收益[7-10],研究表明相比臨床資料以及影像的半定量診斷方法,基于機器學習的影像組學方法能夠提升疾病的診斷效能,輔助臨床診斷決策。乳腺癌腋窩淋巴轉移狀態是乳腺癌患者治療規劃以及預后復發風險評估的重要生物學標志物,Yu等[11]在MRI影像上提取腋窩淋巴和乳腺癌區域的影像學特征,通過隨機森林進行特征篩選后,構建基于支持向量機的影像組學模型無創預測乳腺癌患者腋窩淋巴轉移狀態,并在803例訓練集、179例外部驗證集以及前瞻性-回顧性臨床實驗收集的106例研究隊列得到了驗證,AUC為0.90~0.93,影像學特征不僅能夠描述乳腺癌內部的定量特征,也能夠反映浸潤性乳腺癌免疫微環境的改變情況。此外,乳腺癌特征結合淋巴結特征能夠有效提高模型的診斷效能,為后續其他腫瘤淋巴轉移問題提供了新的思路和方法[12-14]。
在疾病的預后風險評估方面,多項關于腦出血預后研究表明基于平掃CT的影像組學特征構建的機器學習模型能夠有效評估腦出血患者短期不良預后的情況,輔助醫生評估腦出血患者的術后不良風險[15-18]。Yu等[19]從多參數MRI(T1ce、T2WI、DWI-ADC)提取乳腺癌以及腋窩淋巴結的影像特征用來預測和分析乳腺癌患者腋窩淋巴結轉移風險與無疾病生存期(DFS),該研究納入了中國4個中心1214例乳腺癌患者,構建了多機器學習模型,采用LASSO和隨機森林進行重要特征篩選,支持向量機和邏輯回歸進行建模分析,該研究表明所構建的臨床決策諾莫圖能夠幫助乳腺癌患者無創診斷腋窩淋巴結轉移以及術后無疾病生存情況,這對早期乳腺癌患者的手術計劃以及治療規劃有重要意義。
由此看來,基于機器學習的影像組學方法已經廣泛應用于疾病鑒別診斷、治療前規劃、治療后疾病反應以及患者后續生存狀態等方面,為個性化、精準治療提供重要依據。
相比基于機器學習的影像組學方法,基于深度學習的智能診斷能夠通過端到端數據驅動的方式自主學習特征,進行醫學影像診斷分析。深度學習智能診斷研究的標準流程包括:①數據集:建立標準化的醫學影像數據集,包含配對的圖像數據、勾畫ROI數據以及患者匿名化的臨床數據;②圖像預處理:通過Z-score以及重采樣的方法對醫學影像數據進行灰度和空間歸一化,減小設備、掃描方式的差異性;③模型選擇:根據數據量情況,選擇合適的深度學習模型,包括ResNet[20]、VGGNet[21]、InceptionNet[22]及3DConv等[23];④模型訓練:根據數據量情況,基于ImageNet預訓練參數對模型部分或全部權重使用較小的學習率進行微調[24];⑤模型驗證:將微調好的模型在訓練集、測試集以及外部驗證集中測試驗證并與其他傳統診斷結果(如人工診斷及影像組學模型等)對比其性能優劣。在多項基于深度學習的醫學影像診斷研究中發現基于深度學習的影像學模型擁有更好的診斷效能并且在多個外部驗證集得到充分驗證[25-28]。在醫學影像臨床實踐中,多任務的醫學影像分析也是目前研究的熱點,研究表明基于多任務的深度學習模型在提高單一任務的預測效能、減緩模型的過擬合現象以及提高深度學習可解釋性方面有獨特優勢[29-31]。
隨著Transformer架構在自然語言研究中的廣泛應用[32],相對卷積神經網絡逐層提高感受野,Transformer通過自注意力機制策略能夠無監督地獲取文本數據的全局信息,提高網絡特征的表達能力,能夠很好地處理數據分布異制性及長尾問題,目前成為人工智能大模型研究的基礎。在醫學影像智能診斷的研究中,Transformer網絡架構也逐漸受到學者們的關注。多項研究表明,基于ImageNet預訓練以及自監督學習預訓練的Transformer深度學習模型能夠更好地擬合醫學影像全局的信息[33],提高其診斷效能[34-36]。值得注意的是,在一項大規模病理影像智能分析研究中,Huang等[37]構建了包含20萬張病理影像的數據集OpenPath,該數據集包含了病理影像以及對應的影像學人類語言描述。在OpenPath數據庫和CLIP模型的基礎上[4],構建了病理影像的基礎預訓練大模型PLIP,在多個下游任務(圖像分類、圖像檢索等)中都有非常高效的表現。研究還表明相對于傳統的分類類別數量固定的模式,基于CLIP的大模型在不需要微調下能夠快速擬合新的數據類別分布。
由此可見,基于人工智能的智能診斷研究由傳統的影像組學、卷積神經網絡以及多任務模型向預訓練醫學影像基礎大模型發展,其診斷效能、模型的泛化能力越來越高,應用場景越來越多樣化。但是,隨著模型越來越復雜,特征層次逐漸加深,其算法的可解釋性也受到多方面挑戰。因此,大規模、規范化的醫學影像數據集、大模型算法的可解釋性是未來人工智能診斷的難點和發展方向。
2015年Ronneberger等[38]在卷積神經網絡的基礎上提出UNet架構應用于醫學影像自動分割上,網絡結構主要由編碼器-解碼器構成。其編碼器逐層卷積提取圖像的語義信息,特征圖尺度逐層減小;解碼器再通過反卷積操作逐層恢復特征圖尺度并與編碼特征融合分割目標區域,在醫學圖像分割領域有較高的效能。在后續的多個研究中分別從網絡結構、損失函數以及分割目標部位等方面進行模型優化以更好地適配醫學影像不同分割部位、不同模態數據分布的特點(CT、MRI、US以及胃腸鏡等),以達到更好的分割效果[39-42]。但在醫學影像分割領域中,圖像重建參數、三維圖像的層厚、掃描范圍以及不同設備、不同中心的影像等都會影響模型的分割效能。
一方面,如何對多樣性的醫學影像進行高效預處理以及算法輸出結果的后處理是人工智能算法應用在醫學影像分割領域首先要考慮的問題。2020年Isensee等[43]提出一種一站式醫學影像預處理、網絡架構自動配置、自動訓練、多分割模型分割融合以及模型評估的nnUNet架構,并在多個公開醫學影像數據集中驗證其分割效能[44-47]。在數據預處理階段,通過一系列自動配置方案根據使用者顯卡情況對分割醫學影像數據集進行自動分析,選擇合適的層厚、掃描范圍、預處理方案以及UNet編碼器各個維度下采樣方案對原始醫學影像預處理;在模型訓練階段,采用基于空間位置的增強策略(如旋轉、鏡像翻轉等)與基于灰度強度的增強策略(如高斯模糊、色度變換等)提高分割模型的泛化能力與分割精度;在模型應用階段,nnUNet采用窗口的方式進行滑動推理,并對窗口推理結果采用高斯融合提高分割精度;在模型評估階段,采用Dice系數、Jaccard系數以及真陽性率等多個指標綜合評估模型預測效能。由于nnUNet架構易于使用及較高的分割效能,目前已在醫學影像分割領域被廣泛使用。
另一方面,如何結合最新人工智能技術改進Unet架構以提高多臟器結構化分割效能和泛化性是目前研究的難點,目前已經有多項研究[48-49]結合Transfromer[50]、擴散概率模型[5]、預訓練大模型的思想[48,51]以及自監督學習的策略[33]對UNet網絡結構進行改進,以通過自然語言描述、少量的人工交互以及全自動的方式實現模型自主的目標區域分割,讓智能體模型更加理解醫生的意圖,進行大范圍多模態的醫學影像精確分割。
除了在預處理以及模型方面的改進之外,利用人工智能分割技術輔助構建標準化的醫學影像數據集也是醫學影像精細化分割的另一發展方向。為了提高模型的分割泛化性和精度,相關學者使用nnUNet框架在來自于不同中心、不同層厚、不同空間分辨率以及不同增強期相的1204個CT影像上訓練了多個分割模型,能夠分割104個人體解剖結構,其中包括27個器官、59種骨骼結構、10種肌肉組織以及8種血管,推動了人工智能分割模型從算法研究到落地應用的發展。目前人工智能醫學影像軟件分割算法正在改變放射科醫生臨床科研的工作方式。在一項大規模醫學影像分割的研究中,在人工智能分割模型的基礎上建立迭代式人工輔助半自動分割方案,在該方案中“自動分割-專家矯正-模型迭代”的模式能夠幫助醫生節省大量的手工標注時間,并且模型的分割精度隨著迭代的進行,其效能不斷提升以擬合新的數據分布,該方案僅用3個星期便可以完成8000例腹部CT的多臟器分割任務,而一名經驗豐富的腹部放射科醫生可能需要30年的時間才能完成,極大提高了標注效率。
由此可見,大規模的醫學影像自動分割工具和軟件是未來人工智能在醫學影像應用的重要方向和研究趨勢。
隨著人工智能技術、計算機算力以及醫學影像數據庫標準化的發展,人工智能技術正在改變放射科醫生日常的工作模式。人工智能新技術在疾病的早期篩查、臨床診斷、病灶檢測與分割、治療方式的選擇與規劃以及治療后的療效評估與生存分析等臨床工作中起到了不可忽視的作用,為臨床和科研工作帶來了巨大的便利。然而,人工智能作為一項新興的技術,依然在不斷發展和完善。醫學影像相關算法模型仍不成熟,存在系統性故障以及模型誤判漏判的風險,可能造成臨床評估、診斷、方案規劃等工作的誤判。因此放射科醫生在擁抱人工智能的同時仍需保持清醒客觀的認識,不能形成完全依賴,AI輔助的最終環節仍需醫學專家嚴格地加以人工審核。未來人工智能技術要想進一步與醫學影像融合,其模型的可解釋性、算法的泛化性和魯棒性、如何克服醫學影像的多樣性和復雜性以及大規模數據的驗證是人工智能醫學影像領域研究和落地的難點和發展方向。