王可欣, 邱建星
人工智能(artificial intelligence,AI)工具已經用于醫學影像科臨床工作中,在圖像處理、影像診斷、流程優化等方法取得了一定的成果。AI涉及多種技術,包括傳統機器學習(machine learning)和深度學習(deep learning)算法兩大類; 從應用的角度,可分為圖像、表格類數據、自然語言和語音處理等; 在圖像處理方面以影像組學和卷積神經網絡是現在的熱點技術。AI工具的應用場景多樣,除了用于輔助診斷,還可以用于流程優化。本文重點對AI的非診斷應用進行綜述。
為了便于表述,本文姑且將應用于醫學影像科的AI工具分為“診斷類(image interpretive)AI”與“非診斷類(non-interpretive)AI”[1]。從輔助影像診斷醫生工作的角度將AI工具按功能分類,診斷類AI主要是在圖像處理和報告書寫過程中幫助醫生完成診斷任務,而非診斷類AI主要是在工作流中幫助流程優化和完善服務。這種分類概念的外延和內涵并不完全準確,將來隨著技術的進展和學科的演化可能會有更準確的定義和分類。
美國放射醫師學院數據科學學院(American College of Radiology, Data Science Institute)在發布AI用例(use case)時,將非診斷類AI按應用領域分為:事務管理、患者服務、公共衛生、讀片環境和技術質控等方面。另有研究者將非診斷類AI分為:圖像產生和質量控制、影像科流程優化、事務管理、研究應用和影像AI教學等[2]。雖然分類不盡相同,但多數都認為AI在流程優化工具在臨床應用中,目前已對影像科工作產生了直接幫助[3]。本文結合自身經驗,綜述部分非診斷類AI的研究和應用進展,因認識水平不足,難免有錯漏之處,歡迎同行專家批評指正。
AI可以用于提高圖像質量以控制射線輻射風險和對比劑風險。隨著CT的廣泛應用,醫學影像檢查的射線輻射問題日益引起關注。MR檢查雖然沒有射線輻射風險,但含釓對比劑導致的不良反應也成為醫療安全關注的問題之一。因此,低劑量CT(low-dose CT)、低對比劑增強MR成為更安全的影像檢查方法,但是因圖像噪聲較大、對比度欠佳,有可能影響臨床診斷而應用受限。AI可用于降低噪聲、減少偽影,從而提高圖像質量、縮短掃描時間、減少對比劑用量,取得保障患者安全和提高工作效率的成效[4]。
使用更好的圖像重建方法有助于提高圖像質量,通過各種算法的實施目標主要提高信噪比和減少偽影。AI技術中用于圖像重建的主要是卷積神經網絡(convolutional neural network,CNN),近年來對抗生成網絡(generative adversarial network,GAN)顯示圖像降噪效果似乎更佳[5]。AI模型輸入的圖像來源于X線、CT、MR、超聲、PET等,既可以是探測器采集的原始數據,也可以是處理后的圖像數據。AI模型學習的對象既可以是圖像中的解剖及病灶結構,也可以是噪聲。AI模型輸出的結果通常是優化后的圖像。輸出圖像與輸入圖像相比,通常有更高的信噪比,偽影更少,且保持圖像中相關結構的對比度。這類工作的評價通常是以醫生對圖像的主觀評估為主,也可結合一些客觀定量評價指標[6]。通過降低圖像噪聲,可以轉換為患者安全、采集時間、圖像質量等方面的獲益。利用AI技術,可從低劑量CT數據產生高質量圖像,影像科醫生的主觀評價認為其效果優于或等同于常規CT掃描[7]。通過AI模型,可利用注射極低劑量對比劑(常規劑量的10%)生成MR增強掃描,圖像對比度與常規增強MR圖像類似[8]。
AI應用于醫學影像科的質控要求對合適的患者以恰當的方法取得合格的圖像,并即時準確地生成影像診斷報告。
AI可以用于判斷圖像質量以輔助影像技術的質控工作。影像檢查的質控主要關注圖像質量是否合格。技師通常在采集圖像之后通過觀察圖像中組織結構的顯示來評價圖像是否合格。通常圖像質控的要點有:掃描范圍、曝光條件或序列參數、動態增強掃描期相、圖像偽影等。技師判斷圖像不合格時,可采取適當措施予以補救,必要時再次采集圖像。主觀評價要求承擔質控任務者具備一定的經驗,且質控在檢查完成后,有一定的滯后性。AI模型有望用于判斷圖像質量,且與圖像采集直接整合,在檢查當時發現問題即提醒技師立刻處理,對全部檢查均可有效率地完成質控任務[9]。
使用AI算法可以模擬技術專家評估圖像質量。例如心臟超聲檢查中要通過標準的解剖定位以評價特定的心臟功能異常,人工定位不易保持精準,通過AI技術可以評估解剖定位是否達到質量要求,以保證超聲測量值是可靠的[10]。胸片是影像科最常見的檢查工作,使用AI技術可以在投照完成之后立即自動判斷是否有肋膈角包括不全、患者體位是否有旋轉、患者吸氣是否恰當等[11]。新生兒MR圖像常因存在運動偽影或信噪比低而影響診斷,使用AI技術可以即時發現這些情況[12]??傊ㄟ^對AI技術對圖像質量的即時評估、即時反饋可以監視圖像形成過程,以達到質量要求,保障診斷需要。
AI可以用于縮短掃描時間和后處理時間以直接提高影像工作效率。目前影像科的檢查項目中,MR掃描的人次平均時間較長,檢查效率不高。既往通過k空間不全采樣(incomplete k-space sampling)、并行成像(parallel imaging)、壓縮感知(compressed sensing)等技術提高掃描速度,但仍有一定的局限性。在上述技術的基礎上,將AI用于MR圖像處理可以保證在縮短掃描時間時保持較高的圖像質量,提高MR工作效率[13]。AI工具可以用于提取影像中的定量信息,如使用AI技術可以從DCE MRI動態圖像中自動提取出Ktrans相關參數[14],從ASL序列中提取出組織灌注參數[15]等,這種自動的處理可以減少繁瑣的圖像后處理工作,提高后處理的工作效率。
AI可以用于優化工作流程以提高工作效率。AI在優化效率方面的應用日益受到影像科管理者的關注。在影像科日常工作中,將患者、設備、工作人員的負荷精準匹配,是非常復雜的任務。以MR檢查為例,由于設備功能各具特色,在不同掃描設備上完成相同檢查所需的時間不同,在相同設備上完成不同檢查所需的時間也不一致;有些檢查可以在全部設備上進行,有些檢查僅能在某些設備上進行。有研究通過收集信息系統中人員信息和設備信息,以機器學習或深度學習的方法分析影響患者預約時間、候檢時間的因素,對可能的爽約(no show)做出預測,就可以調整預約策略,以提高患者到檢率,提高設備利用率。也有研究使用AI優化預約隊列,縮短了患者等候時間,增加了單位時間內的MR檢查數量[16]。基于AI對工作人員排班和設備開機時間進行管理,在不延長工作時間的情況下,提高檢查量,對工作人員和患者是雙贏的[17]。
AI工具可以用于提高報告效率和滿意度。醫學影像工作的價值一方面體現在提供有意義的診斷信息用于診療活動,另一方面體現在患者和臨床醫生的滿意度。將AI工具與信息化工具整合,可以為臨床醫生和患者提供更加快速、準確、直觀的結構化報告,提升滿意度。通過優化IT系統可以將AI生成的結果直接返回到結構化報告,使影像診斷醫生可以方便地利用AI結果[18]。將AI產生的病灶標注區域自動地發送到多媒體報告(multimedia radiology report,MERR)中[19],臨床醫生和患者就可以在移動端直接查看文本報告和病灶的關鍵圖像,從而更直觀地了影像檢查的結果?;谝巹t和算法可以自動發送危急值警告、產生隨訪建議和推薦意見,并可以自動生成對報告的解釋,使得報告信息充分發揮作用,實現影像工作的價值[20]。
AI工具可以用于輔助醫學影像相關科研工作。NLP工具對科研數據的提取有幫助。從臨床材料中提取科研記錄時,常需要在醫學文檔中找到數據。既往日常工作中的臨床記錄多是自然語言文檔,需要花費大量的時間去檢索、錄入、核查,因此大樣本的臨床研究成本很高。通過NLP自動提取文檔中的關鍵信息,有利于高效、準確地整理臨床資料[21]。使用AI圖像分類模型可以對醫學影像圖像進行初步篩選和分類,包括掃描范圍、期相;圖像中解剖結構是否正確等,用于科研過程中圖像的整理。使用AI圖像分割模型可以對圖像中的解剖結構和病變進行分割,然后做出精確的定量評價,如:徑線、體積、密度/信號強度、增強曲線和功能參數等。AI模型的效率高、分析結果一致性強,對于定量研究非常有益。
AI工具可以用于輔助醫學影像相關教學工作。AI技術既是醫學影像教學工作的內容,也是教學的輔助工具。既往醫學教育中數學、統計和計算機內容較少,臨床醫學工作者理解AI有一定困難。國外多個地區的醫學影像專業學會很關注這個問題[22-23],認為應對使用AI和研發AI的醫學工作者進行繼續教育,修改大學課程和住院醫師規范化培訓課程,增加AI相關的培訓和考核。未來的醫學影像工作者必須有足夠的AI知識,才能適應AI新技術帶來的工作模型轉變,并促進學科發展。
AI工具也可以用于輔助教學[24]。通過收集醫學生和住院醫師在工作和學習過程中的資料,可對其學習表現進行精細化評價,根據評價結果安排后續的學習活動,教學過程因人而異,對學生的知識體系進行個性化評價,查缺補漏,有利于高效地完成學習,使不同入學水平、不同轉輪計劃下的學生均達到同質化的高水平。
非診斷類AI與診斷類AI有相似之處,因此二者面臨的問題和挑戰類似。與診斷類AI相關,非診斷類AI研究和應用中的問題很多,主要有:合格數據的獲取、模型的泛化和倫理問題等。另外,非診斷AI更多地關注流程數據,涉及人類活動數據的收集和處理,利如對技師工作效率、醫師診斷準確性、學生學習成績等數據的處理,這些情況在診斷類AI是不涉及的,因此其問題和挑戰也有其獨特之處。
非診斷類AI獲取數據不難,常從信息化工具提供的metadata(元數據)而來[25],數據量通常也較大,但數據的結構化困難非常大,影像工作中人類活動的本體(ontology)概念還不完善[26],使得大規模的模型共享、系統集成、知識獲取和重用都不易實現。所以當前部分非診斷類AI的研究和應用有強烈的環境依賴,未來模型泛化的可能是受限制的。
非診斷類AI關注的結局常常是人類行為表現、人類內心體驗等,其評價指標與診斷類AI不相同,其度量指標(metrics)和參考標準(ground truth)與應用場景密切相關,不可一概而論[27]。在度量指標和參考標準不一致的情況下,對AI工具的效能評價可能不一定反映其本質,不同AI工具的評價和比較也不容易實現。
非診斷類AI的倫理困難尤其實出[28]。診斷類AI通常是在在匿名化(annoymized)的數據集上用于訓練模型,模型訓練過程中的數據基本與特定的人無關。但非診斷類AI很多情況下以人類信息訓練模型,即使把數據的標識符(ID)去除,仍有可能追溯到個人。如果非診斷類AI生成的是用戶畫像(profile)或個性化推薦系統(recommend system),則AI應用過程中的倫理問題更加嚴峻[29]。
總之,無論是診斷類AI還是非診斷類AI,醫學影像AI的最終目標是提升價值,為患者提供更好的服務。非診斷類AI更多地關注患者和醫務工作者,通過流程優化為醫療、教學、科研和管理提供輔助幫助[30]。