周平,程豐飛,任波,王健,張冉,柴象飛
1.山東省蘭陵縣人民醫院 影像科,山東 臨沂 277799;2.新疆醫科大學第一附屬醫院 影像科,新疆 烏魯木齊 830011;3.慧影醫療科技(北京)有限公司,北京 100192
骨肌系統為機體內各器官及系統提供保護作用,組成部分包括骨髂、韌帶、肌腱及肌肉[1]。根據流行病學的報告,在我國骨肌系統的病變呈多樣化,組織成分復雜[2],其惡性腫瘤常常會發生遠處轉移,復雜的組織來源使骨腫瘤診斷依賴于穿刺活檢[3],但實體腫瘤的穿刺結果具有一定的局限性,其診斷及治療的研究進展相對緩慢。近年來,CT技術在診斷精度上已取得了長足的進步[4],并且CT動態增強掃描技術的臨床影像學診斷中較為普及,在肌肉骨骼系統早期病變定性研究方面具有一定的優勢[5]。若能在早期發病時及時針對不同病癥進行相應的救治,可大大降低死亡率,因此有必要進一步研究骨肌系統疾病的早期診斷方法[6]。
目前,迅速發展的人工智能(artificial Intelligence,AI)為解決這一問題提供了新的思路和方法。影像組學(radiomics)可將圖像轉換為可進行分析計算的特征值,利用機器學習算法對數據進行分析以提供臨床決策支持[7]。目前很多研究都將其應用于影像學的臨床診斷中,尤其是在肺部、肝臟、腦部、血管、骨骼分析等領域智能算法已經非常成熟,能夠輔助醫師進行圖像處理,提高了診斷的準確性[8]。在臨床使用場景中,目前的解決方案都是將AI算法與云計算相結合,進行靈活的模塊化部署[9]。由于云平臺有存儲空間大和計算能力強這兩大優勢[10],因此基于云技術將智能診斷系統與醫院影像歸檔和通信系統(Picture Archiving and Communication Systems,PACS)進行高效對接,能夠更好的實現骨肌系統數據集成管理、模型的存儲、調用以及輔助診斷結果的提供,進而有效防范漏診、誤診安全風險,提高整體醫療質量水平[11]。
本研究基于影像組學的分析方法,運用云技術搭建了一套針對骨肌系統良惡性病變診斷的智能系統,輔助研究者便捷地使用醫學數據進行鑒別骨肌系統良惡性的相關研究,進而得到高精度、高穩定性的模型。
本研究收集了2010年7月至2019年12月期間在蘭陵縣人民醫院影像科檢查中發生骨肌系統病變的162例影像數據,其中男性93例,女性69例;年齡37~65歲,平均年齡51.9歲;其中48例行CT平掃,114例行CT平掃+增強掃描,病理類型如表1所示。本研究已征得醫院醫學倫理會批準。

表1 162例患者的骨肌系統病理類型統計[n(%)]
1.1.1 納入和排除標準
納入標準:① 具有骨肌系統病變的患者,并經常規CT檢查;② 經手術病理明確診斷結果。排除標準:① 無完整的CT影像資料及病理診斷報告;② 無血液病等重大疾病。
1.1.2 檢查方法
患者均采用飛利浦Brilliance iCT 256層螺旋極速CT機,各部位的掃描范圍、條件按照該部位的標準掃描條件進行。掃描層厚及間距均為2 mm。增強掃描,對比劑采用碘佛醇(濃度:320 mgl/mL,江蘇恒瑞),注射速率3.0~3.5 mL/s,在對比劑注射45~55 s后行增強掃描。薄層重建為層厚1.0 mm,層間距0.5 mm標準算法的容積包。
影像組學工作流程主要包括:圖像獲取與分割、特征提取與篩選、模型建立與分析。其流程示意圖如圖1所示。

圖1 影像組學工作流程
首先通過CT成像方法獲取含解剖結構及功能代謝信息的162例標準化圖像。由2名放射線科主治醫師進行雙盲閱片,使用3DSlicer基于閾值、區域生長以及主輪廓模型等方式選取病灶最大層面沿輪廓邊緣進行手動分割病灶[12],并保存ROI。然后利用pyradiomics工具包(https://pyradiomics.readthedocs.io/)對ROI提取高通量特征1409個,其中包括一階統計量特征、形態學特征、紋理特征和高階濾波特征等,并對其進行數據標準化,以定量化表征病灶信息。經過對上述兩位醫師的標注結果進行ICC檢驗后篩選出P>0.85的特征1337個。再采用梯度降維實現特征選擇,即通過統計學中獨立t檢驗預篩選得到P<0.05的特征后,最后利用器學習LASSO正則化將得到的影像組學特征進行降維處理,最終篩選得到9個與骨肌系統兩個性病變高度相關的特征,見圖2。共有8個特征屬于小波變換濾波處理后的高階特征,其中2個一階統計量特征,6個特征為紋理特征(其中3個為灰度級共生矩陣特征,3個為灰度級長度矩陣特征);1個特征為強度統計特征。

圖2 降維后得到的9個放射組學特征及其在LASSO模型中的系數
得到降維的特征和特征值以后,利用SVM、KNN、LR等機器學習方法結合臨床診斷結果和其他的臨床信息建立三種分析模型,進行鑒別診斷。最后通過各種評價指標對模型測試集的結果進行評估,對比討論后將最優結果作為后續搭建系統中所調用的模型。分類問題常見的評價指標主要有模型的準確率、敏感度(即召回率)、特異度、漏診率、誤診率、F1分數(F1-score)和ROC曲線下面積(AUC)等。
基于云計算的系統平臺能夠為骨肌系統影像的管理、存儲和同享,以及嵌入通用的智能算法模型提供可能。本研究基于匯醫慧影(北京)醫療科技有限公司已有的云技術分布式系統架構的設計基礎,將訓練結果最優的良惡性鑒別分析模型進行嵌入,進一步完成了系統的搭建。本系統自下而上分為數據資源、輔助診斷模型、應用服務和WEB前端,整個系統的整體架構設計如圖3所示。從數據資源的基礎層到中間的輔助診斷模型和應用服務,再到最上層WEB前端,連接方式都采用統一的接口調用,從而建立起一套標準的系統架構。

圖3 系統整體架構設計圖
首先,主要進行骨肌系統良惡性病變輔助診斷系統的核心設計,也就是前端瀏覽器和后端服務的搭建。上層的WEB前端部分設計了登錄頁面,檢查列表頁面,閱片頁面并配有多種閱片工具按鈕、標注列表模塊和標注顯示模塊以及生成的閱片報告頁面,運用最新的HTML5編碼技術和JavaScript語言實現頁面的搭建、顯和交互操作,布局合理,功能齊全。與WEB前端通過接口直接進行鏈接的是系統的多樣化應用服務,其采用B/S(瀏覽器/服務器)結構,對各種功能模塊進行垂直劃分,主要包括用戶服務部分、圖像處理單元和模型調用模塊。其用戶服務部分在用戶登錄系統后提供課題管理、成員管理以及數據庫管理等功能。圖像處理單元實現接收、解析、查詢影像等操作。同時應用服務層還負責將訓練好的模型進行調用,給出診斷結果。后端服務中的輔助診斷模型層是本系統十分關鍵的一個模塊。它通過與最下端的數據資源對接,將接收到的影像進行統一處理,與醫生對病灶的分割結果一并進行保存,然后運用影像組學方法的對其進行智能分析,訓練出預測模型以供應用服務層進行調用。
本系統是在云計算的基本三層框架下,添加了輔助診斷層用于訓練和保存智能診斷模型,并針對每層的功能和負責的業務邏輯進行了重新劃分,利用云計算能夠分布式部署的優勢逐一完成模塊化,利用數據接口對不同類型的消息調用我們已建立的良惡性鑒別算法模型,從而得出輔助診斷的結果返回給前端顯示界面,建立一個完整的輔助診斷系統,實現高效、準確地幫助臨床診斷和決策。
本研究中構建的三種機器學習模型中,SVM算法經過多次訓練調整參數后得到了最優模型,將其進行保存。訓練集和測試集中對良惡性的分類結果如表2~3所示。

表2 SVM、KNN、LR模型在訓練集上的結果

表3 SVM、KNN、LR模型在測試集上的結果
在訓練集和測試集上,三種算法構建的模型對良性和惡性的分類準確度分別為0.97、0.97(訓練集)、0.93、0.92(測試集)、0.93、0.91(訓練集)、0.83、0.77(測試集)和 0.85、0.88(訓練集)、0.72、0.75(測試集)。從訓練集的結果可以看出,SVM算法的建模效果良好,良性和惡性的F1-score分別為0.95和0.87,訓練集的總體AUC為0.97,而且在測試集上同樣是SVM模型表現最優,測試集的總體AUC為0.92(圖4)。

圖4 SVM模型分別在訓練集和測試集上的ROC曲線
通過上述3個模型試驗及相關分析可看出,在訓練和測試樣本保持一致相同的情況下,本研究比較SVM、KNN和LR共3種分類模型,試驗結果表明SVM分類效果優于KNN和LR分類模型,針對影像組學分析模型在CT醫學圖像提取到的特征出現維度較高、數據冗余等問題,特征的篩選十分重要,改進模型的特征篩選結果可大幅提高模型的分類效果。尤其是本研究建立的基于影像組學的SVM分類模型擬合能力強,分類準確度高,模型總體的AUC值,靈敏度、特異性等評價指標優于其他2個模型,這證明了通過SVM分類模型判斷分析不同骨腫瘤的為良性或者是惡性具有明顯的優異性。
搭建基于云技術的輔助診斷系統主要目的在于針對骨肌系統的良惡性病變進行輔助診斷,對其前、后端的設計進行智能化改進來滿足醫生的多元化需求。輔助診斷流程如圖5所示,可以概括為以下幾個方面:上傳醫學圖像數據至云端、提取二維切面、用戶交互式標注二維切面上的病灶區域、影像組學模型的訓練、存儲與調用及給出預測結果。

圖5 系統的工作流程圖
應用服務層與院內CT設備或PACS對接后獲取圖像信息,相當于本系統的服務資源中心,提供可將患者病歷數據、醫療影像數據等信息解析入庫后提供分布式的數據存儲和數據處理服務,實現了數據的大規模聚集和長時間保存,可進一步提高數據的利用效率。應用服務層不僅集成了原有的多種數據治理功能,還支持接入上層Web前端和下層的影像組學輔助模型,從而共同構建了一個開放式、模塊化、可擴展的智能輔助診斷系統。
在影像組學模塊中主要包括影像組學數據預處理模型、降維后特征名稱、影像組學模型的加載與應用等。利用本系統四層架構設計中的數據資源層實現院內數據的對接,系統后端嵌入訓練好的模型,以META格式文件存儲到系統的測試模塊,通過加載己訓練好的模型,選擇應用到輸入到網絡的圖像數據上即可進行預測。
Web前端以閱片頁和診斷結果界面為主,其產生的服務請求消息通過接口到達服務應用層,經過處理后將相應的服務結果返回Web前端進行顯示。同時,對于輸入為DICOM格式的圖像來說,Web前端也支持窗寬窗位的設定,以滿足影像組學模型對圖像的輸入預處理要求。最終系統界面在右側將顯示該患者的預測良惡性分類的概率,見圖6。將骨肌系統良惡性病變鑒別算法和醫學影像云平臺相結合,在滿足醫生閱片的基礎上更進一步,使得醫生可以更加便捷地查看骨肌系統病變良惡性的預測結果,發揮了在線計算的靈活性。

圖6 輔助檢測系統界面示意圖
最后,本系統充分考慮了醫學影像數據的安全性與隱私性,利用云計算高安全、高可用和高并發的優勢,利用加密存儲、數據脫敏和安全傳輸協議,從技術層面上實現了醫療影像數據的安全保障,使得醫療影像在移動化、數字化、智能化的三個維度的高度統一。
本研究致力于骨肌系統良惡性輔助診斷算法的原理和具體實現步驟、基于云計算的系統架構設計以及智能化輔助診斷算法與云計算系統的集成,為醫生提供高效、可靠的診斷結果。
從本研究中建立的模型診斷精度而言,SVM的AUC、靈敏度最高,分別是93%、98%;在對良惡性兩種類別的特異度上SVM和LR模型對良性的特異度高于惡性,而KNN模型則對惡性特異度更高,因此SVM在特異度、靈敏度、準確度方面均較高,適合用于大多數情況下骨肌系統良惡性病變的鑒別診斷,而KNN判別方法的診斷效能為79%~85%,診斷效果相對而言較差,但其對惡性腫瘤的高特異性也可用于相應的實際使用場景中進行鑒別診斷,如惡性病變較多的腫瘤醫院。本研究建立的模型說明影像組學分析方法對骨肌系統病變,尤其是在骨腫瘤良惡性的臨床診斷上具有一定的價值,結合患者特點的SVM模型提高了鑒別不同類型骨腫瘤良惡性的準確性。
同時,本系統不僅能夠實現移動閱片,而且借助圖像后處理技術和影像組學方法的結合,能對于可疑病變定量分析并且給出預測良惡性的結果。除了在骨肌系統病變研究領域中可以使用平臺方便地得到結果外,對于已得到的高穩定性模型還可以提供進一步的臨床實際應用的功能。國內外的研究表明,如果患者在骨肌系統發生惡性病變的早期能夠盡早診斷,就能盡早地進行手術治療,從而將患者的五年生存率提高至60%以上[13]。因此,對早期骨肌系統發生病變的患者進行良惡性的預測具有重要的意義。
本研究中構建的系統交互響應時間短,可以在較少的時間內獲得骨肌系統良惡性診斷的結果,整個處理流程可以在幾十秒內完成;并且易于學習,因為它們涉及簡單的操作和簡潔的圖形界面,讓沒有編程能力的用戶都可以輕松學習該系統的操作;通過簡潔友好的網頁界面實現交互式診斷;可以作單機運行,也可以異地運行,達到了安全性與可協作性的要求。本系統可以幫助醫療資源相對匱乏的基層醫院或社區醫療機構在骨肌系統疾病診斷領域獲得較高的診療水平。
影像組學通過高通量獲取一階、二階、高階紋理特征進行定量分析,能夠運用數學方法分析圖像,具有無創、準確、可重復等優點[14]。現有不少研究希望通過影像組學獲取更多有價值的診斷信息。Larhmam等[15]則嘗試利用SVM與遞歸特征消除相結合的方法同時進行特征選擇與模型構建,動態觀察改變特征選擇數量對模型準確性的影響,發現選擇少量恰當的特征構建模型即可實現相對高的轉移與非轉移椎體分類精度,同時該研究嘗試通過網格搜索嵌套交叉驗證設置SVM的方法解決骨腫瘤等小型數據庫機器學習問題。
此外,影像組學還可對有相似影像學表現的不同骨腫瘤進行鑒別。Li[16]分析了154例顱底脊索瘤和56例軟骨肉瘤患者的多參數磁共振圖像(Multi-Parameter Magnetic Resonance Imaging,mpMRI),通過最大相關性最小冗余和遞歸特征消除算法從1941個特征中選取11個特征構建單序列及多序列SVM分類模型。在訓練隊列中,相比于單序列模型多序列模型分類性能顯著改善(P<0.05),其在訓練和驗證隊列中AUC分別達到了0.97和0.87。另一項基于多參數磁共振特征構建影像組學模型以鑒別骨盆骨肉瘤與尤文氏肉瘤的研究也取得了不錯的結果[17],表明影像組學在骨腫瘤鑒別診斷中有較大價值。還有研究對鑒別3種不同骨腫瘤進行了嘗試。Yin等[18]回顧性分析了54例脊索瘤、30例骨巨細胞瘤和36例骨轉移瘤患者的mpMRI,通過LASSO回歸算法篩選特征后構建RF分類模型,聯合T2加權脂肪抑制序列和增強T1加權序列特征構建的三分類模型AUC可達0.773,準確度為0.711。還有研究基于CT及增強CT圖像,比較3種不同特征選擇算法和3種不同機器學習算法構建的脊索瘤與骨巨細胞瘤分類模型發現,可以通過選擇恰當的特征選擇方法和分類方法提高影像組學分類診斷效能[19]。
本實驗還存在一些局限,如實驗的病例為單中心樣本,病例相對較少,得到的結果難免有一定的偏倚;另外,本文采用的是橫斷位病變最大層面圖像研究,對層面的選擇難免有主觀偏倚,故仍需要對本實驗進行優化改進。在本系統的下一步使用中,將會更加便捷地收集到更多患者數據,可進一步對模型進行迭代更新。
目前越來越多醫院的影像科已經部署了基于傳統的本地計算機輔助設計(Computer Aided Design,CAD)系統進行輔助診斷[20],但是在我國存在著數量龐大的基層醫院和醫療機構因資金、資源、醫療水平等各種客觀的限制而沒有購買和安裝獨立的影像CAD系統,并且這些醫院和機構往往缺乏高水平的影像科技術專家來日常維護系統[21]。針對這一普遍情況,本文通過研究骨肌系統良惡性病變診斷的影像組學方法并實現算法模型的云端化,有效輔助基層醫院、機構和影像科醫生的診斷決策。