孔艷青 湯紅平 李 曉
(1 南方醫科大學附屬深圳市婦幼保健院病理科, 518000;2 深圳市第二人民醫院功能神經科, 518028)
近年來,隨著芯片技術、深度學習及大數據等技術的蓬勃發展,AI 研究在醫學領域中的應用得到了快速的發展。人工智能在醫學影像領域的研究已廣泛涉及放射影像、超聲影像、內窺鏡影像及病理形態學圖像等多個方面[1]。AI 得以實現前提是人工智能的“視覺”,攝像頭和傳感器性能的提高,匯集更豐富的數字圖像,而后計算機通過大數據獲取全部經驗,利用深度學習的機理分析并學習,既通過多層神經網絡和神經元學習,解釋數據及進行決策。深度學習作為機器學習研究中的一個新的領域,基本原理是構建出模擬人類神經系統的多層人工神經網絡,并在大量的數據集的基礎上進行多次反復的訓練,使其能夠替代或部分替代醫師的閱圖及判斷能力。卷積神經網絡在應用于圖像模式識別方面研究成果尤為突出,可能得益于數字圖片的快速發展及數據信息豐富等因素,在計算機視覺中表現出色[2]。在基于深度學習的自然圖像分割的最優解,卷積神經網絡技術在病理圖像識別方面的AI 方面最為常用。目前AI 在病理圖像學領域已經成為熱點,特別是細胞病理學方面。機器深度學習通過多模態圖像分割與數據合成、自動分類、描述及診斷方面取得了突破性的成果,幫助病理醫師提供高質量的診斷。
人工智能在臨床病理學中的應用主要包括細胞學初篩(主要為宮頸細胞學)、形態定性分析、臨床活檢組織病理形態學診斷和免疫組織化學等輔助判斷預后等方面[3]。病理圖像數據來源于細胞學、HE 染色、特殊染色或免疫組化片等玻片,每個醫院的制片技術及染色深淺等差別,造成圖像識別系統的差別。
標注圖像是數字掃描后的圖像,其圖像與顯微鏡下的圖像有不同程度的差別,國內的病理圖像,絕大部分是二維圖像,缺少三維的立體圖像感。標注人員由鏡下圖像轉換為掃描后的圖像,在不同程度上存在認識差別,同時人工閱片標注也存在一定主觀性。圖像的差別轉換到機器學習時的數據差別,據集的標準化問題,數字圖像經不同的掃描儀,進行優化,使部分圖像過于美化,同時數據質量參差不齊,標注人員水平標準不一。標注結果在某種程度上可靠性存在問題。同時掃描后的圖片失真問題,對標注人員也產生不同程度的影響,在圖片數據集質量控制方面,需要多名經過培訓的人員醫師和算法工程師共同完成。同時對有針對爭議圖像數據集,需要討論后再確定,從而能從機制方面有效的降低因標注人員個人原因引起的隨機誤差和團隊認知水平造成的系統性錯誤。圖像數據質量本身也很重要,在圖像數據被應用于AI 算法識別或應用于標準化數據集之前,相關人員先要對AI 學習的圖像質量進行判斷。
病理組織學診斷方面存在著診斷標準的差異,如不典型增生病變與癌的分界點的分歧。如果數據來自不同的醫師可能造成判斷結果的不同,同時把數據讓計算機學習,可能造AI 系統的有效數據差別,AI判斷結果的不滿意。所以,病理診斷標準數據集對規范化、標準化的至關重要。目前已經有試驗版的病理診斷AI 在臨床驗證,效果有待于進一步評估,AI 前期進行的數據納入標準是開發性的,非統一的,導致后期算法波動比較大。研發機構逐步轉向閉環,自己制度的標準化數據集,高質量的數據標注可能將會最終影響AI 系統的性能。同時一張病理切片圖像通常含有較大可以達到數十個G,有時檢查一位患者可產生1T 的數據。如此龐大的數據量對于圖像數據的存儲及傳輸來說是需要相應的儲存空間,增加了應用的困難[4]。AI 在細胞學上主要以3D 掃描成像后,人工標注后進行學習,3D 掃描的片子并非像醫生想象的那樣清楚,對于擁擠重疊的細胞團,用3 層或5 層掃描,可能要3 個小時的時間才掃描出一張相對來說清晰的圖像。這樣對于學術研究,產品開發是可以的,但對于后期的市場應用較為困難。一張細胞學的片子在顯微鏡下幾分鐘給出診斷結果,3D 掃描要數分鐘到半個小時,是市場不樂意接受的結果。病理診斷試驗主要集中在宮頸細胞學方面,絕大部分是全數字掃片后進行判讀,僅有個別為人工智能顯微鏡在臨床場景驗證,是否符合臨床病理診斷應用場景,通過靈敏度、特異性為主要觀察指標,以盡可能客觀地反映AI產品的性能是評判人工智能系統的金標準。
病理學AI 深度學習模型是通過數字圖像識別和分類為特征進行學習的,區別在于病理醫師直接在顯微鏡下做出診斷的病變特點。同時病理診斷具有獨特的特點,一方面具有明確診斷,還有一部分為傾向或考慮性的診斷。在對AI 來說,即要有病理診斷的準確性,還要有一定的解釋推理性。神經網絡在圖片學習中主要為卷積神經網絡,具體來說為靜止圖像的分析表現出色。然而神經網絡的算法內部的具體機制及每一卷積層的物理含義并不十分明確,造成病理學AI 在不明確的病理診斷有一定的難度。神經網絡的參數設置導致某些AI 算法的病變劃分等級可能偏于保守或者激進,在模棱兩可的情況下劃歸為程度較高的病變或無病變。
病理學AI 產品,在細胞學方面主要是集中在婦科液基細胞學上,以3D 掃描的形式出現,以全玻片數字掃描技術(WSI)將計算機網絡應用于病理學應用領域,通過顯微掃描儀將玻片掃描并轉化為高分辨數字圖像,在計算機上進行后續的數字化圖像進行高精度、多視野的拼接和處理,量化病理圖像的形狀、大小和顏色等信息綜合分析。通過算法,進行學習及判讀,但對于應用抗炎藥、性激素、老年人及放療治療患者的細胞片,算法呈現出的判讀結果,無論排陰率,還是假陽性率結果,不太令人滿意。同時細胞學方面很難看到腺細胞異常的產品幾乎沒有,可能與收集數據較為困難有關,另一方面腺體大都是成團出現,掃描的片子,很難判斷和標準,造成計算機學習的困難[5]。因此一種較為完美或使病理醫師得以滿意的產品形式,需要更大規模的數據及高質量的數據進一步迭代。在組織學病理方面,AI 當前幾乎處于預演階段比較多,對于判讀癌癥的類型及分級,淋巴結轉移癌及免疫組織化學結果等,現在未見較好的產品形式出現,仍然是以WSI 的形式出現,這個設備只有少數大醫院感興趣,很難普及。還有谷歌開發的顯微鏡增強現實技術(ARM),將ARM 加載在普通的顯微鏡上,對實時成像信息進行增強、篩選和分析[6-9]。產品形式還有待進一步了解。組織病理形態學表現出僅對某一、兩種腫瘤的形式,測試結果是較高的特異度和靈敏度,而不能像醫生一樣進行類比和轉換學習。而是每種腫瘤都要一定的數據進行標注學習,對產品的開發增加了難度。
病理學AI 技術在單一的篩查細胞學診斷中表現出突出的優勢,同時在常規組織病理切片中,逐步顯示出來便捷性。由于部分縣級醫療機構病理醫師人員不足,診療水平參差不齊,許多患者不能得到及時診斷,因此錯失最佳治療時機[10]。人工智能病理學技術的發展,將對我國公共衛生事業具有重大意義。病理學AI 能夠優化醫療資源配置,提高基層病理科疾病的診斷水平,有效推動癌癥的篩查診斷工作的開展,使眾多老少邊窮地區的患者從中獲益。