晏丕松,項(xiàng)毅帆,李強(qiáng),陳睛晶,林浩添
[1.中山大學(xué)中山眼科中心,眼科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,廣州 510060;2.云智道智慧醫(yī)療科技(廣州)有限公司,廣州 510080;3.中山大學(xué)醫(yī)學(xué)院,廣州 510080]
醫(yī)學(xué)人工智能研究的發(fā)展和智能醫(yī)療模式的興起,有望改善目前醫(yī)療供需不平衡的現(xiàn)狀,提高優(yōu)質(zhì)醫(yī)療資源的覆蓋率和可及性,為建立更全面、高效、精準(zhǔn)的醫(yī)療服務(wù)模式和醫(yī)療改革提供可能。醫(yī)療大數(shù)據(jù)是醫(yī)學(xué)人工智能研究發(fā)展最重要的土壤,而數(shù)據(jù)的收集、存儲(chǔ)和管理一直是各研究項(xiàng)目的重中之重[1]。隨著數(shù)據(jù)體量不斷增加,數(shù)據(jù)的模態(tài)與屬性變得更為多樣、復(fù)雜,加上開(kāi)展多中心研究的迫切需求,建立標(biāo)準(zhǔn)化數(shù)據(jù)中心對(duì)積累高質(zhì)量的數(shù)據(jù)資源和推動(dòng)醫(yī)學(xué)人工智能的發(fā)展極為重要[2]。
人工智能技術(shù)可對(duì)人類長(zhǎng)期醫(yī)療實(shí)踐中產(chǎn)生的大量數(shù)據(jù)資料進(jìn)行更大規(guī)模和更深入的分析,使珍貴的醫(yī)療信息資源得到更充分合理的利用,并可根據(jù)數(shù)據(jù)的類型和訓(xùn)練任務(wù),建立不同應(yīng)用場(chǎng)景的人工智能醫(yī)療系統(tǒng)[3]。目前,醫(yī)學(xué)人工智能的研究發(fā)展迅速,針對(duì)不同疾病、不同任務(wù)的醫(yī)學(xué)人工智能系統(tǒng)層出不窮,實(shí)際使用方式和訪問(wèn)途徑也缺乏相關(guān)的應(yīng)用規(guī)范和統(tǒng)一管理。整合不同應(yīng)用場(chǎng)景的醫(yī)學(xué)人工智能系統(tǒng),搭建可滿足多種疾病診療需求的智能醫(yī)療云服務(wù)平臺(tái),為患者提供智能醫(yī)療服務(wù)的統(tǒng)一訪問(wèn)端口,無(wú)論是對(duì)增強(qiáng)智能醫(yī)療服務(wù)的可及性和安全性,還是提高智能醫(yī)療模式的管理效率,都具有重要意義[4]。
眼科作為醫(yī)療人工智能發(fā)展的領(lǐng)先學(xué)科,在人工智能數(shù)據(jù)中心的整合與標(biāo)準(zhǔn)化、人工智能系統(tǒng)的研發(fā)與智能服務(wù)云平臺(tái)的搭建等方面積累了豐富的實(shí)踐經(jīng)驗(yàn)和工作基礎(chǔ)[5-6]。本文以眼科為研究基礎(chǔ),對(duì)眼科數(shù)據(jù)中心和智能服務(wù)云平臺(tái)的建設(shè)經(jīng)驗(yàn)進(jìn)行總結(jié)分析,為眼科及其他醫(yī)學(xué)專科開(kāi)展人工智能研究,建立數(shù)據(jù)中心和搭建智能服務(wù)云平臺(tái)提供參考。
眼科數(shù)據(jù)中心的建設(shè)內(nèi)容,包括數(shù)據(jù)收集、錄入、整理、標(biāo)注、擴(kuò)展、備份、恢復(fù)以及分類數(shù)據(jù)中心的構(gòu)建、數(shù)據(jù)中心的管理與維護(hù)等方面的內(nèi)容,具體工作和管理流程如下。
明確數(shù)據(jù)中心的數(shù)據(jù)類型與不同類型數(shù)據(jù)的采集標(biāo)準(zhǔn)。眼科數(shù)據(jù)類型可分文字、圖像、視頻和其他4大類,所有數(shù)據(jù)應(yīng)包括性別、年齡、檢查時(shí)間等基本信息,并與住院號(hào)或門診號(hào)相關(guān)聯(lián)。
第一,文字?jǐn)?shù)據(jù)主要包括門診和住院病歷,健康體檢記錄等。第二,圖像數(shù)據(jù)主要包括裂隙燈顯微鏡、眼底相機(jī)、光學(xué)相關(guān)斷層掃描儀等眼科檢查設(shè)備產(chǎn)生的二維圖像和由計(jì)算機(jī)斷層掃描、磁共振設(shè)備等檢查設(shè)備生成的三維圖像,由不同儀器生成的圖像數(shù)據(jù)都應(yīng)該分別以統(tǒng)一的格式和屬性(包括并不限于分辨率、對(duì)比度)存儲(chǔ)在數(shù)據(jù)中心。目前多數(shù)圖像數(shù)據(jù)為DICOM格式,DICOM不僅是圖像的存儲(chǔ)格式,還是不同成像設(shè)備產(chǎn)生的不同格式數(shù)據(jù)之間相互轉(zhuǎn)換的中間形式。第三,視頻數(shù)據(jù)主要為患者檢查過(guò)程錄像,可以由avi,rmvb等格式存儲(chǔ),最好使用統(tǒng)一的格式編碼、視頻分辨率、視頻碼率和視頻幀率,同時(shí)在數(shù)據(jù)中心記錄其相應(yīng)的保存路徑。第四,其他數(shù)據(jù)包括音頻,四維影像等醫(yī)學(xué)數(shù)據(jù)。所有數(shù)據(jù)類型應(yīng)分別以統(tǒng)一的格式儲(chǔ)存,以便后期的整合與分析。
數(shù)據(jù)錄入包括紙檔記錄轉(zhuǎn)為電子記錄和直接電子記錄兩類。紙檔記錄轉(zhuǎn)為電子記錄需要逐樣本、逐項(xiàng)發(fā)現(xiàn)可能存在的記錄錯(cuò)誤,在轉(zhuǎn)錄入時(shí)應(yīng)避免出現(xiàn)誤差。直接電子記錄在檢查無(wú)誤后可將各數(shù)據(jù)結(jié)果直接轉(zhuǎn)入數(shù)據(jù)中心。
數(shù)據(jù)錄入需遵守以下原則:第一,搭建數(shù)據(jù)中心分類錄入平臺(tái),實(shí)現(xiàn)數(shù)據(jù)按疾病、按診療項(xiàng)目、按數(shù)據(jù)類型分類錄入;第二,所有錄入的數(shù)據(jù)應(yīng)該保持準(zhǔn)確,由專人對(duì)錄入數(shù)據(jù)進(jìn)行核實(shí),如發(fā)現(xiàn)錯(cuò)誤,應(yīng)重新錄入并再次檢查;第三,錄入數(shù)據(jù)的過(guò)程應(yīng)安全、保密,只能數(shù)據(jù)錄入者才有數(shù)據(jù)查看權(quán)限,特定的管理人員才可擁有數(shù)據(jù)修改權(quán)限;第四,對(duì)數(shù)據(jù)結(jié)果編碼可方便數(shù)據(jù)錄入、識(shí)別和分析。
數(shù)據(jù)整理包括數(shù)據(jù)清洗及缺失數(shù)據(jù)的處理。數(shù)據(jù)清洗是數(shù)據(jù)質(zhì)量控制的起點(diǎn),其本質(zhì)是一個(gè)發(fā)現(xiàn)問(wèn)題、解決問(wèn)題的過(guò)程。清洗過(guò)程主要關(guān)注數(shù)據(jù)質(zhì)量問(wèn)題,包括相似重復(fù)記錄、不完整記錄、邏輯錯(cuò)誤、異常數(shù)據(jù)等,并確定數(shù)據(jù)質(zhì)量問(wèn)題的性質(zhì)及位置,對(duì)數(shù)據(jù)進(jìn)行修正,并對(duì)數(shù)據(jù)修正過(guò)程歸檔保存。缺失數(shù)據(jù)的處理方法有刪除法、加權(quán)調(diào)整法、單一填補(bǔ)法、多重填補(bǔ)法,根據(jù)缺失數(shù)據(jù)的比例、類型和重要程度選擇相應(yīng)的處理方法。
數(shù)據(jù)標(biāo)注的目的是人工提取數(shù)據(jù)中所包含的信息,為后期數(shù)據(jù)分析,機(jī)器學(xué)習(xí)模型的構(gòu)建打下基礎(chǔ)。數(shù)據(jù)標(biāo)注流程及規(guī)范包括:第一,根據(jù)所需標(biāo)注的數(shù)據(jù)類型確定標(biāo)注方式,如圖像數(shù)據(jù)包括圖像分類、目標(biāo)檢測(cè)、圖像分割,從而明確標(biāo)注所需的軟件工具;第二,確定標(biāo)注層級(jí)關(guān)系,在標(biāo)注之前根據(jù)眼科學(xué)知識(shí)體系,確定不同標(biāo)注標(biāo)簽的層級(jí)關(guān)系,以網(wǎng)狀圖或者樹狀圖的形式表示;第三,確定標(biāo)注標(biāo)簽的統(tǒng)一標(biāo)準(zhǔn),制定不同眼科疾病和不同病灶的標(biāo)注模板,保證對(duì)同一眼科疾病、病灶、部位的相同標(biāo)注。
在構(gòu)建分類數(shù)據(jù)中心時(shí)需遵循以下原則:第一,所保存的數(shù)據(jù)需包含完整的樣本信息和標(biāo)簽信息,且樣本和標(biāo)簽信息一一對(duì)應(yīng);第二,所保存的數(shù)據(jù)按照疾病分類保存在相應(yīng)的目錄下,并且為方便使用,每個(gè)目錄以及目錄下的每個(gè)樣本數(shù)據(jù)都應(yīng)按照特定的方式統(tǒng)一命名,即通過(guò)當(dāng)前目錄名字或者樣本名字,可以知道目錄或樣本的詳細(xì)分類情況;第三,所保存的每個(gè)分類需要有相應(yīng)的說(shuō)明內(nèi)容,包括數(shù)據(jù)類型、數(shù)據(jù)數(shù)量、數(shù)據(jù)標(biāo)簽獲得方式等。
數(shù)據(jù)擴(kuò)展可分為存儲(chǔ)數(shù)據(jù)的擴(kuò)展和數(shù)據(jù)中心的擴(kuò)展。存儲(chǔ)數(shù)據(jù)的擴(kuò)展較為簡(jiǎn)單,只需將符合要求的數(shù)據(jù)添加到數(shù)據(jù)中心。當(dāng)數(shù)據(jù)量增加到一定程度時(shí),現(xiàn)有的計(jì)算機(jī)資源可能不足以保存和處理現(xiàn)有數(shù)據(jù),從而需要對(duì)數(shù)據(jù)中心進(jìn)行擴(kuò)展。數(shù)據(jù)中心的擴(kuò)展分為橫向擴(kuò)展和縱向擴(kuò)展,可分別通過(guò)增加服務(wù)器或升級(jí)現(xiàn)有服務(wù)器的配置實(shí)現(xiàn)。
建立一套科學(xué)高效的安全管理制度可提高數(shù)據(jù)利用效率、保障數(shù)據(jù)中心的安全。數(shù)據(jù)中心安全管理制度的內(nèi)容應(yīng)詳細(xì)規(guī)范各級(jí)操作流程、明確管理責(zé)任以及責(zé)任追究機(jī)制,防止出現(xiàn)由于工作態(tài)度、作風(fēng)等因素引發(fā)數(shù)據(jù)中心安全事故。所以,安全管理制度應(yīng)包含以下方面的內(nèi)容:第一,明確數(shù)據(jù)平臺(tái)運(yùn)行和安全管理的具體措施,如數(shù)據(jù)備份、數(shù)據(jù)加密、數(shù)據(jù)權(quán)限管理、數(shù)據(jù)傳輸安全、數(shù)據(jù)檢查等;第二,明確平臺(tái)管理責(zé)任,落實(shí)各級(jí)平臺(tái)運(yùn)行維護(hù)管理人員的責(zé)任,建立追責(zé)和處罰制度;第三,建立安全應(yīng)急預(yù)案,應(yīng)對(duì)各類突發(fā)的數(shù)據(jù)平臺(tái)安全事故。
數(shù)據(jù)備份與數(shù)據(jù)恢復(fù)是數(shù)據(jù)中心信息安全的一個(gè)重要保障。為應(yīng)對(duì)不同類型的數(shù)據(jù)丟失,多種數(shù)據(jù)備份策略極為重要。備份方式分為完全備份、增量備份、差分備份、按需備份等,可根據(jù)數(shù)據(jù)中心的數(shù)據(jù)情況和備份內(nèi)容,按需采取多種策略搭配的備份方式。
基于眼科數(shù)據(jù)中心積累的數(shù)據(jù)資源,可以研發(fā)一系列眼科人工智能預(yù)測(cè)、篩查、診斷、治療、隨訪系統(tǒng)并進(jìn)行臨床應(yīng)用。將系統(tǒng)部署到服務(wù)云平臺(tái),開(kāi)放給患者、醫(yī)生和醫(yī)療單位,通過(guò)互聯(lián)網(wǎng)進(jìn)行訪問(wèn)的端口,提供相應(yīng)的醫(yī)療服務(wù)。對(duì)提高眼科人工智能系統(tǒng)的服務(wù)效率、可及性、推廣眼科人工智能產(chǎn)品都具有重要意義[4,7]。
智能服務(wù)云平臺(tái)的建設(shè)包括一般智能服務(wù)云平臺(tái)的建設(shè)和基于互聯(lián)網(wǎng)醫(yī)院的智能服務(wù)云平臺(tái)的建設(shè)。一般智能服務(wù)云平臺(tái)的建設(shè)不需要依賴于實(shí)體醫(yī)療機(jī)構(gòu)及互聯(lián)網(wǎng)醫(yī)院平臺(tái),是比較常見(jiàn)的智能云服務(wù)形式。智能服務(wù)云平臺(tái)的系統(tǒng)架構(gòu)可如圖1所示。1)用戶層:用戶包含但不限于社區(qū)服務(wù)中心等醫(yī)療單位醫(yī)務(wù)人員、幼兒園和中小學(xué)等學(xué)校單位醫(yī)務(wù)人員、后臺(tái)管理人員、大眾用戶(家長(zhǎng)/學(xué)生)。2)展現(xiàn)層:根據(jù)不同的使用場(chǎng)景及用戶需求,可分為手機(jī)APP、平板APP、電腦PC、微信公眾號(hào)不同的應(yīng)用形式。3)應(yīng)用層:各系統(tǒng)功能模塊,包括診療系統(tǒng)、健康管理與服務(wù)系統(tǒng)、數(shù)據(jù)分析管理系統(tǒng)、后臺(tái)管理系統(tǒng)。可實(shí)現(xiàn)檔案管理、在線門診、遠(yuǎn)程問(wèn)診、一鍵轉(zhuǎn)診、健康教育、健康計(jì)劃、數(shù)據(jù)分析等功能。4)應(yīng)用支撐層是基于分布式多層構(gòu)架和組件技術(shù)構(gòu)建,具有跨領(lǐng)域和通用性的特質(zhì)。兼顧穩(wěn)定性、伸縮性、安全性以及效率等方面的要求,保證系統(tǒng)完整性。做到統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一交換、統(tǒng)一管理、統(tǒng)一認(rèn)證、互聯(lián)互通和資源共享。應(yīng)用支撐層所提供的服務(wù)包括注冊(cè)服務(wù)、病歷調(diào)閱服務(wù)、影像查看服務(wù)等。5)數(shù)據(jù)資源層主要是實(shí)現(xiàn)各系統(tǒng)的數(shù)據(jù)存儲(chǔ),需要解決數(shù)據(jù)存儲(chǔ)的結(jié)構(gòu)、模型、內(nèi)容、數(shù)據(jù)庫(kù)管理軟件的選型等。包括管理數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、多媒體數(shù)據(jù)等。6)物理層主要指與系統(tǒng)對(duì)接的檢驗(yàn)檢測(cè)設(shè)備,通過(guò)與系統(tǒng)間的對(duì)接,實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)傳輸。
眼科智能服務(wù)云平臺(tái)的部署可分為3級(jí):家庭,學(xué)校和社區(qū),基層和三甲醫(yī)院等醫(yī)療單位(圖2)。通過(guò)接口對(duì)接、網(wǎng)絡(luò)傳輸?shù)确绞剑瑢?shí)現(xiàn)各系統(tǒng)之間的數(shù)據(jù)互通,從而實(shí)現(xiàn)“就診者-基層醫(yī)療機(jī)構(gòu)-上級(jí)專家醫(yī)院”之間的業(yè)務(wù)協(xié)作和資源共享。并通過(guò)“診療設(shè)備-軟件系統(tǒng)-數(shù)據(jù)中心”之間的互聯(lián)互通,實(shí)現(xiàn)數(shù)據(jù)的管理和分析等需求。
該級(jí)智能服務(wù)云平臺(tái)的建設(shè)一方面要滿足家庭、學(xué)校、社區(qū)等場(chǎng)景下患者使用眼科智能診療系統(tǒng)的醫(yī)療需求,另一方面要滿足醫(yī)生可對(duì)智能診療系統(tǒng)的診療結(jié)果進(jìn)行復(fù)核的工作需求。患者端的智能服務(wù)云平臺(tái)的建設(shè)形式包括實(shí)現(xiàn)基于移動(dòng)終端瀏覽器、小程序、終端軟件等智能診療系統(tǒng)的訪問(wèn)和應(yīng)用[8]。患者在手機(jī)、平板等移動(dòng)終端連接到智能服務(wù)云平臺(tái),輸入年齡、性別等就診信息,對(duì)平臺(tái)上不同診療系統(tǒng)的功能進(jìn)行選擇和使用。患者可以根據(jù)個(gè)人就診需求,選擇相應(yīng)的功能并在智能系統(tǒng)的指導(dǎo)下輸入文字信息并上傳相應(yīng)圖片信息,即可獲得相應(yīng)的診斷結(jié)果和醫(yī)療建議。醫(yī)生工作端可以24 h對(duì)人工智能診療系統(tǒng)的診斷結(jié)果和診療建議進(jìn)行復(fù)核,保證云平臺(tái)服務(wù)的質(zhì)量和效率。

圖1 眼科智能服務(wù)云平臺(tái)的系統(tǒng)架構(gòu)Figure 1 System structure of ophthalmic intelligent service cloud platform

圖2 眼科智能服務(wù)云平臺(tái)的應(yīng)用架構(gòu)Figure 2 Application structure of ophthalmic intelligent service cloud platform
該級(jí)智能服務(wù)云平臺(tái)的建設(shè)主要滿足社區(qū)和基層醫(yī)院為患者提供眼科相關(guān)智能診療服務(wù)的需求。部分基層和社區(qū)醫(yī)院缺乏相應(yīng)的眼科檢查設(shè)備和眼科醫(yī)生,智能服務(wù)云平臺(tái)可以將眼科醫(yī)療資源下沉到基層醫(yī)院,建立適用于社區(qū)和基層醫(yī)院的眼科智能服務(wù)模式[9]。基層和社區(qū)醫(yī)院的患者和醫(yī)生可以將患者信息、檢查圖片、報(bào)告等上傳到智能服務(wù)云平臺(tái),獲得相應(yīng)的診療結(jié)果和醫(yī)療建議,輔助基層和社區(qū)醫(yī)院醫(yī)生開(kāi)展診療活動(dòng),將優(yōu)質(zhì)眼科醫(yī)療資源賦能到基層和社區(qū)醫(yī)院。綜合醫(yī)院及專科醫(yī)院的醫(yī)生專家可對(duì)基層和社區(qū)醫(yī)院的智能診療過(guò)程進(jìn)一步復(fù)核與確認(rèn),保證其決策的準(zhǔn)確性和安全性(圖3)。

圖3 社區(qū)及基層醫(yī)院患者診療流程Figure 3 Diagnosis and treatment process of patients in communities and primary hospitals
該級(jí)智能服務(wù)云平臺(tái)的建設(shè)主要解決綜合醫(yī)院和專科醫(yī)院眼科患者眾多,眼科醫(yī)生的工作效率與患者醫(yī)療需求差距較大的問(wèn)題[10]。將智能服務(wù)云平臺(tái)上相關(guān)的眼病診療系統(tǒng)與相關(guān)眼科圖像采集設(shè)備和成像系統(tǒng)相連接,患者在接受相應(yīng)的眼科檢查后,可即刻在移動(dòng)終端查詢?cè)\斷結(jié)果和治療建議,打通了部分檢查環(huán)節(jié)和診療咨詢環(huán)節(jié)之間存在的空間和時(shí)間壁壘,減少了醫(yī)生的工作負(fù)擔(dān),提高了患者的就醫(yī)效率和就診體驗(yàn)[11]。此外,基于實(shí)體綜合醫(yī)院和專科醫(yī)院的部署互聯(lián)網(wǎng)醫(yī)院智能服務(wù)云平臺(tái),診療流程符合互聯(lián)網(wǎng)醫(yī)院的管理規(guī)范,以進(jìn)一步提高智能服務(wù)云平臺(tái)的安全性和準(zhǔn)確性。
現(xiàn)階段眼科數(shù)據(jù)中心和智能服務(wù)云平臺(tái)的建設(shè)存在兩大難點(diǎn):1)各大醫(yī)院眼科數(shù)據(jù)中心建設(shè)關(guān)于數(shù)據(jù)整理及標(biāo)注缺乏統(tǒng)一標(biāo)準(zhǔn),各個(gè)眼科數(shù)據(jù)中心無(wú)法實(shí)現(xiàn)數(shù)據(jù)互通和資源共享,導(dǎo)致醫(yī)院間的“信息孤島”;2)優(yōu)化智能服務(wù)云平臺(tái)建設(shè)框架,整合多維度眼科數(shù)據(jù)集,搭建多種眼病通用診斷的智能服務(wù)云平臺(tái)。
眼科數(shù)據(jù)中心和智能服務(wù)云平臺(tái)的建設(shè)有助于實(shí)現(xiàn)醫(yī)療數(shù)據(jù)資源的充分利用,開(kāi)發(fā)出高準(zhǔn)確性和普適性的醫(yī)學(xué)人工智能系統(tǒng),并對(duì)智能系統(tǒng)進(jìn)行統(tǒng)一整合、管理與推廣,保證智能平臺(tái)提供的醫(yī)療服務(wù)的準(zhǔn)確性和安全性[12]。該模式可以在眼科專科以外的其他醫(yī)療專科進(jìn)行推廣和應(yīng)用,對(duì)于促進(jìn)醫(yī)學(xué)人工智能系統(tǒng)的研發(fā)與普及,推動(dòng)醫(yī)療模式的智能化改革,具有重要意義[13]。