成靜
(南京醫(yī)科大學(xué)附屬淮安第一醫(yī)院,江蘇淮安 223300)
癌癥是威脅全球健康的主要公共問題之一,近年來癌癥治療負(fù)擔(dān)在全球呈持續(xù)增長趨勢(shì)。我國癌癥發(fā)病率和死亡率均居首位,對(duì)人民健康構(gòu)成巨大威脅。我國癌癥死亡人數(shù)呈逐年上升趨勢(shì),治療費(fèi)用遠(yuǎn)高于其他疾病,嚴(yán)重影響國民經(jīng)濟(jì)、社會(huì)發(fā)展和人民健康。在癌癥診治整體邁向個(gè)體化和精準(zhǔn)化的多學(xué)科綜合治療新時(shí)代的過程中,癌癥規(guī)范化診療的推進(jìn)已成為提升我國整體癌癥治療水平與治療效果的關(guān)鍵[1]。
為貫徹落實(shí)《中共中央國務(wù)院關(guān)于深化醫(yī)療保障制度改革的意見》《國務(wù)院辦公廳關(guān)于印發(fā)深化醫(yī)藥衛(wèi)生體制改革2021年重點(diǎn)工作任務(wù)的通知》(國辦發(fā)〔2021〕20號(hào))等文件要求,堅(jiān)持以人民健康為中心,強(qiáng)化醫(yī)療、醫(yī)保、醫(yī)藥三醫(yī)聯(lián)動(dòng),國家癌癥中心在國家衛(wèi)生健康委及國家醫(yī)療保障局指導(dǎo)下,開展各級(jí)醫(yī)院抗腫瘤藥物上報(bào)工作,依據(jù)非常寶貴的腫瘤大數(shù)據(jù)資源,可以充分利用真實(shí)世界證據(jù),推動(dòng)規(guī)范診療再上新臺(tái)階,共同促進(jìn)我國癌癥診療的同質(zhì)化、均質(zhì)化發(fā)展。全面提高癌癥診療質(zhì)量,規(guī)范癌癥診療合理用藥,保障癌癥診療安全,提高癌癥治愈率,改善癌癥患者的生存質(zhì)量具有深遠(yuǎn)意義[2]。
Kettle 中文名叫水壺,意指將不同類型數(shù)據(jù)放到一個(gè)壺里[3],最后能按需要的格式流出。Kettle是一個(gè)ETL工具集(Extract-Transform-Load,數(shù)據(jù)抽取、轉(zhuǎn)換、裝載),允許用戶管理來自不同數(shù)據(jù)庫的數(shù)據(jù)。Kettle中主要包含兩部分:Transformation(轉(zhuǎn)換)和Job(作業(yè)),Transformation 完成數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,Job 實(shí)現(xiàn)對(duì)工作流的控制。通過圖形界面設(shè)計(jì)實(shí)現(xiàn)做什么業(yè)務(wù),并在Job 下的start 模塊,有一個(gè)定時(shí)功能,可以每日、每周等計(jì)劃方式進(jìn)行定時(shí)執(zhí)行。在開發(fā)、測(cè)試和調(diào)試階段,作業(yè)和轉(zhuǎn)換可以在圖形界面里執(zhí)行,部署生產(chǎn)階段一般需要通過命令行執(zhí)行,需要把命令行放到Shell 腳本中,并定時(shí)調(diào)度這個(gè)腳本。在開發(fā)完成后,Kitchen 和Pan 命令行工具用于實(shí)際的生產(chǎn)環(huán)境。Kitchen和Pan工具是Kettle的命令行執(zhí)行程序,Kitchen用于執(zhí)行作業(yè),Pan用于執(zhí)行轉(zhuǎn)換。采用拖拽組件、連線、配置的方式來構(gòu)建數(shù)據(jù)管道,通過超過200個(gè)不同的組件,用戶可以在不編寫一句代碼就能輕松完成對(duì)數(shù)據(jù)源讀取,對(duì)多源數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換、關(guān)聯(lián)、建模、統(tǒng)計(jì)、計(jì)算,并輸出數(shù)據(jù)結(jié)果。極大程度地降低開發(fā)技術(shù)門檻和有效降低開發(fā)和維護(hù)成本。
由于上報(bào)數(shù)據(jù)涉及多個(gè)業(yè)務(wù)系統(tǒng),如醫(yī)院信息系統(tǒng)、電子病歷系統(tǒng)、實(shí)驗(yàn)室信息系統(tǒng)、醫(yī)學(xué)圖像信息系統(tǒng)、病理標(biāo)本管理系統(tǒng)、病案信息系統(tǒng)等,各個(gè)業(yè)務(wù)系統(tǒng)又來自不同生產(chǎn)廠商,每個(gè)生產(chǎn)廠商又使用的是不同類型的數(shù)據(jù)庫,就需要將數(shù)據(jù)統(tǒng)一抽取的前置服務(wù)器,再統(tǒng)一上傳國家抗腫瘤藥物臨床應(yīng)用監(jiān)測(cè)網(wǎng)。
前置服務(wù)器部署包括環(huán)境部署:安裝JDK--Java語言的軟件開發(fā)工具包,設(shè)置環(huán)境變量。以及資源庫配置:配置資源庫信息,包括數(shù)據(jù)庫、主機(jī)名稱、數(shù)據(jù)庫名稱、端口號(hào)、賬號(hào)、密碼等。
Kettle 主要包含兩大部分:轉(zhuǎn)換transform:完全針對(duì)數(shù)據(jù)的基礎(chǔ)進(jìn)行轉(zhuǎn)換、作業(yè)job:整個(gè)工作流的控制(如圖1所示)。

圖1 transform工作流
1)創(chuàng)建轉(zhuǎn)換transform
先新建轉(zhuǎn)換,更改轉(zhuǎn)換名稱,選擇轉(zhuǎn)換歸屬。再建立表輸入輸出:在組件組-輸入中找到組件-表輸入,選擇數(shù)據(jù)庫連接(數(shù)據(jù)源),填入相應(yīng)SQL 語句。接著建立表輸出:在組件組-輸出中找到組件-表輸出,建立表輸入和表輸出的連接,選擇數(shù)據(jù)庫連接(數(shù)據(jù)倉庫),錄入目標(biāo)表名,指定數(shù)據(jù)庫字段,獲取相應(yīng)字段,最后執(zhí)行SQL即完成建表。建立清理SQL:在組件組-腳本中找到組件-執(zhí)行SQL腳本,選擇數(shù)據(jù)庫連接(數(shù)據(jù)倉庫),填寫相應(yīng)SQL 語句,建立與表輸入的關(guān)系即可。最后測(cè)試轉(zhuǎn)換是否能正常工作[4]。
2)創(chuàng)建作業(yè)job
一個(gè)轉(zhuǎn)換就是一個(gè)ETL 的過程,而作業(yè)則是多個(gè)轉(zhuǎn)換、作業(yè)的集合,在作業(yè)中可以對(duì)轉(zhuǎn)換或作業(yè)進(jìn)行調(diào)度、定時(shí)任務(wù)等。當(dāng)數(shù)據(jù)抽取需要多步驟時(shí),需要分成多個(gè)轉(zhuǎn)換,再集成到一個(gè)作業(yè)里順序擺放,然后執(zhí)行即可。作業(yè)job 是對(duì)整個(gè)工作流的控制,可以定時(shí),一個(gè)作業(yè)可以包含多個(gè)作業(yè)項(xiàng),轉(zhuǎn)換transform 只是其中一個(gè)作業(yè)項(xiàng)。
本次設(shè)計(jì)需要將HIS 系統(tǒng)中病人基本信息數(shù)據(jù)、費(fèi)用數(shù)據(jù)、結(jié)算數(shù)據(jù)等,醫(yī)生站系統(tǒng)中醫(yī)囑數(shù)據(jù)、病歷數(shù)據(jù)、診斷數(shù)據(jù)等,實(shí)驗(yàn)室信息系統(tǒng)中檢驗(yàn)結(jié)果數(shù)據(jù),醫(yī)學(xué)影像系統(tǒng)中檢查結(jié)果數(shù)據(jù),病理系統(tǒng)中病理檢查結(jié)果,病案管理系統(tǒng)中病案首頁相關(guān)數(shù)據(jù)等各系統(tǒng)中數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換再上傳至全國抗腫瘤藥物臨床應(yīng)用監(jiān)測(cè)網(wǎng)。共涉及SQL Server、Oracle Database、MySQL三種類型數(shù)據(jù)庫,21張表(如圖2所示)。

圖2 最終實(shí)現(xiàn)效果
1)上報(bào)患者范圍:根據(jù)患者診斷來判斷是否屬于上報(bào)范圍。通過門(急)診診斷和住院診斷中的診斷信息篩選出惡性腫瘤患者相關(guān)數(shù)據(jù)進(jìn)行上報(bào)。
2)上報(bào)時(shí)間范圍:醫(yī)院需要每月上報(bào)門診患者、住院患者的醫(yī)療數(shù)據(jù)。住院患者數(shù)據(jù)按出院時(shí)間進(jìn)行篩選后上報(bào)、門(急)診患者數(shù)據(jù)按就診時(shí)間進(jìn)行篩選后上報(bào)(如圖3所示)。

圖3 上報(bào)時(shí)間范圍
3)上報(bào)內(nèi)容范圍:患者的門診、住院、診斷、治療、檢查、檢驗(yàn)、隨訪等相關(guān)數(shù)據(jù)。
1)數(shù)據(jù)關(guān)聯(lián)關(guān)系
醫(yī)院上報(bào)數(shù)據(jù)實(shí)現(xiàn)2個(gè)維度的關(guān)聯(lián):患者維度、單次就診維度。患者維度:住院患者信息表、門診患者信息表,以“患者ID”與患者就診基本信息表關(guān)聯(lián)。患者ID 是患者在本院信息系統(tǒng)內(nèi)的唯一標(biāo)識(shí),其他上報(bào)數(shù)據(jù)表中患者ID 均應(yīng)與本表患者ID 一致。單次就診維度:住院信息相關(guān)表,以“單次就診唯一標(biāo)識(shí)號(hào)”與住院患者信息表關(guān)聯(lián)。單次就診唯一標(biāo)識(shí)號(hào)是患者在本院的單次就診唯一標(biāo)識(shí)。除了單次就診唯一標(biāo)識(shí)號(hào),還可以通過病案號(hào)、住院號(hào)、住院次數(shù)等字段實(shí)現(xiàn)關(guān)聯(lián)[5]。
2)數(shù)據(jù)質(zhì)量
通過數(shù)據(jù)量、關(guān)聯(lián)性、數(shù)據(jù)內(nèi)容正確性,分別驗(yàn)證上報(bào)患者數(shù)據(jù)。包括:字段級(jí)檢查如時(shí)間類型字段是不是合法的時(shí)間范圍檢查、非空校驗(yàn)等、單表級(jí)檢查如患者存在手術(shù)記錄,則手術(shù)日期為必須項(xiàng)等、跨表級(jí)檢查如:HIS 系統(tǒng)唯一號(hào)在門診、住院表格中的關(guān)聯(lián)度,檢查病人的唯一號(hào)在基礎(chǔ)信息表中必須存在等,確保數(shù)據(jù)評(píng)估的有效性。
傳統(tǒng)的數(shù)據(jù)上報(bào)方法,是通過醫(yī)院HIS、LIS、PACS等業(yè)務(wù)系統(tǒng)報(bào)表查詢功能或者使用SQL數(shù)據(jù)庫軟件等方法將數(shù)據(jù)查詢、導(dǎo)出,整理匯總后上報(bào)至國家抗腫瘤藥物臨床應(yīng)用監(jiān)測(cè)網(wǎng),由于各業(yè)務(wù)系統(tǒng)相互獨(dú)立,人工查詢統(tǒng)計(jì)匯總,發(fā)生差錯(cuò)不可避免,必須仔細(xì)核對(duì),并經(jīng)業(yè)務(wù)部門確認(rèn)數(shù)據(jù),浪費(fèi)人力資源[6]。抗腫瘤藥物應(yīng)用監(jiān)測(cè)數(shù)據(jù)上報(bào)系統(tǒng)應(yīng)用實(shí)施后,解決了上述難題。該系統(tǒng)通過自動(dòng)采集數(shù)據(jù)、統(tǒng)計(jì)匯總形成報(bào)表,最終完成上報(bào),全過程均由計(jì)算機(jī)完成,無須人工參與,降低了人力資源成本。同時(shí),避免了人工統(tǒng)計(jì)所不可避免的差錯(cuò),有效防止誤報(bào)、漏報(bào),被國家抗腫瘤藥物臨床應(yīng)用監(jiān)測(cè)網(wǎng)評(píng)定為A級(jí)。
持續(xù)上報(bào)抗腫瘤藥物在我院臨床應(yīng)用監(jiān)測(cè)情況,加強(qiáng)腫瘤病人用藥管理,規(guī)范醫(yī)院抗腫瘤藥物在臨床的應(yīng)用,積極探索醫(yī)院重點(diǎn)監(jiān)控項(xiàng)目,建立預(yù)警制度,借助國家抗腫瘤藥物臨床應(yīng)用監(jiān)測(cè)網(wǎng)的數(shù)據(jù)分析功能,實(shí)現(xiàn)診療過程中抗腫瘤藥物的全流程管理。依托國家癌癥中心腫瘤信息數(shù)據(jù)庫,進(jìn)行腫瘤規(guī)范化診療行為綜合評(píng)價(jià),分析不合理診療行為,規(guī)范患者全周期治療過程中的檢驗(yàn)檢查[5]。在腫瘤診療服務(wù)領(lǐng)域加強(qiáng)“互聯(lián)網(wǎng)+醫(yī)療健康”建設(shè),增強(qiáng)優(yōu)質(zhì)服務(wù)的可及性。為腫瘤規(guī)范化診療管理相關(guān)工作提供科學(xué)數(shù)據(jù)依據(jù),積極推行“單病種,多學(xué)科”綜合治療理念,制定MDT診療標(biāo)準(zhǔn)化操作流程,提升參與MDT 腫瘤患者比例,持續(xù)優(yōu)化腫瘤診療模式,提高科學(xué)決策水平。