999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)治理的先心病專病數(shù)據(jù)庫建設(shè)研究*

2022-03-25 11:19:24袁駿毅潘常青戴錦杰
中國衛(wèi)生質(zhì)量管理 2022年2期
關(guān)鍵詞:數(shù)據(jù)庫

——袁駿毅 潘常青 戴錦杰 李 榕 沈 蘭

先天性心臟病(以下簡稱“先心病”)是指胚胎發(fā)育異常導(dǎo)致的先天心臟缺陷性疾病,發(fā)病率約占新生兒的7‰~10‰[1-2]。國內(nèi)外已有醫(yī)院展開先心病治療影響因素的研究,建立風(fēng)險評估及治療策略模型,以減少術(shù)后并發(fā)癥[3]。

近年來,醫(yī)院信息化逐漸側(cè)重臨床,但業(yè)務(wù)軟件繁多且彼此獨立,科研數(shù)據(jù)仍高度依賴人工收集,費時費力且效率不高[4]。Mayer JE等[5]指出,通過對疾病數(shù)據(jù)智能采集和挖掘,有利于分析不同心電結(jié)果和臨床癥狀對先心病術(shù)后干預(yù)的效果。本研究以上海市胸科醫(yī)院的先心病專病數(shù)據(jù)庫(以下簡稱“專病庫”)為研究對象,解析專病庫架構(gòu)設(shè)計和運行方式,以期更好地支撐先心病的臨床研究。同時,為其他醫(yī)療機(jī)構(gòu)醫(yī)療數(shù)據(jù)的深度應(yīng)用提供參考。

1 專病庫數(shù)據(jù)集設(shè)計

專病庫的目標(biāo)是滿足多層面科研需求,數(shù)據(jù)集的飽和度決定了數(shù)據(jù)分析的支撐力度。項目啟動階段,臨床專家、科研人員以及信息工程師組成團(tuán)隊,討論專項數(shù)據(jù)采集范圍。數(shù)據(jù)集的設(shè)計借鑒了美國胸外科醫(yī)師學(xué)會(Society of Thoracic Surgeons, STS)成人心臟外科數(shù)據(jù)庫、兒童心臟網(wǎng)絡(luò)(Pediatric Heart Network, PHN)數(shù)據(jù)庫等,參考了國際疾病分類第10版、HL7ChinaCDA等10余項規(guī)范[6]。數(shù)據(jù)集共分為8個緯度,下分65個域,內(nèi)含781個數(shù)據(jù)單元,構(gòu)成了專病庫“緯度-域-數(shù)據(jù)單元”的物理存儲以及統(tǒng)計分析層次結(jié)構(gòu)。從數(shù)據(jù)提取可及性角度出發(fā),梳理數(shù)據(jù)單元采集點,如圖1所示。每個數(shù)據(jù)單元均支持復(fù)合數(shù)值存儲結(jié)構(gòu),擁有編碼、名稱、緯度標(biāo)簽、域標(biāo)簽、數(shù)值、參考值、提取源等12項屬性,確保可追溯性和標(biāo)識度[7]。

2 系統(tǒng)架構(gòu)

專病庫在醫(yī)院臨床數(shù)據(jù)中心(Clinical Data Repository,CDR)基礎(chǔ)上,通過后結(jié)構(gòu)化、脫敏安全和質(zhì)控管理等數(shù)據(jù)治理過程,整合成病種數(shù)據(jù)集。采用面向服務(wù)體系結(jié)構(gòu)的分布式網(wǎng)絡(luò)架構(gòu),1臺數(shù)據(jù)庫服務(wù)器存儲數(shù)據(jù),兩臺GPU治理服務(wù)器用于后結(jié)構(gòu)化等高通量處理,4臺應(yīng)用服務(wù)器提供單病種分析等擴(kuò)展應(yīng)用支持。系統(tǒng)架構(gòu)如圖2所示。

圖1 數(shù)據(jù)集采集源分析

圖2 系統(tǒng)架構(gòu)

3 數(shù)據(jù)治理環(huán)節(jié)

3.1 數(shù)據(jù)匯集

病種數(shù)據(jù)集的源數(shù)據(jù)來源于多個異構(gòu)業(yè)務(wù)軟件,CDR的數(shù)據(jù)供給能力尤為重要。該院在2018年開展CDR建設(shè),以患者主索引(Enterprise Master Patient Index,EMPI)集成服務(wù)為主線,匯集診療流程相關(guān)數(shù)據(jù)。如圖3所示,CDR采用訂閱發(fā)布技術(shù),建立對應(yīng)EMR、EDSS等生產(chǎn)庫的操作型數(shù)據(jù)存儲庫(Operational Data Store,ODS),通過變化數(shù)據(jù)捕捉(Change Data Capture,CDC)技術(shù),實時獲取ODS的日志變更,使用數(shù)據(jù)庫集成服務(wù)(SQL Server Integration Services,SSIS)工具, CDC將日志解析成增量待處理數(shù)據(jù)。由于業(yè)務(wù)軟件的代碼定義未必相同,依托于CDR的主數(shù)據(jù)管理(Master Data Management,MDM),以MDM的疾病代碼、藥品字典等醫(yī)學(xué)術(shù)語映射集,進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)換,標(biāo)簽數(shù)據(jù)的來源。EMPI提供了患者身份標(biāo)識的主鍵服務(wù),關(guān)聯(lián)相同患者數(shù)據(jù),根據(jù)交叉關(guān)系實施驗證,判斷匯集過程是否發(fā)生遺漏。遵循《電子病歷基本架構(gòu)與數(shù)據(jù)標(biāo)準(zhǔn)》的規(guī)范,如ADT.A01代表入出轉(zhuǎn)信息,以標(biāo)準(zhǔn)截面建立cube[8]。支持孤島系統(tǒng)及試驗數(shù)據(jù)的導(dǎo)入,確保醫(yī)療數(shù)據(jù)的全量收納。截止2020年底,CDR共對接32個業(yè)務(wù)應(yīng)用軟件,數(shù)據(jù)倉庫容量16T,以年9.8%的速率增長。在針對新建應(yīng)用的服務(wù)能力方面,建立了82萬個索引,78個標(biāo)準(zhǔn)字典,502套字典映射,近1.2億條內(nèi)外交互日志,為醫(yī)院建設(shè)專病庫、學(xué)科評估等新系統(tǒng)提供了有效的數(shù)據(jù)供給。

3.2 后結(jié)構(gòu)化

與藥品醫(yī)囑等已經(jīng)結(jié)構(gòu)化的數(shù)據(jù)不同,病史文書通常包含大量非結(jié)構(gòu)化的自由文本,后結(jié)構(gòu)化屬于數(shù)據(jù)治理的深度步驟,精度影響到海量病歷的利用程度。對于EMR的心電報告、既往史等文本,需要通過自然語言處理(Natural Language Processing,NLP)和知識圖譜的后結(jié)構(gòu)化治理,轉(zhuǎn)化成符合標(biāo)準(zhǔn)結(jié)構(gòu)化數(shù)據(jù)項的字段和鍵值。系統(tǒng)建立了主動學(xué)習(xí)、遷移學(xué)習(xí)等機(jī)器學(xué)習(xí)的NLP處理流程,進(jìn)行上下文嵌入的文本智能解析,實現(xiàn)命名實體、醫(yī)學(xué)分詞的提取,同步處理詞義消歧和時序解析。

深度學(xué)習(xí)算法采用了條件隨機(jī)場(Conditional Random Field,CRF)和雙向長短時記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory,BiLSTM)的疊加算法,以CRF的輸出層作為BiLSTM的輸入層,有效解決常規(guī)NLP效果不佳的情況[9],信息抽取的識別精度超過85%,識別覆蓋率占文本可轉(zhuǎn)換內(nèi)容的92%。病史文本轉(zhuǎn)化后,增加了時序邏輯及數(shù)據(jù)耦合的判讀范圍,如術(shù)中抗生素、術(shù)后病程錄等交叉邏輯,基于知識圖譜的醫(yī)學(xué)分支邏輯,利用決策樹、邏輯回歸等AI算法,構(gòu)建出分類合并最優(yōu)模型,以信息增益的特征值對邏輯節(jié)點進(jìn)行時間耦合度分析,使診療過程數(shù)據(jù)處于連續(xù)的時序排序。

圖3 CDR數(shù)據(jù)匯集過程

圖4 脫敏安全體系

圖5 質(zhì)控管理

3.3 脫敏安全

為保證隱私數(shù)據(jù)的存儲和傳輸安全,處理過程采用脫敏技術(shù)手段。隨著移動物聯(lián)網(wǎng)的推廣,患者個人隱私信息面臨較大泄露風(fēng)險。根據(jù)上海市衛(wèi)生健康委員會有關(guān)規(guī)定,存儲患者身份及生物信息的系統(tǒng)必須符合公安部《安全等級保護(hù)制度2.0標(biāo)準(zhǔn)》要求[10]。

如圖4所示,敏感信息定義方面,除了姓名等明顯的隱私項,還存在著表面無關(guān)聯(lián)的、內(nèi)含風(fēng)險的數(shù)據(jù),若未納入敏感等級,一旦泄露也會帶來損失。采用關(guān)聯(lián)規(guī)則分析技術(shù)對敏感項進(jìn)行界定,基于關(guān)聯(lián)信息挖掘算法判定關(guān)聯(lián)因子的可靠性程度,窮舉算出敏感規(guī)則的置信度區(qū)間,確保在不損失數(shù)據(jù)價值的條件下更好地確定范圍。脫敏處理方面,去隱私化過程采用加密算法,利用對稱算法DES加密隱私項,EMPI等關(guān)系型外鍵采用不可逆算法MD5加密,并留有隱藏轉(zhuǎn)換的目錄對照。后臺管理方面,結(jié)合審計監(jiān)察需求,使用辦公審批流程監(jiān)督數(shù)據(jù)申請,保證審計日志的可靠性,定期更換加密算法的動態(tài)密鑰,所有加密和傳輸均記錄密鑰版本號,以便出現(xiàn)問題時回溯。

3.4 質(zhì)控管理

數(shù)據(jù)經(jīng)過前序加工后,依然存在如檢查醫(yī)囑無報告等空值情況,或者如出院小結(jié)和病案首頁診斷不一致等邏輯互斥現(xiàn)象[11],因此需進(jìn)行質(zhì)控處理(圖5)。針對預(yù)入庫數(shù)據(jù),一是采用AI自動全面質(zhì)檢方法,以EMPI和標(biāo)準(zhǔn)目錄梳理患者數(shù)據(jù),基于質(zhì)控規(guī)則庫的參考標(biāo)準(zhǔn),檢測關(guān)鍵指標(biāo)的單變量約束,實施孤立數(shù)據(jù)分析和上下文聯(lián)動檢驗,捕捉關(guān)系完整性、臨床變量依賴性等情況。二是采用人工校驗進(jìn)行復(fù)核。質(zhì)控人員按比例隨機(jī)抽取患者信息,打開業(yè)務(wù)軟件中的病歷,判斷治理過程是否存在偏差。根據(jù)自動和人工的檢測結(jié)果,生成質(zhì)量測評報告,實現(xiàn)質(zhì)控統(tǒng)計指標(biāo)的血緣追蹤,監(jiān)測診療業(yè)務(wù)和臨床路徑的變異情況,形成動態(tài)提示的深度質(zhì)控面板。測評報告中詳細(xì)列舉發(fā)現(xiàn)的具體問題,原生數(shù)據(jù)問題反饋信息部門,追溯業(yè)務(wù)軟件,提高采集準(zhǔn)確性;違規(guī)性數(shù)據(jù)問題反饋醫(yī)務(wù)部門,制定新的邏輯規(guī)則,規(guī)避再次發(fā)生。待問題糾正且達(dá)到測度評價分值要求時,終態(tài)數(shù)據(jù)才能被判定為合格,數(shù)據(jù)正式入庫。

4 建設(shè)成效

4.1 專病庫運行情況

醫(yī)院的專病庫已導(dǎo)入既往數(shù)據(jù),進(jìn)入了常態(tài)化運營階段。專病庫目前收納了自2015年1月—5月的2 384例患者資料,男性1 026例,女性1 358例。平均年齡(35.2±25.0)歲,其中,18歲以上成人1 687例,占比70.76%,符合醫(yī)院診治成人心臟病為主的年齡分布特征;外省籍患者1 722例,占比72.23%,表明醫(yī)院具有鮮明的專科特色和輻射影響力。

4.2 數(shù)據(jù)入庫與提取

一是建立了日常的新增歸檔數(shù)據(jù)入庫機(jī)制。每月15日專病庫自動從CDR提取并治理上月的出院先心病患者資料,臨床研究中心在質(zhì)量測評報告上簽字后入庫。二是制定了完整的科研數(shù)據(jù)提取流程。研究者在院內(nèi)辦公平臺發(fā)起課題數(shù)據(jù)申請,經(jīng)臨床研究中心、科教部、分管院長逐級審批后予以授權(quán),研究者按批準(zhǔn)的篩選范圍,導(dǎo)出符合需求的脫敏數(shù)據(jù)。截至2021年8月,臨床研究中心已配合完成6項先心病隨訪研究,通過快速提供所需臨床數(shù)據(jù),使研究者精準(zhǔn)界定隨訪階段與內(nèi)容。

4.3 數(shù)據(jù)應(yīng)用

利用AI技術(shù)實現(xiàn)了臨床病史的后結(jié)構(gòu)化,拓展了數(shù)據(jù)收集范圍,體現(xiàn)出醫(yī)療數(shù)據(jù)的利用價值。賦予研究者全新的科研手段,全文檢索功能支持預(yù)研隊列特征項的模糊匹配,提高了查找和預(yù)處理數(shù)據(jù)的效率;構(gòu)建了時序性的先心病數(shù)據(jù)集,避免了多源數(shù)據(jù)相互矛盾的現(xiàn)象,滿足預(yù)測模型的訓(xùn)練需求,研究結(jié)論更可靠。

5 討論

醫(yī)院通過多源數(shù)據(jù)的智能化治理,建設(shè)高質(zhì)量的專病庫,解決了臨床研究數(shù)據(jù)采集受限的問題,避免了人工收集數(shù)據(jù)造成的錯誤,提升了科研效率。

需要說明的是,專病庫建設(shè)全程需要臨床專家、信息技術(shù)人員及科研人員共同參與。臨床專家前瞻性地厘清面臨的問題,提出常規(guī)資料收集要求;信息技術(shù)人員具體分析從業(yè)務(wù)軟件提取數(shù)據(jù)的可及性,設(shè)計并架構(gòu)數(shù)據(jù)庫,通過算法匯聚并清洗數(shù)據(jù);研究者則利用數(shù)據(jù)庫展開研究,提煉實際的研究證據(jù),從而引申出新的問題。通過多方介入的運轉(zhuǎn)流程,數(shù)據(jù)才能起到關(guān)鍵作用,形成以數(shù)據(jù)庫為核心的研究閉環(huán)模式。

專病庫的核心組件和模塊具有較強的復(fù)用能力。但數(shù)據(jù)庫建設(shè)費用高昂,而橫向的復(fù)制成本相對較低。因此,在推廣應(yīng)用時,面對不同的病種,首先,如患者資料、就診信息等相同數(shù)據(jù),與病種獨有數(shù)據(jù)應(yīng)加以標(biāo)記分隔;其次,多模態(tài)數(shù)據(jù)的處理中,抽取及治理邏輯常常也是類似的,區(qū)別在于病種代碼和特定規(guī)則不同。因此,數(shù)據(jù)庫的組件應(yīng)采用“通用-病種”的方式整體定義,既減少軟硬件資源的投入,也有利于縮短推廣到其他病種的實施周期。

當(dāng)然,專病庫的建設(shè)是一個逐漸完善的過程,隨著研究者使用次數(shù)增多,也會不定期地暴露出一些缺陷:如某類業(yè)務(wù)軟件存在信息盲點,使源數(shù)據(jù)無法提取,缺失項需要研究者手動補充,數(shù)據(jù)無法共享等。另外,針對同一種特征的描述,醫(yī)生的書寫各異,導(dǎo)致提取不準(zhǔn)確。對此,NLP算法的精準(zhǔn)度,以及數(shù)據(jù)項的全面性和準(zhǔn)確性有待進(jìn)一步提高。隨著診前及預(yù)后模型的復(fù)雜度提升,醫(yī)院信息化要不斷改進(jìn),實現(xiàn)業(yè)務(wù)軟件的前結(jié)構(gòu)化改造,推動專病庫持續(xù)優(yōu)化,真正發(fā)揮出醫(yī)療數(shù)據(jù)的潛力。

猜你喜歡
數(shù)據(jù)庫
數(shù)據(jù)庫
財經(jīng)(2017年15期)2017-07-03 22:40:49
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
兩種新的非確定數(shù)據(jù)庫上的Top-K查詢
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
數(shù)據(jù)庫
財經(jīng)(2015年3期)2015-06-09 17:41:31
數(shù)據(jù)庫
財經(jīng)(2014年21期)2014-08-18 01:50:18
數(shù)據(jù)庫
財經(jīng)(2014年6期)2014-03-12 08:28:19
數(shù)據(jù)庫
財經(jīng)(2013年6期)2013-04-29 17:59:30
主站蜘蛛池模板: 精品国产www| 日韩午夜福利在线观看| 亚洲精品无码AV电影在线播放| 综合久久久久久久综合网| 伊人久久久久久久| 国产精彩视频在线观看| 91视频国产高清| 深爱婷婷激情网| 黑人巨大精品欧美一区二区区| 青青热久麻豆精品视频在线观看| 亚洲电影天堂在线国语对白| 国产精品尤物在线| 天堂成人av| 午夜性爽视频男人的天堂| 国产乱肥老妇精品视频| 福利在线不卡| 免费在线不卡视频| 伊人久久婷婷| 婷五月综合| 19国产精品麻豆免费观看| 亚洲人成人伊人成综合网无码| 亚洲第一极品精品无码| 无码精品国产dvd在线观看9久| 亚洲中久无码永久在线观看软件| 91偷拍一区| 国产一区在线观看无码| 国产女人综合久久精品视| 精品少妇三级亚洲| 婷婷午夜影院| 国产网站一区二区三区| 国产成人精品一区二区不卡| 国产精品浪潮Av| 成人久久18免费网站| 亚洲天堂免费观看| 91视频99| 四虎永久免费在线| 99久久亚洲综合精品TS| 婷婷综合色| 日韩福利视频导航| 91国内在线视频| 一级黄色欧美| 国产AV毛片| 日韩专区欧美| 国产新AV天堂| аⅴ资源中文在线天堂| 99久久精品国产自免费| 国产99精品视频| 一本无码在线观看| 91美女视频在线观看| 高潮毛片免费观看| 四虎永久免费地址| 在线看片中文字幕| 一级毛片无毒不卡直接观看| 五月天综合婷婷| 五月天在线网站| 日韩国产综合精选| 波多野结衣的av一区二区三区| 欧亚日韩Av| 狠狠色狠狠综合久久| 国产亚洲精品在天天在线麻豆 | 欧美国产另类| 国产乱人伦偷精品视频AAA| 亚洲人成网站色7777| 亚洲国产在一区二区三区| 91免费国产在线观看尤物| 激情综合五月网| 亚洲男人的天堂在线观看| 97综合久久| 91成人在线免费视频| 亚洲综合极品香蕉久久网| 伊人精品成人久久综合| 在线另类稀缺国产呦| 国产在线精品99一区不卡| 久久伊人操| 成人精品午夜福利在线播放| 热九九精品| 色综合久久久久8天国| 在线观看免费AV网| 亚洲Av激情网五月天| 性色生活片在线观看| 亚洲欧洲自拍拍偷午夜色| 亚洲bt欧美bt精品|