999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CDM的仿真臨床大數據教學平臺的建設與應用

2021-02-08 13:31:10萬程顧宜卿張昕夏偉郁蕓
教育教學論壇 2021年50期

萬程 顧宜卿 張昕 夏偉 郁蕓

[摘 要] 隨著現代信息化技術的發展,醫學事業與計算機行業的逐步交叉,醫學信息學相關專業由此產生。醫學信息工程專業的教學應與實際臨床大數據緊密結合。面向醫學信息工程等專業課堂實踐教學需求,開展了學生關于臨床大數據學習態度的調研。根據調研結果基于通用數據模型(CDM)和隨機化仿真化技術,生成了大規模核心臨床仿真大數據集合,開拓創新地設計了跨課程融通的仿真臨床大數據教學平臺,并將其應用于實際教學,為學生開展科研培訓提供了可靠的訓練方式,教學效果得到了明顯提升。

[關鍵詞] 通用數據模型;仿真臨床大數據;教學平臺

[基金項目] 2019年度南京醫科大學教育教學研究課題“基于CDM的仿真臨床大數據平臺的建設與應用”(2019LX072)

[作者簡介] 萬 程(1979—),女,江蘇南京人,碩士,南京醫科大學生物醫學工程與信息學院講師,主要從事醫學信息學研究;顧宜卿(2002—),女,江蘇蘇州人,南京醫科大學生物醫學工程與信息學院2020級智能醫學與工程專業本科生,研究方向為醫學信息學;郁 蕓(1979—),女,江蘇南通人,碩士,南京醫科大學生物醫學工程與信息學院副教授(通信作者),主要從事醫學圖像處理研究。

[中圖分類號] G434? ?[文獻標識碼] A? ?[文章編號] 1674-9324(2021)50-0137-04? ? [收稿日期] 2021-04-25

一、引言

醫學信息工程是一門以信息科學和生命科學為主的多學科交叉與融合的新興綜合性學科[1]。近幾年來,醫療健康大數據的維度、廣度和深度都迅速增長。臨床大數據驅動的醫學新時代將引領醫學研究和實踐的轉型升級,推進醫療衛生產業創新發展[2,3]。

但是,真實的臨床大數據來源于患者醫院就診的觀察數據,涉及患者個人信息等隱私問題,再加上部分臨床數據的不完整性、冗余性和數據結構的復雜性,這些信息往往不能直接用于相關課程的教學和實踐活動。因此,迫切需要建設一個與真實臨床大數據相近的仿真數據平臺,將臨床大數據抽取、清理、集成并合理轉換,使其適用于醫學信息工程等醫學相關專業學生的教學學習。

二、方法

(一)通用數據模型OHDSI CDM

臨床診療數據伴隨治愈患者的目的產生,而研究數據旨在發現疾病的一般規律。不同的目的使得分散在多個業務系統(如HIS、LIS、PACS等)中的診療數據無法直接進入臨床科研數據庫[4]。

觀察性健康醫療數據科學與信息學(Observational Health Data Sciences and Informatics,OHDSI)計劃,是一個由美國哥倫比亞大學發起的,世界性的公益型非盈利研究聯盟,主要研究全方位醫學大數據分析的開源解決方案,旨在通過大規模數據分析和挖掘來提升臨床醫學數據價值,實現跨學科、跨行業的多方合作[5]。

通用數據模型(CommonData Model,CDM)是一種標準化的臨床數據描述模型。此過程構建以定義數據之間相互關系的通用模型,描述特定信息字段中的概念,以便獲得可以在該領域即臨床數據中具有概括意義的結果。在CDM的基礎上,對臨床大數據進行整理后,可以使用相同的分析程序在不同的機構內進行臨床大數據分析。進一步地,可以通過標準化整合,得出多中心的、更大范圍的、多數據源的觀察性研究結論[6]。

在OHDSI的CDM中,由概念表示具體內容,從而使各個臨床信息系統的數據規范化,可以實現對真實醫學臨床大數據的初步篩選。

(二)匿名化與隨機化仿真

由于患者就診數據屬于個人隱私范疇,必須通過去隱私化處理,才可以應用于教學過程。匿名化及隨機仿真是常見的指刪除或修改數據擁有者的個人信息,以及帶有敏感屬性的明確標識符[7],是數據處理中有效保護隱私信息的技術方法之一。然而,現有的技術大多是先刪除身份標識屬性,在此過程中,丟失部分的信息可能會影響正常運作[8]。本文圍繞慢性病患者的疾病風險預測分析,通過匿名化與隨機化技術,建立符合真實的疾病規律和特征的仿真就診記錄,便于面向慢性疾病的臨床大數據研究及其他相關工作。

匿名化與隨機化對臨床數據進行仿真過程主要包括以下步驟:第一,通過隨機化映射,在脫敏后的數據集增加仿真的患者個人信息,填補缺漏數據,使得在保護患者真實隱私數據后,仍可以正常進行對疾病數據的初步研究。第二,通過時間軌跡映射,虛擬化就診數據的時序信息,對患者的真實就診時間進行調整重排,隨機且合理設置仿真時間。第三,通過臨床特征映射,進行檢驗樣本的虛擬化,在保護重要特征樣本的同時保留數據集中蘊含的臨床特征。

在仿真過程中,首先將患者的個人信息按性別、年齡(每10年為1組)分層,每層中分別再各自采用回歸預測方法(regression predict method)建立預測模型,傾向得分法(Propensity Score Method)計算原理及其受到干預的可能性,再用蒙特卡羅的馬爾科夫鏈方法(Markov Chain Monte Carlo,MCMC)隨機化分析處理變量,對原先臨床信息樣本中缺失的數據采用多重插補法進行10次插補,并形成5個獨立同分布的仿真數據集。

(三)調查對象與方法

1.調查對象:南京醫科大學、徐州醫科大學、江蘇衛生健康學院等醫學相關院校部分學生,共680名。其中男生250名,占總人數的36.8%,女生430名,占總人數的63.2%。大一學生413名,大二學生154名,大三學生65名,大四學生11名,大五學生7名,研究生及以上30名。醫學相關專業學生380名,醫學信息學及智能醫學專業學生79名,其他專業學生221名。

2.調查方法:通過問卷星平臺發放“關于人工智能結合醫學學習的調查”,生成問卷二維碼邀請學生掃描后獨立填寫。本次調查共回收680份問卷,其中有效問卷680份,有效率100%。問卷調查結束后,使用SPSS進行相關統計分析。

3.調查內容:調查問卷主要包括三方面:(1)學生對臨床大數據基本知識的了解程度;(2)學生課堂學習與教師教學模式;(3)學生學習結合臨床大數據的興趣及需求情況。

三、結果

(一)大規模仿真教學數據集CDM_SADT

本研究采集了南京醫科大學附屬第一醫院,即江蘇省人民醫院自2008年1月至2017年6月期間,就診的糖尿病患者的去隱私化和匿名化脫敏CDM數據,以診療過程為中心,采用上述匿名化與隨機化仿真方法,建立核心臨床仿真大數據集合CDM_SADT(CDM Based Simulated Anonymized Dataset for Teaching)。該集合共包括148624位患者的就診記錄,根據常用的疾病分析與預測模型的需求[9],篩選了21項常用的結構化變量和3項非結構化信息,包括患者的基本信息、既往病史、家族史、用藥史、檢驗檢查記錄等。

(二)跨課程融通的仿真臨床大數據平臺SADT_CIDP

南京醫科大學于2018年成立了醫學信息與工程專業,并于2020年更新為智能醫學與工程專業。該專業以現代醫學和生物學理論為基礎,結合大數據、機器學習、深度學習等相關工程技術,強調醫工結合的多元復合型人才培養,采用多模式教學,主要研究醫學信息學、自然語言處理、醫學人工智能等領域。

該專業開設了多門醫學與數據科學、計算機科學相交叉的專業類課程。在構建好的核心數據集的基礎上,根據不同課程的需求分別建立了跨課程融通的仿真臨床大數據平臺SADT_CIDP(SADT Based Cross-curriculum Integrated Data Platform),以滿足跨課程融通的臨床數據分析教學要求。該平臺包括四種數據集,各數據集與課程的相關性見圖1。

面向自然語言處理課程的非結構化電子病歷仿真數據集(NLP_EHR,Simulated Natural Language Processing Dataset Based on Simulated Electric Health Record),服務于“醫學知識表示與處理”“自然語言處理與醫學應用”課程,主要被應用于臨床病歷特征提取、公共健康信息分析、智能健康問答等領域。

面向數據庫管理課程的關系型臨床觀察數據庫(RD_CDM,Relational Database Based on Commen Data Model),服務于“數據庫管理與應用”類課程,提供仿真臨床觀察性數據庫,培養學生對觀察性健康醫療數據的數據庫管理能力。

面向統計類課程的疾病風險預測結構化數據集(SD_DRP,Structured Dataset Based on Disease Risk Prediction),服務于醫學統計學課程,豐富了課程的實例數據,擴展了問題導向的案例教學的案例集。

面向“智能”類課程的多模態融合數據集(MFD_EHR,Multimodality Fusion Dataset Based on Imulated Electric Health Record),服務于程序設計、深度學習與醫學應用、計算機視覺、醫學大數據導論等課程,融合了來源于CDM的結構化數據、來源于EHR脫敏后的自然語言文本和醫學影像數據,為學生提供深度多模態數據的疾病風險預測案例,為學生開展研究性學習提供條件。

綜上所述,不同學科的教學均可通過該平臺調用不同類型格式的仿真臨床大數據集針對性進行課堂實踐運用。

(三)學習態度調查

據問卷調查統計,185名學生在學習人工智能相關課程中使用過基于真實臨床大數據的數據集,僅占總人數的27.2%。90.4%的學生提出有興趣參與基于仿真臨床大數據的人工智能與臨床醫學的交叉研究,97.6%的學生認為使用仿真臨床大數據來開展基于案例的課程學習十分有必要(見表1)。由此可知,學生對于使用仿真臨床數據輔助課程學習的想法十分強烈。另外,56%的學生也認為在學習人工智能相關知識時,實驗中使用的數據集規模應盡量接近真實臨床大數據,此時經過特定處理的仿真臨床大數據教學平臺就為數據集的選擇增加了可能性。

(四)教學應用實踐

在智能醫學工程專業的“程序設計基礎(Python)”課程的教學中,課堂基于仿真臨床大數據教學平臺設計了教學案例——基于既往病史文本的發病年份的提取與分析。在該案例中,運用Python讀取病歷中的文本,再使用正則表達式提取患者發病年份,并計算程序的準確率,再進一步運用matplotlib庫繪圖使結構數據可視化。學生在學習用Python程序對txt文本文件處理的同時又真正接觸了接近真實的臨床大數據,做到了課堂教學與實踐練習的有效結合。

通過課后調查得知,個別學生認為完成基于臨床數據的程序設計案例存在一定的挑戰性,但是90%以上的學生仍然都認同,采用基于臨床數據進行程序設計的學習,比采用普通的數據進行程序設計而言更有助于對專業課程的學習。

四、討論

用于多門數據分析相關課程的實踐教學平臺為南京醫科大學的醫學信息工程等專業多門專業課程的教學提供了融通的數據平臺,能滿足多種復雜的教學需求。平臺建設應用實踐證明,仿真臨床大數據教學有助于提高學生對課堂教學內容的理解程度,接觸臨床數據也為學生學習增強了模擬效果。總之,該仿真數據平臺較好地處理了運用臨床大數據在教學過程中存在的隱私保護和數據安全問題,為學生開展科研培訓提供了可靠的訓練方式。因此,我們將進一步建設為我校醫工交叉的其他專業學生培養所需的大數據分析的綜合數據平臺,使臨床大數據在教學中發揮其應有的作用。

(課題組成員:萬程、顧宜卿、張昕、夏偉、郁蕓、周高信、王俊杰、胡杰)

參考文獻

[1]王能河,阮若林,彭微.醫學信息工程專業教育發展戰略探究[J].黑龍江教育(高教研究與評估),2016(7):11-13.

[2]李慧杰,張晴晴,劉瑞紅,等.大數據背景下臨床專病數據庫建設實踐與思考[J].中國衛生事業管理,2020,37(8):574-576+591.

[3]葉永飛,張曉,趙志升.大數據環境下的醫學信息學專業課程建設[J].課程教育研究,2015(3):76-77.

[4]李丹彤,梁會營,劉廣建.臨床科研數據庫建設中的數據標準化問題探討[J].中國數字醫學,2021,16(1):29-34.

[5]張昕,繆姝妹,戴作雷,等.臨床數據向通用數據模型轉換研究及應用實踐[J].中國數字醫學,2018,13(10):64-67.

[6]Association AD. 8. Cardiovascular disease and risk man- agemen[J].Diabetes care,2016(39):S60-S71.

[7]程德生,萬晶,宋國彩,等.中醫藥大數據云服務平臺的醫療數據安全隱私保護設計[J].網絡安全技術與應用,2021(2):122-124.

[8]史婷瑤,馬金剛,曹慧,等.醫療大數據隱私保護技術的研究進展[J].中國醫療設備,2019,34(5):163-166.

[9]Yusuf S, Joseph P, Rangarajan S, et al. Modifiable risk factors, cardiovascular disease, and mortality in 155 722 individuals from 21 high-income, middle-income, and low-income countries (PURE): a prospective cohort study[J].The Lancet,2020,395(10226):795-808.

主站蜘蛛池模板: 国产国拍精品视频免费看| 动漫精品中文字幕无码| www.亚洲色图.com| 欧日韩在线不卡视频| 欧美精品在线观看视频| 精品一区二区无码av| AV在线天堂进入| 亚洲无码日韩一区| 青青青国产精品国产精品美女| 国产精品视频白浆免费视频| 在线观看免费AV网| 欧洲一区二区三区无码| 91成人精品视频| 久久国产香蕉| 人人看人人鲁狠狠高清| 国产成在线观看免费视频| 91综合色区亚洲熟妇p| 国产 在线视频无码| 国产极品美女在线播放| 亚洲无线一二三四区男男| 中文字幕第4页| 亚洲人成亚洲精品| 欧美.成人.综合在线| 精品视频一区二区三区在线播| 国产精品护士| 国产尹人香蕉综合在线电影 | 久久久精品久久久久三级| 广东一级毛片| 日韩av无码DVD| 国内黄色精品| 欧美天天干| 在线看片中文字幕| 久草国产在线观看| 日本免费福利视频| 国产亚洲精品无码专| 99精品福利视频| 97久久免费视频| m男亚洲一区中文字幕| 亚洲AⅤ无码国产精品| 成人福利免费在线观看| 在线亚洲天堂| 亚洲人成影院午夜网站| 一边摸一边做爽的视频17国产 | 色噜噜狠狠色综合网图区| 久久国产免费观看| 亚洲男人天堂2020| 国产欧美视频综合二区| 国产成人亚洲综合a∨婷婷| 在线色国产| 日本一区高清| 国产亚洲欧美在线专区| 日韩A∨精品日韩精品无码| 亚洲国产综合自在线另类| 国产午夜一级淫片| 亚洲人成成无码网WWW| 亚洲天堂日韩在线| 亚洲 欧美 日韩综合一区| 国产97公开成人免费视频| 亚洲无码精彩视频在线观看| 成人国产免费| 狠狠亚洲婷婷综合色香| 天堂成人在线| 精品人妻无码区在线视频| 国模视频一区二区| 亚洲天堂视频在线播放| 高h视频在线| 亚洲男人天堂网址| 国产色伊人| 亚洲国产欧美目韩成人综合| 国产91精品最新在线播放| 天天综合网站| 中文字幕无码中文字幕有码在线| 亚卅精品无码久久毛片乌克兰| 华人在线亚洲欧美精品| 国产在线无码av完整版在线观看| 亚洲精品午夜无码电影网| 欧美五月婷婷| 久久久久亚洲av成人网人人软件| 国产麻豆精品在线观看| 色偷偷一区二区三区| 91在线国内在线播放老师| 午夜精品福利影院|