999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于臨床業務系統的臨床科研數據收集與整理的應用研究*

2018-05-10 03:18:16何志仁黃家杰傅昊陽劉旭生
世界科學技術-中醫藥現代化 2018年2期
關鍵詞:數據庫系統

何志仁,黃家杰,鄒 川,傅昊陽,劉旭生**

(1.廣東省中醫院腎內科 廣州 51000;2.廣東省中醫院信息科 廣州 510000;3.廣州中醫藥大學第二臨床醫學院 廣州 510000)

隨著醫院臨床業務的信息化不斷深入,從掛號、就診、檢查、繳費、取藥、治療等各個日常醫療流程都已經出現不同程度的信息化。臨床業務系統協助我們完成臨床工作。大量的臨床數據在完成這些流程的過程中產生并保存。這些臨床業務流程積累的數據是我們進行臨床科研的寶貴素材。如何整合這些臨床資料近期成為研究的熱點[1]。

真實世界研究是近年來興起的新的研究方法[2,3],要求廣泛地收集真實世界的信息,進而對某一種臨床治療的療效進行評價[4]。真實世界研究需要收集患者在診療過程中盡可能詳盡的臨床數據,因此需要在醫院各個業務系統中對特定患者群的數據進行收集和處理。由于不同業務系統的構造邏輯和基礎軟件不同,導致統一提取和整理這些數據存在困難。難怪有學者認為,目前由不同開發商、不同臨床科室、不同臨床需求開發出來的臨床業務系統組合而成的醫院信息化構架,正在遭遇“信息孤島”的尷尬[5]。

為解決上述問題,我們在現有的臨床業務系統的基礎上,構建一個用于??婆R床科研的數據倉庫。整合院內不同業務系統的病人身份信息,做到根據每個病人的唯一編碼,就可以查詢院內各個業務系統中該病人的數據,同時根據業務系統中某一個數據點,可反向查詢其所屬的病人信息,進而實現對整個數據倉庫資料的篩選。在此數據倉庫的基礎上加入中醫特色,構建有中醫藥特色的臨床科研數據倉庫。實現某一個病人的信息在整個醫院各個系統中互聯互通。

數據倉庫[1]為支持決策管理建立的,是面向主題、集成的、穩定的、隨時間變化的數據集合。通過針對國內外對醫療信息數據倉庫的調研表明,目前多數文獻報道的數據倉庫涉及到的疾病一般局限在糖尿病、腫瘤、精神疾病、胃病、慢性腎小球腎炎等常見疾病,缺乏對整個科室或者整個醫院病人數據整合的數據倉庫[6]。中醫界也缺乏在西醫臨床數據的基礎上結合中醫辨證、方藥因素的臨床數據庫。

圖1 數據倉庫的總體設計概覽

Python語言是一個結合解釋性、編譯性、互動性和面向對象的腳本語言[7]。Python語言的Django框架是目前流行的整合數據庫和Web交互的程序設計語言框架[8],被廣泛應用于各種輕量級的數據管理平臺的建設。MySQL是一款開源的關系型數據庫系統,目前被廣泛使用的關系型數據庫[9]。

我們以Python+Django+MySQL為框架在院內構建一個這樣的數據倉庫,收集從2008年至今在我院腎內科住院病人的相關臨床數據。為目前科內多個臨床研究提供大量數據支持。下面我們試圖描述數據倉庫中的數據結構,說明其構造過程并展示其應用成果。整個數據庫的構建以及數據提取的過程都是通過Python語言編寫的代碼完成,讀者如有興趣了解進一步的技術細節可以聯系作者查看源代碼。

1 總體設計概覽

利用Python+Django+MySQL構造一個獨立于醫院各種業務系統的統一的臨床數據倉庫,運行在醫院內部網絡的獨立服務器上,實現一下三大功能:(1)從各個業務系統提取的數據接口提取數據;(2)把所提取的數據按照預設模型進行整理保存;(3)按照臨床科研的需求對數據庫進行檢索并輸出所需要的數據。

2 模型設計

基于Django構造與醫院業務系統相匹配的數據模型。我院同時存在多個臨床業務系統(住院病歷、門診病歷、實驗室檢查、影像學檢查、病理檢查系統),根據各個業務系統可以提供的數據接口、臨床研究可能需要的查詢邏輯,對各個數據表的結構進行設計。大部分的數據表結構直接模仿對應業務系統的數據結構即可??紤]中醫辨證處方、手術、有創操作可能是臨床研究的關鍵節點。因此我們對住院病歷接口輸出的xml文件進行了文本分析,提取了其中中醫辨證處方記錄、手術記錄、有創操作記錄單獨構造了相應的數據表。

結合中醫院的特點,在住院情況數據表中專門加入了中醫辨證以及中醫診斷部分,以便記錄,病人住院的中醫情況。專門設置住院中醫辨證處方數據表記錄住院期間中藥湯劑使用情況。

表1 臨床科研數據平臺數據庫具體模型設計

圖2 各個數據表之間的鏈接互查關系

上述的各種數據表之間,通過外鍵將各個數據庫,與病人總索引數據表、住院情況數據表、門診病歷數據表相關聯。各個數據表之間的關聯如圖。

3 業務系統的數據接口

3.1 住院病歷系統接口

住院病歷系統的接口提供住院病歷的xml文檔。其中包含入院記錄、首次病程記錄、中醫辨證處方記錄、病程記錄、手術記錄、有創操作記錄、出院記錄、死亡記錄等常規的病歷內容信息。通過Python的xml庫提取這些記錄的內容。通過簡單的文本匹配可以提取病人的中醫辨證依據,中醫診斷,中醫證候的記錄。具體的提取字段,可以參見表1中提到的相關項目。

3.2 實驗室以及門診病歷系統接口

實驗室檢查系統以及門診病歷系統接口為Web Service形式,提供病人的門診號、住院號以及設定日期范圍后即可返回該病人在制定時間內的實驗室檢查結果以及門診病歷信息。利用Python的suds庫讀取相應的Web Service接口。通過文本匹配可以提取門診病歷信息中的中醫診斷、中藥處方等細分內容也可以提取實驗室檢查中的項目名稱、結果參考范圍等內容。

3.3 影像檢查系統以及病理系統接口

影像檢查系統以及病理系統通過HTML文本分析提取影像檢查結果數據以及病理數據。利用urllib、HTMLParser、xml、re庫可以通過網頁爬蟲的方式讀取網頁報告形式影像學及病理報告。

4 數據抽取

考慮到信息安全,以及日常業務系統的負載,我們在院內設立了獨立的數據倉庫服務器,在臨床業務系統負載較輕的時候分批從各個業務系統的數據接口讀取數據。由于各個業務系統的數據接口不同,讀取接口數據的時候需要使用的軟件工具不盡相同,這個時候Python的靈活性就能解決大量的問題。Python有現成的各種讀取接口的工具,可以方便地實現與各個業務系統接口的對接。數據的轉換,由于不同接口的數據格式不同,同一個項目可能有多種表達方法,如性別,某些數據接口直接標識男、女,某些數據接口則標識M、F。我們自己構建了一個轉義字典。統一這類數據標識的差異,在寫入數據倉庫的時候使用本倉庫統一的標識。抽取過程中建立數據提取日志,防止數據的重復提取。

5 數據查詢

對整個數據倉庫的資料進行檢索耗費大量的計算資源,因此在業務系統滿足日常工作的情況下,難以應付復雜的科研數據查詢工作。由于我們的數據中心與臨床業務系統是相互獨立的,因此我們的大規模檢索并不影響醫院日常業務的開展。我們的數據查詢工作主要包括篩選與提取兩個步驟。

5.1 病人篩選

所謂的篩選,就是設定特定的條件,選擇數據庫中的病人。由于數據庫中各個數據表都可以通過病人主索引表進行連接。所以前面論述的表1中提到的各種數據表字段,都可以作為我們篩選的條件。例如我們可以根據病歷中記載的中醫證候、舌脈、過敏史、主訴等特征對病人進行篩選,也可以根據住院或者門診檢查中特定的檢查結果的范圍進行篩選,也可以根據手術、有創操作的種類和時間進行篩選,也可以根據中醫辨證處方中特定的用藥組合進行篩選。上述的多種維度可以同時或者先后根據邏輯關系對數據庫中的病人進行篩選,最后得出一個病人名單。

5.2 數據提取

數據提取就是按照臨床研究的需求,提取上述名單病人的特定數據表字段。同樣的原則上前面論述的表1總的各種字段都可以作為數據提取項目。例如某些實驗室檢查結果,某些影像學檢查結果,特定的手術、特定原因的住院等臨床事件,例如特定中藥處方或者藥對的使用。可以利用Pyhton的數據處理能力根據科研需求輸出CSV、Excel、SPSS、SASS等的數據文件格式,以便進一步進行數據分析。

6 實際應用舉例

數據提取的過程通過Python腳本完成,截止2016年12月31日我們建成的數據庫文件達2.3 GB。各個數據模型的記錄情況如下表:

數據提取過程需要通過編寫Python代碼完成。篩選超過30 000人的住院以及門診記錄和其相關的實驗室以及影像學檢查結果。從編寫代碼到執行代碼輸出結果的平均時間可以縮短到1天,數據篩選和提取的效率有巨大的提高。具體的數據篩選以及提取流程如下:

6.1 數據篩選、提取目標

慢性腎臟病3-4期合并高尿酸血癥住院患者的中醫癥候、舌脈特點以及血脂情況。

6.2 病人篩選

首先對住院情況數據表進行篩選,找到出院診斷中同時存在慢性腎臟病3-4期以及高尿酸血癥的病人,把對應的住院情況記錄列出,生成符合上述條件的病人列表。

6.3 數據提取

然后根據其住院情況記錄讀取相關的中醫證候及舌脈情況。由于住院情況記錄與實驗室檢查結果有關聯,因此我們可以提取每一次住院情況對應的血脂情況的檢驗結果,將需要提取的數據就整理為一個數據表,進而進行數據分析。

7 討論

本數據倉庫建立在我院多年來信息化的數據積累的基礎上[10],根據我們醫院的實際情況進行模型設計和構建。由于各個醫院的具體情況不盡相同,因此本系統的接口部分的可推廣性不足。然而從各個系統中提取出數據,匯總后構成的新的數據模型(圖2),經過我們的實踐證明是一種行之有效的解決方案。可以高效地整合醫院各個子系統的數據到一個統一平臺進行查詢和管理。在建設數據模型的過程中,我們發現統一的病人索引是我們整合各子系統數據的重要依據。在醫院各個子系統設計時就需要考慮病人身份識別這個問題[11]。目前比較常用的處理方法就是通過病人的身份證號碼作為鑒別身份的唯一標識。在門診、住院、隨訪等分系統中均需要記錄病人的身份信息。

本系統整合了醫院中各個主要的臨床業務系統的數據。目前國內的中醫腎臟病臨床數據庫的建設多以文獻數據庫[12-14]或專病數據庫為主[15]。我們的數據庫收集了從2008年至今在我院腎內科住院的所有住院病人的門診、住院、檢驗、影像學檢查數據,并記錄了病人的各種臨床事件。由于所有數據在一個平臺上,可以對大量的病人進行多維度的檢索和篩選,極大地提高了真實世界回顧性研究數據檢索和收集的效率。結合我們中醫院的特點,在西醫相關業務數據的基礎上增加了相應的中醫模塊,對中醫的辨證、用藥等客觀的中醫臨床實踐進行詳細的記錄。使得中醫藥的辨證和用藥有據可查。

本系統的特點就是數據直接來源于臨床業務系統,無手工錄入過程,盡可能挖掘現有數據的潛力,并不增加臨床工作的負擔,且數據的準確性得到保證,數據提取的效率得到有效提高。這樣做可以在短時間內建立一個規模龐大的數據庫。且臨床資料隨著日常的臨床工作不斷積累的,數據庫的規??梢圆粩鄶U大,然后進行更大規模的研究。但是由于數據庫的回顧特性以及未加入研究設計,不可避免的存在回顧性研究的種種問題[16]。在設計研究和定義篩選以及提取規則的時候需要認真考慮這些這些數據的真實性。

表2 數據倉庫內各個數據表的記錄條數

本系統存在以下不足。由于國內目前政策情況的局限,目前這個數據庫并沒有能夠整合中西醫醫囑數據,因此對病人的干預措施以及用藥劑量方面數據整理無法進行。受限于國內病人流動性較大的特點,一家醫院難以收集病人的所有臨床事件。我們認為規范、規律的隨訪數據依然是臨床研究必不可少的素材,全面系統的隨訪系統是臨床研究必不可少的素材。目前我院也在開發相應的病人隨訪系統。通過對隨訪系統中數據整合,對臨床數據記性跟進一步的整合。

本數據系統基于Python語言設計,臨床研究者需要從數據庫中調閱數據,需要編寫Python語言代碼來實現提取邏輯和定制提取的項目,對于臨床研究者來說有一定的難度。開發交互式檢索以及數據提取界面是我們下一步開發的方向。

本數據庫整合的依然是自然語言記錄的醫療記錄,雖然實驗室檢查、影像學檢查、病理學檢查的結果實現了相當部分的結構化。然而病歷資料的數據粒度還非常低,對病歷資料的分析需要使用大量的自然語言處理技術,對普通的研究者有一定的門檻。而且如何利用自然語言處理技術分析病歷記錄恐怕是今后研究的一個重要方向。

1 吳瓊.以臨床數據倉庫為核心的醫院大數據平臺構建.電腦知識與技術,2017,13(10):6-7.

2 Dormer L.How can real-world evidence be used in practice to demonstrate drug value and improve patient care.J Comp Eff Res,2017,6(3):183-184.

3 Sherman R E,Anderson S A,Dal Pan G J,et al.Real-World Evidence-What Is It and What Can It Tell Us.N Engl J Med,2016,375(23):2293-2297.

4 黃卓山,羅艷婷,劉金來.真實世界研究的方法與實踐.循證醫學,2014,14(6):364-368.

5 董方杰,蒲立新,曲建明,等.醫療信息院內交互與區域共享的架構及其技術研究.生物醫學工程學雜志,2014,(4):788-792.

6 秦慎強.面向中醫證候的慢性腎小球腎炎數據倉庫的研究.成都:電子科技大學碩士學位論文:2016.

7 高昂.Django及國內Python社區進展.程序員,2009(9):23.

8 肖旻,陳行.基于Python語言編程特點及應用之探討.電腦知識與技術,2014(34):8177-8178.

9 胡敏.Web系統下提高MySQL數據庫安全性的研究與實現.北京:北京郵電大學碩士學位論文,2015.

10 易傳亮,黃家杰,徐飛龍,等.中醫臨床科研共享平臺建設.中國信息界(e醫療),2014(2):36-37.

11 李征.數據倉庫統一身份認證系統的研究與實現.北京:北京郵電大學碩士學位論文,2006.

12 孔麗婭,柴可夫,牛永寧.數據挖掘方法在中醫證候學中的應用.浙江中醫藥大學學報,2014,38(6):825-828.

13 魏立良.現代名中醫尿血醫案的數據挖掘研究.廣州:廣州中醫藥大學碩士學位論文,2014.

14 李鑫頡,賈振華,吳以嶺.數據挖掘方法在中醫醫案研究中的現狀分析.中國中醫基礎醫學雜志,2012(1):117-118.

15 李開龍,張建國.腎臟病臨床數據庫簡介.中國中西醫結合腎病雜志,2003,4(3):180-182.

16 王祥配,宋毅鵬,何麗云,等.醫院病歷信息數據化的路徑與方法研究.世界科學技術-中醫藥現代化,2015(2):389-393.

猜你喜歡
數據庫系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 秋霞一区二区三区| 欧美日韩专区| 久久精品人妻中文视频| 久草美女视频| 久久精品一卡日本电影| 亚洲国产精品不卡在线 | 欧美亚洲欧美区| 青青热久免费精品视频6| 国产成人精品在线| 99热精品久久| 在线色国产| 久久黄色免费电影| 在线不卡免费视频| 日本草草视频在线观看| 女人一级毛片| 国产精品白浆在线播放| 亚洲男人在线| 午夜少妇精品视频小电影| 国产凹凸视频在线观看| 香蕉综合在线视频91| 制服丝袜 91视频| 国产欧美又粗又猛又爽老| 99热这里只有精品国产99| 免费不卡视频| 午夜日本永久乱码免费播放片| 亚洲成人动漫在线| 国产网友愉拍精品视频| 一级毛片免费高清视频| 久久精品电影| 午夜视频免费一区二区在线看| 久久人午夜亚洲精品无码区| 乱人伦99久久| 国产乱码精品一区二区三区中文| 色噜噜狠狠色综合网图区| 亚洲最大情网站在线观看| 亚洲男人天堂2020| 国产成人综合日韩精品无码首页| 丁香五月激情图片| 成人福利在线看| 麻豆精品在线| 免费一级无码在线网站| 亚洲一区波多野结衣二区三区| 亚洲无线一二三四区男男| 不卡色老大久久综合网| 日韩视频福利| 精久久久久无码区中文字幕| 欧美日韩资源| 久久黄色视频影| 大香伊人久久| 香蕉eeww99国产在线观看| 人与鲁专区| 欧美日本在线观看| 天天干天天色综合网| 国产香蕉一区二区在线网站| 又污又黄又无遮挡网站| 国产精品亚洲天堂| 亚洲IV视频免费在线光看| 亚洲九九视频| 久久青草热| 伊伊人成亚洲综合人网7777| 精品国产自| 亚洲欧美另类久久久精品播放的| 国产成人精品亚洲77美色| 亚洲中字无码AV电影在线观看| 伊人91在线| 亚洲区第一页| 制服丝袜一区二区三区在线| 三上悠亚在线精品二区| 日本成人不卡视频| 久久a毛片| 亚洲精品波多野结衣| 亚洲欧美日韩动漫| 日韩在线网址| 亚洲男人的天堂在线| 精品三级网站| 国产欧美一区二区三区视频在线观看| 精品国产成人三级在线观看| 日韩东京热无码人妻| 国产精品一区二区无码免费看片| 99色亚洲国产精品11p| 97在线观看视频免费| 青青草原偷拍视频|