999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多源數據整合的居民死亡數據管理與分析研究

2020-03-29 17:24:49湯娟華
探索科學(學術版) 2020年12期
關鍵詞:數據挖掘信息模型

湯娟華 陸 凱 袁 焱

常州市衛生健康數據管理中心 江蘇 常州213003

一、課題的主要研究內容分析

1.數據采集。通過近幾年來的建設和發展,常州市衛生健康數據管理中心管理的區域全民健信息平臺已經收集并存儲了三十多億條醫療衛生數據,當前存儲在中心機房中,并計劃在2020年內遷移到電子政務云——衛生健康專區存儲,得到“兩地三中心”的容災備份支持,因此在數據存儲和保管方面已經擁有比較完善的基礎設施。

2.標準模型建立。考慮對近10年的居民死亡數據進行研究,在研究過程中需要搭建相應主題的數據倉庫。首先構建邏輯模型,也就是列出需要分析的主題、明確需求目標、定義關系模式,同時在邏輯模型的基礎上對實體的屬性、屬性的值域等信息進行明確、完善和細化。在邏輯模型建立完畢后,需要基于邏輯模型將其轉換為物理模型,主要包括將實體名轉換為表名、將屬性名轉換為列名,確定列的屬性;在物理模型的創建過程中,必須要對列的屬性進行明確,包括列名、數據類型等。確定物理模型之后,對于數據的存放位置和存儲空間的分配等也同時進行規劃。

3.數據處理和數據整合。預期建立的居民死因數據檔案數據來源包括全民健康信息平臺中存儲的健康檔案數據、江蘇省死亡登記系統中常州區域的死因數據、常州市民政系統的殯葬數據和公安系統的非正常死亡數據等,不同的數據來源由于其側重點的差異,在數據結構設計上存在著較大差異,數據的準確程度也各有不同。全民健康信息平臺中存儲了居民的健康檔案信息和體檢相關信息,其中也包括了居民的個人基本信息及就醫記錄等,但由于數據來源限制,其個人基本信息可能存在部分缺失和更新不及時等問題,死亡登記系統中的數據更加側重于由直接死因、其他死因和時間間隔等構建起來的死因鏈,其病理數據記錄較為全面也更權威,但由于歷史全因,其ICD疾病分類與編碼等存在多個不同的版本。民政的殯葬數據主要提供了殯葬地點和較為籠統的死因、住址等信息,公安的非正常死亡數據則是對數據完整性的進一步補充。

4.統計分析。根據數據標準完成數據整合后,需要對數據進一步進行分析。包括但不限于通過數據統計分析工具對每年的死亡人口年齡結構變化、職業結構變化、區位變化、因心腦血管疾病、癌癥、慢性呼吸系統疾病和糖尿病這4類重大慢性病導致的死亡數、疾病費用負擔等進行分析。

5.數據挖掘算法應用。當前國內對于死因數據的研究主要集中在死亡率計算、生命表編制和死因鏈分析等基于統計基礎的分析和基于醫學研究的分析,將數據挖掘技術應用于死因數據的情況還比較少,因此具有一定的嘗試和探索價值。當前數據挖掘技術已經在許多領域得到了較好的應用,其中應用廣泛的分類回歸算法、關聯規則算法、聚類算法等監督和非監督算法能否成功應用于死因數據,進行死亡人群分類、預期壽命估計等工作,是本課題需要重點研究的部分之一。

二、研究的實踐意義

1.促進數據管理,強化互聯互通。當前大數據在醫療健康領域的應用還處于起步階段,有大量的醫療健康數據因為不符合數據標準、或缺少數據整合而無法進行利用,仍處在“冷數據”狀態。當前衛生健康部門收集存儲的醫療數據與政府其他各部委辦局收集存儲的數據之間也存在著“信息孤島”的現象,跨區域、跨部門的數據交換并不暢通。通過市大數據局管理中心進行部門間數據交換,整合衛健、民政和公安等多個來源的居民死亡相關數據,集中到市級全民健康信息平臺上,才能形成較為完整和全面的死因檔案數據用于統計分析和算法數據挖掘。

2.推動平臺建設,促進全民健康。目前,以人為核心的數據資源在醫學診療過程中的成功運用,不僅給老百姓帶來更加便捷的看病服務,而且進一步提高了醫療資源的利用效率。在平臺建設過程中,收集整合死因相關數據,并研究制定相應的數據標準,對數據進行后標準化,有利于平臺真正意義上實現全生命周期健康數據管理。此外,當前平臺缺乏及時的檔案封存工作,這不僅加大了數據存儲的負擔,也一定程度上影響到了平臺數據的準確性。將死因數據整合納入平臺管理,有利于對健康檔案及時進行更新和注銷,也有利于平臺數據質量的進一步提高。另一方面,將全民健康信息平臺上現有的數據補充到死因檔案中,有助于進行更有效的數據分析。現有的死亡登記系統中存儲了詳細的死因鏈等信息,但并沒有包括居民的電子病歷信息,也就是無法獲知其歷史就醫經歷。將歷史就醫經歷補充到死因分析中,能夠得到更多有價值的結論,也有利于改善居民健康,延長居民平均壽命。

3.應用相關算法,挖掘數據價值。死因數據分析具有重要的意義,大到國家,小到地區的衛生和經濟狀況某種程度上都可以通過死因數據分析了解到,分析結果也可以為衛生政策的制定提供依據。數據分析得到的指標可以反映一個國家或者地區的衛生狀況、經濟水平和文化發展情況,也能夠為制定衛生保健措施、衛生事業發展規劃乃至社會經濟發展提供科學的依據,同時也是醫學、人口學、社會學等學科研究的基礎參考信息。隨著數據價值逐漸被大眾所認知,數據挖掘技術在近年來有了長足的發展和進步,目前已經被廣泛應用到了各個領域。數據挖掘算法主要包括監督學習算法和非監督學習算法兩大類別。監督學習算法又分為分類算法和回歸算法,主要包括最近鄰(KNN)算法,決策樹算法等,非監督學習算法則主要包括聚類方法和關聯規則分析算法,常用的有K-均值聚類等。

三、結語

將數據挖掘相關技術和算法應用到死因數據上來,一方面可以彌補傳統的統計研究方法中存在的不足,從不同的維度和層面挖掘到有價值、可利用的信息,為政府相關部門的政策制定提供參考意見,另一方面也可以拓寬數據挖掘技術的應用領域,在實踐中進一步促進其發展和進步。

猜你喜歡
數據挖掘信息模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
3D打印中的模型分割與打包
一種基于Hadoop的大數據挖掘云服務及應用
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 久久77777| 亚洲三级电影在线播放| 亚洲国产精品不卡在线| 午夜毛片免费观看视频 | 婷婷综合色| 热99精品视频| 国产本道久久一区二区三区| 国产精品视频999| 亚洲免费人成影院| 久久久噜噜噜| 亚洲五月激情网| 中文毛片无遮挡播放免费| 中文字幕亚洲专区第19页| 91视频国产高清| 在线观看免费黄色网址| 久久久久久午夜精品| 伊人中文网| 国产乱子伦无码精品小说| 国内精品久久久久久久久久影视| 97成人在线视频| 伊人久久大香线蕉综合影视| 激情无码字幕综合| 97亚洲色综久久精品| 美女视频黄频a免费高清不卡| 热热久久狠狠偷偷色男同| 亚洲国产成熟视频在线多多| 日本不卡视频在线| 欧美精品伊人久久| 日本精品视频| 中文字幕免费视频| 亚洲综合在线网| 国产AV无码专区亚洲精品网站| 1769国产精品免费视频| 日韩高清欧美| yjizz国产在线视频网| 亚洲视频a| 天天做天天爱夜夜爽毛片毛片| 国产内射在线观看| 91欧美在线| 免费一级成人毛片| 国产麻豆精品在线观看| 日韩黄色在线| 国产日本视频91| 亚洲性视频网站| 91久久偷偷做嫩草影院免费看| 精品视频一区二区观看| 国产亚洲现在一区二区中文| 久久精品这里只有精99品| 亚洲VA中文字幕| 国产chinese男男gay视频网| 中文字幕亚洲精品2页| 久久这里只有精品2| 欧美国产在线一区| 精品久久久久无码| 亚洲 欧美 日韩综合一区| 欧美日本在线观看| 国产又爽又黄无遮挡免费观看| 免费观看国产小粉嫩喷水| 国产一区二区三区精品久久呦| 亚洲精品国产综合99久久夜夜嗨| 久久青青草原亚洲av无码| 91黄视频在线观看| 中文字幕在线不卡视频| 亚洲午夜18| 婷婷午夜天| 国产尤物jk自慰制服喷水| 成人字幕网视频在线观看| 伊人蕉久影院| 国产成人精品亚洲77美色| 狠狠色噜噜狠狠狠狠色综合久| 国产乱人乱偷精品视频a人人澡 | 操操操综合网| 国产女人水多毛片18| 欧美成人二区| 热这里只有精品国产热门精品| 成AV人片一区二区三区久久| 久久99这里精品8国产| 视频二区中文无码| 中文字幕亚洲另类天堂| 五月婷婷激情四射| 9cao视频精品| 毛片一级在线|